AI netrukus perims projektus, kurie žmonėms kainuos savaites

AI netrukus perims projektus, kurie žmonėms kainuos savaites
Dabartinės dirbtinio intelekto sistemos (AI) negali viršyti žmonių atliekant ilgas užduotis, tačiau AI modeliai , kurie vadinami„ laiko užduotys, laiko horizontas “. Tai laikas, kai programuotojams paprastai reikia atlikti užduotis, gali atlikti AI modelius su tam tikru sėkmės procentu.
„Arxiv“ pranešime, paskelbtame išankstiniame spausdinime, praneša, kad „GPT-2“, ankstyvas didelis balso modelis (LLM), kurį 2019 m. Išleido „Openai“, nepavyko atlikti visose užduotyse, kurių žmonių ekspertai kainuoja daugiau nei minutę. „Claude 3.7 Sonnet“, kurį vasario mėn. Išleido JAV pradedantysis antropikas, baigė 50 % užduočių, kurių žmonės užtruks 59 minutes.
Remiantis tyrimu, iš viso 13 pirmaujančių AI modelių laiko horizontas išaugo dvigubai kas septynis mėnesius nuo 2019 m. Eksponentinis AI laiko horizonto augimas, pagreitėjęs 2024 m., Kai naujausi modeliai padvigubina jų horizontus maždaug kas tris mėnesius. Darbas dar nebuvo oficialiai išnagrinėtas.
2019–2024 m. Pažangoje „MetR“ rodo, kad AI modeliai iki 2029 m. Gali valdyti užduotis, kurių žmonėms reikia maždaug mėnesį, o tai yra 50 %patikimumas, galbūt dar anksčiau.
Mėnesio įsipareigojimų kompetencija, pasak dokumento, gali pakakti įkurti naują įmonę ar padaryti mokslinius atradimus.
Joshua Gans, Kanados Toronto universiteto vadybos profesorius, rašęs apie AI ekonomiką, paaiškina, kad tokios prognozės nėra ypač naudingos. „Ekstrapoliacijos vilioja, tačiau vis dar yra tiek daug, kad mes nežinome, kaip AI iš tikrųjų naudojama, kad šios prognozės turėtų prasmę“, - sako jis.
Žmogaus ir Ki
įvertinimasKomanda pasirinko 50 %sėkmės procentą, nes ji buvo patikimiausia, palyginti su mažais duomenų pasiskirstymo pokyčiais. „Jei pasirinksite labai žemas ar labai aukštas slenksčio vertes, pridėdami ar pašalindami vieną sėkmingą ar nesėkmingą užduotį, pakeiskite įvertinimą pagal“, -aiškina CO -Author Lawrence Chan.
Patikimumo padidėjimas nuo 50 % iki 80 % sumažino vidutinį laiko horizontą penkiais - nors bendras dvigubinimo laikas ir tendencijų linija buvo panašūs.
Per pastaruos iš LLM daugiausia dėl mastelio padidina mokymo duomenų kiekį, treniruočių laiką ir modelio parametrų skaičių. Straipsnis lemia pagrindinio laiko horizonto figūrą, daugiausia kaip loginio argumento patobulinimas, įrankių naudojimas, klaidų taisymas ir pasitikėjimas savimi atliekant užduotis.
METR metodas, skirtas įvertinti „Time Horizon“, apima kai kuriuos esamų AI etalonų apribojimus, kurie atitinka tik tikrąjį darbą ir yra greitai „prisotinti“, kai modeliai pagerėja. Tai siūlo nuolatinę, intuityvią priemonę, kuri geriau užfiksuotų didelę pažangą per ilgesnį laiką, sako Mitautorius Benas Westas.
Pagrindiniai AI modeliai pasiekia superžmogišką našumą daugelyje , tačiau iki šiol buvo palyginti žemas ekonominis poveikis, paaiškina Vakarų
Anton Troynikov, AI tyrėjas ir verslininkas iš San Francisko, Kalifornijoje, paaiškina, kad AI turėtų didesnę ekonominę įtaką, jei organizacijos būtų geriau pasirengusios eksperimentuoti ir investuoti į veiksmingą modelių naudojimą. kwa, T. et al. Išankstinis spausdinimas ARXIV " https://doi.org/10.48550/arxiv.2503.14499 (2025).