AI ottaa pian haltuunsa hankkeet, jotka maksavat ihmisille viikkoja

Künstliche Intelligenz verbessert sich rasant und könnte bald Projekte übernehmen, für die Menschen Wochen benötigen. Expertenanalysen zeigen, dass führende KI-Modelle im Fortschritt sind und bis 2029 Aufgaben mit menschlicher Expertise in kürzerer Zeit bewältigen könnten.
Keinotekoinen älykkyys paranee nopeasti ja voisi pian ottaa haltuunsa projektit, joita ihmiset tarvitsevat viikkojen ajan. Asiantuntija -analyysit osoittavat, että johtavat AI -mallit ovat käynnissä ja että ne voisivat selviytyä ihmisen asiantuntemuksesta lyhyemmässä ajassa vuoteen 2029 mennessä. (Symbolbild/natur.wiki)

AI ottaa pian haltuunsa hankkeet, jotka maksavat ihmisille viikkoja

; "https://www.nature.com/articles/d41586-025-00649-4" data-track-category = "Body Text Link"> Rapid ja olisi voinut sulkea aukon nopeamman kuin monet odotetut, johtavien mallien analyysin mukaan 1 .

voittoa tavoittelematon organisaatio Metreley, Kalifornia, kehitti melkein 170 todellista tehtävää ohjelmoinnin, tietoverkkoturvan, yleisen ajattelun ja mekaanisen oppimisen aloilla ja määritteli sitten "ihmisen peruslinjan" ottamalla aikaa, joka tarvitsi asiantuntijoita näiden tehtävien suorittamiseen.

Ryhmä kehitti sitten avainkuvan AI -mallit , jota kutsutaan" ajan tehtäviksi, aikahorisontiksi ". Tämä on aika, jolloin ohjelmoijien on tyypillisesti suorittaa tehtävät, voi tehdä AI -mallit tietyllä onnistumisasteella.

ARXIV: n tällä viikolla julkaistussa esipaineessa raportoi, että Openai julkaisi vuonna 2019 julkaiseman varhaisen suuren äänimallin (LLM) GPT-2: n epäonnistuneet kaikissa tehtävissä, että ihmisen asiantuntijat maksavat yli minuutin. Claude 3.7 Sonnet, jonka Yhdysvaltain startup-antropia julkaisi helmikuussa, suoritti 50 % tehtävistä, jotka ihmiset vievät 59 minuuttia.

Kaiken kaikkiaan 13 johtavan AI -mallin aikahorisontti on kaksinkertaistunut noin seitsemän kuukauden välein vuoden 2019 jälkeen, tutkimuksen mukaan. AI -aikahorisontin eksponentiaalinen kasvu kiihtyi vuonna 2024, ja uusimmat mallit kaksinkertaistavat horisontinsa joka kolmas kuukausi. Työtä ei ole vielä tutkittu virallisesti.

Edistyessä vuosina 2019 - 2024 Metr ehdottaa, että AI -mallit voivat hallita tehtäviä vuoteen 2029 mennessä, joita ihmiset tarvitsevat noin kuukauden, ja luotettavuus on 50 %, mahdollisesti jopa aikaisemmin.

Kuukausi sitoutunutta ihmisen asiantuntemusta voi olla riittävä uuden yrityksen perustamiseen tai tieteellisten löytöjen tekemiseen.

Kanadan Toronton yliopiston johtamisen professori Joshua Gans, joka kirjoitti AI: n taloudesta, selittää, että tällaiset ennusteet eivät ole erityisen hyödyllisiä. "Extrapoloinnit ovat houkuttelevia, mutta on vielä niin paljon, että emme tiedä kuinka AI: tä todella käytetään, jotta nämä ennusteet ovat järkeviä", hän sanoo.

ihmisen verrattuna ki

Ryhmä valitsi 50 %: n onnistumisprosentin, koska se oli vahvin verrattuna pieniin muutoksiin datan jakautumisessa. "Jos valitset erittäin alhaiset tai erittäin korkeat kynnysarvot, yhden onnistuneen tai epäonnistuneen tehtävän lisääminen tai poistaminen muuttaa arviota", selittää couthor Lawrence Chan.

Luotettavuuden kasvu 50 %: sta 80 %: iin vähensi keskimääräistä aikahorisonttia kertoimella viisi - vaikka yleinen kaksinkertaistumisaika ja trendilinja olivat samanlaisia.

Viimeisen viiden vuoden aikana Pääasiassa mittakaavan ohjaamat kasvavat-koulutustietojen määrää, koulutusaikaa ja malliparametrien lukumäärää. Artikkeli johtaa aikahorisontin avainhahmossa pääasiassa loogisen argumentin parannuksiin, työkalujen, virheenkorjauksen ja itseluottamisen käyttämiseen tehtävien toteuttamisessa.

Metr -lähestymistapa aikahorisontin arvioimiseksi käsittelee joitain olemassa olevien AI -vertailuarvojen rajoituksia, jotka vastaavat vain todellista työtä ja ovat nopeasti ”tyydyttyneitä” mallien parantuessa. Se tarjoaa jatkuvan, intuitiivisen toimenpiteen, joka paremman merkittävän edistymisen ajanjakson aikana Mitautor Ben West sanoo.

johtavat AI-mallit saavuttavat ylimääräisen suorituskyvyn monilla , mutta sillä on toistaiseksi ollut suhteellisen alhaisia ​​taloudellisia vaikutuksia.

Anton Troynikov, AI -tutkija ja yrittäjä San Franciscosta, Kalifornia, selittää, että AI: lla olisi suurempi taloudellinen vaikutus, jos organisaatiot olisivat paremmin valmiita kokeilemaan ja investoimaan mallien tehokkaaseen käyttöön.

    Ra

    kwa, T. et ai. Preprint at arxiv (2025).

    Lataa viitteet