AI ottaa pian haltuunsa hankkeet, jotka vievät ihmisten viikkoja

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Keinotekoinen älykkyys paranee nopeasti ja voisi pian toteuttaa hankkeita, joiden toteuttaminen kestää ihmisiä viikkoja. Asiantuntija -analyysi osoittaa, että johtavat AI -mallit edistyvät ja voivat suorittaa tehtäviä ihmisen asiantuntemuksella vähemmän aikaa vuoteen 2029 mennessä.

Künstliche Intelligenz verbessert sich rasant und könnte bald Projekte übernehmen, für die Menschen Wochen benötigen. Expertenanalysen zeigen, dass führende KI-Modelle im Fortschritt sind und bis 2029 Aufgaben mit menschlicher Expertise in kürzerer Zeit bewältigen könnten.
Keinotekoinen älykkyys paranee nopeasti ja voisi pian toteuttaa hankkeita, joiden toteuttaminen kestää ihmisiä viikkoja. Asiantuntija -analyysi osoittaa, että johtavat AI -mallit edistyvät ja voivat suorittaa tehtäviä ihmisen asiantuntemuksella vähemmän aikaa vuoteen 2029 mennessä.

AI ottaa pian haltuunsa hankkeet, jotka vievät ihmisten viikkoja

Nykypäivän tekoälyn (AI) järjestelmät eivät voi ylittää ihmisiä pitkissä tehtävissä, mutta ne kehittyvät nopeasti edelleen ja voisi sulkea aukon nopeammin kuin monet odotettiin, johtavien mallien analyysin mukaan 1.

Kalifornian Berkeley, voittoa tavoittelematon pääkaupunki kehitti lähes 170 reaalimaailman tehtävää ohjelmoinnissa, kyberturvallisuudessa, yleisessä päättelyssä ja koneoppimisessa, ja perusti sitten "inhimillisen perustason" mittaamalla aika, jonka asiantuntijat kuluivat näiden tehtävien suorittamiseen.

Ryhmä kehitti sitten mittarin arvioidakseen AI -mallit, jota kutsutaan ”tehtävän valmistumisajan horisontiksi”. Tällä hetkellä ohjelmoijien tyypillisesti kuluu suorittamaan tehtävät, jotka AI -mallit voivat suorittaa tietyllä onnistumisasteella.

ARXIV: llä julkaistussa tällä viikolla julkaistussa esipaineessa Metr raportoi, että OpenAI: n vuonna 2019 julkaisema varhainen suuri kielimalli (LLM), joka on julkaissut, epäonnistui kaikissa tehtävissä, jotka veivät ihmisen asiantuntijoita yli minuutin. Claude 3.7 Sonnet, joka julkaisi helmikuussa Yhdysvaltain startup Antropicin, suoritti 50% tehtävistä, jotka vievät ihmisiä 59 minuuttia.

Kaiken kaikkiaan 13 johtavan AI -mallin aikahorisontti on kaksinkertaistunut noin seitsemän kuukauden välein vuoden 2019 jälkeen, tutkimuksen mukaan. AI -aikahorisontin eksponentiaalinen kasvu kiihtyi vuonna 2024, kun viimeisimmät mallit kaksinkertaistivat horisontinsa noin kolmen kuukauden välein. Työtä ei ole vielä tarkistettu virallisesti.

Metr viittaa eteenpäin vuosina 2019 - 2024, että AI -mallit pystyvät suorittamaan tehtäviä, jotka vievät ihmisiä noin kuukauden aikana 50%: n luotettavuudella vuoteen 2029 mennessä, ehkä jopa aikaisemmin.

Yksi kuukausi omistautuneesta inhimillisestä asiantuntemuksesta, paperi ehdottaa, että se voi olla tarpeeksi uuden yrityksen perustamiseen tai tieteellisten löytöjen tekemiseen.

Kanadan Toronton yliopiston johtamisen professori Joshua Gans, joka on kirjoittanut AI: n taloudesta, selittää, että tällaiset ennusteet eivät ole erityisen hyödyllisiä. "Extrapoloinnit ovat houkuttelevia, mutta vielä niin paljon emme tiedä, kuinka AI: tä todella käytetään näihin ennusteisiin järkeväksi", hän sanoo.

Ihmisten tuomitseminen verrattuna AI: hen

Ryhmä valitsi 50%: n onnistumisasteen, koska se oli vahvin pienille muutoksille tietojen jakautumisessa. "Jos valitset erittäin alhaiset tai erittäin korkeat kynnysarvot, yhden onnistuneen tai epäonnistuneen tehtävän lisääminen tai poistaminen vastaavasti, arvioi arvioi suuresti", selittää yhteiskirjailija Lawrence Chan.

Luotettavuus 50%: sta 80%: iin vähensi keskimääräistä aikahorisonttia kertoimella viidellä - vaikka yleinen kaksinkertaistumisaika ja trendilinja olivat samanlaisia.

Viimeisen viiden vuoden aikana on tehty parannuksia LLMS: n yleiset taidot Pääasiassa mittakaavan lisääntyminen - harjoitustietojen määrä, koulutusaika ja malliparametrien lukumäärä. Paperi määrittelee edistymisen aikahorisonttimetrissä pääasiassa loogisen päättelyn, työkalujen käytön, virheenkorjauksen ja tehtävän luottamuksen parannuksiin.

Metr: n lähestymistapa aikahorisontin arviointiin koskee joitain olemassa olevien AI-vertailuarvojen rajoituksia, jotka vastaavat vain löysästi reaalimaailmaa ja muuttuvat nopeasti "tyydyttyneiksi" mallien parantuessa. Se tarjoaa jatkuvan, intuitiivisen toimenpiteen, joka kuvaa paremmin merkittävää edistystä ajan myötä, sanoo avustaja Ben West.

Johtavat AI -mallit saavuttavat ylimääräisen inhimillisen suorituskyvyn monissa Vertailuarvo, mutta toistaiseksi on ollut suhteellisen vähän taloudellisia vaikutuksia, Länsi selittää. Metr: n viimeisin tutkimus tarjoaa osittaisen vastauksen tähän palapeliin: Parhaat mallit osoittavat noin 40 minuutin aikataulun, ja henkilö ei ole tuona aikana paljon taloudellisesti arvokasta työtä, West sanoi.

Kalifornian San Franciscon AI -tutkija ja yrittäjä Anton Troynikov selittää kuitenkin, että AI: lla olisi enemmän taloudellisia vaikutuksia, jos organisaatiot olisivat halukkaita kokeilemaan ja investoimaan mallien tehokkaasti.

  1. Kwa, T. et ai. Preprintt arxivissa https://doi.org/10.48550/arxiv.2503.14499 (2025).

Lataa viitteet