AI võtab peagi üle projektid, mis maksavad inimestele nädalaid

AI võtab peagi üle projektid, mis maksavad inimestele nädalaid
Praegused tehisintellekti (AI) süsteemid ei tohi pikkadel ülesannetel inimesi ületada, kiire ja oleks võinud lüngad kiiremini sulgeda, kui paljud arvatakse, vastavalt juhtivate mudelite analüüsile 1 .
Mittetulundusühing Metreley, Californias, töötas välja programmeerimise, küberturvalisuse, üldise mõtlemise ja mehaanilise õppimise valdkonnas peaaegu 170 tegelikku ülesannet ning määras seejärel "inimpsisejoone", võttes aega, mis vajas eksperte nende ülesannete täitmiseks.
Seejärel töötas meeskond välja võtmenumbri AI mudelid , mida nimetatakse "ajaülesanneteks, ajahorisondiks". See on aeg, mida programmeerijad tavaliselt vajavad ülesandeid täitma, saavad AI -mudelid teatud edukuse määraga teha.
ARXIV-is sel nädalal avaldatud eeltrükis teatas, et OpenAi 2019. aastal avaldanud varajase suure häälemudel (LLM) GPT-2 ebaõnnestus kõigis ülesannetes, mida inimeksperdid maksavad rohkem kui minut. Claude 3.7 Sonnet, mille USA iduprooviantropic vabastas veebruaris, täitis 50 % ülesannetest, mille inimesed võtaksid 59 minutit.
Üldiselt on uuringu kohaselt 13 juhtiva AI mudeli ajahorisont kahekordistunud umbes iga seitsme kuu tagant. AI ajahorisondi eksponentsiaalne kasv kiirenes 2024. aastal, viimased mudelid kahekordistasid silmaringi iga kolme kuu tagant. Teos pole veel ametlikult uuritud.
Aastatel 2019–2024 soovitab METR, et AI -mudelid saavad 2029. aastaks ülesandeid hallata, mida inimesed vajavad umbes kuu aega, usaldusväärsusega 50 %, mis võib -olla isegi varem.
Kuu pühendunud inimteadmised võivad paberi kohaselt olla piisavad uue ettevõtte asutamiseks või teaduslike avastuste tegemiseks.
Kanada Toronto ülikooli juhtimisprofessorJoshua Gans, kes kirjutas AI majandusest, selgitab, et sellised ennustused pole eriti kasulikud. "Ekstraheerimised on ahvatlevad, kuid neid on veel nii palju, et me ei tea, kuidas AI tegelikult kasutatakse, nii et need ennustused oleksid mõistlikud," ütleb ta.
inimese versus ki
hindamineMeeskond valis edukuse 50 %, kuna see oli kõige tugevam võrreldes andmete jaotuse väikeste muutustega. "Kui valite väga madalad või väga kõrged läviväärtused, muutke üksiku eduka või ebaõnnestunud ülesande lisamine või eemaldamine hinnangu kohaselt," selgitab Co -autor Lawrence Chan.
Usaldusväärsuse suurenemine 50 % -lt 80 % -ni vähendas keskmist ajahorisondi koefitsiendiga - ehkki üldine kahekordistumisaeg ja trendijoon olid sarnased.
Viimase viie aasta jooksul parandused , kuid on seni olnud suhteliselt madal, selgitab West'i uusimat uuringut.
Californias San Francisco AI teadlane ja ettevõtja Anton Troynikov selgitab, et AI -l oleks suurem majanduslik mõju, kui organisatsioonid oleksid paremini nõus katsetama ja investeerima mudelite tõhusaks kasutamiseks. kwa, T. et al. Eeltööd arxivis Laadige alla viited