AI va prelua în curând proiecte care vor costa oamenii săptămâni

Künstliche Intelligenz verbessert sich rasant und könnte bald Projekte übernehmen, für die Menschen Wochen benötigen. Expertenanalysen zeigen, dass führende KI-Modelle im Fortschritt sind und bis 2029 Aufgaben mit menschlicher Expertise in kürzerer Zeit bewältigen könnten.
Inteligența artificială se îmbunătățește rapid și ar putea prelua în curând proiecte de care oamenii au nevoie de săptămâni întregi. Analizele de experți arată că modelele AI de frunte sunt în desfășurare și ar putea face față expertizei umane într -un timp mai scurt până în 2029. (Symbolbild/natur.wiki)

AI va prelua în curând proiecte care vor costa oamenii săptămâni

Sistemele actuale de inteligență artificială (AI) nu pot depăși oamenii pe sarcini lungi, cu toate acestea, Rapid and could have closed the gap faster than many expected, according to an analysis of leading models 1

Organizația non -profit Metrey, California, a dezvoltat aproape 170 de sarcini reale în domeniile programării, securității cibernetice, gândirii generale și învățării mecanice și apoi a determinat o „linie de bază umană”, luând timp care a avut nevoie de experți pentru a finaliza aceste sarcini.

Echipa a dezvoltat apoi o cifră cheie pentru evaluarea progresului AI Modele , care se numește" Tasks of Time, Time Horizon ". Acesta este momentul în care programatorii au de obicei nevoie pentru a finaliza sarcinile, pot face modelele AI cu o anumită rată de succes.

Într-un preprint publicat săptămâna aceasta în Arxiv relatează că GPT-2, un model de voce mare timpurie (LLM), publicat de OpenAI în 2019, a eșuat în toate sarcinile pe care le-au costat experții umani mai mult de un minut. Claude 3.7 Sonet, care a fost lansat de startul american antropic în februarie, a finalizat 50 % din sarcinile pe care oamenii le vor dura 59 de minute.

În general, orizontul de timp al celor 13 modele AI de frunte s -a dublat aproximativ la fiecare șapte luni din 2019, potrivit studiului. Creșterea exponențială a orizonturilor de timp AI s -a accelerat în 2024, cele mai noi modele își dublează orizonturile în jur de trei luni. Lucrarea nu a fost încă examinată formal.

În progresul din 2019 până în 2024, METR sugerează că modelele AI pot gestiona sarcinile până în 2029 de care oamenii au nevoie de aproximativ o lună, cu o fiabilitate de 50 %, posibil chiar mai devreme.

O lună de expertiză umană angajată, potrivit lucrării, poate fi suficientă pentru a începe o nouă companie sau pentru a face descoperiri științifice.

Joshua Gans, profesor de management la Universitatea din Toronto din Canada, care a scris despre economia AI, explică că astfel de predicții nu sunt deosebit de utile. „Extrapolările sunt ispititoare, dar mai sunt atât de multe încât nu știm cum este folosită AI, astfel încât aceste predicții să aibă sens”, spune el.

Evaluarea omului versus ki

Echipa a ales rata de succes de 50 %, deoarece a fost cea mai robustă în comparație cu modificările mici în distribuția datelor. „Dacă alegeți valori de prag foarte scăzute sau foarte mari, adăugând sau eliminând o singură sarcină de succes sau eșuată, schimbați estimarea în funcție de”, explică co -author Lawrence Chan.

O creștere a fiabilității de la 50 % la 80 % a redus orizontul mediu de timp cu un factor de cinci - deși timpul de dublare generală și linia de tendință au fost similare.

În ultimii cinci ani, îmbunătățirile Condus în principal de scară crește-cantitatea de date de instruire, timpul de instruire și numărul de parametri ai modelului. Lucrarea conduce progresul în cifra cheie a orizontului de timp, în principal la îmbunătățirea argumentului logic, utilizarea instrumentelor, corectarea erorilor și confidența de sine în îndeplinirea sarcinilor.

Abordarea METR pentru evaluarea orizontului de timp abordează unele dintre restricțiile de referințe AI existente, care se potrivesc doar cu munca reală și sunt rapid „saturate” atunci când modelele se îmbunătățesc. Oferă o măsură continuă, intuitivă, care înregistrează mai bine progresele semnificative pe o perioadă mai lungă de timp, spune Mitautor Ben West.

modele AI de frunte obțin performanțe supraumane la multe Anton Troynikov, un cercetător și antreprenor AI din San Francisco, California, explică că AI ar avea o influență economică mai mare dacă organizațiile ar fi mai bine dispuse să experimenteze și să investească în utilizarea eficientă a modelelor.

  1. kwa, T. și colab. Preprint la arxiv >>>> https://doi.org/10.48550/arxiv.2503.14499 (2025).

  2. Descărcați referințe