Az AI hamarosan átveszi azokat a projekteket, amelyek hetekig vesznek igénybe az embereket

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

A mesterséges intelligencia gyorsan javul, és hamarosan olyan projekteket folytathat, amelyek hetekig tartanak az emberek befejezéséhez. A szakértői elemzés azt mutatja, hogy a vezető AI -modellek haladnak előre, és 2029 -ig kevesebb idő alatt elvégezhetik az emberi szakértelemmel kapcsolatos feladatokat.

Künstliche Intelligenz verbessert sich rasant und könnte bald Projekte übernehmen, für die Menschen Wochen benötigen. Expertenanalysen zeigen, dass führende KI-Modelle im Fortschritt sind und bis 2029 Aufgaben mit menschlicher Expertise in kürzerer Zeit bewältigen könnten.
A mesterséges intelligencia gyorsan javul, és hamarosan olyan projekteket folytathat, amelyek hetekig tartanak az emberek befejezéséhez. A szakértői elemzés azt mutatja, hogy a vezető AI -modellek haladnak előre, és 2029 -ig kevesebb idő alatt elvégezhetik az emberi szakértelemmel kapcsolatos feladatokat.

Az AI hamarosan átveszi azokat a projekteket, amelyek hetekig vesznek igénybe az embereket

A mai mesterséges intelligencia (AI) rendszerek nem tudják felülmúlni az embereket hosszú feladatokkal, de fejlődnek gyorsan tovább, és a vezető modellek elemzése szerint gyorsabban bezárhatják a rést, mint sokan várták 1 -

A kaliforniai székhelyű Berkeley nonprofit METR közel 170 valós feladatot fejlesztett ki a programozás, a kiberbiztonság, az általános érvelés és a gépi tanulás területén, majd létrehozott egy "emberi alapvonalat" azáltal, hogy megméri a szakértőknek az időt, hogy elvégezze a szakértőket.

A csapat ezután kifejlesztett egy mutatót a fejlődés előrehaladására AI modellek, amelyet „feladat befejezési időhorizontjának” hívnak. Ez az az idő, amelyre általában a programozók elvégzéséhez szükséges az AI modellek elvégzése egy bizonyos sikerrel.

Az ARXIV-ről ezen a héten közzétett Preprintben a Metr jelentése szerint a GPT-2, a 2019-ben kiadott korai nagy nyelvi modell (LLM) minden olyan feladatnál kudarcot vallott, amely több mint egy percet vett fel az emberi szakértőknek. A Claude 3.7 Sonnet, amelyet februárban adtak ki az USA Startup Antropic, a feladatok 50% -át teljesítette, amelyek 59 percet igényelnek.

Összességében a tanulmány szerint a 13 vezető AI modell időhorizontja 2019 óta körülbelül héthavonta megduplázódott. Az AI időhorizonok exponenciális növekedése 2024 -ben felgyorsult, a legújabb modellek körülbelül háromhavonta megduplázták a horizontot. A munkát még nem hivatalosan felülvizsgálták.

A 2019 -től 2024 -ig haladva a METR azt sugallja, hogy az AI modellek képesek lesznek elvégezni azokat a feladatokat, amelyek körülbelül egy hónapot igényelnek 2029 -ig 50% -os megbízhatósággal, talán még hamarabb.

A cikk szerint egy hónapos dedikált emberi szakértelem elegendő lehet egy új társaság alapításához vagy tudományos felfedezések készítéséhez.

Joshua Gans, a kanadai Torontói Egyetem menedzsment professzora, aki az AI közgazdaságtanáról írt, elmagyarázza, hogy az ilyen jóslatok nem különösebben hasznosak. "Az extrapolációk csábítóak, de még mindig annyira nem tudunk arról, hogy az AI -nek hogyan fogják használni ezeket az előrejelzéseket, hogy értelme legyen" - mondja.

Az emberek megítélése az AI -vel szemben

A csapat az 50% -os sikerességi rátát választotta, mert az a legmegfelelőbb volt az adatok eloszlásának kis változásaival kapcsolatban. "Ha nagyon alacsony vagy nagyon magas küszöbértékeket választ, akkor egyetlen sikeres vagy sikertelen feladat hozzáadása vagy eltávolítása nagymértékben megváltoztatja a becslést"-magyarázza Lawrence Chan társszerző.

A megbízhatóság 50% -ról 80% -ra történő növelése ötszor csökkentette az átlagos időhorizontot - annak ellenére, hogy az általános duplázási idő és a trendvonal hasonló volt.

Az elmúlt öt évben javításokat végeztek a Az LLMS általános készségei elsősorban a méretarány növekedése - az edzési adatok mennyisége, az edzési idő és a modellparaméterek száma. A papír az időhorizont metrikus fejlődésének előrehaladását a logikai érvelés, a szerszámhasználat, a hibajavítás és a feladatbizalom javításainak tulajdonítja.

A Metr megközelítése az időhorizontok értékelésére a meglévő AI referenciaértékek néhány korlátozását foglalkozik, amelyek csak lazán felelnek meg a valós munkáknak, és gyorsan "telítettek" a modellek javulásakor. Folyamatos, intuitív intézkedést biztosít, amely jobban megragadja a jelentős előrehaladást az idő múlásával-mondja Ben West társszerző.

A vezető AI modellek sokan elérik a férfias emberfeletti teljesítményt Referencia -tesztelés, de eddig viszonylag kevés gazdasági hatással volt - magyarázza West. A Metr legújabb kutatása részleges választ ad erre a rejtvényre: A legjobb modellek körülbelül 40 perces időkeretet mutatnak, és nincs sok gazdasági szempontból értékes munka, amelyet az ember abban az időben megtehet - mondta West.

Anton Troynikov, a kaliforniai San Francisco -i AI kutató és vállalkozó elmagyarázza, hogy az AI -nek nagyobb gazdasági hatása lenne, ha a szervezetek inkább hajlandóak kísérletezni és befektetni a modellek hatékony használatába.

  1. Kwa, T. et al. Előre nyomja az ARXIV -t https://doi.org/10.48550/arxiv.2503.14499 (2025).

Töltse le a referenciákat