Το AI θα αναλάβει σύντομα έργα που θα κοστίζουν εβδομάδες των ανθρώπων

Künstliche Intelligenz verbessert sich rasant und könnte bald Projekte übernehmen, für die Menschen Wochen benötigen. Expertenanalysen zeigen, dass führende KI-Modelle im Fortschritt sind und bis 2029 Aufgaben mit menschlicher Expertise in kürzerer Zeit bewältigen könnten.
Η τεχνητή νοημοσύνη βελτιώνεται γρήγορα και σύντομα θα μπορούσε να αναλάβει έργα που χρειάζονται οι άνθρωποι για εβδομάδες. Οι αναλύσεις εμπειρογνωμόνων δείχνουν ότι τα κορυφαία μοντέλα AI βρίσκονται σε εξέλιξη και θα μπορούσαν να αντιμετωπίσουν την ανθρώπινη εμπειρογνωμοσύνη σε μικρότερο χρονικό διάστημα μέχρι το 2029. (Symbolbild/natur.wiki)

Το AI θα αναλάβει σύντομα έργα που θα κοστίζουν εβδομάδες των ανθρώπων

Τα τρέχοντα συστήματα της τεχνητής νοημοσύνης (AI) δεν μπορούν να υπερβούν τους ανθρώπους σε μακρά καθήκοντα, ωστόσο, Rapid "Αναφορές"> 1

Ο μη κερδοσκοπικός οργανισμός Metreley, Καλιφόρνια, ανέπτυξε σχεδόν 170 πραγματικά καθήκοντα στους τομείς του προγραμματισμού, της ασφάλειας στον κυβερνοχώρο, της γενικής σκέψης και της μηχανικής μάθησης και στη συνέχεια καθόρισε μια «ανθρώπινη γραμμή βάσης» λαμβάνοντας χρόνο που χρειάζονταν τους εμπειρογνώμονες για να ολοκληρώσουν αυτά τα καθήκοντα.

Η ομάδα τότε ανέπτυξε ένα βασικό σχήμα για την αξιολόγηση της προόδου του μοντέλα AI , τα οποία ονομάζονται" εργασίες του χρόνου, του χρονικού ορίζοντα ". Αυτός είναι ο χρόνος που οι προγραμματιστές συνήθως πρέπει να ολοκληρώσουν τις εργασίες, μπορούν να κάνουν τα μοντέλα AI με ένα συγκεκριμένο ποσοστό επιτυχίας.

Σε ένα preprint που δημοσιεύθηκε αυτή την εβδομάδα στο ARXIV αναφέρει ότι το GPT-2, ένα πρώιμο μεγάλο φωνητικό μοντέλο (LLM), το οποίο δημοσιεύθηκε από την OpenAI το 2019, απέτυχε σε όλα τα καθήκοντα ότι οι ανθρώπινοι εμπειρογνώμονες κοστίζουν περισσότερο από ένα λεπτό. Ο Claude 3,7 Sonnet, το οποίο απελευθερώθηκε από τον αμερικανικό start-up Anthropic τον Φεβρουάριο, ολοκλήρωσε το 50 % των καθηκόντων που οι άνθρωποι θα διαρκέσουν 59 λεπτά.

Συνολικά, ο χρονικός ορίζοντας των 13 μοντέλων AI έχει διπλασιαστεί περίπου κάθε επτά μήνες από το 2019, σύμφωνα με τη μελέτη. Η εκθετική ανάπτυξη των χρονικών ορίζοντων AI επιταχύνθηκε το 2024, με τα τελευταία μοντέλα να διπλασιάσουν τους ορίζοντές τους γύρω από κάθε τρεις μήνες. Το έργο δεν έχει ακόμη εξεταστεί επισήμως.

Στην πρόοδο από το 2019 έως το 2024, η METR υποδηλώνει ότι τα μοντέλα AI μπορούν να διαχειριστούν τα καθήκοντα μέχρι το 2029 ότι οι άνθρωποι χρειάζονται περίπου ένα μήνα, με αξιοπιστία 50 %, ενδεχομένως ακόμη και νωρίτερα.

Ένας μήνας αφοσιωμένης ανθρώπινης εμπειρογνωμοσύνης, σύμφωνα με το έγγραφο, μπορεί να είναι αρκετό για να ξεκινήσει μια νέα εταιρεία ή να κάνει επιστημονικές ανακαλύψεις.

Ο Joshua Gans, καθηγητής διοίκησης στο Πανεπιστήμιο του Τορόντο στον Καναδά, ο οποίος έγραψε για την οικονομία του AI, εξηγεί ότι τέτοιες προβλέψεις δεν είναι ιδιαίτερα χρήσιμες. "Οι παρεκτάσεις είναι δελεαστικές, αλλά εξακολουθούν να υπάρχουν τόσα πολλά που δεν ξέρουμε πώς χρησιμοποιείται στην πραγματικότητα το AI έτσι ώστε αυτές οι προβλέψεις να έχουν νόημα", λέει.

Αξιολόγηση του ανθρώπινου έναντι Ki

Η ομάδα επέλεξε το ποσοστό επιτυχίας του 50 %, επειδή ήταν πολύ ισχυρή σε σύγκριση με τις μικρές αλλαγές στη διανομή δεδομένων. "Εάν επιλέξετε πολύ χαμηλές ή πολύ υψηλές τιμές κατωφλίου, προσθέτοντας ή αφαιρώντας μια ενιαία επιτυχημένη ή αποτυχημένη μεταβολή της εργασίας, αλλάξτε την εκτίμηση σύμφωνα με", εξηγεί ο συν -συγγραφέας Lawrence Chan.

Η αύξηση της αξιοπιστίας από 50 % σε 80 % μείωσε τον μέσο χρονικό ορίζοντα κατά πέντε - αν και ο γενικός χρόνος διπλασιασμού και η γραμμή τάσης ήταν παρόμοια.

Τα τελευταία πέντε χρόνια, οι βελτιώσεις του Κυρίως οδηγείται από την κλίμακα αυξάνεται-το ποσό των δεδομένων κατάρτισης, του χρόνου κατάρτισης και του αριθμού των παραμέτρων μοντέλου. Το έγγραφο οδηγεί στην πρόοδο στο βασικό σχήμα του χρονικού ορίζοντα κυρίως σε βελτιώσεις στο λογικό επιχείρημα, στη χρήση εργαλείων, στη διόρθωση σφαλμάτων και στην αυτοπεποίθηση στην εκπλήρωση των καθηκόντων.

Η προσέγγιση METR για την αξιολόγηση του χρονικού ορίζοντα αντιμετωπίζει μερικούς από τους περιορισμούς των υφιστάμενων σημείων αναφοράς AI, τα οποία ταιριάζουν μόνο με το πραγματικό έργο και είναι γρήγορα "κορεσμένα" όταν βελτιώνονται τα μοντέλα. Προσφέρει ένα συνεχές, διαισθητικό μέτρο που καταγράφει καλύτερα σημαντική πρόοδο για μεγαλύτερο χρονικό διάστημα, λέει ο Mitautor Ben West.

Τα πρωτοποριακά μοντέλα AI επιτυγχάνουν την απόδοση υπεράνθρωπων σε πολλές Ο Anton Troynikov, ερευνητής και επιχειρηματίας AI από το Σαν Φρανσίσκο της Καλιφόρνια, εξηγεί ότι η AI θα είχε μεγαλύτερη οικονομική επιρροή εάν οι οργανισμοί ήταν καλύτερα πρόθυμοι να πειραματιστούν και να επενδύσουν στην αποτελεσματική χρήση των μοντέλων.

  1. >

    kwa, Τ. et al. Preprint στο arxiv (2025).

  2. "https://citation-needr.springer.com/v2/references/1038/d41586-025-00831-8?format=refman&flavour=references "> Λήψη αναφορών