DeepMind atinge o etapă în soluția problemelor matematice - următoarea mare provocare pentru AI

"Aflați cum Google DeepMind revoluționează lumea matematicii prin provocarea celor mai buni studenți din lume în rezolvarea problemelor matematice. Citiți mai multe despre progresul inovator și despre viitorul AI în matematică."
(Symbolbild/natur.wiki)

DeepMind atinge o etapă în soluția problemelor matematice - următoarea mare provocare pentru AI

după ce Google DeepMind a învins oamenii în toate, de la Joc Du-te la jocurile de bord de strategie ,
Acum pretinde că este pe punctul de a învinge cei mai buni studenți din lume atunci când rezolvă sarcinile de matematică.

The London bazat pe Londra Machine-Learning Compania a anunțat pe 25 iulie că sistemele sale de inteligență artificială (KI) au rezolvat patru dintre cele șase sarcini care au fost date studenților de la Olimpiada Internațională de Matematică (IMO) 2024 din Bath, Marea Britanie. AI a furnizat dovezi riguroase, treptate, care au fost evaluate de două matematice de top și au obținut un scor de 28/42 doar un punct din zona medaliei de aur.

"Este evident un progres foarte important", spune Joseph Myers, un matematician din Cambridge, Marea Britanie, care, împreună cu medalia Fields, Tim Gowers, a verificat soluțiile și au ajutat la selectarea problemelor originale pentru acest an.

DeepMind și alte companii sunt în cursă pentru a furniza în cele din urmă dovezi ale mașinilor, esențialul Rezolvați întrebări de cercetare în matematică . Problemele cu IMO, concurența mondială pentru tinerii matematicieni, au devenit un element de curte pentru progrese în direcția acestui obiectiv și sunt văzute ca o „mare provocare” pentru învățarea automată, potrivit companiei.

"Aceasta este prima dată când un sistem AI a reușit să obțină servicii la nivel de medalii", a declarat Pushmeet Kohli, vicepreședinte pentru AI în Știință la DeepMind, într -o consultație de presă. "Aceasta este o etapă importantă pe calea de a construi dovezi progresive", a spus Kohli.

Extensie

* Data-label = "https://www.nature.com/articles/d41586-024-00141-5" data-track-category = "link de text corp"> Servicii de alfageometrie la nivel de medalii Când rezolvați un tip de probleme IMO, și anume cele din geometria euclideană. Prima AI care funcționează la un nivel de medalie de aur pentru întrebările generale care includ testul în algebră, combinatorice și teoria numerelor, care sunt în general considerate mai solicitante decât geometria-are dreptul să obțină un preț de 5 milioane de dolari, Premiul Olimpiadei de matematică AI (AIMO). (Prețul are criterii stricte, cum ar fi dezvăluirea codului sursă și lucrările cu o putere de calcul limitată, ceea ce înseamnă că eforturile actuale ale DeepMind nu s -ar califica.)

În ultima lor încercare, cercetătorii au folosit alphageometry2 pentru a rezolva problema de geometrie în mai puțin de 20 de secunde; AI este o versiune îmbunătățită și mai rapidă a sistemului dvs. de înregistrări, spune specialistul de la DeepMind Computer Thang Luong.

Pentru celelalte tipuri de întrebări, echipa a dezvoltat un sistem complet nou numit Alphaproof. Alphaproof a rezolvat două probleme de algebră în competiție și una în teoria numerelor, pentru care a durat trei zile. (Participanții la IMO -ul real au două sesiuni de 4,5 ore fiecare.) Nu a putut rezolva cele două probleme în combinație, o altă zonă a matematicii.


apropiere a unei medalii de aur, câștigată la cea de-a 63-a olimpiadă internațională de matematică de către un participant român.

Cercetătorii au obținut rezultate mixte atunci când răspund la întrebări matematice cu modele vocale - tipul de sistem care conduce chatbots precum Chatt. Uneori, modelele dau răspunsul corect, dar nu pot explica raționamentul lor rațional, și alteori

Abia săptămâna trecută, o echipă de companii de software Numina și Huggingface au folosit un model vocal pentru a câștiga un „preț de progres” intermediar Amio, bazat pe versiuni simplificate ale problemelor IMO. Companiile au făcut ca întregul lor sisteme să fie deschis și l -au pus la dispoziție pentru descărcarea altor cercetători. Dar câștigătorii au spus Nature că modelele de limbă singure nu ar fi probabil suficiente pentru a rezolva probleme dificile.

doar clasa

alphaproof combină un model vocal cu tehnologia de consolidare a învățării, pe care motorul „alphazero” pentru jocuri de atac, cum ar fi, precum și unele Probleme matematice specifice . Odată cu creșterea învățării, o rețea neuronală învață prin experimente și erori. Acest lucru funcționează bine dacă răspunsurile sale pot fi evaluate folosind o scară obiectivă. În acest scop, Alphaproof a fost instruit să citească și să scrie dovezi într -un limbaj formal numit Lean, care este utilizat în pachetul software „Asistent de probă” cu același nume care este popular în rândul matematicienilor. Pentru aceasta, Alphaproof a testat dacă cheltuielile sale au fost corecte făcând -o în pachetul Lean, ceea ce a contribuit la completarea unora dintre pașii din cod.

Pregătirea unui model vocal necesită cantități masive de date, dar doar câteva dovezi matematice au fost disponibile în Lean. Pentru a depăși această problemă, echipa a dezvoltat o rețea suplimentară care a încercat să traducă o înregistrare existentă a unui milion de probleme care au fost scrise în limbaj natural, dar fără a traduce soluții scrise în Lean, spune Thomas Hubert, un cercetător de cursanți de la Deepmind Machine care a condus la dezvoltarea Alphaproof cu. "Putem învăța să ne dovedim abordarea, chiar dacă nu ne -am antrenat inițial pe dovezi scrise de oameni?" (Compania a fost similară cu Go, unde AI -ul său a învățat să joace jocul jucând împotriva ei înșiși, în loc de modul în care fac oamenii.)

cheie magică

Multe dintre traducerile slabe nu aveau sens, dar suficient au fost suficient de bune pentru a aduce alfaproof până la punctul în care ar putea începe ciclurile sale de învățare crescânde. Rezultatele au fost mult mai bune decât se aștepta, a spus Gowers la consultația de presă. "Multe probleme cu IMO au această proprietate a cheii magice. Problema arată mai întâi dificilă până când găsești o cheie magică care o deschide", a spus Gowers, care lucrează la Collège de France din Paris.

În unele cazuri, alfaproof părea să poată face acest pas suplimentar de creativitate, oferindu -i un pas corect dintr -o soluție posibilă infinit de mare. Dar este necesară o analiză suplimentară pentru a determina dacă răspunsurile au fost mai puțin surprinzătoare decât arătau, a adăugat Gowers. Un discurs similar a apărut după surprinzător 'zug 37' , DeepMinds alphago-bot la Faimoasă victorie în 2016 despre cel mai bun jucător al lumii din lume -Un punct de cotitură pentru KI.

rămâne de văzut dacă tehnicile pot fi perfecționate pentru a lucra la un nivel de cercetare în matematică, a spus Myers la revizuirea presei. "Se poate extinde la alte tipuri de matematică în care nu pot fi instruite milioane de probleme?"

"Am ajuns la punctul în care nu numai că puteți dovedi probleme de cercetare deschise, ci și probleme care sunt foarte dificile pentru cei mai buni tineri matematicieni din lume", a declarat David Silver, specialistul în calculatoare Deepmind, care a fost principalul cercetător în dezvoltarea Alphago la mijlocul anului 2010.