Deepmind doseže mejnik v rešitvi matematičnih problemov - naslednji velik izziv za AI

Deepmind doseže mejnik v rešitvi matematičnih problemov - naslednji velik izziv za AI
Potem ko je Google Deepmind premagal ljudi v vsem, od Igra pojdite na strategijske igre ,
Zdaj trdi, da je na robu, da bi pri reševanju matematičnih nalog premagali najboljše študente na svetu.
Londonski osnovi strojno učenje Podjetje je 25. julija objavilo, da so njegovi sistemi umetne inteligence (Ki) rešili štiri od šestih nalog, ki so jih študentje dali na Mednarodni matematični olimpijki (IMO) 2024 v Bathu, Velika Britanija. AI je predložil stroge, postopne dokaze, ki sta jih ovrednotili z dvema vrhunskima matematiko in dosegli oceno samo 28/42, ki je bila samo iz območja zlatih medalj.
"To je očitno zelo pomemben napredek," pravi Joseph Myers, matematik iz Cambridgea v Veliki Britaniji, ki je skupaj s poljskimi odličjem Timom Gowersom preveril rešitve in pomagal pri izbiri izvirnih težav za letošnje leto.
Deepmind in druga podjetja so na dirki, da na koncu predložijo dokaze o strojih, bistveni Rešite raziskovalna vprašanja v matematiki . Težave z IMO, vodilnim tekmovanjem na svetu za mlade matematike, so postale merca za napredek v smeri tega cilja in jih vidijo kot "velik izziv" za strojno učenje, poroča podjetje.
"To je prvič, da je sistem AI uspel doseči storitve na ravni medalj," je v posvetu za tisk dejal Pushmeet Kohli, podpredsednik AI v Science v Deepmind. "To je pomemben mejnik na poti do oblikovanja progresivnih dokazov," je dejal Kohli.
razširitev
Šele nekaj mesecev, januarja, sistem DeepMind STORITVE ALPHAGEOMETRY na ravni medalj Pri reševanju vrste imo težav, in sicer tistih v evclidski geometriji. Prvi AI, ki deluje na ravni zlate medalje za celotna vprašanja, ki vključujejo preizkus v algebri, kombinatoriki in teoriji števila, ki se na splošno štejejo za zahtevnejše od geometrije-IS, da dobijo ceno 5 milijonov dolarjev, nagrada AI matematične olimpiade (AIMO). (Cena ima stroga merila, kot sta razkritje izvorne kode in delo z omejeno računalniško močjo, kar pomeni, da trenutna prizadevanja DeepMinda ne bi bila kvalificirana.)
V zadnjem poskusu so raziskovalci uporabili Alphageometry2 za reševanje problema geometrije v manj kot 20 sekundah; AI je izboljšana in hitrejša različica vašega sistema zapisov, pravi strokovnjak za računalniški računalniki Deepmind Thang Luong.
Za druge vrste vprašanj je ekipa razvila popolnoma nov sistem, imenovan Alphaproof. Alphaproof je v konkurenci rešil dva problema algebre in eno v teoriji števil, za katero je trajalo tri dni. (Udeleženci dejanskega IMO imajo po dve seji 4,5 ure.) O dveh težavah ni bilo mogoče rešiti v kombinaciji, drugem področju matematike.

Raziskovalci so dosegli mešane rezultate, ko odgovarjajo na matematična vprašanja z glasovnimi modeli - vrsto sistema, ki poganja klepetalnice, kot je Chatt. Včasih modeli dajo pravilen odgovor, vendar ne morejo racionalno razložiti njihovega sklepanja, včasih pa > "
Šele prejšnji teden sta ekipa programskih podjetij Numina in Huggingface uporabila glasovni model za osvojitev vmesnega Amio "cena napredka" na podlagi poenostavljenih različic težav z IMO. Podjetja so celotne sisteme dala odprtokodno in dala na voljo za prenos drugih raziskovalcev. Toda zmagovalci so rekli Nature , da samo jezikovni modeli verjetno ne bi bili dovolj za reševanje težkih težav. Alphaproof združuje glasovni model s tehnologijo ojačanja učenja, ki ga je "Alphazero" motor za napadalne igre, kot so tudi nekaj Specifični matematični problemi . Z vse večjim učenjem se nevronska mreža uči s poskusi in napakami. To dobro deluje, če lahko njegove odgovore ocenimo z objektivno lestvico. V ta namen je bil Alphaproof usposobljen za branje in pisanje dokazov v formalnem jeziku, imenovanem Lean, ki se uporablja v istoimenskem programskem paketu "Proof Assistant", ki je priljubljen pri matematikih. Za to je Alphaproof preizkusil, ali so bili njegovi stroški pravilni, tako da so jih naredili v paketu Lean, ki je pomagal izpolniti nekatere korake v kodi. Usposabljanje glasovnega modela zahteva ogromno podatkov, vendar je bilo na voljo le nekaj matematičnih dokazov. Da bi premagala to težavo, je ekipa razvila dodatno mrežo, ki je poskušala prevesti obstoječi posnetek milijon težav, ki so bili napisani v naravnem jeziku, vendar brez prevajanja rešitev, napisanih v vitko, pravi Thomas Hubert, raziskovalec učenja Deepmind Machine, ki je z njo izvedel razvoj alfaproofa. "Lahko se naučimo dokazati svoj pristop, tudi če nismo prvotno usposobili za človeške napisane dokaze?" (Družba je bila podobna Go, kjer se je njegov AI naučil igrati z igranjem proti sebi, namesto na način, kako to počne
Številni vitki prevodi niso imeli smisla, vendar je bilo dovolj dobro, da je alfaproof pripeljal do točke, ko bi lahko začel svoje naraščajoče učne cikle. Rezultati so bili veliko boljši od pričakovanj, so na posvetu za tisk povedali Gowers. "Številne težave z IMO imajo to lastnost čarobnega ključa. Težava najprej izgleda težko, dokler ne najdete čarobnega ključa, ki ga odpre," je dejal Gowers, ki dela v Collège de France v Parizu. V nekaterih primerih se je zdelo, da je Alphaproof lahko izvedel ta dodatni korak ustvarjalnosti, tako da mu je dal pravilen korak iz neskončno velike možne rešitve. Toda potrebna je nadaljnja analiza, da se ugotovi, ali so bili odgovori manj presenetljivi, kot so bili videti, so dodali Gowers. Podoben diskurz se je pojavil po presenetljivem 'Zug 37' , the Deepminds Alphago-Bot at his Znana zmaga v letu 2016 o najboljšem svetovnem igralcu človeške poti -A prelomnico za Ki. Še ni treba ugotoviti, ali je mogoče tehnike izpopolniti, da delujejo na ravni raziskav matematike, je dejal Myers v pregledu tiska. "Ali se lahko razširi na druge vrste matematike, kjer ni mogoče usposobiti milijonov težav?" "Dosegli smo točko, ko ne morete samo dokazati odprtih raziskovalnih težav, ampak tudi težave, ki so zelo zahtevne za najboljše mlade matematike na svetu," je dejal strokovnjak za računalniški računalnik David Silver, ki je bil sredi leta 2010 vodilni raziskovalec v razvoju Alphaga. samo razred
čarobni ključ