DeepMind doseže prekretnicu u rješenju matematičkih problema - sljedeći veliki izazov za AI

DeepMind doseže prekretnicu u rješenju matematičkih problema - sljedeći veliki izazov za AI
Nakon što je Google DeepMind pobijedio ljude u svemu, od Igra idite na strateške igre na ploči ,
Sada tvrdi da je na rubu premlaćivanja najboljih studenata na svijetu prilikom rješavanja matematičkih zadataka.
London sa sjedištem u Londonu Strojno učenje Tvrtka je 25. srpnja objavila da su njegovi sustavi za umjetnu inteligenciju (KI) riješili četiri od šest zadataka koji su studentima na Međunarodnoj matematičkoj olimpijskoj igara (IMO) 2024 u Bathu, Velika Britanija. AI je pružio rigorozne, postupne dokaze, koji su procijenili dvije vrhunske matematike i postigao je ocjenu samo 28/42 točke samo iz područja zlatnih medalja.
"Očito je to vrlo važan napredak", kaže Joseph Myers, matematičar iz Cambridgea, Velika Britanija, koji je zajedno s medaljom Fields Tim Gowers provjerio rješenja i pomogao odabrati izvorne probleme za ovu godinu.
DeepMind i druge tvrtke su u utrci da na kraju pruže dokaze o strojevima, bitno Riješite istraživačka pitanja u matematici . Problemi s IMO -om, vodećom svjetskom konkurencijom za mlade matematičare, postali su mjerilo za napredak u smjeru ovog cilja i smatraju se "velikim izazovom" za strojno učenje, navodi tvrtka.
"Ovo je prvi put da je AI sustav uspio postići usluge na razini medalje", rekao je Pushmeet Kohli, potpredsjednik za AI u Science At DeepMind, u savjetovanju za tisak. "Ovo je važna prekretnica na putu za izgradnju progresivnih dokaza", rekao je Kohli.
Proširenje
prije samo nekoliko mjeseci, u siječnju, DeepMind System AlphaGeometry Services na razini medalja Prilikom rješavanja problema s IMO-om, naime u euklidskoj geometriji. Prvi AI koji radi na razini zlatne medalje za cjelokupna ispitivanja pitanja u algebri, kombinatorici i teoriji brojeva, koji se uglavnom smatraju zahtjevnijim od geometrije-ima pravo dobiti cijenu od 5 milijuna dolara, AI Math Olympiad nagradu (AIMO). (Cijena ima stroge kriterije poput otkrivanja izvornog koda i rada s ograničenom računalnom snagom, što znači da se trenutni napori DeepMind -a ne bi kvalificirali.)
U svom posljednjem pokušaju istraživači su koristili AlphageOmetry2 za rješavanje problema geometrije za manje od 20 sekundi; AI je poboljšana i brži verzija vašeg sustava zapisa, kaže stručnjak za računalo DeepMind Thang Luong.
Za ostale vrste pitanja, tim je razvio potpuno novi sustav nazvan AlphaProof. AlphaProof je riješio dva problema s algebrama u konkurenciji i jedan u teoriji brojeva, za koje je trajala tri dana. (Sudionici stvarnog IMO -a imaju dvije sesije od 4,5 sata.) Nije bilo u mogućnosti riješiti dva problema u kombinaciji, drugo područje matematike.

Istraživači su postigli mješovite rezultate kada odgovore na matematička pitanja s glasovnim modelima - vrstu sustava koji pokreću chatbote poput chatta. Ponekad modeli daju točan odgovor, ali ne mogu racionalno objasniti njihovo obrazloženje, a ponekad
Tek prošlog tjedna, tim softverskih tvrtki Numina i Humingface koristio je glasovni model za osvajanje intermedijarne amio 'cijene napretka' na temelju pojednostavljenih verzija IMO problema. Tvrtke su cijele svoje sustave učinile otvorenim kodom i učinile ga dostupnim za preuzimanje drugih istraživača. Ali pobjednici su rekli da priroda da samo jezični modeli vjerojatno ne bi bili dovoljni za rješavanje teških problema. AlphaProof kombinira glasovni model s tehnologijom jačanja učenja, koji je motor "Alphazero" za napadne igre poput GO kao i nekih Specifični matematički problemi . S povećanjem učenja, neuronska mreža uči kroz eksperimente i pogreške. To dobro funkcionira ako se njegovi odgovori mogu procijeniti pomoću objektivne skale. U tu svrhu, AlphaProof je bio osposoban za čitanje i pisanje dokaza na formalnom jeziku nazvanom Lean, koji se koristi u istoimenom softverskom paketu 'Assistant', koja je popularna kod matematičara. Zbog toga je AlphaProof testirao jesu li njegovi troškovi ispravni radeći ih u Lean paketu, što je pomoglo u popunjavanju nekih koraka u kodu. Obuka glasovnog modela zahtijeva ogromne količine podataka, ali samo je nekoliko matematičkih dokaza bilo dostupno na Lean. Kako bi prevladao ovaj problem, tim je razvio dodatnu mrežu koja je pokušala prevesti postojeće snimanje milijun problema koji su napisani prirodnim jezikom, ali bez prevođenja rješenja napisanih na Lean, kaže Thomas Hubert, istraživač učenika DeepMind Machine -a koji je proveo razvoj AlphaProof -a. "Možemo naučiti dokazati svoj pristup, čak i ako nismo izvorno obučeni o ljudskim dokazima?" (Tvrtka je bila slična Go, gdje je njegov AI naučio igrati igru igrajući protiv sebe, umjesto načina na koji to čine ljudi.) Mnogi od vitkih prijevoda nisu imali smisla, ali dovoljno su bili dovoljno dobri da AlphaProof dovedu do točke u kojoj bi mogao započeti sve veće cikluse učenja. Rezultati su bili puno bolji od očekivanog, rekao je Gowers na savjetovanju za tisak. "Mnogi problemi s IMO -om imaju ovo svojstvo čarobnog ključa. Problem prvo izgleda dok ne nađete čarobni ključ koji ga otvara", rekao je Gowers, koji radi u Collège de Franceu u Parizu. Činilo se da je u nekim slučajevima AlphaProof mogao poduzeti ovaj dodatni korak kreativnosti dajući mu ispravan korak od beskonačno velikog mogućeg rješenja. Ali potrebna je daljnja analiza kako bi se utvrdilo jesu li odgovori bili manje iznenađujući nego što su izgledali, dodali su se vrtovi. Sličan diskurs nastao je nakon iznenađenja 'Zug 37' , The DeepMinds Alphago-Bot u njegovom Poznata pobjeda u 2016. o najboljem svjetskom igraču Human Go-a -At Točka za KI. Ostaje za vidjeti mogu li se tehnike usavršiti na razini istraživanja matematike, rekao je Myers na pregledu Press. "Može li se proširiti na druge vrste matematike gdje se ne mogu osposobiti milijuni problema?" "Došli smo do točke u kojoj ne možete dokazati samo otvorene istraživačke probleme, već i probleme koji su vrlo izazovni za najbolje mlade matematičare na svijetu", rekao je specijalist za računalni računal DeepMind David Silver, koji je bio vodeći istraživač u razvoju Alphaga sredinom 2010. godine. Samo klasa
Čarobni ključ