Pēc tam, kad Google DeepMind uzvarēja cilvēkus it visā, sākot no Spēlēt Iet uz stratēģijas galda spēlēm,
tagad tā apgalvo, ka ir uz robežas, lai pārspētu pasaules labākos skolēnus matemātikas uzdevumu risināšanā.
Londonā bāzētais Mašīnmācība Uzņēmums 25. jūlijā paziņoja, ka tā mākslīgā intelekta (AI) sistēmas atrisināja četras no sešām problēmām, kas skolēniem tika dotas 2024. gada Starptautiskajā matemātikas olimpiādē (IMO) Bātā, Apvienotajā Karalistē. AI sniedza stingrus, soli pa solim pierādījumus, kurus novērtēja divi labākie matemātiķi un sasniedza punktu skaitu 28/42 – tikai vienu punktu no zelta medaļas teritorijas.
"Tas acīmredzami ir ļoti nozīmīgs progress," saka Džozefs Maierss, matemātiķis no Kembridžas, Apvienotās Karalistes, kurš kopā ar Fields medaļnieku Timu Gowersu izskatīja risinājumus un palīdzēja atlasīt sākotnējās problēmas šī gada SJO.
DeepMind un citi uzņēmumi sacenšas, lai galu galā nodrošinātu iekārtām svarīgus pierādījumus Risināt pētnieciskos jautājumus matemātikā. Problēmas, kas tika prezentētas SJO, pasaules vadošajā jauno matemātiķu konkursā, ir kļuvušas par etalonu virzībai uz šo mērķi un tiek uzskatītas par "lielu izaicinājumu" mašīnmācībai, sacīja uzņēmums.
"Šī ir pirmā reize, kad AI sistēma ir sasniegusi medaļu līmeņa veiktspēju," preses brīfingā sacīja Pušmīts Kolli, DeepMind MI viceprezidents zinātnē. "Tas ir svarīgs pavērsiens progresīvu pierādījumu izmeklētāju veidošanā," sacīja Kolli.
Pagarinājums
Tikai pirms dažiem mēnešiem, janvārī, DeepMind sistēma AlphaGeometry medaļu līmeņa sasniegumi sasniegts, risinot viena veida SJO problēmas, proti, Eiklīda ģeometrijas problēmas. Pirmais mākslīgais intelekts, kas uzstāsies zelta medaļas līmenī vispārējā testā, tostarp algebras, kombinatorikas un skaitļu teorijas jautājumus, kas parasti tiek uzskatīti par grūtākiem nekā ģeometrija, būs tiesīgs saņemt 5 miljonu ASV dolāru balvu, AI matemātikas olimpiādes balvu (AIMO). (Balvai ir stingri kritēriji, piemēram, pirmkoda atklāšana un darbs ar ierobežotu skaitļošanas jaudu, kas nozīmē, ka DeepMind pašreizējie centieni nebūtu kvalificējami.)
Savā jaunākajā mēģinājumā pētnieki izmantoja AlphaGeometry2, lai atrisinātu ģeometrijas problēmu mazāk nekā 20 sekundēs; AI ir uzlabota un ātrāka viņu ierakstu sistēmas versija, saka DeepMind datoru speciālists Thangs Luongs.
Cita veida jautājumiem komanda izstrādāja pilnīgi jaunu sistēmu ar nosaukumu AlphaProof. AlphaProof konkursā atrisināja divus algebras uzdevumus un vienu skaitļu teorijā, kas aizņēma trīs dienas. (Faktiskās IMO dalībniekiem ir divas sesijas, katra pa 4,5 stundām.) Tā nespēja atrisināt abas problēmas kombinatorikā, citā matemātikas jomā.

Pētniekiem ir bijuši dažādi rezultāti, atbildot uz matemātiskiem jautājumiem, izmantojot valodu modeļus — tādas sistēmas, kuras darbina tērzēšanas robotus, piemēram, ChatGPT. Dažreiz modeļi sniedz pareizo atbildi, bet nevar racionāli izskaidrot savu argumentāciju, un dažreiz viņi izpļāpā muļķības.
Pagājušajā nedēļā programmatūras uzņēmumu Numina un HuggingFace pētnieku komanda izmantoja valodas modeli, lai iegūtu starpposma AMIO “progresa balvu”, kuras pamatā ir IMO problēmu vienkāršotas versijas. Uzņēmumi ir padarījuši visas savas sistēmas atvērtā pirmkoda un padarījušas tās pieejamas citiem pētniekiem, lai tās varētu lejupielādēt. Bet uzvarētāji teicaDaba, ka ar valodu modeļiem vien, iespējams, nepietiktu grūtāku problēmu risināšanai.
Tikai klase
AlphaProof apvieno valodas modeli ar pastiprināšanas mācību tehnoloģiju, kas izmanto “AlphaZero” dzinēju, ko uzņēmums ir veiksmīgi izmantojis uzbrukuma spēlēm, piemēram, Go un dažām specifiskas matemātiskas problēmas lietots. Pastiprināšanas mācībās neironu tīkls mācās, izmantojot izmēģinājumus un kļūdas. Tas darbojas labi, ja viņa atbildes var novērtēt, izmantojot objektīvu standartu. Šim nolūkam AlphaProof tika apmācīts lasīt un rakstīt pierādījumus formālā valodā ar nosaukumu Lean, kas tiek izmantota matemātiķu iecienītajā programmatūras pakotnē Proof Assistant ar tādu pašu nosaukumu. Lai to izdarītu, AlphaProof pārbaudīja, vai tā izvadi ir pareizi, palaižot tos Lean pakotnē, kas palīdzēja izpildīt dažas koda darbības.
Valodas modeļa apmācībai ir nepieciešams milzīgs datu apjoms, taču Lean bija pieejams maz matemātisku pierādījumu. Lai pārvarētu šo problēmu, komanda izstrādāja papildu tīklu, kas mēģināja pārtulkot jau esošo miljonu problēmu ierakstu, kas rakstīts dabiskā valodā, bet bez cilvēka rakstītiem risinājumiem, Lean, saka Tomass Hūberts, DeepMind mašīnmācīšanās pētnieks, kurš bija AlphaProof izstrādes līdzdalībnieks. "Mūsu pieeja bija tāda, vai mēs varam iemācīties pierādīt pat tad, ja sākotnēji nemācījāmies uz cilvēku rakstītiem pierādījumiem?" (Uzņēmums izmantoja līdzīgu pieeju Go, kur tā AI iemācījās spēlēt spēli, spēlējot pret sevi, nevis no tā, kā cilvēki to dara.)
Burvju atslēgas
Daudziem Lean tulkojumiem nebija jēgas, taču tie bija pietiekami labi, lai AlphaProof sasniegtu punktu, kurā tas varētu sākt pastiprināšanas mācību ciklus. Rezultāti bija daudz labāki, nekā gaidīts, preses brīfingā sacīja Govers. "Daudzām problēmām SJO ir šī burvju atslēgas īpašība. Problēma sākotnēji šķiet sarežģīta, līdz atrodat burvju atslēgu, kas to atver," sacīja Goverss, kurš strādā Parīzes koledžā (Collège de France).
Dažos gadījumos AlphaProof, šķiet, spēj nodrošināt šo papildu radošuma pakāpi, nodrošinot vienu pareizu soli no bezgala liela iespējamā risinājuma. Bet ir nepieciešama turpmāka analīze, lai noteiktu, vai atbildes bija mazāk pārsteidzošas, nekā šķita, piebilda Gowers. Līdzīgs diskurss parādījās pēc pārsteidzošā "Vilciens 37", DeepMinds AlphaGo robots pie viņa slavenā 2016. gada uzvara pār pasaulē labāko cilvēku Go spēlētāju padarīts – pagrieziena punkts AI.
Tas, vai metodes var pilnveidot, lai strādātu matemātikas pētniecības līmenī, vēl ir redzams, preses brīfingā sacīja Maierss. "Vai to var paplašināt, iekļaujot citus matemātikas veidus, kuros, iespējams, nav apmācītu miljoniem problēmu?"
"Mēs esam tajā brīdī, kad viņi var pierādīt ne tikai atklātas pētniecības problēmas, bet arī problēmas, kas ir ļoti sarežģītas pašiem labākajiem jaunajiem matemātiķiem pasaulē," sacīja DeepMind datoru speciālists Deivids Silvers, kurš 2010. gadu vidū bija vadošais pētnieks, kas izstrādāja AlphaGo.
