DeepMind sasniedz pavērsienu matemātisko problēmu risināšanā - nākamais lielais izaicinājums AI

"Uzziniet, kā Google Deepmind revolucionizē matemātikas pasauli, izaicinot labākos pasaules studentus matemātisko problēmu risināšanā. Lasiet vairāk par revolucionāro progresu un AI nākotni matemātikā."
(Symbolbild/natur.wiki)

DeepMind sasniedz pavērsienu matemātisko problēmu risināšanā - nākamais lielais izaicinājums AI

Pēc tam, kad Google Deepmind pieveica cilvēkus visā, no Spēle Pāriet uz stratēģijas galda spēlēm ,
Tagad apgalvo, ka, risinot matemātikas uzdevumus, ir uz pasaules labāko studentu pārspēšanas robežas.

Londonā bāzēts Mašīnmācība Uzņēmums 25. jūlijā paziņoja, ka viņa mākslīgā intelekta (KI) sistēmas ir atrisinājušas četrus no sešiem uzdevumiem, kas tika doti studentiem Starptautiskajā matemātikas olimpiādē (SJO) 2024 Bathā, Lielbritānijā. AI sniedza stingrus, pakāpeniskus pierādījumus, kurus novērtēja divas labākās matemātikas un ieguva rezultātu tikai 28/42 vienā punktā no zelta medaļu zonas.

"Tas acīmredzami ir ļoti svarīgs progress," saka Džozefs Myers, matemātiķis no Kembridžas, Lielbritānijas, kurš kopā ar lauku medaļnieku Timu Gowers pārbaudīja risinājumus un palīdzēja izvēlēties sākotnējās problēmas šogad.

Deepmind un citi uzņēmumi ir sacensībās, lai galu galā sniegtu pierādījumus par mašīnām, kas ir Essential Atrisiniet pētniecības jautājumus matemātikā . Problēmas ar SJO, pasaules vadošo konkurenci jaunajiem matemātiķiem, ir kļuvušas par progresu šī mērķa virzienā un tiek uzskatītas par “lielu izaicinājumu” mašīnu apguvei, norāda uzņēmums.

"Šī ir pirmā reize, kad AI sistēma spēja sasniegt pakalpojumus medaļu līmenī," preses konsultācijā sacīja Pushmeet Kohli, AI zinātnes viceprezidents Deepmind. "Šis ir svarīgs pagrieziena punkts ceļā uz progresīvu pierādījumu veidošanu," sacīja Kohli.

paplašinājums

Tikai pirms dažiem mēnešiem, janvārī, DeepMind sistēma Alfageometrijas pakalpojumi medaļu līmenī Atrisinot IMO problēmu tipu, proti, tie, kas atrodas Eiklīdiešu ģeometrijā. Pirmais AI, kas darbojas zelta medaļu līmenī, lai vispārīgi pārbaudītu jautājumus algebrā, kombinatorika un skaitļu teorija, kas parasti tiek uzskatīta par prasīgāku nekā ģeometrija, ir tiesības iegūt cenu USD 5 miljonu apmērā, AI matemātikas olimpiādes balvu (AIMO). (Cenai ir stingri kritēriji, piemēram, avota koda atklāšana un darbs ar ierobežotu skaitļošanas jaudu, kas nozīmē, ka pašreizējie DeepMind centieni nebūtu kvalificēti.)

Savā jaunākajā mēģinājumā pētnieki izmantoja Alphageometry2, lai atrisinātu ģeometrijas problēmu mazāk nekā 20 sekundēs; AI ir uzlabota un ātrāka jūsu ierakstu sistēmas versija, saka DeepMind datora speciālists Thang Luong.

Cita veida jautājumiem komanda izstrādāja pilnīgi jaunu sistēmu ar nosaukumu Alphaproof. Alphaproof sacensībās atrisināja divas algebras problēmas un viena pēc skaita teorijas, kurai tas ilga trīs dienas. (Faktiskā SJO dalībnieku divām sesijām ir 4,5 stundas.) Tas nespēja atrisināt abas problēmas kombinācijā, kas ir vēl viena matemātikas joma.


zelta medaļas tuvplāns, kuru 63. starptautiskajā matemātikas olimpiādē uzvarēja Rumānijas dalībnieks.

Pētnieki ir sasnieguši jauktus rezultātus, atbildot uz matemātiskiem jautājumiem ar balss modeļiem - sistēmas tips, kas virza tērzēšanas robotus, piemēram, Chatt. Dažreiz modeļi sniedz pareizu atbildi, bet nevar racionāli izskaidrot to argumentāciju un dažreiz

Tikai pagājušajā nedēļā programmatūras uzņēmumu Numina un HuggingFace komanda izmantoja balss modeli, lai uzvarētu starpposma amio “progresa cena”, pamatojoties uz SJO problēmu vienkāršotām versijām. Uzņēmumi padarīja visas savas sistēmas atvērtā pirmkoda un padarīja to pieejamu citu pētnieku lejupielādei. Bet uzvarētāji teica, ka daba , ka valodas modeļi vien, iespējams, nepietiks, lai atrisinātu sarežģītas problēmas.

Tikai klase

Alphaproof apvieno balss modeli ar mācīšanās pastiprināšanas tehnoloģiju, kuru “Alphazero” motors ir uzbrukuma spēlēm, piemēram, Go, kā arī daži īpašas matemātiskas problēmas . Pieaugot mācībām, neironu tīkls mācās, izmantojot eksperimentus un kļūdas. Tas darbojas labi, ja tā atbildes var novērtēt, izmantojot objektīvu skalu. Šim nolūkam Alphaproof tika apmācīts lasīt un rakstīt pierādījumus formālā valodā ar nosaukumu Lean, kas tiek izmantots tāda paša nosaukuma programmatūras paketē “Pierādījums palīgs”, kas ir iecienīts matemātiķos. Par to Alphaproof pārbaudīja, vai viņa izdevumi ir pareizi, veicot tos liesās paketē, kas palīdzēja aizpildīt dažus no koda posmiem.

Balss modeļa apmācība prasa milzīgu datu daudzumu, bet liesā bija pieejami tikai daži matemātiski pierādījumi. Lai pārvarētu šo problēmu, komanda izstrādāja papildu tīklu, kas mēģināja tulkot esošu vienas miljona problēmu ierakstīšanu, kas rakstīta dabiskā valodā, bet, netulkojot liesās risinājumus, saka Tomass Huberts, Deepmind Machine izglītojamā pētnieks, kurš veica Alphapdroof attīstību ar. "Mēs varam iemācīties pierādīt savu pieeju, pat ja mēs sākotnēji neesam apmācījušies ar cilvēkiem rakstītiem pierādījumiem?" (Uzņēmums bija līdzīgs Go, kur viņa AI iemācījās spēlēt spēli, spēlējot pret sevi, nevis tā, kā cilvēki to dara.)

maģiskā atslēga

Daudziem liesajiem tulkojumiem nebija jēgas, bet pietiekami daudz bija pietiekami labi, lai Alphapdroof nonāktu vietā, kur tas varētu sākt savu pieaugošos mācību ciklus. Rezultāti bija daudz labāki, nekā gaidīts, sacīja Gowers preses konsultācijā. "Daudzām problēmām ar SJO ir šis maģiskās atslēgas īpašums. Problēma vispirms izskatās sarežģīta, līdz atrodat maģisku atslēgu, kas to atver," sacīja Gowers, kurš strādā Collège de France Parīzē.

Dažos gadījumos šķita, ka Alphaproof varēja spert šo papildu radošuma soli, piešķirot tam pareizu soli no bezgalīgi liela iespējamā risinājuma. Bet ir nepieciešama turpmāka analīze, lai noteiktu, vai atbildes ir mazāk pārsteidzošas, nekā tās izskatījās, piebilda Gowers. Līdzīgs diskurss radās pēc pārsteidzošā 'Zug 37' , The DeepMinds Alphago-bot viņa Slavenā uzvara 2016. gadā par pasaules labāko Human Go spēlētāju -Ki pagrieziena punkts.

Atliek redzēt, vai metodes var pilnveidot, lai darbotos matemātikas pētījumu līmenī, sacīja Myers preses pārskatā. "Vai tas var izvērsties citos matemātikas veidos, kur nevar apmācīt miljoniem problēmu?"

"Mēs esam sasnieguši punktu, kurā jūs varat ne tikai pierādīt atvērtas pētniecības problēmas, bet arī problēmas, kas ir ļoti izaicinošas labākajiem jaunajiem matemātiķiem pasaulē," sacīja Deepmind datora speciālists Deivids Sudrabs, kurš bija vadošais pētnieks Alphago attīstībā 2010. gada vidū.