DeepMind jõuab matemaatiliste probleemide lahendamisel verstapostini - AI järgmine suur väljakutse

DeepMind jõuab matemaatiliste probleemide lahendamisel verstapostini - AI järgmine suur väljakutse
Pärast seda, kui Google DeepMind alistas inimesi kõiges, alates Mäng minge strateegialauamängudele ,
Londonipõhine masinõpp Ettevõte teatas 25. juulil, et tema tehisintellekti (KI) süsteemid on lahendanud kuuest ülesandest neli, mis anti üliõpilastele rahvusvahelisel matemaatika olümpial (IMO) 2024 Bathis, Suurbritannias. AI esitas ranged, järkjärgulised tõendid, mida hinnati kaks parimat matemaatikat ja saavutas tulemuse 28/42-ga ainult ühe punktiga kuldmedalide piirkonnast.
"See on ilmselgelt väga oluline areng," ütleb Suurbritannia Cambridge'i matemaatik Joseph Myers, kes koos Fieldsi medalisti Tim Gowersiga kontrollis lahendusi ja aitas valida selle aasta algsed probleemid.
DeepMind ja teised ettevõtted on võistlusel, et lõppkokkuvõttes tõendeid pakkuda masinate kohta. Data-Track = "Click" Data Label = "https://www.nature.com/subjects/mathematics-and-computing" Data-Track-category = "Body Text Link"> Lahendage uurimisküsimusi matemaatikas . Probleemid IMO -ga, maailma juhtiva noorte matemaatikute jaoks, on sellest eesmärgi suunas edusamme muutunud ja seda peetakse ettevõtte sõnul masinõppe jaoks "suureks väljakutseks".
"See on esimene kord, kui AI -süsteem suutis medali tasemel teenuseid saavutada," ütles DeepMindi teaduse AI asepresident PushMeet Kohli pressikonsultatsioonis. "See on progressiivsete tõendite loomise teel oluline verstapost," ütles Kohli.
pikendus
Alles mõni kuu tagasi, jaanuaris, DeepMind System alfageomeetriateenused medali tasemel IMO-i probleemide tüübi lahendamisel, nimelt need, mis on Euclideakeni geomeetrial. Esimene AI, mis töötab kuldmedali tasemel üldiste testide sisaldavate küsimuste jaoks algebra, kombinatoorika ja arvu teooria osas, mida peetakse üldiselt nõudlikumaks kui geomeetria-on õigus saada 5 miljonit dollarit hind, AI Math Olümpiaadi auhind (AIMO). (Hinnal on ranged kriteeriumid, näiteks lähtekoodi avalikustamine ja piiratud arvutusvõimsusega töö, mis tähendab, et DeepMindi praegused jõupingutused ei kvalifitseeru.)
Teadlased kasutasid oma viimasel katsel alfageomeetria2 geomeetriaprobleemi lahendamiseks vähem kui 20 sekundiga; AI on teie plaadisüsteemi täiustatud ja kiirem versioon, ütles DeepMindi arvutispetsialist Thang Luong.
Muud tüüpi küsimuste jaoks töötas meeskond välja täiesti uue süsteemi nimega tähed. Täheliiguline lahendas võistlusel kaks algebraprobleemi ja üks arvu teooriana, mille jaoks kulus kolm päeva. (Tegeliku IMO osalejate kaks seanssi on kaks 4,5 tundi.) See ei suutnud lahendada kahte probleemi kombinatsioonis, mis on teine matemaatika valdkond.

Teadlased on matemaatilistele küsimustele vastavatel häälmudelitega vastamisel saavutanud segatulemusi - süsteemi tüüpi, mis juhivad vestlusbotte nagu Chatt. Mõnikord annavad mudelid õige vastuse, kuid ei suuda nende mõttekäiku mõistlikult selgitada, ja mõnikord
Alles eelmisel nädalal kasutasid tarkvaraettevõtete Numina ja Huggingface meeskond häälmudelit, et võita AMIO vahepealne progressi hind, mis põhineb IMO probleemide lihtsustatud versioonidel. Ettevõtted tegid kogu oma süsteemid avatud lähtekoodiga ja tegid selle teiste teadlaste allalaadimiseks kättesaadavaks. Kuid võitjad ütlesid, et loodus , et ainuüksi keelemudelitest ei piisa keeruliste probleemide lahendamiseks. Tähepealne ühendab häälmudeli tugevdavate õppimise tehnoloogiaga, mille mootor “Alphazero” rünnakumängude jaoks nagu Go, samuti mõned Spetsiifilised matemaatilised probleemid . Õppimise suurenemisega õpib närvivõrk katsete ja vigade kaudu. See töötab hästi, kui selle vastuseid saab objektiivse skaala abil hinnata. Sel eesmärgil koolitati tähendusõpet ja kirjutama tõendeid formaalses keeles, mida nimetatakse Lean, mida kasutatakse samanimelise tarkvarapaketis „Kinnispruuks”, mis on populaarne matemaatikute seas. Selleks testiti tähedorutis, kas tema kulud olid õiged, tehes neid lahja paketiga, mis aitas täita mõned koodi etapid. Häälmudeli koolitus nõuab tohutul hulgal andmeid, kuid Lean'is oli saadaval vaid mõned matemaatilised tõendid. Sellest probleemist ülesaamiseks töötas meeskond välja täiendava võrgu, mis üritas tõlkida olemasolevat lindistust miljonist looduskeeles kirjutatud probleemist, kuid ilma Lean kirjutatud lahendusi tõlgita, ütles DeepMind Machine'i õppija uurija Thomas Hubert, kes viis läbi tähekujulise arengu. "Saame õppida oma lähenemisviisi tõestama, isegi kui me pole algselt inimese kirjutatud tõendite järgi koolitanud?" (Ettevõte sarnanes GO -ga, kus tema AI õppis mängu mängides iseenda vastu, selle asemel, et inimesed seda teevad.) Paljudel kõhnadel tõlgetel polnud mõtet, kuid piisavalt head olid tähedoroofid, et see võiks alustada oma kasvavaid õppimistsüklit. Tulemused olid oodatust palju paremad, ütles Gowers pressikonsultatsioonis. "Paljudel IMO -ga probleemidel on see maagilise võtme omadus. Probleem näeb kõigepealt välja keeruline, kuni leiate selle avatava maagilise võtme," ütles Pariisi Collège de France'is töötav Gowers. Mõnel juhul näis tähenduslik, et suudab selle täiendava loovuse sammu astuda, andes sellele õige sammu lõpmata suure võimaliku lahenduse põhjal. Kuid täiendav analüüs on vajalik, et teha kindlaks, kas vastused olid vähem üllatavad, kui nad välja nägid, lisas Gowers. Sarnane diskursus tekkis pärast üllatavat 'Zug 37' , DeepMinds Alphago-botil tema Kuulus võit 2016. aastal maailma parima inimese GO-mängija kohta -Ki pöördepunkt. Jääb üle vaadata, kas tehnikaid saab täiustada matemaatika uurimistöö tasemel, ütles Myers ajakirjanduse ülevaates. "Kas see võib laieneda muud tüüpi matemaatikale, kus miljoneid probleeme ei pruugi koolitada?" "Oleme jõudnud punkti, kus saate mitte ainult tõestada avatud uurimisprobleeme, vaid ka probleeme, mis on maailma parimatele noortele matemaatikutele väga keerulised," ütles DeepMindi arvutispetsialist David Silver, kes oli alfaare arendamise juhtiv uurija 2010. aasta keskel. ainult klass
maagiline võti