A DeepMind eléri a mérföldkövet a matematikai problémák megoldásában - az AI következő nagy kihívása

A DeepMind eléri a mérföldkövet a matematikai problémák megoldásában - az AI következő nagy kihívása
Miután a Google DeepMind mindenben legyőzte az embereket, a Game Go to stratégiai társasjátékokhoz ,
Most azt állítja, hogy a matematikai feladatok megoldásakor a világ legjobb diákjainak legyőzése küszöbön áll.
A londoni székhelyű Machine-Learning A társaság július 25-én bejelentette, hogy mesterséges intelligencia (KI) rendszerei oldották meg a hat feladat közül négyet, amelyeket a Nemzetközi Matematikai Olimpia (IMO) 2024-es hallgatóknak adtak Bathban, Nagy-Britanniában. Az AI szigorú, fokozatos bizonyítékokat szolgáltatott, amelyeket két felső matematika értékelt, és csak 28/42 pontot ért el az aranyérmek területétől.
"Ez nyilvánvalóan nagyon fontos előrelépés" - mondja Joseph Myers, a Nagy -Britanniában, Cambridge -i matematikus, aki, a Fields Medalist Tim Gowers -rel együtt ellenőrizte a megoldásokat és segített kiválasztani az idei eredeti problémákat.
DeepMind és más vállalatok a versenyen, hogy végül bizonyítékot nyújtsanak a gépekről, az Essential A kutatási kérdések megoldása a matematikában . Az IMO problémái, a világ vezető versenyének a fiatal matematikusok számára, a cél irányába való haladás mércéjévé váltak, és a vállalat szerint "nagy kihívásnak" tekintik őket.
"Ez az első alkalom, hogy egy AI rendszer képes volt érmei szinten elérni a szolgáltatásokat" - mondta Pushmeet Kohli, a Deepmind tudományának AI alelnöke, sajtó konzultációban. "Ez egy fontos mérföldkő a progresszív bizonyítékok felépítéséhez" - mondta Kohli.
kiterjesztés
Csak néhány hónappal ezelőtt, januárban, a DeepMind rendszer Alpagetria szolgáltatások érmek szintjén Az IMO valamilyen problémájának megoldásakor, nevezetesen az euclidean geometria euclidean geometriájában. Az első AI, amely aranyérmes szinten működik az algebrában, a kombinatorikában és a számelméletben, amelyek általában igényesebbnek tekintik, mint a geometria-jogosult 5 millió dolláros ár megszerzésére, az AI Math Olimpiad-díj (AIMO). (Az árnak szigorú kritériumai vannak, például a forráskód nyilvánosságra hozatala és a korlátozott számítási teljesítményű munka, ami azt jelenti, hogy a DeepMind jelenlegi erőfeszítései nem minősülnek.)
Legutóbbi kísérletük során a kutatók alphagetria2 -t használtak a geometriai probléma kevesebb mint 20 másodperc alatt történő megoldására; Az AI a lemezrendszerének továbbfejlesztett és gyorsabb verziója - mondja a DeepMind számítógépes szakember, Thang Luong.
A többi típusú kérdés esetében a csapat kifejlesztett egy teljesen új rendszert, az Alphaproof nevű rendszert. Az Alphaproof két algebrai problémát oldott meg a versenyben, és egy elméletben, amelyre három napot vett igénybe. (A tényleges IMO résztvevői két ülésen vannak, mindegyik 4,5 óra.) Nem volt képes megoldani a két problémát a kombinációban, a matematika egy másik területén.
<ábra class = "ábra">
A kutatók vegyes eredményeket értek el, amikor hangmodellekkel válaszolnak a matematikai kérdésekre - az a rendszertípus, amely olyan chatbotokat vezet, mint a chatt. Időnként a modellek adják a helyes választ, de nem tudják ésszerűen megmagyarázni érvelésüket, és néha
Csak a múlt héten a Numina és a Huggingface szoftvercégek egy csoportja hangmodellt használt egy közbenső Amio „előrehaladási ár” megnyerésére az IMO problémáinak egyszerűsített verziói alapján. A vállalatok nyílt forráskódúvá tették a teljes rendszerüket, és elérhetővé tették más kutatók letöltésére. De a nyertesek azt mondták, hogy a természet a nyelvi modellek önmagukban nem lesznek elegendőek a nehéz problémák megoldásához. alfaprém egyesíti a hangmodellt a tanulás megerősítésének technológiájával, amelyet az „Alphazero” olyan támadási játékokhoz, mint például a Go, valamint néhány specifikus matematikai problémák . A növekvő tanulással egy idegi hálózat kísérletek és hibák révén tanul. Ez jól működik, ha a válaszokat objektív skálán lehet értékelni. Ebből a célból az Alphaproof -ot arra képezték, hogy olvassa el és írjon bizonyítékokat a Lean nevű hivatalos nyelven, amelyet az azonos nevű „Proof Assistant” szoftvercsomagban használnak, amely népszerű a matematikusok körében. Ehhez az Alphaproof megvizsgálta, hogy a költségei helyesek -e a Lean csomagban, ami elősegítette a kód néhány lépésének kitöltését. A hangmodell edzése hatalmas mennyiségű adatot igényel, de csak néhány matematikai bizonyíték állt rendelkezésre a Lean -ben. A probléma leküzdése érdekében a csapat egy további hálózatot fejlesztett ki, amely megpróbálta lefordítani egy millió, a természetes nyelven írt egy millió probléma meglévő felvételét, de a Lean -ben írt megoldások lefordítása nélkül - mondja Thomas Hubert, a mélymás gépi tanulók kutatója, aki az Alphaproof fejlesztését végezte. "Megtanulhatjuk bizonyítani a megközelítésünket, még akkor is, ha eredetileg nem képzett az emberi írásbeli bizonyítékokra?" (A társaság hasonló volt a GO -hoz, ahol az AI megtanulta a játékot játszani azzal, hogy önmagával játszik, ahelyett, hogy az emberek.) Sok sovány fordításnak nincs értelme, de elég jó volt ahhoz, hogy az Alphaproof -ot arra a pontra hozzák, ahol megkezdheti a növekvő tanulási ciklusokat. Az eredmények sokkal jobbak voltak a vártnál - mondta Gowers a sajtó konzultációján. "Az IMO -val kapcsolatos sok probléma megvan a mágikus kulcs tulajdonságával. A probléma először nehéznek tűnik, amíg nem talál egy varázslatos kulcsot, amely kinyitja azt" - mondta Gowers, aki a párizsi Collège de France -ban dolgozik. Csak osztály
A Varázslatos kulcs
Még nem kell látni, hogy a technikák tökéletesíthetők -e a matematika kutatásának szintjén történő munkavégzéshez - mondta Myers a sajtó áttekintésen. "Lehet -e kiterjedni más típusú matematikára, ahol nem lehet több millió problémát képezni?"
"Elértük azt a pontot, ahol nemcsak a nyílt kutatási problémákat, hanem olyan problémákat is bizonyíthatunk, amelyek nagyon kihívást jelentenek a világ legjobb fiatal matematikusjai számára"-mondta David Silver, a Deepmind számítógépes szakember, aki 2010 közepén az Alphago fejlesztésének vezető kutatója volt.