A DeepMind eléri a mérföldkövet a matematikai problémák megoldásában - az AI következő nagy kihívása

"Erfahren Sie, wie Google DeepMind die Welt der Mathematik revolutioniert, indem es die besten Schüler der Welt bei der Lösung von mathematischen Problemen herausfordert. Lesen Sie mehr über die bahnbrechenden Fortschritte und die Zukunft von KI in der Mathematik."
"Tudja meg, hogy a Google DeepMind hogyan forradalmasítja a matematika világát azáltal, hogy kihívja a világ legjobb hallgatóit a matematikai problémák megoldásában. Olvassa el többet az úttörő haladásról és az AI jövőjéről a matematikában." (Symbolbild/natur.wiki)

A DeepMind eléri a mérföldkövet a matematikai problémák megoldásában - az AI következő nagy kihívása

<ábra class = "ábra">

Miután a Google DeepMind mindenben legyőzte az embereket, a Game Go to stratégiai társasjátékokhoz ,
Most azt állítja, hogy a matematikai feladatok megoldásakor a világ legjobb diákjainak legyőzése küszöbön áll.

A londoni székhelyű Machine-Learning A társaság július 25-én bejelentette, hogy mesterséges intelligencia (KI) rendszerei oldották meg a hat feladat közül négyet, amelyeket a Nemzetközi Matematikai Olimpia (IMO) 2024-es hallgatóknak adtak Bathban, Nagy-Britanniában. Az AI szigorú, fokozatos bizonyítékokat szolgáltatott, amelyeket két felső matematika értékelt, és csak 28/42 pontot ért el az aranyérmek területétől.

"Ez nyilvánvalóan nagyon fontos előrelépés" - mondja Joseph Myers, a Nagy -Britanniában, Cambridge -i matematikus, aki, a Fields Medalist Tim Gowers -rel együtt ellenőrizte a megoldásokat és segített kiválasztani az idei eredeti problémákat.

DeepMind és más vállalatok a versenyen, hogy végül bizonyítékot nyújtsanak a gépekről, az Essential A kutatási kérdések megoldása a matematikában . Az IMO problémái, a világ vezető versenyének a fiatal matematikusok számára, a cél irányába való haladás mércéjévé váltak, és a vállalat szerint "nagy kihívásnak" tekintik őket.

"Ez az első alkalom, hogy egy AI rendszer képes volt érmei szinten elérni a szolgáltatásokat" - mondta Pushmeet Kohli, a Deepmind tudományának AI alelnöke, sajtó konzultációban. "Ez egy fontos mérföldkő a progresszív bizonyítékok felépítéséhez" - mondta Kohli.

kiterjesztés

Csak néhány hónappal ezelőtt, januárban, a DeepMind rendszer Alpagetria szolgáltatások érmek szintjén Az IMO valamilyen problémájának megoldásakor, nevezetesen az euclidean geometria euclidean geometriájában. Az első AI, amely aranyérmes szinten működik az algebrában, a kombinatorikában és a számelméletben, amelyek általában igényesebbnek tekintik, mint a geometria-jogosult 5 millió dolláros ár megszerzésére, az AI Math Olimpiad-díj (AIMO). (Az árnak szigorú kritériumai vannak, például a forráskód nyilvánosságra hozatala és a korlátozott számítási teljesítményű munka, ami azt jelenti, hogy a DeepMind jelenlegi erőfeszítései nem minősülnek.)

Legutóbbi kísérletük során a kutatók alphagetria2 -t használtak a geometriai probléma kevesebb mint 20 másodperc alatt történő megoldására; Az AI a lemezrendszerének továbbfejlesztett és gyorsabb verziója - mondja a DeepMind számítógépes szakember, Thang Luong.

A többi típusú kérdés esetében a csapat kifejlesztett egy teljesen új rendszert, az Alphaproof nevű rendszert. Az Alphaproof két algebrai problémát oldott meg a versenyben, és egy elméletben, amelyre három napot vett igénybe. (A tényleges IMO résztvevői két ülésen vannak, mindegyik 4,5 óra.) Nem volt képes megoldani a két problémát a kombinációban, a matematika egy másik területén.

<ábra class = "ábra">
Az aranyérmet, a 63. nemzetközi matematikai olimpián nyert egy román résztvevő által nyert.

A kutatók vegyes eredményeket értek el, amikor hangmodellekkel válaszolnak a matematikai kérdésekre - az a rendszertípus, amely olyan chatbotokat vezet, mint a chatt. Időnként a modellek adják a helyes választ, de nem tudják ésszerűen megmagyarázni érvelésüket, és néha

Csak a múlt héten a Numina és a Huggingface szoftvercégek egy csoportja hangmodellt használt egy közbenső Amio „előrehaladási ár” megnyerésére az IMO problémáinak egyszerűsített verziói alapján. A vállalatok nyílt forráskódúvá tették a teljes rendszerüket, és elérhetővé tették más kutatók letöltésére. De a nyertesek azt mondták, hogy a természet a nyelvi modellek önmagukban nem lesznek elegendőek a nehéz problémák megoldásához.

Csak osztály

A

alfaprém egyesíti a hangmodellt a tanulás megerősítésének technológiájával, amelyet az „Alphazero” olyan támadási játékokhoz, mint például a Go, valamint néhány specifikus matematikai problémák . A növekvő tanulással egy idegi hálózat kísérletek és hibák révén tanul. Ez jól működik, ha a válaszokat objektív skálán lehet értékelni. Ebből a célból az Alphaproof -ot arra képezték, hogy olvassa el és írjon bizonyítékokat a Lean nevű hivatalos nyelven, amelyet az azonos nevű „Proof Assistant” szoftvercsomagban használnak, amely népszerű a matematikusok körében. Ehhez az Alphaproof megvizsgálta, hogy a költségei helyesek -e a Lean csomagban, ami elősegítette a kód néhány lépésének kitöltését.

A hangmodell edzése hatalmas mennyiségű adatot igényel, de csak néhány matematikai bizonyíték állt rendelkezésre a Lean -ben. A probléma leküzdése érdekében a csapat egy további hálózatot fejlesztett ki, amely megpróbálta lefordítani egy millió, a természetes nyelven írt egy millió probléma meglévő felvételét, de a Lean -ben írt megoldások lefordítása nélkül - mondja Thomas Hubert, a mélymás gépi tanulók kutatója, aki az Alphaproof fejlesztését végezte. "Megtanulhatjuk bizonyítani a megközelítésünket, még akkor is, ha eredetileg nem képzett az emberi írásbeli bizonyítékokra?" (A társaság hasonló volt a GO -hoz, ahol az AI megtanulta a játékot játszani azzal, hogy önmagával játszik, ahelyett, hogy az emberek.)

Varázslatos kulcs

Sok sovány fordításnak nincs értelme, de elég jó volt ahhoz, hogy az Alphaproof -ot arra a pontra hozzák, ahol megkezdheti a növekvő tanulási ciklusokat. Az eredmények sokkal jobbak voltak a vártnál - mondta Gowers a sajtó konzultációján. "Az IMO -val kapcsolatos sok probléma megvan a mágikus kulcs tulajdonságával. A probléma először nehéznek tűnik, amíg nem talál egy varázslatos kulcsot, amely kinyitja azt" - mondta Gowers, aki a párizsi Collège de France -ban dolgozik.

Bizonyos esetekben úgy tűnt, hogy az Alphaproof képes megtenni ezt a kreativitás további lépését azáltal, hogy helyes lépést ad neki a végtelenül nagy lehetséges megoldásból. További elemzésre van szükség annak meghatározására, hogy a válaszok kevésbé meglepőek -e, mint amennyire néztek - tette hozzá Gowers. Hasonló diskurzus merült fel a meglepő 'zug 37' , a DeepMinds Alphago-Bot at Híres győzelem 2016-ban a világ legjobb emberi GO-lejátszójáról -A KI fordulópontja.

Még nem kell látni, hogy a technikák tökéletesíthetők -e a matematika kutatásának szintjén történő munkavégzéshez - mondta Myers a sajtó áttekintésen. "Lehet -e kiterjedni más típusú matematikára, ahol nem lehet több millió problémát képezni?"

"Elértük azt a pontot, ahol nemcsak a nyílt kutatási problémákat, hanem olyan problémákat is bizonyíthatunk, amelyek nagyon kihívást jelentenek a világ legjobb fiatal matematikusjai számára"-mondta David Silver, a Deepmind számítógépes szakember, aki 2010 közepén az Alphago fejlesztésének vezető kutatója volt.