Deepmind når milepæl i løsningen af matematiske problemer - den næste store udfordring for AI

Deepmind når milepæl i løsningen af matematiske problemer - den næste store udfordring for AI
Hævder nu at være på randen af at slå verdens bedste studerende, når de løser matematikopgaver.
Det London-baserede Machine-learning Company annoncerede den 25. juli, at hans kunstige intelligens (KI) -systemer har løst fire af de seks opgaver, der blev givet til de studerende ved International Mathematics OL (IMO) 2024 i Bath, Storbritannien. AI leverede strenge, gradvise beviser, som blev evalueret ved to øverste matematik og opnåede en score på 28/42-kun et punkt fra området med guldmedaljer.
"Det er åbenlyst en meget vigtig fremgang," siger Joseph Myers, en matematiker fra Cambridge, Storbritannien, der sammen med Fields -medalist Tim Gowers kontrollerede løsningen og hjalp med at vælge de originale problemer for dette år.
Deepmind og andre virksomheder er i løbet om at give til sidst bevis for maskiner, det essentielle Solve Research Spørgsmål i matematik . Problemerne med IMO, verdens førende konkurrence for unge matematikere, er blevet en målestok for fremskridt i retning af dette mål og ses som en "stor udfordring" for maskinlæring, ifølge virksomheden.
"Dette er første gang, at et AI -system var i stand til at opnå tjenester på medaljiveau," sagde Pushmeet Kohli, vicepræsident for AI i videnskab i Deepmind, i en pressekonsultation. "Dette er en vigtig milepæl på vej til at opbygge progressive beviser," sagde Kohli.
udvidelse
For kun få måneder siden, i januar, DeepMind-systemet Alfageometri-tjenester på medaljens niveau Når du løser en type IMO-problemer, nemlig dem i eukletisk geometri. Den første AI, der arbejder på et guldmedaljiveau for de samlede testafslutningsspørgsmål inden for algebra, kombinatorik og antal teori, der generelt betragtes som mere krævende end geometri-er berettiget til at opnå en pris på $ 5 millioner, AI Math Olympiad Prize (AIMO). (Prisen har strenge kriterier, såsom videregivelse af kildekoden og arbejdet med begrænset computerkraft, hvilket betyder, at DeepMinds aktuelle bestræbelser ikke ville kvalificere sig.)
I deres seneste forsøg brugte forskere alfageometri2 til at løse geometriproblemet på mindre end 20 sekunder; AI er en forbedret og hurtigere version af dit pladesystem, siger DeepMind -computerspecialisten Thang Luong.
For de andre typer spørgsmål udviklede teamet et helt nyt system kaldet Alphaproof. Alphaproof løste to algebra -problemer i konkurrencen og et i antal teori, som det tog tre dage for. (Deltagerne i den faktiske IMO har to sessioner på 4,5 timer hver.) Det var ikke i stand til at løse de to problemer i kombinationen, et andet matematikområde.

Kun i sidste uge brugte et team af softwarevirksomheder Numina og HuggingFace en stemmemodel til at vinde en mellemliggende Amio 'Progress Price' baseret på forenklede versioner af IMO -problemer. Virksomhederne lavede hele deres systemer med open source og stillede dem til rådighed til download af andre forskere. Men vinderne sagde natur , at sprogmodeller alene sandsynligvis ikke ville være nok til at løse vanskelige problemer.
kun klasse
Alphaproof kombinerer en stemmemodel med teknologien til forstærkning af læring, som "Alphazero" -motoren til angrebspil såsom Go såvel som nogle Specifikke matematiske problemer . Med stigende læring lærer et neuralt netværk gennem eksperimenter og fejl. Dette fungerer godt, hvis dens svar kan evalueres ved hjælp af en objektiv skala. Til dette formål blev alfaproof uddannet til at læse og skrive bevis på et formelt sprog kaldet Lean, der bruges i 'Proof Assistant' softwarepakken med samme navn, der er populær blandt matematikere. Til dette testede Alphaproof, om hans udgifter var korrekte ved at gøre dem i den magre pakke, hvilket hjalp med at udfylde nogle af trinnene i koden.
Uddannelse af en stemmemodel kræver enorme mængder data, men kun et par matematiske beviser var tilgængelige i Lean. For at overvinde dette problem udviklede teamet et ekstra netværk, der forsøgte at oversætte en eksisterende optagelse af en million problemer, der blev skrevet på naturligt sprog, men uden at oversætte løsninger skrevet i Lean, siger Thomas Hubert, en DeepMind Machine -elevforsker, der gennemførte udviklingen af alphaproof med. "Vi kan lære at bevise vores tilgang, selvom vi ikke oprindeligt har trænet i menneskelige -skrevne beviser?" (Virksomheden svarede til farten, hvor hans AI lærte at spille spillet ved at spille mod sig selv, i stedet for den måde, folk gør.)
magisk nøgle
Mange af de magre oversættelser gav ingen mening, men nok var gode nok til at bringe alfaproof til det punkt, hvor det kunne starte sine stigende læringscyklusser. Resultaterne var meget bedre end forventet, sagde Gowers på pressekonsultationen. "Mange problemer med IMO har denne egenskab ved den magiske nøgle. Problemet ser først vanskeligt ud, indtil du finder en magisk nøgle, der åbner den," sagde Gowers, der arbejder på Collège de France i Paris.
I nogle tilfælde syntes alfaproof at være i stand til at tage dette ekstra skridt i kreativiteten ved at give den et korrekt skridt fra en uendelig stor mulig løsning. Men yderligere analyse er påkrævet for at afgøre, om svarene var mindre overraskende, end de så ud, tilføjede Gowers. En lignende diskurs opstod efter den overraskende 'Zug 37' , DeepMinds alphago-bot ved hans Berømt sejr i 2016 om verdens bedste menneskelige Go-spiller -en vendepunkt for KI.
Det er tilbage at se, om teknikkerne kan perfektioneres til at arbejde på et forskningsniveau i matematik, sagde Myers ved Press Review. "Kan det udvide til andre typer matematik, hvor der ikke kan trænes millioner af problemer?"
"Vi har nået det punkt, hvor du ikke kun kan bevise åbne forskningsproblemer, men også problemer, der er meget udfordrende for de allerbedste unge matematikere i verden," sagde Deepmind-computerspecialist David Silver, der var den førende forsker i udviklingen af Alphago i midten af 2010.