DeepMind dosahuje míľnik v riešení matematických problémov - ďalšia veľká výzva pre AI

DeepMind dosahuje míľnik v riešení matematických problémov - ďalšia veľká výzva pre AI
Po tom, čo Google DeepMind porazil ľudí vo všetkom, od Game Go to Strategy Board Games ,
Teraz tvrdí, že pri riešení matematických úloh je na pokraji porazenia najlepších študentov na svete.
Londýnsky založený Machine-Learning Spoločnosť 25. júla oznámila, že jeho systémy Artificial Intelligence (KI) vyriešili štyri zo šiestich úloh, ktoré boli udelené študentom na Medzinárodnej olympijskej matematickej olympiáde (IMO) 2024 v Bath, Veľkej Británii. AI poskytla prísne, postupné dôkazy, ktoré boli hodnotené dvoma najvyššou matematikou a dosiahli skóre 28/42 iba jeden bod z oblasti zlatých medailí.
„Je to očividne veľmi dôležitý pokrok,“ hovorí Joseph Myers, matematik z Cambridge, Veľká Británia, ktorý spolu s medailistom polí Tim Gowers skontroloval riešenia a pomohol zvoliť pôvodné problémy pre tento rok.
DeepMind a ďalšie spoločnosti sú v rase, aby v konečnom dôsledku poskytli dôkazy o strojoch, základných Riešenie výskumných otázok v matematike . Problémy s IMO, poprednou svetovou konkurenciou pre mladých matematikov, sa podľa spoločnosti stali meradlom pre pokrok v smere tohto cieľa a podľa spoločnosti sa považujú za „veľkú výzvu“ pre strojové učenie.
„Toto je prvýkrát, čo bol systém AI schopný dosiahnuť služby na úrovni medailí,“ uviedol v tlačovej konzultácii Pushmeet Kohli, viceprezident pre AI v oblasti vedy v DeepMind. „Je to dôležitý míľnik na ceste k vybudovaniu progresívnych dôkazov,“ povedal Kohli.
rozšírenie
Len pred niekoľkými mesiacmi, v januári, systém DeepMind Alphageometry Services na úrovni medailí Pri riešení typu problémov s IMO, konkrétne tých v euclidovej geometrii. Prvá AI, ktorá pracuje na úrovni zlatej medaily pre celkové otázky týkajúce sa testovania v algebre, kombinatoriku a teóriu čísel, ktoré sa vo všeobecnosti považujú za náročnejšie ako geometria-sa oprávňuje získať cenu 5 miliónov dolárov, cenu Olympiad AI Math Olympiad (AIMO). (Cena má prísne kritériá, ako je zverejnenie zdrojového kódu a práca s obmedzeným výpočtovým výkonom, čo znamená, že súčasné úsilie DeepMind by sa nekvalifikovalo.)
Vo svojom poslednom pokuse vedci použili alfageometriu2 na vyriešenie problému geometrie za menej ako 20 sekúnd; AI je vylepšená a rýchlejšia verzia vášho záznamového systému, hovorí počítačový špecialista DeepMind Thang Luong.
Pokiaľ ide o ďalšie typy otázok, tím vyvinul úplne nový systém s názvom Alphaproof. Alphaproof vyriešil dva problémy s algebrom v súťaži a jeden v teórii čísel, pre ktoré trvala tri dni. (Účastníci skutočného IMO majú každé dve relácie 4,5 hodiny.) Nepodarilo sa vyriešiť dva problémy v kombinácii, ďalšia oblasť matematiky.

Vedci dosiahli zmiešané výsledky, keď odpovedajú na matematické otázky s hlasovými modelmi - typ systému, ktorý poháňa chatboty ako Chatt. Modely niekedy dávajú správnu odpoveď, ale nemôžu racionálne vysvetliť svoje zdôvodnenie a niekedy
Až minulý týždeň tím softvérových spoločností Numina a Huggingface použil hlasový model na získanie stredne pokročilej AMIO „Cena Cena“ na základe zjednodušených verzií problémov IMO. Spoločnosti sprístupnili celý svoj systém Open Source a sprístupnili ho na stiahnutie ďalších výskumných pracovníkov. Ale víťazi uviedli, že príroda , že samotné jazykové modely by pravdepodobne nestačili na vyriešenie zložitých problémov. Alphaproof kombinuje hlasový model s technológiou posilňujúceho vzdelávania, ktorý motor „alphazero“ pre útočné hry ako GO, ako aj niektoré Špecifické matematické problémy . S rastúcim vzdelávaním sa neurónová sieť učí prostredníctvom experimentov a chýb. Funguje to dobre, ak je možné jej odpovede vyhodnotiť pomocou objektívnej stupnice. Na tento účel bol Alphaproof trénovaný na čítanie a písanie dôkazov vo formálnom jazyku s názvom Lean, ktorý sa používa v softvérovom balíku „dôkaz asistenta“ s rovnakým menom, ktorý je obľúbený u matematikov. Za týmto účelom Alphaproof testoval, či boli jeho výdavky správne tým, že ich robili v štíhlom balíku, čo pomohlo vyplniť niektoré kroky v kóde. Tréning hlasového modelu vyžaduje obrovské množstvo údajov, ale iba niekoľko matematických dôkazov bolo k dispozícii v Lean. Aby sa tento problém prekonal, tím vyvinul ďalšiu sieť, ktorá sa pokúsila preložiť existujúci zaznamenanie jedného milióna problémov, ktoré boli napísané v prirodzenom jazyku, ale bez prekladu riešení napísaných v Lean, hovorí Thomas Hubert, výskumný pracovník v oblasti stroja DeepMind, ktorý uskutočnil vývoj Alphaproof. „Môžeme sa naučiť dokázať náš prístup, aj keď sme pôvodne nekradali na ľudské dôkazy?“ (Spoločnosť bola podobná ako GO, kde sa jeho AI naučila hrať hru tým, že hrá proti sebe, namiesto toho, ako to robia ľudia.) Mnoho štíhlych prekladov nedávalo zmysel, ale dosť bolo dosť dobré na to, aby sa Alphaproof dostal do bodu, keď by mohol začať zvyšujúce sa učebné cykly. Výsledky boli oveľa lepšie, ako sa očakávalo, uviedli Gowers pri tlačovej konzultácii. „Mnoho problémov s IMO má túto vlastnosť magického kľúča. Problém najskôr vyzerá ťažko, kým nenájdete magický kľúč, ktorý ho otvorí,“ povedal Gowers, ktorý pracuje v Collège de France v Paríži. V niektorých prípadoch sa zdalo, že Alphaproof dokáže urobiť tento ďalší krok kreativity tým, že mu poskytne správny krok z nekonečne veľkého možného riešenia. Ale je potrebná ďalšia analýza na určenie, či boli odpovede menej prekvapujúce, ako vyzerali, dodali Gowers. Podobný diskurz vznikol po prekvapení 'Zug 37' , DeepMinds ALPHAGO-BOT AT Slávne víťazstvo v roku 2016 o najlepšom ľudskom hráčovi GO na svete -Zlomový bod pre Ki. Zostáva vidieť, či je možné techniky zdokonaliť, aby pracovali na úrovni výskumu matematiky, uviedol Myers v Press Review. „Môže sa rozšíriť na iné typy matematiky, kde sa nemôžu trénovať milióny problémov?“ „Dosiahli sme bod, v ktorom môžete nielen dokázať otvorené problémy s výskumom, ale aj problémy, ktoré sú veľmi náročné pre tých najlepších mladých matematikov na svete,“ uviedol počítačový špecialista DeepMind David Silver, ktorý bol popredným výskumným pracovníkom vo vývoji Alphago v polovici roku 2010. iba trieda
magický kľúč