Poté, co Google DeepMind porazil lidi ve všem, z hra přejděte na strategické deskové hry ,
Nyní tvrdí, že je na pokraji poražení nejlepších studentů na světě při řešení matematických úkolů.

Londýnská Machine-Learning Společnost 25. července oznámila, že jeho systémy umělé inteligence (KI) vyřešily čtyři ze šesti úkolů, které byly poskytnuty studentům na mezinárodních olympijských hrách v matematice (IMO) 2024 v Bath, Velká Británie. AI poskytovala přísné, postupné důkazy, které byly hodnoceny dvěma nejlepšími matematikami a dosáhly skóre 28/42 jediného bodu z oblasti zlatých medailí.

„Je to zjevně velmi důležitý pokrok,“ říká Joseph Myers, matematik z Cambridge, Velké Británie, který společně s medailistou polí Tim Gowers zkontroloval řešení a pomohl vybrat původní problémy pro tento rok.

Deepmind a další společnosti jsou v závodě, aby nakonec poskytly důkazy o strojích, esenciální Řešení výzkumných otázek v matematice . Problémy s IMO, přední světovou soutěží pro mladé matematiky, se staly měřítkem pro pokrok ve směru tohoto cíle a podle společnosti jsou považovány za „velkou výzvu“ pro strojové učení.

"Je to poprvé, kdy systém AI byl schopen dosáhnout služeb na úrovni medailí," řekl v tiskové konzultaci Pushmeet Kohli, viceprezident pro AI ve vědě v Deepmind. „Je to důležitý milník na cestě k budování progresivních důkazů,“ řekl Kohli.

rozšíření

6 Data-label = "https://www.nature.com/articles/d41586-024-00141-5" Data-Track-Category = "Text Link"> Alphageometry Services na medaile na úrovni medailí Při řešení problémů IMO, které jsou v Euclidean Geometry. První AI, která pracuje na úrovni zlaté medaile pro celkové otázky včetně testů v algebry, kombinatorice a teorii čísel, které jsou obecně považovány za náročnější než geometrie-je oprávněna získat cenu 5 milionů dolarů, AI Math Olympiad Prize (AIMO). (Cena má přísná kritéria, jako je zveřejnění zdrojového kódu a práce s omezeným výpočetním výkonem, což znamená, že současné úsilí DeepMind by se nekvalifikovalo.)

Ve svém posledním pokusu vědci použili Alphageometry2 k vyřešení problému geometrie za méně než 20 sekund; AI je vylepšená a rychlejší verze vašeho záznamu, říká počítačový specialista Thang Luong.

Pro jiné typy otázek vyvinul tým zcela nový systém s názvem AlphaProof. Alphaproof vyřešil dva problémy algebry v soutěži a jednu v teorii čísel, pro které to trvalo tři dny. (Účastníci skutečného IMO mají dvě sezení po 4,5 hodiny.) Nebyl schopen vyřešit dva problémy v kombinaci, další oblast matematiky.

Close-up zlaté medaile, vyhrál v 63. mezinárodní matematické olympiádě rumunským účastníkem.

Vědci dosáhli smíšených výsledků, když odpovídají matematickým otázkám s hlasovými modely - typ systému, který řídí chatboty jako Chatt. Někdy modely dávají správnou odpověď, ale nemohou vysvětlit své zdůvodnění racionálně a někdy

Teprve minulý týden tým softwarových společností Numina a Huggingface použil hlasový model k získání mezilehlého amio „pokrokové ceny“ založený na zjednodušených verzích problémů IMO. Společnosti poskytly všechny své systémy open source a zpřístupnily jej ke stažení dalších vědců. Vítězové však uvedli, že příroda , že jazykové modely by pravděpodobně nestačily k vyřešení obtížných problémů.

pouze třída

AlphaProof kombinuje hlasový model s technologií posílení učení, který s motorem „alphazero“ pro útočné hry, jako je Go, stejně jako některé Specifické matematické problémy . Neuronová síť se s rostoucím učením učí prostřednictvím experimentů a chyb. Funguje to dobře, pokud lze jeho odpovědi vyhodnotit pomocí objektivního měřítka. Za tímto účelem byl AlphaProof vyškolen, aby čte a psal důkazy ve formálním jazyce s názvem Lean, který se používá v softwarovém balíčku „důkazní asistent“ stejného názvu, který je oblíbený u matematiků. Za tímto účelem AlphaProof testoval, zda jeho výdaje byly správné tím, že je udělali v balíčku Lean, což pomohlo vyplnit některé kroky v kódu.

Školení hlasového modelu vyžaduje obrovské množství dat, ale v Lean bylo k dispozici pouze několik matematických důkazů. Za účelem překonání tohoto problému vyvinul tým další síť, která se pokusila přeložit existující záznam jednoho milionu problémů, které byly napsány v přirozeném jazyce, ale bez překladu řešení napsaných Lean, říká Thomas Hubert, výzkumný pracovník pro studenty Deepmind, který provedl vývoj alphaproof. "Můžeme se naučit prokázat náš přístup, i když jsme původně nevyškolili na důkazy psané člověka?" (Společnost byla podobná Go, kde se jeho AI naučila hrát hru tím, že hraje proti sobě, místo toho, jak to lidé dělají.)

Magical Key

Mnoho štíhlých překladů nedávalo smysl, ale dost dobrých bylo natolik dobrých, aby přineslo alfaproof do bodu, kdy by mohlo zahájit rostoucí učební cykly. Výsledky byly mnohem lepší, než se očekávalo, řekl Gowers na tiskové konzultaci. „Mnoho problémů s IMO má tuto vlastnost magického klíče. Problém nejprve vypadá obtížně, dokud nenajdete magický klíč, který jej otevře,“ řekl Gowers, který pracuje v Collège de France v Paříži.

V některých případech se zdálo, že AlphaProof dokázal tento další krok kreativity učinit správným krokem z nekonečně velkého možného řešení. K určení, zda odpovědi byly méně překvapivé, je však nutná další analýza, přidala se přidaná gowers. Podobný diskurs vznikl po překvapivém 'Zug 37' , DeepMinds alphago-bot na jeho Slavné vítězství v roce 2016 o nejlepším hráči lidského go na světě -pro KI.

Zbývá zjistit, zda lze techniky zdokonalit tak, aby fungovaly na úrovni výzkumu matematiky, řekl Myers při tiskové revizi. "Může se rozšířit na jiné typy matematiky, kde nemohou být vyškoleny žádné miliony problémů?"

"Dosáhli jsme bodu, kdy můžete nejen prokázat otevřené výzkumné problémy, ale také problémy, které jsou velmi náročné pro ty nejlepší mladé matematiky na světě," řekl počítačový specialista Deepmind David Silver, který byl předním výzkumníkem ve vývoji Alphago v polovině roku 2010.