DeepMind在解决数学问题的解决方案中达到了里程碑 - AI的下一个大挑战

"Erfahren Sie, wie Google DeepMind die Welt der Mathematik revolutioniert, indem es die besten Schüler der Welt bei der Lösung von mathematischen Problemen herausfordert. Lesen Sie mehr über die bahnbrechenden Fortschritte und die Zukunft von KI in der Mathematik."
“了解Google如何通过挑战世界上最好的学生解决数学问题来彻底改变数学的世界。在数学上,阅读更多有关数学进展和AI的未来的更多信息。” (Symbolbild/natur.wiki)

DeepMind在解决数学问题的解决方案中达到了里程碑 - AI的下一个大挑战

在Google DeepMind击败了所有事物之后,从 Game to Goame to Strateging Board Games
现在,声称在解决数学任务时要击败世界上最好的学生。

基于伦敦的机器学习公司于7月25日宣布,他的人工智能(KI)系统已解决了国际数学奥运会(IMO)2024年在巴斯浴的六个任务中的四项。 AI提供了严格的渐进证据,通过两个顶部数学进行了评估,并从金牌区域获得了28/42的得分。

“显然,这是一个非常重要的进步,”来自英国剑桥的数学家约瑟夫·迈尔斯(Joseph Myers)说,他与菲尔兹奖牌获得者蒂姆·高尔斯(Tim Gowers)一起检查了解决方案,并帮助选择了今年的原始问题。

DeepMind和其他公司正在竞赛中最终提供机器的证据,Essential 在数学中解决研究问题。据该公司称,IMO的问题是IMO,这是年轻数学家的世界领先竞争,已成为该目标方向发展的标准,并被视为机器学习的“巨大挑战”。

“这是AI系统第一次能够在奖牌水平上实现服务,” DeepMind AI科学副总裁Pushmeet Kohli在新闻咨询中说。科利说:“这是建立渐进证据的途径的重要里程碑。”

扩展

仅几个月前,一月份,deepmind系统奖章级别的AlphageMetry Services 求解IMO问题时,即在Eleclideaneaneyemo中,即在Eleclidean eyleclideansememetry中。第一个在金牌水平上工作的AI,包括代数,组合学和数字理论在内的总体测试问题,通常认为这比几何学要求更高,有权获得500万美元的价格,AI Math Olympiad奖(AIMO)。 (价格具有严格的标准,例如披露源代码和具有有限计算能力的工作,这意味着DeepMind的当前努力将无资格。)

在他们的最新尝试中,研究人员使用Alphageometry2在不到20秒的时间内解决了几何问题。 DeepMind计算机专家Thang Luong说,AI是您记录系统的改进,更快的版本。

对于其他类型的问题,团队开发了一个全新的系统,称为字母隔热。字母座是在比赛中解决了两个代数问题,一个在数量理论中解决了三天。 (实际IMO的参与者每个4.5小时的会话。)它无法解决组合中的两个问题,这是数学的另一个领域。


“金牌的特写,在罗马尼亚参与者的第63届国际数学奥林匹克中获胜。”

研究人员在使用语音模型回答数学问题时取得了不同的结果 - 驱动聊天机器人等聊天机器人的系统类型。有时,这些模型给出了正确的答案,但不能合理地解释其推理,有时

仅在上周,一组软件公司Numina和HuggingFace团队使用语音模型,基于IMO问题的简化版本来赢得中级Amio“进度价格”。两家公司将整个系统开源,并可以下载其他研究人员。但是获奖者说,大自然单独的语言模型可能不足以解决困难问题。

只有类

字母框架将语音模型与加强学习的技术结合在一起,攻击游戏的“ alphazero”引擎以及某些特定的数学问题。随着学习的增加,神经网络通过实验和错误学习。如果可以使用客观量表对其答案进行评估,则可以很好地工作。为此,对字母座的培训可以用一种名为Lean的正式语言读取和写证据,该语言在“证明助手”软件包中使用,该软件包在数学家流行的同名软件包中使用。为此,字母隔板测试了他的支出是否正确,通过在精益包裹中进行费用,这有助于填写代码中的一些步骤。

语音模型的训练需要大量数据,但是精益中只有少数数学证据。为了克服这个问题,团队开发了一个额外的网络,试图翻译以自然语言编写的一百万个问题的现有录音,但没有翻译以精益的方式编写的解决方案。 “即使我们最初没有接受人类作者的证据训练,我们也可以学会证明我们的方法?” (该公司类似于Go,他的人工智能通过对抗自己而不是人们的方式来学习游戏。)

Magical Key

许多精益翻译没有任何意义,但是足够好,足以使字母宽带能够开始增加学习周期。 Gowers在新闻咨询中说,结果比预期的要好得多。在巴黎的CollègeDeFrance工作的Gowers说:“ IMO的许多问题都具有Magical Key的这一属性。直到您找到一个魔法钥匙打开它之前,问题首先看起来很困难。”

在某些情况下,字母隔板似乎可以通过从无限大可能的解决方案中给出正确的步骤来采取这一额外的创造力步骤。但是,需要进一步的分析来确定答案是否比它们看起来不那么令人惊讶。令人惊讶的'zug 37' “ https://www.nature.com/articles/529445a” data-track =“单击” data-label =“ https://www.nature.com/artics/artics/52945a” 数据轨道类别=“身体文本链接”> 2016年关于世界上最好的人类Go Player的著名胜利 -a ki的转折点。

迈尔斯在《新闻报》评论中说,

在数学研究水平上工作是否可以完善这些技术。 “它可以扩展到其他类型的数学类型,在这些数学中,没有培训数百万个问题?”

“我们已经达到了您不仅可以证明开放研究问题的地步,而且对世界上最好的年轻数学家来说非常具有挑战性的问题。