يصل DeepMind إلى معلم في حل المشكلات الرياضية - التحدي الكبير التالي لمنظمة العفو الدولية

"Erfahren Sie, wie Google DeepMind die Welt der Mathematik revolutioniert, indem es die besten Schüler der Welt bei der Lösung von mathematischen Problemen herausfordert. Lesen Sie mehr über die bahnbrechenden Fortschritte und die Zukunft von KI in der Mathematik."
"تعرف على كيفية إحداث ثورة في Google Deepmind في عالم الرياضيات من خلال تحدي أفضل الطلاب في العالم في حل المشكلات الرياضية. اقرأ المزيد عن التقدم الرائد ومستقبل الذكاء الاصطناعي في الرياضيات." (Symbolbild/natur.wiki)

يصل DeepMind إلى معلم في حل المشكلات الرياضية - التحدي الكبير التالي لمنظمة العفو الدولية

<الشكل class = "الشكل">

بعد أن هزم Google Deepmind الأشخاص في كل شيء ، من

مقرها في لندن أعلنت شركة التعلم الآلي في 25 يوليو أن أنظمة الذكاء الاصطناعي (KI) قد حلت أربع من المهام الست التي تم منحها للطلاب في أولمبياد الرياضيات الدولية (IMO) 2024 في باث ، بريطانيا العظمى. قدمت الذكاء الاصطناعى أدلة تدريجية صارمة ، تم تقييمها من قبل اثنين من الرياضيات العليا وحققت درجة 28/42 نقطة واحدة فقط من منطقة الميداليات الذهبية.

يقول جوزيف مايرز ، عالم الرياضيات من كامبريدج ، بريطانيا العظمى ، الذي قام ، مع ميدالية الحقول تيم جويرز ، إلى فحص الحلول ، "إنه من الواضح أنه تقدم مهم للغاية".

DeepMind والشركات الأخرى في السباق لتقديم أدلة في النهاية على الآلات ، حل أسئلة البحث في الرياضيات . أصبحت مشاكل IMO ، وهي المنافسة الرائدة في العالم لعلماء الرياضيات الشباب ، بمثابة معيار للتقدم في اتجاه هذا الهدف وينظر إليه على أنه "تحد كبير" للتعلم الآلي ، وفقًا للشركة.

قال Pushmeet Kohli ، نائب رئيس الذكاء الاصطناعى في Science في DeepMind ، في استشارة صحفية: "هذه هي المرة الأولى التي يتمكن فيها نظام الذكاء الاصطناعى من تحقيق الخدمات على مستوى الميدالية". وقال كوهلي "هذا معلم مهم في طريقه إلى بناء أدلة تقدمية".

التمديد

قبل بضعة أشهر فقط ، في يناير ، نظام DeepMind خدمات القياس ألفاجيوم على مستوى الميداليات عند حل نوع من مشاكل IMO ، وهي في الجيوم الإلكترونية. أول منظمة العفو الدولية التي تعمل على مستوى الميدالية الذهبية للأسئلة الإجمالية للاختبار في الجبر ، والاختلاف ، ونظرية الأرقام ، والتي تعتبر عمومًا أكثر تطلبًا من الهندسة-يحق لها الحصول على سعر 5 ملايين دولار ، جائزة AI Math Olympiad (AIMO). (يحتوي السعر على معايير صارمة مثل الكشف عن رمز المصدر والعمل مع قوة الحوسبة المحدودة ، مما يعني أن الجهود الحالية لـ DeepMind لن تتأهل.)

في محاولتهم الأخيرة ، استخدم الباحثون Alphageometry2 لحل مشكلة الهندسة في أقل من 20 ثانية ؛ يقول Thang Luong ، أخصائي الكمبيوتر DeepMind.

بالنسبة للأنواع الأخرى من الأسئلة ، طور الفريق نظامًا جديدًا تمامًا يسمى Alphaproff. قام Alphaproof بحل مشكلتين للجبر في المنافسة وواحدة في نظرية الأرقام ، والتي استغرق الأمر ثلاثة أيام. (لدى المشاركين في IMO الفعلي دورتين من 4.5 ساعة لكل منهما.) لم يتمكن من حل المشكلتين في المزيج ، وهي مجال آخر من الرياضيات.

<الشكل class = "الشكل">
Close-up of Gold Medal ، فاز في أولمبياد الرياضيات الدولي 63 من قبل مشارك روماني.

الأسبوع الماضي فقط ، استخدم فريق من شركات البرمجيات Numina و Huggingface نموذجًا صوتيًا للفوز بـ Amio "سعر تقدم" وسيطة استنادًا إلى إصدارات مبسطة من مشاكل IMO. جعلت الشركات أنظمةها بالكامل مفتوحة المصدر وجعلتها متاحة لتنزيل الباحثين الآخرين. لكن الفائزين قالوا الطبيعة أن نماذج اللغة وحدها لن تكون كافية لحل المشكلات الصعبة.

فئة فقط

يجمع

Alphaproff بين نموذج صوتي وتكنولوجيا التعلم المعزز ، والذي يحركه محرك "Alphazero" لألعاب الهجوم مثل GO وكذلك بعض مشاكل رياضية محددة . مع زيادة التعلم ، تتعلم الشبكة العصبية من خلال التجارب والأخطاء. هذا يعمل بشكل جيد إذا كان يمكن تقييم إجاباته باستخدام مقياس موضوعي. لهذا الغرض ، تم تدريب Alphaproff على قراءة وكتابة الأدلة بلغة رسمية تسمى Lean ، والتي يتم استخدامها في حزمة برامج "Proof Assistant" التي تحمل نفس الاسم التي تحظى بشعبية لدى علماء الرياضيات. لهذا الغرض ، اختبر Alphaproff ما إذا كانت نفقاته صحيحة من خلال القيام بها في الحزمة Lean ، مما ساعد على ملء بعض الخطوات في الكود.

يتطلب تدريب النموذج الصوتي كميات هائلة من البيانات ، ولكن فقط بعض الأدلة الرياضية كانت متوفرة في العجاف. من أجل التغلب على هذه المشكلة ، طور الفريق شبكة إضافية حاولت ترجمة تسجيل موجود لمليون مشكلة كتبت بلغة طبيعية ، ولكن دون ترجمة حلول مكتوبة في Lean ، كما يقول توماس هوبرت ، باحث متعلم في آلة DeepMind قام بتطوير Alphaprack. "يمكننا أن نتعلم إثبات نهجنا ، حتى لو لم نتدرب في الأصل على أدلة بشرية مكتوبة؟" (كانت الشركة مشابهة لـ The Go ، حيث تعلمت الذكاء الاصطناعي لعب اللعبة من خلال اللعب ضد نفسها ، بدلاً من الطريقة التي يفعلها الناس.)

المفتاح السحري

لا معنى لها في العديد من الترجمات الهزيلة ، لكن بما يكفي كانت جيدة بما يكفي لإحضار ألفاب إلى النقطة التي يمكن أن تبدأ فيها دورات التعلم المتزايدة. وقال جويرز في استشارة الصحافة إن النتائج كانت أفضل بكثير مما كان متوقعًا. وقال جويرز ، الذي يعمل في كوليج دي فرنسا في باريس: "العديد من المشكلات مع IMO لديها هذه الخاصية للمفتاح السحري. تبدو المشكلة أولاً صعبة حتى تجد مفتاحًا سحريًا يفتحه".

في بعض الحالات ، بدا أن Alphaproof قادر على اتخاذ هذه الخطوة الإضافية من الإبداع من خلال منحها خطوة صحيحة من حل كبير لا نهائي. لكن مزيد من التحليل مطلوب لتحديد ما إذا كانت الإجابات أقل إثارة للدهشة مما نظرت. نشأ خطاب مماثل بعد المدهش 'zug 37' Data-track = "انقر فوق" data-label = "https://www.nature.com/artics/52945a" Track Track Category = "Body Text Link"> النصر الشهير في عام 2016 حول أفضل لاعب إنساني في العالم -نقطة تحول لـ KI.

قال مايرز في مراجعة الصحافة إن

يبقى أن نرى ما إذا كانت التقنيات يمكن أن تكون مثالية للعمل على مستوى من البحث في الرياضيات. "هل يمكن أن تتوسع إلى أنواع أخرى من الرياضيات حيث لا يمكن تدريب الملايين من المشاكل؟"

"لقد وصلنا إلى النقطة التي لا يمكنك فيها إثبات مشكلات البحث المفتوحة فحسب ، بل أيضًا مشاكل صعبة للغاية بالنسبة لأفضل علماء الرياضيات الشباب في العالم".