يصل DeepMind إلى معلم في حل المشكلات الرياضية - التحدي الكبير التالي لمنظمة العفو الدولية

يصل DeepMind إلى معلم في حل المشكلات الرياضية - التحدي الكبير التالي لمنظمة العفو الدولية
بعد أن هزم Google Deepmind الأشخاص في كل شيء ، من
مقرها في لندن أعلنت شركة التعلم الآلي في 25 يوليو أن أنظمة الذكاء الاصطناعي (KI) قد حلت أربع من المهام الست التي تم منحها للطلاب في أولمبياد الرياضيات الدولية (IMO) 2024 في باث ، بريطانيا العظمى. قدمت الذكاء الاصطناعى أدلة تدريجية صارمة ، تم تقييمها من قبل اثنين من الرياضيات العليا وحققت درجة 28/42 نقطة واحدة فقط من منطقة الميداليات الذهبية.
DeepMind والشركات الأخرى في السباق لتقديم أدلة في النهاية على الآلات ، حل أسئلة البحث في الرياضيات . أصبحت مشاكل IMO ، وهي المنافسة الرائدة في العالم لعلماء الرياضيات الشباب ، بمثابة معيار للتقدم في اتجاه هذا الهدف وينظر إليه على أنه "تحد كبير" للتعلم الآلي ، وفقًا للشركة.
قال Pushmeet Kohli ، نائب رئيس الذكاء الاصطناعى في Science في DeepMind ، في استشارة صحفية: "هذه هي المرة الأولى التي يتمكن فيها نظام الذكاء الاصطناعى من تحقيق الخدمات على مستوى الميدالية". وقال كوهلي "هذا معلم مهم في طريقه إلى بناء أدلة تقدمية".التمديد
قبل بضعة أشهر فقط ، في يناير ، نظام DeepMind خدمات القياس ألفاجيوم على مستوى الميداليات عند حل نوع من مشاكل IMO ، وهي في الجيوم الإلكترونية. أول منظمة العفو الدولية التي تعمل على مستوى الميدالية الذهبية للأسئلة الإجمالية للاختبار في الجبر ، والاختلاف ، ونظرية الأرقام ، والتي تعتبر عمومًا أكثر تطلبًا من الهندسة-يحق لها الحصول على سعر 5 ملايين دولار ، جائزة AI Math Olympiad (AIMO). (يحتوي السعر على معايير صارمة مثل الكشف عن رمز المصدر والعمل مع قوة الحوسبة المحدودة ، مما يعني أن الجهود الحالية لـ DeepMind لن تتأهل.)
في محاولتهم الأخيرة ، استخدم الباحثون Alphageometry2 لحل مشكلة الهندسة في أقل من 20 ثانية ؛ يقول Thang Luong ، أخصائي الكمبيوتر DeepMind.
بالنسبة للأنواع الأخرى من الأسئلة ، طور الفريق نظامًا جديدًا تمامًا يسمى Alphaproff. قام Alphaproof بحل مشكلتين للجبر في المنافسة وواحدة في نظرية الأرقام ، والتي استغرق الأمر ثلاثة أيام. (لدى المشاركين في IMO الفعلي دورتين من 4.5 ساعة لكل منهما.) لم يتمكن من حل المشكلتين في المزيج ، وهي مجال آخر من الرياضيات.
<الشكل class = "الشكل">الأسبوع الماضي فقط ، استخدم فريق من شركات البرمجيات Numina و Huggingface نموذجًا صوتيًا للفوز بـ Amio "سعر تقدم" وسيطة استنادًا إلى إصدارات مبسطة من مشاكل IMO. جعلت الشركات أنظمةها بالكامل مفتوحة المصدر وجعلتها متاحة لتنزيل الباحثين الآخرين. لكن الفائزين قالوا الطبيعة أن نماذج اللغة وحدها لن تكون كافية لحل المشكلات الصعبة.
فئة فقط
يجمعAlphaproff بين نموذج صوتي وتكنولوجيا التعلم المعزز ، والذي يحركه محرك "Alphazero" لألعاب الهجوم مثل GO وكذلك بعض مشاكل رياضية محددة . مع زيادة التعلم ، تتعلم الشبكة العصبية من خلال التجارب والأخطاء. هذا يعمل بشكل جيد إذا كان يمكن تقييم إجاباته باستخدام مقياس موضوعي. لهذا الغرض ، تم تدريب Alphaproff على قراءة وكتابة الأدلة بلغة رسمية تسمى Lean ، والتي يتم استخدامها في حزمة برامج "Proof Assistant" التي تحمل نفس الاسم التي تحظى بشعبية لدى علماء الرياضيات. لهذا الغرض ، اختبر Alphaproff ما إذا كانت نفقاته صحيحة من خلال القيام بها في الحزمة Lean ، مما ساعد على ملء بعض الخطوات في الكود.
يتطلب تدريب النموذج الصوتي كميات هائلة من البيانات ، ولكن فقط بعض الأدلة الرياضية كانت متوفرة في العجاف. من أجل التغلب على هذه المشكلة ، طور الفريق شبكة إضافية حاولت ترجمة تسجيل موجود لمليون مشكلة كتبت بلغة طبيعية ، ولكن دون ترجمة حلول مكتوبة في Lean ، كما يقول توماس هوبرت ، باحث متعلم في آلة DeepMind قام بتطوير Alphaprack. "يمكننا أن نتعلم إثبات نهجنا ، حتى لو لم نتدرب في الأصل على أدلة بشرية مكتوبة؟" (كانت الشركة مشابهة لـ The Go ، حيث تعلمت الذكاء الاصطناعي لعب اللعبة من خلال اللعب ضد نفسها ، بدلاً من الطريقة التي يفعلها الناس.)
المفتاح السحري
لا معنى لها في العديد من الترجمات الهزيلة ، لكن بما يكفي كانت جيدة بما يكفي لإحضار ألفاب إلى النقطة التي يمكن أن تبدأ فيها دورات التعلم المتزايدة. وقال جويرز في استشارة الصحافة إن النتائج كانت أفضل بكثير مما كان متوقعًا. وقال جويرز ، الذي يعمل في كوليج دي فرنسا في باريس: "العديد من المشكلات مع IMO لديها هذه الخاصية للمفتاح السحري. تبدو المشكلة أولاً صعبة حتى تجد مفتاحًا سحريًا يفتحه".
في بعض الحالات ، بدا أن Alphaproof قادر على اتخاذ هذه الخطوة الإضافية من الإبداع من خلال منحها خطوة صحيحة من حل كبير لا نهائي. لكن مزيد من التحليل مطلوب لتحديد ما إذا كانت الإجابات أقل إثارة للدهشة مما نظرت. نشأ خطاب مماثل بعد المدهش 'zug 37' Data-track = "انقر فوق" data-label = "https://www.nature.com/artics/52945a" Track Track Category = "Body Text Link"> النصر الشهير في عام 2016 حول أفضل لاعب إنساني في العالم -نقطة تحول لـ KI.
قال مايرز في مراجعة الصحافة إنيبقى أن نرى ما إذا كانت التقنيات يمكن أن تكون مثالية للعمل على مستوى من البحث في الرياضيات. "هل يمكن أن تتوسع إلى أنواع أخرى من الرياضيات حيث لا يمكن تدريب الملايين من المشاكل؟"
"لقد وصلنا إلى النقطة التي لا يمكنك فيها إثبات مشكلات البحث المفتوحة فحسب ، بل أيضًا مشاكل صعبة للغاية بالنسبة لأفضل علماء الرياضيات الشباب في العالم".