<σχήμα class = "σχήμα"> <Εικόνες class = "Embed ένταση-υψηλό"> <Πηγή type = "image/webp" srcset = "https://media.nature.com/lw767/magazine-assets/d41586-02441-2/d41586-02441-2_27386140.jpg?as=Webp 767W, https: μεγέθη = "(μέγιστο πλάτος: 319px) 319px, (min-πλάτος: 1023px) 100VW, 767px">

Αφού η Google Deepmind νίκησε τους ανθρώπους σε όλα, από το Παιχνίδι Go to Strategy Board Games ,
Τώρα ισχυρίζεται ότι είναι στα πρόθυρα να νικήσει τους καλύτερους φοιτητές του κόσμου κατά την επίλυση μαθηματικών καθηκόντων.

Το Λονδίνο με έδρα το Λονδίνο Μηχανή-μάθημα Η εταιρεία ανακοίνωσε στις 25 Ιουλίου ότι τα συστήματα τεχνητής νοημοσύνης (KI) έχουν λύσει τέσσερα από τα έξι καθήκοντα που δόθηκαν στους φοιτητές των Διεθνών Ολυμπιακών Ολυμπιακών Αγώνων (IMO) 2024 στο Bath της Μεγάλης Βρετανίας. Το AI παρείχε αυστηρά, σταδιακά στοιχεία, τα οποία αξιολογήθηκαν από δύο κορυφαία μαθηματικά και πέτυχαν βαθμολογία 28/42 μόνο ένα σημείο από την περιοχή των χρυσών μετάλλων.

"Είναι προφανώς μια πολύ σημαντική πρόοδος", λέει ο Joseph Myers, μαθηματικός από το Cambridge της Μεγάλης Βρετανίας, ο οποίος, μαζί με τον πεδίο Tim Gowers, έλεγξε τις λύσεις και βοήθησε να επιλέξει τα αρχικά προβλήματα για το τρέχον έτος.

DeepMind και άλλες εταιρείες βρίσκονται στον αγώνα για να παρέχουν τελικά στοιχεία για μηχανήματα, το βασικό Επίλυση ερευνητικών ερωτήσεων στα μαθηματικά . Τα προβλήματα με τον IMO, τον κορυφαίο ανταγωνισμό στον κόσμο για τους νέους μαθηματικούς, έχουν γίνει ένα κριτήριο για την πρόοδο προς την κατεύθυνση αυτού του στόχου και θεωρούνται ως "μεγάλη πρόκληση" για τη μηχανική μάθηση, σύμφωνα με την εταιρεία.

"Αυτή είναι η πρώτη φορά που ένα σύστημα AI ήταν σε θέση να επιτύχει υπηρεσίες σε επίπεδο μετάλλων", δήλωσε ο Pushmeet Kohli, αντιπρόεδρος της AI στην Science στο Deepmind, σε διαβούλευση τύπου. "Αυτό είναι ένα σημαντικό ορόσημο στο δρόμο για την οικοδόμηση προοδευτικών στοιχείων", δήλωσε ο Kohli.

επέκταση

Μόνο πριν από λίγους μήνες, τον Ιανουάριο, το σύστημα DeepMind Υπηρεσίες αλφαγομετρίας σε επίπεδο μετάλλων Κατά την επίλυση ενός τύπου προβλημάτων ΙΜΟ, και δηλαδή εκείνων της ευρωπαϊκής γεωμετρίας. Το πρώτο AI που εργάζεται σε επίπεδο χρυσού μετάλλου για τις συνολικές ερωτήσεις δοκιμής στην άλγεβρα, τη συνδυαστική θεωρία και τη θεωρία των αριθμών, τα οποία γενικά θεωρούνται πιο απαιτητικά από τη γεωμετρία-έχει το δικαίωμα να αποκτήσει τιμή 5 εκατομμυρίων δολαρίων, το βραβείο AI Math Olympiad (AIMO). (Η τιμή έχει αυστηρά κριτήρια όπως η αποκάλυψη του πηγαίου κώδικα και η εργασία με περιορισμένη υπολογιστική ισχύ, πράγμα που σημαίνει ότι οι τρέχουσες προσπάθειες του DeepMind δεν θα πληρούν τις προϋποθέσεις.)

Στην τελευταία προσπάθειά τους, οι ερευνητές χρησιμοποίησαν αλφαγομετρία2 για να λύσουν το πρόβλημα της γεωμετρίας σε λιγότερο από 20 δευτερόλεπτα. Το AI είναι μια βελτιωμένη και ταχύτερη έκδοση του συστήματος εγγραφής σας, λέει ο ειδικός στον τομέα της πληροφορικής Thang Luong.

Για τους άλλους τύπους ερωτήσεων, η ομάδα ανέπτυξε ένα εντελώς νέο σύστημα που ονομάζεται Alphaproof. Το Alphaproof επιλύει δύο προβλήματα άλγεβρας στον διαγωνισμό και ένα στη θεωρία αριθμών, για τα οποία χρειάστηκαν τρεις ημέρες. (Οι συμμετέχοντες του πραγματικού ΙΜΟ έχουν δύο συνεδρίες 4,5 ωρών το καθένα.) Δεν ήταν σε θέση να λύσει τα δύο προβλήματα στο συνδυασμό, μια άλλη περιοχή μαθηματικών.

<σχήμα class = "σχήμα"> <Εικόνες class = "Embed ένταση-υψηλό"> <Πηγή type = "image/webp" srcset = "https://media.nature.com/lw767/magazine-assets/d41586-02441-2/d41586-02441-2_27385380.jpg?as=Webp 767W, https: μεγέθη = "(μέγιστο πλάτος: 319px) 319px, (min-πλάτος: 1023px) 100VW, 767px">
close-up ενός χρυσού μετάλλου, που κέρδισε στην 63η Διεθνή Ολυμπία Μαθηματικών από έναν Ρουμάνικο συμμετέχοντα

Οι ερευνητές έχουν επιτύχει μικτά αποτελέσματα όταν απαντούν στις μαθηματικές ερωτήσεις με φωνητικά μοντέλα - ο τύπος του συστήματος που οδηγούν chatbots όπως το Chatt. Μερικές φορές τα μοντέλα δίνουν τη σωστή απάντηση, αλλά δεν μπορούν να εξηγήσουν την λογική τους λογικά, και μερικές φορές

Μόνο την περασμένη εβδομάδα, μια ομάδα εταιρειών λογισμικού Numina και HuggingFace χρησιμοποίησε ένα μοντέλο φωνής για να κερδίσει μια ενδιάμεση τιμή Amio 'Progress Prescient' με βάση τις απλοποιημένες εκδόσεις των προβλημάτων IMO. Οι εταιρείες έκαναν ολόκληρη την ανοικτή πηγή του συστημάτων και το κατέστησαν διαθέσιμο για τη λήψη άλλων ερευνητών. Αλλά οι νικητές είπαν ότι Nature ότι τα μοντέλα γλωσσών από μόνα τους πιθανότατα δεν θα ήταν αρκετά για να λύσουν δύσκολα προβλήματα.

Μόνο κλάση

Το Alphaproof συνδυάζει ένα μοντέλο φωνής με την τεχνολογία της ενίσχυσης της μάθησης, την οποία ο κινητήρας "Alphazero" για παιχνίδια επίθεσης όπως GO, καθώς και μερικά Ειδικά μαθηματικά προβλήματα . Με την αύξηση της μάθησης, ένα νευρωνικό δίκτυο μαθαίνει μέσω πειραμάτων και σφαλμάτων. Αυτό λειτουργεί καλά εάν οι απαντήσεις του μπορούν να αξιολογηθούν χρησιμοποιώντας μια αντικειμενική κλίμακα. Για το σκοπό αυτό, το Alphaproof εκπαιδεύτηκε για να διαβάσει και να γράψει στοιχεία σε μια επίσημη γλώσσα που ονομάζεται Lean, η οποία χρησιμοποιείται στο πακέτο λογισμικού «Proof Assistant» με το ίδιο όνομα που είναι δημοφιλές στους μαθηματικούς. Γι 'αυτό, ο Alphaproof εξέτασε αν τα έξοδά του ήταν σωστά κάνοντας τα στο πακέτο Lean, το οποίο βοήθησε να συμπληρωθεί μερικά από τα βήματα του κώδικα.

Η εκπαίδευση ενός φωνητικού μοντέλου απαιτεί τεράστιες ποσότητες δεδομένων, αλλά μόνο λίγα μαθηματικά στοιχεία ήταν διαθέσιμα στο Lean. Προκειμένου να ξεπεραστεί αυτό το πρόβλημα, η ομάδα ανέπτυξε ένα πρόσθετο δίκτυο που προσπάθησε να μεταφράσει μια υπάρχουσα καταγραφή ενός εκατομμυρίου προβλημάτων που γράφτηκαν σε φυσική γλώσσα, αλλά χωρίς να μεταφράζουν λύσεις γραμμένες στο Lean, λέει ο Thomas Hubert, ένας ερευνητής μαθητευόμενης μηχανής βαθιάς μηχανής που διεξήγαγε την ανάπτυξη του alphaproof με. "Μπορούμε να μάθουμε να αποδείξουμε την προσέγγισή μας, ακόμα κι αν δεν έχουμε αρχικά εκπαιδευτεί σε ανθρώπινα στοιχεία;" (Η εταιρεία ήταν παρόμοια με το Go, όπου το AI έμαθε να παίζει το παιχνίδι παίζοντας ενάντια στον εαυτό της, αντί για τον τρόπο που κάνουν οι άνθρωποι.)

μαγικό κλειδί

Πολλές από τις άπαχες μεταφράσεις δεν είχαν νόημα, αλλά αρκετές ήταν αρκετά καλές για να φέρουν το alphaproof στο σημείο όπου θα μπορούσε να ξεκινήσει τους αυξανόμενους κύκλους μάθησης. Τα αποτελέσματα ήταν πολύ καλύτερα από τα αναμενόμενα, δήλωσε ο Gowers στη διαβούλευση του Τύπου. "Πολλά προβλήματα με το IMO έχουν αυτή την ιδιότητα του μαγικού κλειδιού. Το πρόβλημα φαίνεται να είναι δύσκολο μέχρι να βρείτε ένα μαγικό κλειδί που το ανοίγει", δήλωσε ο Gowers, ο οποίος εργάζεται στο Collège de France στο Παρίσι.

Σε ορισμένες περιπτώσεις, το Alphaproof φάνηκε να είναι σε θέση να κάνει αυτό το πρόσθετο βήμα της δημιουργικότητας δίνοντάς του ένα σωστό βήμα από μια απείρως μεγάλη δυνατή λύση. Αλλά απαιτείται περαιτέρω ανάλυση για να προσδιοριστεί εάν οι απαντήσεις ήταν λιγότερο εκπληκτικές από ό, τι φαινόταν, πρόσθεσαν οι Gowers. Ένας παρόμοιος λόγος προέκυψε μετά την εκπληκτική zug 37 ' Data-rack = "Κάντε κλικ στο" Data-Label = "https://www.nature.com/artics/52945a" Data Track Category = "Link Body Text"> Διάσημη νίκη το 2016 σχετικά με τον καλύτερο παγκόσμιο παίκτη Go Go -Ένα σημείο καμπής για το KI.

Παραμένει να δούμε αν οι τεχνικές μπορούν να τελειοποιηθούν για να λειτουργήσουν σε επίπεδο έρευνας στα μαθηματικά, δήλωσε ο Myers στην αναθεώρηση του Τύπου. "Μπορεί να επεκταθεί σε άλλους τύπους μαθηματικών όπου δεν μπορούν να εκπαιδευτούν εκατομμύρια προβλήματα;"

"Έχουμε φτάσει στο σημείο όπου δεν μπορείτε μόνο να αποδείξετε ανοικτά ερευνητικά προβλήματα, αλλά και προβλήματα που είναι πολύ προκλητικά για τους καλύτερους νέους μαθηματικούς στον κόσμο", δήλωσε ο DeepMind Computer Specialist David Silver, ο οποίος ήταν ο κορυφαίος ερευνητής στην ανάπτυξη του Alphago στα μέσα του 2010.