Teadlased avaldasid muljet uusim ChatGPT mudel O1

Teadlased avaldasid muljet uusim ChatGPT mudel O1
Teadlased, kes aitasid testida uut suurt keelemudelit OpenAi, OpenAi O1-st, väidavad, et see on suur samm Chatbotsite kasutamine teaduse jaoks esindab.
"Minu kvantfüüsika valdkonnas on palju üksikasjalikumaid ja sidusamaid vastuseid" kui eelmises mudelis GPT-4O, ütles Max Plancki kunstliku teadlase labori juht Max Plancki instituudi valgusfüüsika kunstliku instituudi juht Mario Krenn Saksamaal Erlangenis. Krenn kuulus "Punase meeskonna" teadlaste rühmale, kes katsetas Californias San Franciscos asuva tehnoloogiaettevõtte Odai eelnevat O1 -st, proovides robotit ja kontrollides neid turvaprobleemide osas.
Alates Oskused suurel hulgal standardiseeritud testides .
OpenAai selgitab, et
üle doktoriõpilased Andrew White, a " AT TRACHORY = " Mittetulundusühing San Franciscos, mis keskendub sellele, kuidas AI-d saab kasutada molekulaarbioloogias, väidab, et vaatleja pooleteise aasta jooksul href = "https://www.nature.com/articles/d41586-023-00816-5" Data-Track = "klõpsake" Data-Track = " "Https://www.nature.com/articles/d41586-00816-5" Data-Track-category = "BOODY Text"> GPT-4 avalik väljaanne oli üllatunud ja pettunud, et teaduslikud ülesanded on CHATBOT-id.
Tähelepanuväärne on O1 esimene suurem keelemudel, mis kõige raskemas küsimuses doktoriõpilased-teemantkuluga lõpetatud lõpetanute tasemel Google'i kindel Q & A Benchark (GPQA) lööb
OpenAai katsetas O1 ka rahvusvahelise matemaatika olümpiaadi kvalifikatsioonitesti ajal. Eelmine parim mudel, GPT-4O, lahendas vaid 13 % ülesannetest õigesti, O1 saavutas 83 %. Mõelge protsessides OpenAi O1 töötab mälestussammude ahelaga: see räägib palju kaalutlusi, üritades probleemi lahendada ja parandab ennast. OpenAai on otsustanud säilitada antud mõtteahela üksikasjad - osaliselt seetõttu, et kett võib sisaldada vigu või sotsiaalselt mittevastumatuid mõtteid ja osaliselt kaitsta ettevõtete saladusi mudeli toimimise kohta. Selle asemel pakub O1 koos oma vastustega rekonstrueeritud kokkuvõtet oma loogikast. On ebaselge, kas Valge sõnul oleks kogu meeleahela ahel, kui see ilmneb, sarnasusi inimliku mõtlemisega. Uutel oskustel on ka tumedad küljed. OpenAi teatab, et ta on saanud anekdootlikku tagasisidet, et O1 mudelid "hallutsineerivad" sagedamini valesid vastuseid-nende eelkäijatena (kuigi O1 sisemiste testid näitavad pisut madalamat hallutsinatsiooni määra). Punase meeskonna teadlased on leidnud arvukalt võimalusi selle kohta, kuidas O1 oli abiks teaduslike katsete protokollide väljatöötamisel, kuid OpenAai sõnul näitasid testijad ka ohutuse puudumist kahjulike sammude kohta, näiteks plahvatusohtude mittealustamine või soovitused, mis viitavad keemiliste ohutusmeetoditele, mis näitavad mudelile THICIC-i. "See pole endiselt piisavalt täiuslik ega usaldusväärne, et seda ei pea täpselt kontrollima," ütleb White. Ta lisab, et O1 sobib paremini
Teaduse probleemide lahendaja Krenn usub, et O1 kiirendab teadust, aidates skaneerida kirjandust, tunnistades lünki ja pakkudes tulevaste uuringute jaoks huvitavaid uurimismeetodeid. Ta integreeris O1 välja töötatud tööriista ja mis võimaldab seda nimega SciMuse 2 . "See loob palju huvitavamaid ideid kui GPT-4 või GPT-4O," ütleb ta. Kyle Kabasares, Californias Moffett Fieldis asuva Bay Area keskkonnauuringute instituudi andmeteadlane, Kasutage O1, et korrata mõned doktorikraadiprojekti programmeerimisetapid, mis arvutasid mustade aukude massi. "Olin lihtsalt hämmingus," ütleb ta, märgates, et O1 vajab umbes tund aega, et saavutada talle mitu kuud. Catherine Brownstein ütleb, et haigla testib praegu mitmeid AI -süsteemi, sealhulgas O1 eelvaadet, näiteks rakenduste jaoks, nagu näiteks patsientide omaduste ja haruldaste haiguste geenide vaheliste seoste paljastamine. Ta ütleb, et O1 "on täpsem ja pakub võimalusi, mida ma ei arvanud, et need on vestlusplaadilt võimalikud".