Zinātnieki pārsteidza jaunāko Chatgpt modeli O1

Zinātnieki pārsteidza jaunāko Chatgpt modeli O1
Pētnieki, kuri palīdzēja pārbaudīt jauno lielās valodas modeli no Openai, Openai O1, saka, ka tas ir liels solis attiecībā uz Tērzu izmantošana zinātnei Pārstāvē.
"Manā kvantu fizikas apgabalā ir daudz detalizētākas un saskaņotākas atbildes" nekā iepriekšējā modelī, GPT-4O, saka Mario Krenn, mākslīgā zinātnieku laboratorijas vadītājs Maksa Planka gaismas fizikas institūtā Erlangenā, Vācijā. Krenn piederēja zinātnieku grupai “Sarkanā komanda”, kas pārbaudīja iepriekšējo Openai, tehnoloģiju uzņēmumu Openai, kas atrodas Sanfrancisko, Kalifornijā, izmēģinot robotu un pārbaudot viņus par drošības problēmām.
Kopš
Openaai skaidro, ka
Pārsniedz doktorantu Andrew White, a GPT-4 publikācija bija pārsteigta un sarūgtināta par vispārēju uzlabojumu trūkumu zinātnisko uzdevumu atbalstam.
Ievērojams ir O1 pirmais galvenais valodas modelis, kuru doktorants ir visgrūtākā jautājumā-“Diamond” sauktais absolventu līmeņa google necaurlaidīgais Q & A etalons (GPQA) Beats 1
Openaai arī pārbaudīja O1 starptautiskās matemātikas olimpiādes kvalifikācijas testa laikā. Iepriekšējais labākais modelis GPT-4O pareizi atrisināja tikai 13 % no uzdevumiem, bet O1 sasniedza 83 %. Padomājiet procesos Openai O1 darbojas ar piemiņas soļu ķēdi: tas runā ar vairākiem apsvērumiem, mēģinot atrisināt problēmu, un izlabo sevi. Openaai ir nolēmis saglabāt detaļas par noteikto domu ķēdi - daļēji tāpēc, ka ķēdē varētu būt kļūdas vai sociāli nepieņemamas “domas” un daļēji lai aizsargātu korporatīvos noslēpumus par modeļa darbību. Tā vietā O1 piedāvā rekonstruētu viņa loģikas kopsavilkumu lietotājam kopā ar atbildēm. Pēc Baltā teiktā, nav skaidrs, vai pilnīgai prāta ķēdei, ja tā tiks atklāta, būtu līdzības ar cilvēku domāšanu. Jaunajām prasmēm ir arī tumšās puses. Openai ziņo, ka tā ir saņēmusi anekdotiskas atgriezeniskās saites, ka O1 modeļi "halucinātu" biežāk izgudrotas nepatiesas atbildes kā viņu priekšgājēji (lai gan O1 iekšējie testi parāda nedaudz zemāku halucinācijas ātrumu). Sarkanās komandas zinātnieki ir atraduši daudzas iespējas, kā O1 bija noderīgs zinātnisku eksperimentu protokolu izstrādē, taču Openaai saka, ka testētāji arī parādīja “drošības informācijas trūkumu par kaitīgiem soļiem, piemēram, sprādziena bīstamības neatņemšana vai ieteikumi, kas nav saistīti ar ķīmiskām drošības metodēm, kas norāda uz nepietiekamu modeli, kad tas ir paredzēts. Drošība-Kritiski. "Tas joprojām nav ideāls vai pietiekami uzticams, lai tas nebūtu precīzi jāpārbauda," saka Vaits. Viņš piebilst, ka O1 ir piemērotāks
Zinātnes problēmu risinātājs Krenn uzskata, ka O1 paātrinās zinātni, palīdzot skenēt literatūru, atpazīstot nepilnības un ierosinot interesantas pētniecības pieejas turpmākajiem pētījumiem. Viņš integrēja O1 instrumentā, kuru viņš ir izstrādājis, un tas ļauj šo sauktu scimuse Kyle Kabasares, datu zinātnieks Bay Area Vides pētījumu institūtā Moffett Field, Kalifornijā, Izmantojiet O1, lai atkārtotu dažus programmēšanas posmus no viņa doktora projekta, kas aprēķināja melno caurumu masu. "Es biju nedaudz satriekts," viņš saka, pamanot, ka O1 ir vajadzīga apmēram stunda, lai sasniegtu to, kas viņam maksāja daudzus mēnešus. Katrīna Braunšteina, Bostonas bērnu slimnīcas ģenētiķe Masačūsetsā, saka, ka slimnīca šobrīd pārbauda vairākas AI sistēmas, ieskaitot O1 priekšskatījumu, tādām lietojumprogrammām kā sakarības starp pacienta īpašībām un retu slimību gēniem. Viņa saka, ka O1 "ir precīzāks un piedāvā iespējas, kuras es nedomāju, ka tās ir iespējamas no tērzēšanas robotprogrammatūras".