Tutkijat vaikuttivat viimeisimmästä chatgpt -mallista O1

Wissenschaftler loben das neue ChatGPT-Modell o1 von OpenAI für seine beeindruckenden Fortschritte in der Wissenschaftsunterstützung.
Tutkijat ylistävät uutta Chatgpt -mallia O1: stä Openaiilta sen vaikuttavasta etenemisestä tieteellisessä tuessa. (Symbolbild/natur.wiki)

Tutkijat vaikuttivat viimeisimmästä chatgpt -mallista O1

Tutkijat, jotka auttoivat testaamaan uuden suuren kielimallin OpenAi, OpenAi O1, sanovat, että se on iso askel Chatbotsin käyttö tieteeseen edustaa.

"Kvanttifysiikan alueella on paljon yksityiskohtaisempia ja yhtenäisempiä vastauksia" kuin edellisessä mallissa GPT-4O, sanoo Mario Krenn, Max Planck -fysiikan instituutin keinotekoisen tutkijalaboratorion päällikkö Erlangenissa, Saksassa. Krenn kuului "punaisen tiimin" tutkijoiden ryhmään, joka testasi ennakkomaksua O1: stä Openaille, teknologiayritykselle, joka sijaitsee Kalifornian San Franciscossa, kokeilemalla bottia ja tarkistamalla heidät turvallisuusongelmiin.

Koska taidot suuressa määrässä standardisoituja testejä .

OpenAai selittää, että

ylittää jatko -opiskelijat

Andrew White, kemisti San Franciscon organisaatio, joka keskittyy siihen, miten AI: tä voidaan käyttää molekyylibiologiassa, sanoo, että tarkkailija viimeisen vuoden ja puolen href = "https://www.nature.com/articles/d41586-023-00816-5" data-strack = "click" data-label = "

Huomattava on O1 ensimmäinen tärkein kielimalli, jonka jatko-opiskelijat ovat vaikeimmissa kysymyksissä-'Diamond'-asetettujen jatko-tason Google-Proof Q & A Benchmark (GPQA) lyö 1

OpenAai testasi myös O1: tä kansainvälisen matematiikan olympialaisen pätevyystestin aikana. Edellinen paras malli, GPT-4O, ratkaisi vain 13 % tehtävistä oikein, kun taas O1 saavutti 83 %.

ajattele prosesseissa

Openai O1 toimii muistovaiheiden ketjun kanssa: Se puhuu useita näkökohtia yrittäessään ratkaista ongelman ja korjaa itsensä.

OpenAai on päättänyt pitää tietyn ajatusketjun yksityiskohdat - osittain siksi, että ketju voisi sisältää virheitä tai sosiaalisesti hyväksyttävää ”ajatuksia” ja osittain yrityssalaisuuksien suojaamiseksi mallin toiminnasta. Sen sijaan O1 tarjoaa rekonstruoidun yhteenvedon logiikastaan ​​käyttäjälle yhdessä vastaustensa kanssa. Valkoisen mukaan on epäselvää, onko täydellisellä mielenketjulla, jos se paljastetaan, olisi samankaltaisuuksia ihmisen ajattelun kanssa.

Uusilla taitoilla on myös tummat puolensa. OpenAi raportoi, että se on saanut anekdoottisen palautteen, jonka mukaan O1-mallit "hallusinaatin" keksineen vääriä vastauksia-kuten edeltäjänsä (vaikka sisäisillä O1: n sisäisillä testillä on hiukan alhaisempi hallusinaatioaste).

Punaisen ryhmän tutkijat ovat löytäneet lukuisia vaihtoehtoja siitä, kuinka O1 oli hyödyllinen tieteellisten kokeiden pöytäkirjojen kehittämisessä, mutta OpenAai sanoo, että testaajat osoittivat myös: "Turvallisuustietojen puute haitallisista vaiheista, kuten räjähdysvaarojen tai ehdotusten poistamatta jättäminen kemiallisiin turvallisuusmenetelmiin, jotka osoittavat mallin saamisen suhteen.

"Se ei ole silti täydellinen tai luotettava, jotta sitä ei tarvitse tarkistaa tarkalleen", White sanoo. Hän lisää, että O1 soveltuu paremmin . "Aloittelijalle se on hänen välittömän kykynsä tarkastella O1: n tuottamaa protokollaa ja tunnustaa, että se on" hölynpölyä "," hän sanoo.

tieteen ongelmanratkaisija

; Hän integroidaan O1 työkaluun, jonka hän on kehittänyt ja joka mahdollistaa tämän nimeltään scimuse
2 . "Se tuottaa paljon mielenkiintoisempia ideoita kuin GPT-4 tai GPT-4O", hän sanoo.

Kyle Kabasares, Bay Area Environmental Research Institute -ympäristötieteilijä Moffett Fieldissä, Kalifornia, Käytä O1: tä toistaaksesi joitain ohjelmointihankkeita tohtorintutkintoprojektistaan, jotka laskivat mustien reikien massan. "Olin vain hukkua", hän sanoo huomatessaan, että O1 tarvitsi noin tunnin saavuttaakseen hänelle useita kuukausia.

Massachusettsin Bostonin lastensairaalan geneetikko Catherine Brownstein sanoo, että sairaala testaa parhaillaan useita AI -järjestelmiä, mukaan lukien O1 -esikatselu, esimerkiksi potilaan ominaisuuksien ja harvinaisten sairauksien geenien välisten suhteiden paljastamiseen. Hänen mukaansa O1 "on tarkempi ja tarjoaa vaihtoehtoja, joita en usko, että ne olisivat mahdollisia chat -botista".

    Ra

    Rein, D. et ai. Preprint at arxiv (2023).

    Ra

    gu, X. & Krenn, M. PrePrintin at arxiv https://doi.org/10.48550/arxiv.2405.17044 (2024).

    Lataa viitteet