Naukowcy byli pod wrażeniem najnowszego modelu Chatgpt O1

Naukowcy byli pod wrażeniem najnowszego modelu Chatgpt O1
Badacze, którzy pomogli przetestować nowy duży model języka z Openai, OpenAi O1, twierdzą, że jest to duży krok pod względem Reprezentuje chatboty dla nauki .
„W mojej dziedzinie fizyki kwantowej jest znacznie bardziej szczegółowe i bardziej spójne odpowiedzi” niż w poprzednim modelu, GPT-4O, mówi Mario Krenn, szef sztucznego laboratorium naukowca w Max Planck Institute for the Physics of Light w Erlangen w Niemczech. Krenn należał do grupy naukowców w „Czerwonym zespole”, który testował datowanie z O1 dla Openai, firmy technologicznej z siedzibą w San Francisco w Kalifornii, wypróbowując bota i sprawdzając ich obawy związane z bezpieczeństwem.
Od czasu publiczne wprowadzenie czterej w 2022 r. Duże modele językowe, które napędzają takie chatboty, średnio coraz lepsze, z większą liczbą parametrów, większych zestawów danych treningowych i Umiejętności w dużej liczbie standardowych testów
Przekrocz doktoranci
Andrew White, a chemikist Publikacja GPT-4 Była zaskoczona i rozczarowana ogólnym brakiem ulepszeń w poparciu naukowym przez Chatbots
niezwykłe jest O1 pierwszym głównym modelem języka, który doktoranci w najtrudniejszym pytaniu-„Diamond” połączony z absolwentem Benchmarku Pytania i odpowiedzi (GPQA) bije . „Dla początkującego jest to poza jej natychmiastową zdolnością patrzenia na protokół generowany przez O1 i uznanie, że jest to„ nonsens ”, mówi.
Problem Solver of Science
Krenn uważa, że O1 przyspieszy naukę, pomagając skanować literaturę, rozpoznając luki i proponując interesujące podejścia badawcze do przyszłych badań. Zintegrował O1 z narzędziem, które opracował, i to umożliwia ten zwany scimuse 2 . „Generuje znacznie bardziej interesujące pomysły niż GPT-4 lub GPT-4O”-mówi.
Kyle Kabasares, naukowca danych w Bay Area Environmental Research Institute w Moffett Field, Kalifornia, Użyj O1, aby odtworzyć niektóre etapy programowania z jego projektu doktoranckiego, który obliczył masę czarnych otworów. „Byłem po prostu przytłoczony” - mówi, zauważając, że O1 potrzebował około godziny, aby osiągnąć go przez wiele miesięcy.
Catherine Brownstein, genetyka w Boston Children's Hospital w Massachusetts, twierdzi, że szpital testuje obecnie kilka systemów AI, w tym podgląd O1, pod kątem takich zastosowań, jak odkrywanie relacji między cechami pacjenta i genami w przypadku rzadkich chorób. Mówi, że O1 „jest bardziej precyzyjne i oferuje opcje, których nie sądziłem, że są możliwe z bota czatu”.