Naukowcy byli pod wrażeniem najnowszego modelu Chatgpt O1

Naukowcy byli pod wrażeniem najnowszego modelu Chatgpt O1

Badacze, którzy pomogli przetestować nowy duży model języka z Openai, OpenAi O1, twierdzą, że jest to duży krok pod względem Reprezentuje chatboty dla nauki .

„W mojej dziedzinie fizyki kwantowej jest znacznie bardziej szczegółowe i bardziej spójne odpowiedzi” niż w poprzednim modelu, GPT-4O, mówi Mario Krenn, szef sztucznego laboratorium naukowca w Max Planck Institute for the Physics of Light w Erlangen w Niemczech. Krenn należał do grupy naukowców w „Czerwonym zespole”, który testował datowanie z O1 dla Openai, firmy technologicznej z siedzibą w San Francisco w Kalifornii, wypróbowując bota i sprawdzając ich obawy związane z bezpieczeństwem.

Od czasu Umiejętności w dużej liczbie standardowych testów

Openaai wyjaśnia, że ​​ O1 Series Podstawowa zmiana podejścia firmy. Obserwatorzy informują, że ten model AI charakteryzuje się faktem, że spędził więcej czasu na niektórych fazach uczenia się i „myśli” o swoich odpowiedzi dłużej, co sprawia, że ​​wolniej jest, ale bardziej zdolny-szczególnie w obszarach, w których poprawne i niewłaściwe odpowiedzi są wyraźnie zdefiniowane. Firma dodaje, że O1 może „przemyśleć złożone zadania i rozwiązać trudniejsze problemy niż poprzednie modele w nauce, programowaniu i matematyce”. Obecnie O1-Preview i O1-Mini-A mniejsza, bardziej opłacalna wersja, która jest odpowiednia do programowania, jest dostępna dla płacących klientów i niektórych programistów podczas pracy testowej. Firma nie opublikowała żadnych informacji na temat parametrów ani mocy obliczeniowej modeli O1.

Przekrocz doktoranci

Andrew White, a chemikist Publikacja GPT-4 Była zaskoczona i rozczarowana ogólnym brakiem ulepszeń w poparciu naukowym przez Chatbots

niezwykłe jest O1 pierwszym głównym modelem języka, który doktoranci w najtrudniejszym pytaniu-„Diamond” połączony z absolwentem Benchmarku Pytania i odpowiedzi (GPQA) bije . „Dla początkującego jest to poza jej natychmiastową zdolnością patrzenia na protokół generowany przez O1 i uznanie, że jest to„ nonsens ”, mówi.

Problem Solver of Science

Krenn uważa, że ​​O1 przyspieszy naukę, pomagając skanować literaturę, rozpoznając luki i proponując interesujące podejścia badawcze do przyszłych badań. Zintegrował O1 z narzędziem, które opracował, i to umożliwia ten zwany scimuse 2 . „Generuje znacznie bardziej interesujące pomysły niż GPT-4 lub GPT-4O”-mówi.

Kyle Kabasares, naukowca danych w Bay Area Environmental Research Institute w Moffett Field, Kalifornia, Użyj O1, aby odtworzyć niektóre etapy programowania z jego projektu doktoranckiego, który obliczył masę czarnych otworów. „Byłem po prostu przytłoczony” - mówi, zauważając, że O1 potrzebował około godziny, aby osiągnąć go przez wiele miesięcy.

Catherine Brownstein, genetyka w Boston Children's Hospital w Massachusetts, twierdzi, że szpital testuje obecnie kilka systemów AI, w tym podgląd O1, pod kątem takich zastosowań, jak odkrywanie relacji między cechami pacjenta i genami w przypadku rzadkich chorób. Mówi, że O1 „jest bardziej precyzyjne i oferuje opcje, których nie sądziłem, że są możliwe z bota czatu”.

  1. rein, D. i in. Preprint w arxiv

    gu, x. & krenn, M. Preprint w arxiv https://doi.org/10.48550/arxiv.2405.17044 (2024).

  2. .sidebar { width: 300px; min-width:300px; position: sticky; top: 0; align-self: flex-start; } .contentwrapper { display: flex ; gap: 20px; overflow-wrap: anywhere; } @media (max-width:768px){ .contentwrapper { flex-direction: column; } .sidebar{display:none;} } .sidebar_sharing { display: flex; justify-content: space-between; } .sidebar_sharing a { background-color: #e6e6e6; padding: 5px 10px; margin: 0; font-size: .95rem; transform: none; border-radius: 5px; display: inline-block; text-decoration: none; color:#333; display: inline-flex; justify-content: space-between; } .sidebar_sharing a:hover { background-color: #333; color:#fff; } .sidebar_box { padding: 15px; margin-bottom: 20px; box-shadow: 0 2px 5px rgba(0, 0, 0, .1); border-radius: 5px; margin-top: 20px; } a.social__item { color: black; } .translate-dropdown { background-color: #e6e6e6; padding: 5px 10px; margin: 0; font-size: .8em; transform: none; border-radius: 5px; display: inline-block; text-decoration: none; color: #333; margin-bottom: 8px; } .translate-dropdown { position: relative; display: inline-flex; align-items: center; width: 100%; justify-content: space-between; height: 36px; } .translate-dropdown label { margin-right: 10px; color: #000; font-size: .95rem; } .article-meta { gap:0 !important; } .author-label, .modified-label, .published-label, modified-label { font-weight: 300 !important; } .date_autor_sidebar { background-color: #e6e6e6; padding: 5px 10px; margin: 0; font-size: .8em; transform: none; border-radius: 5px; text-decoration: none; color: #333; display: flex; justify-content: space-between; margin-bottom: 8px; } .sidebar_autor { background: #333; border-radius: 4px; color: #fff; padding: 0px 5px; font-size: .95rem; } time.sidebar_time, .translateSelectlabel, sidebar_time { margin-top: 2px; color:#000; font-style:normal; font-size:.95rem; } .sidebar_updated_time { background-color: #e6e6e6; padding: 5px 10px; margin: 0; font-size: .8em; transform: none; border-radius: 5px; text-decoration: none; color: #333; display: flex; justify-content: space-between; margin-bottom: 8px; } time.sidebar_updated_time_inner { background: #333; border-radius: 4px; color: #fff;; padding: 2px 6px; } .translate-dropdown .translate { color: #fff; !important; background-color: #333; } .translate-dropdown .translate:hover { color: #fff; !important; background-color: #2f845b !important; } .share-button svg, .translate-dropdown .translate svg { fill: #fff; } span.modified-label { margin-top: 2px; color: #000; font-size: .95rem; font-weight: normal !important; } .ad_sidebar{ padding:0; border: none; } .ad_leaderboard { margin-top: 10px; margin-bottom: 10px; } .pdf_sidebar:hover { background: #2f845b; } span.sidebar_time { font-size: .95rem; margin-top: 3px; color: #000; } table.wp-block-table { white-space: normal; } input {padding: 8px;width: 200px;border: 1px solid #ddd;border-radius: 5px;} .comments { margin-top: 30px; } .comments ul { list-style: none; padding: 0; } .comments li { border-bottom: 1px solid #ddd; padding: 10px 0; } .comment-form { margin-top: 15px; display: flex; flex-direction: column; gap: 10px; } .comment-form textarea { width: 100%; padding: 8px; border: 1px solid #ddd; border-radius: 5px;} .comment-form button { align-self: flex-start; background: #333; color:#fff; border:0; padding:8px 15px; border-radius:5px; cursor:pointer; } .comment-form button:hover { background: #2f845b; }

Kommentare (0)