Naukowcy byli pod wrażeniem najnowszego modelu Chatgpt O1
Badacze, którzy pomogli przetestować nowy duży model języka z Openai, OpenAi O1, twierdzą, że jest to duży krok pod względem Reprezentuje chatboty dla nauki .
„W mojej dziedzinie fizyki kwantowej jest znacznie bardziej szczegółowe i bardziej spójne odpowiedzi” niż w poprzednim modelu, GPT-4O, mówi Mario Krenn, szef sztucznego laboratorium naukowca w Max Planck Institute for the Physics of Light w Erlangen w Niemczech. Krenn należał do grupy naukowców w „Czerwonym zespole”, który testował datowanie z O1 dla Openai, firmy technologicznej z siedzibą w San Francisco w Kalifornii, wypróbowując bota i sprawdzając ich obawy związane z bezpieczeństwem.
Od czasu publiczne wprowadzenie czterej w 2022 r. Duże modele językowe, które napędzają takie chatboty, średnio coraz lepsze, z większą liczbą parametrów, większych zestawów danych treningowych i Umiejętności w dużej liczbie standardowych testów
Openaai wyjaśnia, że O1 Series Podstawowa zmiana podejścia firmy. Obserwatorzy informują, że ten model AI charakteryzuje się faktem, że spędził więcej czasu na niektórych fazach uczenia się i „myśli” o swoich odpowiedzi dłużej, co sprawia, że wolniej jest, ale bardziej zdolny-szczególnie w obszarach, w których poprawne i niewłaściwe odpowiedzi są wyraźnie zdefiniowane. Firma dodaje, że O1 może „przemyśleć złożone zadania i rozwiązać trudniejsze problemy niż poprzednie modele w nauce, programowaniu i matematyce”. Obecnie O1-Preview i O1-Mini-A mniejsza, bardziej opłacalna wersja, która jest odpowiednia do programowania, jest dostępna dla płacących klientów i niektórych programistów podczas pracy testowej. Firma nie opublikowała żadnych informacji na temat parametrów ani mocy obliczeniowej modeli O1.
Przekrocz doktoranci
Andrew White, a chemikist Publikacja GPT-4 Była zaskoczona i rozczarowana ogólnym brakiem ulepszeń w poparciu naukowym przez Chatbots
niezwykłe jest O1 pierwszym głównym modelem języka, który doktoranci w najtrudniejszym pytaniu-„Diamond” połączony z absolwentem Benchmarku Pytania i odpowiedzi (GPQA) bije . „Dla początkującego jest to poza jej natychmiastową zdolnością patrzenia na protokół generowany przez O1 i uznanie, że jest to„ nonsens ”, mówi.
Problem Solver of Science
Krenn uważa, że O1 przyspieszy naukę, pomagając skanować literaturę, rozpoznając luki i proponując interesujące podejścia badawcze do przyszłych badań. Zintegrował O1 z narzędziem, które opracował, i to umożliwia ten zwany scimuse 2 . „Generuje znacznie bardziej interesujące pomysły niż GPT-4 lub GPT-4O”-mówi.
Kyle Kabasares, naukowca danych w Bay Area Environmental Research Institute w Moffett Field, Kalifornia, Użyj O1, aby odtworzyć niektóre etapy programowania z jego projektu doktoranckiego, który obliczył masę czarnych otworów. „Byłem po prostu przytłoczony” - mówi, zauważając, że O1 potrzebował około godziny, aby osiągnąć go przez wiele miesięcy.
Catherine Brownstein, genetyka w Boston Children's Hospital w Massachusetts, twierdzi, że szpital testuje obecnie kilka systemów AI, w tym podgląd O1, pod kątem takich zastosowań, jak odkrywanie relacji między cechami pacjenta i genami w przypadku rzadkich chorób. Mówi, że O1 „jest bardziej precyzyjne i oferuje opcje, których nie sądziłem, że są możliwe z bota czatu”.
-
rein, D. i in. Preprint w arxiv
gu, x. & krenn, M. Preprint w arxiv https://doi.org/10.48550/arxiv.2405.17044 (2024).
.sidebar {
width: 300px;
min-width:300px;
position: sticky;
top: 0;
align-self: flex-start;
}
.contentwrapper {
display: flex ;
gap: 20px;
overflow-wrap: anywhere;
}
@media (max-width:768px){
.contentwrapper {
flex-direction: column;
}
.sidebar{display:none;}
}
.sidebar_sharing {
display: flex;
justify-content: space-between;
}
.sidebar_sharing a {
background-color: #e6e6e6;
padding: 5px 10px;
margin: 0;
font-size: .95rem;
transform: none;
border-radius: 5px;
display: inline-block;
text-decoration: none;
color:#333;
display: inline-flex;
justify-content: space-between;
}
.sidebar_sharing a:hover {
background-color: #333;
color:#fff;
}
.sidebar_box {
padding: 15px;
margin-bottom: 20px;
box-shadow: 0 2px 5px rgba(0, 0, 0, .1);
border-radius: 5px;
margin-top: 20px;
}
a.social__item {
color: black;
}
.translate-dropdown {
background-color: #e6e6e6;
padding: 5px 10px;
margin: 0;
font-size: .8em;
transform: none;
border-radius: 5px;
display: inline-block;
text-decoration: none;
color: #333;
margin-bottom: 8px;
}
.translate-dropdown {
position: relative;
display: inline-flex;
align-items: center;
width: 100%;
justify-content: space-between;
height: 36px;
}
.translate-dropdown label {
margin-right: 10px;
color: #000;
font-size: .95rem;
}
.article-meta {
gap:0 !important;
}
.author-label, .modified-label, .published-label, modified-label {
font-weight: 300 !important;
}
.date_autor_sidebar {
background-color: #e6e6e6;
padding: 5px 10px;
margin: 0;
font-size: .8em;
transform: none;
border-radius: 5px;
text-decoration: none;
color: #333;
display: flex;
justify-content: space-between;
margin-bottom: 8px;
}
.sidebar_autor {
background: #333;
border-radius: 4px;
color: #fff;
padding: 0px 5px;
font-size: .95rem;
}
time.sidebar_time, .translateSelectlabel, sidebar_time {
margin-top: 2px;
color:#000;
font-style:normal;
font-size:.95rem;
}
.sidebar_updated_time {
background-color: #e6e6e6;
padding: 5px 10px;
margin: 0;
font-size: .8em;
transform: none;
border-radius: 5px;
text-decoration: none;
color: #333;
display: flex;
justify-content: space-between;
margin-bottom: 8px;
}
time.sidebar_updated_time_inner {
background: #333;
border-radius: 4px;
color: #fff;;
padding: 2px 6px;
}
.translate-dropdown .translate {
color: #fff; !important;
background-color: #333;
}
.translate-dropdown .translate:hover {
color: #fff; !important;
background-color: #2f845b !important;
}
.share-button svg, .translate-dropdown .translate svg {
fill: #fff;
}
span.modified-label {
margin-top: 2px;
color: #000;
font-size: .95rem;
font-weight: normal !important;
}
.ad_sidebar{
padding:0;
border: none;
}
.ad_leaderboard {
margin-top: 10px;
margin-bottom: 10px;
}
.pdf_sidebar:hover {
background: #2f845b;
}
span.sidebar_time {
font-size: .95rem;
margin-top: 3px;
color: #000;
}
table.wp-block-table {
white-space: normal;
}
input {padding: 8px;width: 200px;border: 1px solid #ddd;border-radius: 5px;}
.comments { margin-top: 30px; }
.comments ul { list-style: none; padding: 0; }
.comments li { border-bottom: 1px solid #ddd; padding: 10px 0; }
.comment-form { margin-top: 15px; display: flex; flex-direction: column; gap: 10px; }
.comment-form textarea { width: 100%; padding: 8px; border: 1px solid #ddd; border-radius: 5px;}
.comment-form button { align-self: flex-start; background: #333; color:#fff; border:0; padding:8px 15px; border-radius:5px; cursor:pointer; }
.comment-form button:hover { background: #2f845b; }
Kommentare (0)