ChatGPT passe à deux : comment le chatbot IA a changé la vie des scientifiques

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

ChatGPT fête ses deux ans et révolutionne la recherche : Comment le chatbot IA a changé la vie des scientifiques.

ChatGPT wird zwei Jahre alt und revolutioniert die Forschung: Wie der AI-Chatbot das Leben von Wissenschaftlern verändert hat.
ChatGPT fête ses deux ans et révolutionne la recherche : Comment le chatbot IA a changé la vie des scientifiques.

ChatGPT passe à deux : comment le chatbot IA a changé la vie des scientifiques

Au cours des deux années écoulées depuis Partager ChatGPT au public, les chercheurs l'utilisent pour communiquer leurs améliorer les textes scientifiques, consulter la littérature scientifique et Écrire du code pour analyser les données. Si certains estiment que le chatbot, devenu populaire le 30 novembre 2022, augmente la productivité des scientifiques, d'autres craignent qu'il Le plagiat facilité, introduit des inexactitudes dans les articles de recherche et consomme de grandes quantités d’énergie.

La maison d'édition Wiley, basée à Hoboken, dans le New Jersey, a interrogé 1 043 chercheurs en mars et avril sur leur utilisation d'outils d'IA générative comme ChatGPT et a partagé les résultats préliminaires avec Nature. Quatre-vingt pour cent des personnes interrogées ont déclaré utiliser ChatGPT à titre personnel ou professionnel, ce qui en fait l'outil le plus largement utilisé par les universitaires. Les trois quarts des personnes interrogées estiment qu'au cours des cinq prochaines années, il sera important pour les chercheurs de développer les capacités de l'IA pour mener à bien leur travail.

« Les traitements de texte IA existaient auparavant, mais un changement significatif s'est produit avec la sortie de ces grands modèles de langage très puissants », explique James Zou, chercheur en IA à l'Université de Stanford en Californie. Le chatbot ChatGPT, développé par la société technologique OpenAI basée à San Francisco, a été le catalyseur de ce changement.

Pour marquer le deuxième anniversaire de ChatGPT, Nature a compilé des données d'utilisation et a expliqué aux scientifiques comment ChatGPT a changé le paysage de la recherche.

ChatGPT en chiffres

  • 60.000: Die Mindestanzahl an wissenschaftlichen Arbeiten, die 2023 veröffentlicht wurden und voraussichtlich mit Hilfe eines großen Sprachmodells (LLM) verfasst wurden 1. Dies entspricht etwas mehr als 1 % aller Artikel in der von dem Forschungsteam untersuchten Dimensions-Datenbank akademischer Veröffentlichungen.
  • 10 %: Der Mindestanteil der Forschungspapiere, die von Mitgliedern der biomedizinischen Gemeinschaft in der ersten Jahreshälfte 2024 veröffentlicht wurden und voraussichtlich ihre Abstracts mit Unterstützung eines LLM verfasst haben 2. Eine andere Studie schätzte diesen Anteil für die Informatikgemeinde im Februar sogar auf höhere 17.5 % 3.
  • 6.5–16.9 %: Der geschätzte Anteil der Peer-Reviews, die 2023 und 2024 an einer Auswahl von Top-AI-Konferenzen eingereicht wurden und vermutlich erheblich von LLMs generiert wurden 4. Diese Bewertungen beurteilen Forschungspapiere oder Präsentationen, die für die Konferenzen vorgeschlagen werden.

Assistante de rédaction

Tous ces chiffres, déterminés en évaluant des modèles et des mots-clés dans des textes caractéristiques des LLM, sont probablement des estimations prudentes, explique Debora Weber-Wulff, informaticienne et chercheuse en plagiat à HTW Berlin. Leurs travaux montrent que les outils de détection échouent souvent lorsqu’il s’agit de déterminer si un article a été rédigé avec l’aide de l’IA. 5.

Au cours des deux dernières années, les chercheurs ont découvert que l'utilisation de ChatGPT pour créer des résumés, ainsi que des demandes de subvention et des lettres de soutien pour les étudiants, leur permettait de se concentrer sur des tâches complexes. « Les choses qui valent la peine, ce sont les questions difficiles et les hypothèses créatives », déclare Milton Pividori, informaticien médical à la faculté de médecine de l'Université du Colorado à Aurora.

Les chercheurs rapportent que les LLM sont particulièrement utiles pour surmonter les barrières linguistiques. "Cela démocratise l'écriture et aide les personnes pour qui l'anglais est une langue seconde", explique Gabe Gomes, chimiste à l'université Carnegie Mellon de Pittsburgh, en Pennsylvanie. Une analyse publiée sur le serveur de prépublication SSRN avant l'examen par les pairs en novembre a révélé que la qualité de la rédaction des articles d'auteurs dont la langue maternelle n'est pas l'anglais s'est améliorée après la publication de ChatGPT, davantage que celle des auteurs parlant couramment l'anglais. 6.

Depuis sa sortie en 2022, ChatGPT a subi plusieurs mises à niveau. GPT-4, publié en mars 2023, a impressionné les utilisateurs par sa capacité à générer des textes de type humain. Le dernier modèle, o1, qui a été annoncé en septembre et disponible pour certains clients payants ainsi que pour certains développeurs en test, OpenAI affirme pouvoir « analyser des tâches complexes et résoudre des problèmes plus difficiles que les modèles précédents en science, programmation et mathématiques ». Kyle Kabasares, data scientist au Bay Area Environmental Research Institute de Moffett Field, en Californie, a utilisé o1 pour reproduire du code de son projet de doctorat. Lorsqu'il a saisi les informations de la section méthodes de son document de recherche, le système d'IA a écrit du code en seulement une heure, ce qui lui avait pris près d'un an de ses études supérieures pour le créer.

Limites et potentiel

Un domaine dans lequel ChatGPT et les systèmes d’IA similaires ont eu moins de succès est celui de la réalisation d’analyses documentaires, explique Pividori. « Ils ne nous aident pas vraiment à être plus productifs », explique-t-il, car un chercheur doit lire et comprendre les articles pertinents dans leur intégralité. "Si l'article n'est pas au cœur de votre recherche, vous pourrez peut-être utiliser des outils d'IA pour le résumer", ajoute-t-il. Mais il a été démontré que les LLM hallucinent 7 – c’est-à-dire qu’ils constituent des informations. Par exemple, ils pourraient parler de chiffres qui n’existent même pas dans un article.

Une autre préoccupation des chercheurs lorsqu’ils utilisent les LLM est la protection des données. Par exemple, lorsque des scientifiques saisissent des données originales non publiées dans l’un de ces outils d’IA pour rédiger un article, il existe un risque que le contenu soit utilisé pour former des versions mises à jour de ces modèles. "Ce sont des boîtes noires", explique Weber-Wulff. "Vous n'avez aucune idée de ce qui arrive aux données que vous y téléchargez."

Pour éviter ce risque, certains chercheurs choisissent des modèles locaux plus petits au lieu de ChatGPT. "Vous l'exécutez sur votre ordinateur et rien n'est partagé en externe", explique Pividori. Il ajoute que certains plans d'abonnement ChatGPT garantissent que vos données ne sont pas utilisées pour entraîner le modèle.

Une grande question que les chercheurs se sont penchées au cours de la dernière année est de savoir si ChatGPT ira au-delà du rôle d'assistant virtuel et un scientifique en IA peut être. Certains premiers efforts suggèrent que cela est possible. Zou dirige le développement d'un laboratoire virtuel dans lequel divers LLM assument le rôle de scientifiques au sein d'une équipe interdisciplinaire tandis qu'un scientifique humain fournit des commentaires de haut niveau. « Ils travaillent ensemble pour formuler de nouveaux projets de recherche », dit-il. Le mois dernier, Zou et ses collègues ont publié les résultats de l'un de ces projets sur le serveur de prépublication bioRxiv avant l'examen par les pairs. 8. Le laboratoire virtuel a conçu des nanocorps – un type de petit anticorps – capables de se lier aux variantes du coronavirus SARS-CoV-2 à l’origine de la pandémie de COVID-19. Des chercheurs humains ont validé leurs travaux par des expériences et identifié deux candidats prometteurs pour des études plus approfondies.

Gomes et ses collègues sont également enthousiasmés par la possibilité d'utiliser ChatGPT en laboratoire. Elle utiliser l'outil pour effectuer plusieurs réactions chimiques en utilisant un système robotique qu'ils ont déployé à la fin de l'année dernière. "On s'attend à ce que ces modèles soient capables de découvrir de nouvelles connaissances scientifiques", explique Gomes.

  1. Gray, A. Préimpression sur arXiv https://doi.org/10.48550/arXiv.2403.16887 (2024).

  2. Kobak, D., González-Márquez, R., Horvát, E.-Á. & Lause, J. Préimpression sur arXiv https://doi.org/10.48550/arXiv.2406.07016 (2024).

  3. Liang, W. et coll. Préimpression sur arXiv https://doi.org/10.48550/arXiv.2404.01268 (2024).

  4. Liang, W. et coll. Préimpression sur arXiv https://doi.org/10.48550/arXiv.2403.07183 (2024).

  5. Weber-Wulff, D. et al. Int. J. Éduc. Intégré. 19, 26 (2023).

    Article
    PubMed

    Google Scholar

  6. Liang, Y., Yang, T. et Zhu, F. Préimpression sur SSRN https://doi.org/10.2139/ssrn.4992755 (2024).

  7. Farquhar, S. et al. Nature 630, 625-630 (2024).

    Article
    PubMed

    Google Scholar

  8. Swanson, K., Wu, W., Bulaong, NL, Pak, JE et Zou, J. Préimpression sur bioRxiv https://doi.org/10.1101/2024.11.11.623004 (2024).

Télécharger les références

Quellen: