ChatGPT va en dos: cómo el chatbot de IA cambió la vida de los científicos
ChatGPT cumple dos años y está revolucionando la investigación: cómo el chatbot con IA ha cambiado la vida de los científicos.

ChatGPT va en dos: cómo el chatbot de IA cambió la vida de los científicos
En los dos años transcurridos desde Compartir chatGPT al público, los investigadores lo utilizan para comunicar sus mejorar los textos científicos, revisar la literatura científica y Escribir código para analizar datos.. Si bien algunos creen que el chatbot, que se hizo popular el 30 de noviembre de 2022, aumenta la productividad de los científicos, otros temen que él El plagio es más fácil, introduce imprecisiones en artículos de investigación y consume grandes cantidades de energía.
La editorial Wiley, con sede en Hoboken, Nueva Jersey, encuestó a 1.043 investigadores en marzo y abril sobre su uso de herramientas de inteligencia artificial generativa como ChatGPT y compartió los resultados preliminares con Nature. El ochenta por ciento de los encuestados informó que utiliza ChatGPT a nivel personal o profesional, lo que la convierte en la herramienta más utilizada entre los académicos. Tres cuartas partes de los encuestados creían que en los próximos cinco años será importante que los investigadores desarrollen capacidades de IA para realizar su trabajo.
“Los procesadores de texto con IA ya existían antes, pero se produjo un cambio significativo con el lanzamiento de estos modelos de lenguaje de gran tamaño y muy potentes”, explica James Zou, investigador de IA de la Universidad de Stanford en California. El chatbot ChatGPT, desarrollado por la empresa de tecnología OpenAI, con sede en San Francisco, fue el catalizador de este cambio.
Para conmemorar el segundo cumpleaños de ChatGPT, Nature recopiló datos de uso y habló con científicos sobre cómo ChatGPT ha cambiado el panorama de la investigación.
ChatGPT en números
- 60.000: Die Mindestanzahl an wissenschaftlichen Arbeiten, die 2023 veröffentlicht wurden und voraussichtlich mit Hilfe eines großen Sprachmodells (LLM) verfasst wurden 1. Dies entspricht etwas mehr als 1 % aller Artikel in der von dem Forschungsteam untersuchten Dimensions-Datenbank akademischer Veröffentlichungen.
- 10 %: Der Mindestanteil der Forschungspapiere, die von Mitgliedern der biomedizinischen Gemeinschaft in der ersten Jahreshälfte 2024 veröffentlicht wurden und voraussichtlich ihre Abstracts mit Unterstützung eines LLM verfasst haben 2. Eine andere Studie schätzte diesen Anteil für die Informatikgemeinde im Februar sogar auf höhere 17.5 % 3.
- 6.5–16.9 %: Der geschätzte Anteil der Peer-Reviews, die 2023 und 2024 an einer Auswahl von Top-AI-Konferenzen eingereicht wurden und vermutlich erheblich von LLMs generiert wurden 4. Diese Bewertungen beurteilen Forschungspapiere oder Präsentationen, die für die Konferenzen vorgeschlagen werden.
asistente de escritura
Todas estas cifras, determinadas mediante la evaluación de patrones y palabras clave en textos característicos de los LLM, son probablemente estimaciones conservadoras, dice Debora Weber-Wulff, científica informática e investigadora de plagio en HTW Berlin. Su trabajo muestra que las herramientas de detección a menudo fallan cuando se trata de determinar si un artículo se escribió con la ayuda de IA. 5.
Durante los últimos dos años, los investigadores han descubierto que el uso de ChatGPT para crear resúmenes, así como solicitudes de subvenciones y cartas de apoyo para los estudiantes, les permite centrarse en tareas complejas. “The things that are worth our time are the hard questions and the creative hypotheses,” says Milton Pividori, a medical informaticist at the University of Colorado School of Medicine in Aurora.
Los investigadores informan que los LLM son particularmente útiles para superar las barreras del idioma. “democratiza la escritura y ayuda a las personas para quienes el inglés es su segunda lengua”, explica Gabe Gomes, químico de la Universidad Carnegie Mellon en Pittsburgh, Pensilvania. Un análisis publicado en el servidor de preimpresión SSRN antes de la revisión por pares en noviembre encontró que la calidad de la redacción de artículos de autores cuyo primer idioma no es el inglés mejoró después de la publicación de ChatGPT, más que la redacción de autores que dominan el inglés. 6.
Desde su lanzamiento en 2022, ChatGPT ha pasado por varias actualizaciones. GPT-4, publicado en marzo de 2023, impresionó a los usuarios por su capacidad para generar textos similares a los humanos. El último modelo, o1, que fue anunciado en septiembre y disponible para algunos clientes de pago, así como para ciertos desarrolladores en fase de pruebas, OpenAI dice que puede "analizar tareas complejas y resolver problemas más difíciles que los modelos anteriores en ciencia, programación y matemáticas". Kyle Kabasares, científico de datos del Instituto de Investigación Ambiental del Área de la Bahía en Moffett Field, California, utilizó o1 para para reproducir algún código de su proyecto doctoral. Cuando ingresó la información de la sección de métodos de su trabajo de investigación, el sistema de inteligencia artificial escribió el código en solo una hora, cuya creación le llevó casi un año de estudios de posgrado.
Limitaciones y potencial
Un área en la que ChatGPT y sistemas de IA similares han tenido menos éxito es en la realización de revisiones bibliográficas, afirma Pividori. "En realidad no nos ayudan a ser más productivos", explica, porque un investigador tiene que leer y comprender los artículos relevantes en su totalidad. "Si el artículo no es fundamental para su investigación, es posible que pueda utilizar herramientas de inteligencia artificial para resumirlo", añade. Pero se ha demostrado que los LLM alucinan 7 – es decir, inventan información. Por ejemplo, podrían hablar de números que ni siquiera existen en un artículo.
Otra preocupación de los investigadores cuando utilizan LLM es la protección de datos. Por ejemplo, cuando los científicos introducen datos originales no publicados en una de estas herramientas de IA para escribir un artículo, existe el riesgo de que el contenido se utilice para entrenar versiones actualizadas de estos modelos. "Se trata de cajas negras", explica Weber-Wulff. "No tienes idea de lo que sucede con los datos que subes allí".
Para evitar este riesgo, algunos investigadores eligen modelos locales más pequeños en lugar de ChatGPT. "Lo ejecutas en tu computadora y no se comparte nada externamente", dice Pividori. Agrega que ciertos planes de suscripción a ChatGPT garantizan que sus datos no se utilicen para entrenar el modelo.
Una gran pregunta que los investigadores han estado persiguiendo durante el año pasado es si ChatGPT irá más allá del papel de un asistente virtual y un científico de IA puede ser. Algunos de los primeros esfuerzos sugieren que esto es posible. Zou lidera el desarrollo de un laboratorio virtual en el que varios LLM asumen el papel de científicos en un equipo interdisciplinario mientras un científico humano proporciona comentarios de alto nivel. "Trabajan juntos para formular nuevos proyectos de investigación", dice. El mes pasado, Zou y sus colegas publicaron los resultados de uno de estos proyectos en el servidor de preimpresión bioRxiv antes de la revisión por pares. 8. El laboratorio virtual diseñó nanocuerpos -un tipo de pequeño anticuerpo- capaz de unirse a variantes del coronavirus SARS-CoV-2 que causó la pandemia de COVID-19. Los investigadores humanos validaron el trabajo mediante experimentos e identificaron dos candidatos prometedores para estudios posteriores.
Gomes y sus colegas también están entusiasmados con la posibilidad de utilizar ChatGPT en el laboratorio. Ella Utilice la herramienta para realizar múltiples reacciones químicas. utilizando un sistema robótico que implementaron a fines del año pasado. “La expectativa es que estos modelos permitan descubrir nueva ciencia”, dice Gomes.
-
Gray, A. Preimpresión en arXiv https://doi.org/10.48550/arXiv.2403.16887 (2024).
-
Kobak, D., González-Márquez, R., Horvát, E.-Á. & Lause, J. Preimpresión en arXiv https://doi.org/10.48550/arXiv.2406.07016 (2024).
-
Liang, W. y col. Preimpresión en arXiv https://doi.org/10.48550/arXiv.2404.01268 (2024).
-
Liang, W. y col. Preimpresión en arXiv https://doi.org/10.48550/arXiv.2403.07183 (2024).
-
Weber-Wulff, D. y col. Int. J. Educación. Integral 19, 26 (2023).
-
Liang, Y., Yang, T. y Zhu, F. Preimpresión en SSRN https://doi.org/10.2139/ssrn.4992755 (2024).
-
Farquhar, S. y col. Naturaleza 630, 625–630 (2024).
-
Swanson, K., Wu, W., Bulaong, N. L., Pak, J. E. y Zou, J. Preimpresión en bioRxiv https://doi.org/10.1101/2024.11.11.623004 (2024).