¿Podrá Google Scholar sobrevivir a la revolución de la IA?

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Google Scholar celebra 20 años. Con la nueva competencia basada en la IA, la pregunta es: ¿podrá mantenerse firme?

Google Scholar feiert 20 Jahre. Angesichts neuer KI-basierter Konkurrenz stellt sich die Frage: Kann es sich behaupten?
Google Scholar celebra 20 años. Con la nueva competencia basada en la IA, la pregunta es: ¿podrá mantenerse firme?

¿Podrá Google Scholar sobrevivir a la revolución de la IA?

Google Scholar, el motor de búsqueda académico más grande y completo, celebra esta semana su vigésimo cumpleaños. Durante las últimas dos décadas, algunos investigadores han señalado que esta herramienta se ha convertido en una de las más importantes de la ciencia. Sin embargo, en los últimos años han surgido competidores que utilizan inteligencia artificial (IA) para mejorar la experiencia de búsqueda, así como otros que permiten a los usuarios descargar sus datos.

El impacto de Google Scholar, administrado por el gigante de Internet Google en Mountain View, California, es notable, dice Jevin West, científico social computacional de la Universidad de Washington en Seattle, que utiliza la base de datos a diario. Pero "si alguna vez hubo un momento en el que Google Scholar podría ser reemplazado como motor de búsqueda principal, podría ser ahora, debido a algunas de estas nuevas herramientas y las innovaciones que están ocurriendo en otros lugares", dijo West.

Muchas de las ventajas de Google Scholar (el acceso gratuito, la amplitud de la información y las sofisticadas opciones de búsqueda) "ahora son compartidas por otras plataformas", dice Alberto Martín Martín, bibliométrico de la Universidad de Granada en España.

Chatbots impulsados ​​por IA como ChatGPT y otras herramientas que utilizan grandes modelos de lenguaje se han convertido en las aplicaciones preferidas de algunos investigadores a la hora de buscar, revisar y resumir la literatura. Algunos investigadores han cambiado Google Scholar por estas herramientas. “Hasta hace poco, Google Scholar era mi motor de búsqueda predeterminado”, dice Aaron Tay, bibliotecario académico de la Singapore Management University. Todavía está en lo más alto de su lista, pero "últimamente he empezado a utilizar otras herramientas de IA".

Aun así, dado el tamaño de Google Scholar y lo profundamente arraigado que está en la comunidad científica, "se necesitaría mucho esfuerzo para destronarlo", añade West.

Anurag Acharya, cofundador de Google Scholar, acoge con agrado todos los esfuerzos para hacer que la información académica sea más fácil de encontrar, comprender y aprovechar. "Cuanto más podamos hacer todos, mejor será para el avance de la ciencia".

El más grande y completo

Google Scholar entró en funcionamiento 2004 aparecen en el escenario de la investigación literaria y cambió todo. En aquel entonces, los investigadores utilizaban bibliotecas para encontrar información o buscaban artículos académicos a través de servicios en línea pagos, como la base de datos de citas Web of Science. El mismo mes en que se lanzó Google Scholar, Elsevier también lanzó su servicio pago Scopus, una base de datos integral de referencias y resúmenes académicos.

Google Scholar buscó en la web trabajos académicos de todo tipo, como capítulos de libros, informes, preimpresiones y documentos web, incluidos aquellos en idiomas distintos del inglés. El objetivo era "hacer que los investigadores del mundo sean más eficaces y permitir que todos se encuentren en una frontera común de la ciencia", dice Acharya.

Los acuerdos de Google Scholar con los editores le brindan un acceso incomparable al texto completo de los artículos detrás de los muros de pago, no solo a los títulos y resúmenes que ofrecen la mayoría de los motores de búsqueda. Los artículos se clasifican según su relevancia para una consulta de búsqueda (normalmente los artículos más citados aparecen en la parte superior) y se sugieren más consultas de búsqueda. La profundidad de la cobertura permite búsquedas muy específicas.

Google no reveló datos de uso del servicio, pero según el medidor de tráfico web Similarweb, Google Scholar recibe más de 100 millones de visitas al mes.

La base de datos también es muy buena para indicar a los usuarios versiones gratuitas de un artículo, afirma Martín Martín. Esto fomenta el movimiento de acceso abierto, añade José Luis Ortega, bibliométrico del Instituto de Estudios Sociales Avanzados del Consejo Superior de Investigaciones Científicas de España en Córdoba.

Sin embargo, Google Scholar es opaco en otros aspectos. Una preocupación clave es la falta de visibilidad sobre qué contenido, incluidas las revistas, se busca y qué algoritmo se utiliza para recomendar artículos. También restringe las descargas masivas de sus resultados de búsqueda, que podrían usarse para análisis bibliométricos, entre otras cosas. "No tenemos mucha información sobre una de las herramientas más valiosas que tenemos en la ciencia", dice West.

Acharya explica que Google Scholar es principalmente una herramienta de búsqueda y su principal objetivo es ayudar a los académicos a encontrar las investigaciones más útiles.

Motores de búsqueda actualizados

En los últimos años han surgido competidores que ofrecen este tipo de datos bibliométricos, aunque ninguno puede superar el tamaño de Google Scholar y el acceso a artículos de texto completo detrás de muros de pago. Un ejemplo notable es OpenAlex, lanzado en 2022. El año anterior, Microsoft Academic Graph, que buscaba información académica en la Web, se cerró y se publicó todo su conjunto de datos. OpenAlex se basa en esta y otras fuentes abiertas de datos científicos. Los usuarios pueden buscar el contenido catalogado por autor, institución y cita, y también pueden descargar el registro completo de forma gratuita. “Hacen lo que esperábamos que hiciera Google Scholar”, afirma Martín-Martín.

Otra herramienta de investigación popular, Semantic Scholar, se lanzó en 2015 y utiliza inteligencia artificial para crear resúmenes legibles de artículos e identificar las citas más relevantes. Otra herramienta, Consenso, lanzado en 2022, utiliza la base de datos de Semantic Scholar para encontrar respuestas a preguntas basadas en investigaciones (West es consultor de Consensus). Uno de los favoritos de Tay es Socavar, que utiliza una búsqueda sofisticada basada en agentes en la que una entidad autónoma escanea la literatura científica como un ser humano y ajusta la búsqueda en función del contenido encontrado. Se necesitan unos minutos (en comparación con segundos en Google Scholar) para producir resultados, pero Tay explica que vale la pena esperar. "Creo que la calidad de los resultados que arroja es mejor que la de Google Scholar".

Acharya dice que Google Scholar también utiliza IA para clasificar artículos, sugerir búsquedas adicionales y recomendar artículos relacionados. Y a principios de este mes, la compañía presentó resúmenes de artículos generados por IA para su lector de PDF. Acharya añade que la herramienta de búsqueda intenta comprender la intención y el contexto detrás de una consulta. Este método de búsqueda semántica se basa en modelos lingüísticos y se utiliza desde hace unos dos años, afirma.

Una cosa que Google Scholar no está haciendo todavía es incorporar resúmenes generados por IA de las respuestas a una consulta buscada, similares a los que ahora se encuentran en la parte superior de una búsqueda típica de Google. Acharya dice que es un desafío resumir las conclusiones de múltiples artículos de una manera concisa y rica en contexto. "Aún no hemos visto una solución eficaz a este desafío", añade.

Quellen: