Riuscirà Google Scholar a sopravvivere alla rivoluzione dell'intelligenza artificiale?
Google Scholar festeggia 20 anni. Con la nuova concorrenza basata sull’intelligenza artificiale, la domanda è: riuscirà a reggere il confronto?

Riuscirà Google Scholar a sopravvivere alla rivoluzione dell'intelligenza artificiale?
Google Scholar, il motore di ricerca accademico più grande e completo, festeggia questa settimana il suo ventesimo compleanno. Negli ultimi due decenni, alcuni ricercatori hanno notato che questo strumento è diventato uno degli strumenti più importanti della scienza. Tuttavia, negli ultimi anni, sono emersi concorrenti che utilizzano l’intelligenza artificiale (AI) per migliorare l’esperienza di ricerca, così come altri che consentono agli utenti di scaricare i propri dati.
L'impatto di Google Scholar, gestito dal gigante di Internet Google a Mountain View, in California, è notevole, afferma Jevin West, uno scienziato sociale computazionale dell'Università di Washington a Seattle che utilizza quotidianamente il database. Ma "se mai ci fosse un momento in cui Google Scholar potrebbe essere sostituito come motore di ricerca principale, potrebbe essere adesso, grazie ad alcuni di questi nuovi strumenti e alle innovazioni che stanno accadendo altrove", ha detto West.
Molti dei vantaggi di Google Scholar - l'accesso gratuito, l'ampiezza delle informazioni e le sofisticate opzioni di ricerca - "sono ora condivisi da altre piattaforme", afferma Alberto Martín Martín, bibliometrico dell'Università di Granada in Spagna.
Chatbot basati sull'intelligenza artificiale come ChatGPT e altri strumenti che utilizzano modelli linguistici di grandi dimensioni sono diventati applicazioni preferite per alcuni ricercatori durante la ricerca, la revisione e il riassunto della letteratura. Alcuni ricercatori hanno scambiato Google Scholar con questi strumenti. "Fino a poco tempo fa, Google Scholar era il mio motore di ricerca predefinito", afferma Aaron Tay, bibliotecario accademico presso la Singapore Management University. È ancora in cima alla sua lista, ma "ultimamente ho iniziato a utilizzare altri strumenti di intelligenza artificiale".
Tuttavia, date le dimensioni di Google Scholar e il suo profondo radicamento nella comunità scientifica, "ci vorrebbe un grande sforzo per detronizzarlo", aggiunge West.
Anurag Acharya, cofondatore di Google Scholar, accoglie con favore tutti gli sforzi volti a rendere le informazioni accademiche più facili da trovare, comprendere e sviluppare. “Più possiamo fare tutti, meglio è per il progresso della scienza”.
Il più grande e completo
È intervenuto Google Scholar 2004 appaiono sulla scena della ricerca letteraria e cambiato tutto. Allora, i ricercatori utilizzavano le biblioteche per trovare informazioni o cercavano articoli accademici attraverso servizi online a pagamento come il database delle citazioni Web of Science. Nello stesso mese in cui è stato lanciato Google Scholar, Elsevier ha lanciato anche il suo servizio a pagamento Scopus, un database completo di riferimenti accademici e abstract.
Google Scholar ha cercato sul Web opere accademiche di ogni tipo, come capitoli di libri, relazioni, prestamp e documenti web, compresi quelli in lingue diverse dall'inglese. L’obiettivo era “rendere i ricercatori di tutto il mondo più efficaci e consentire a tutti di posizionarsi su una frontiera comune della scienza”, afferma Acharya.
Gli accordi di Google Scholar con gli editori gli danno un accesso senza pari al testo completo degli articoli dietro pagamento, non solo ai titoli e agli abstract offerti dalla maggior parte dei motori di ricerca. Gli articoli vengono classificati in base alla loro pertinenza rispetto a una query di ricerca (solitamente gli articoli più citati vengono portati in cima) e vengono suggerite ulteriori query di ricerca. La profondità della copertura consente ricerche altamente specifiche.
Google non ha fornito dati sull'utilizzo del servizio, ma secondo il misuratore di traffico web Similarweb, Google Scholar riceve oltre 100 milioni di visite al mese.
Il database è anche molto efficace nel indirizzare gli utenti alle versioni gratuite di un articolo, afferma Martín Martín. Ciò incoraggia il movimento dell’accesso aperto, aggiunge José Luis Ortega, bibliometrico presso l’Istituto di Studi Sociali Avanzati del Consiglio Nazionale delle Ricerche spagnolo a Córdoba.
Tuttavia, Google Scholar è opaco sotto altri aspetti. Una delle principali preoccupazioni è la mancanza di visibilità su quali contenuti, comprese quali riviste, vengono ricercate e quale algoritmo viene utilizzato per consigliare gli articoli. Limita inoltre i download di massa dei risultati di ricerca, che potrebbero essere utilizzati, tra le altre cose, per l'analisi bibliometrica. "Non abbiamo molte informazioni su uno degli strumenti più preziosi di cui disponiamo nel campo della scienza", afferma West.
Acharya spiega che Google Scholar è principalmente uno strumento di ricerca e il suo obiettivo principale è aiutare gli studiosi a trovare le ricerche più utili.
Motori di ricerca aggiornati
Negli ultimi anni sono emersi concorrenti che offrono tali dati bibliometrici, sebbene nessuno possa battere le dimensioni di Google Scholar e l'accesso agli articoli full-text dietro pagamento. Un esempio notevole è OpenAlex, lanciato nel 2022. L’anno prima, Microsoft Academic Graph, che cercava sul Web informazioni accademiche, era stato chiuso e il suo intero set di dati pubblicato. OpenAlex si basa su questa e altre fonti aperte di dati scientifici. Gli utenti possono cercare i contenuti catalogati per autore, istituzione e citazione e possono anche scaricare gratuitamente l'intero record. "Fanno ciò che speravamo facesse Google Scholar", afferma Martín-Martín.
Un altro popolare strumento di ricerca, Semantic Scholar, lanciato nel 2015, utilizza l’intelligenza artificiale per creare riassunti leggibili degli articoli e identificare le citazioni più rilevanti. Un altro strumento, Consenso, lanciato nel 2022, utilizza il database di Semantic Scholar per trovare risposte a domande basate sulla ricerca (West è un consulente di Consensus). Uno dei preferiti di Tay è Sotto la mente, che utilizza una sofisticata ricerca basata su agenti in cui un'entità autonoma scansiona la letteratura scientifica come un essere umano e adatta la ricerca in base al contenuto trovato. Ci vogliono alcuni minuti, rispetto ai secondi di Google Scholar, per produrre risultati, ma Tay spiega che vale la pena aspettare. "Penso che la qualità dei risultati restituiti sia migliore di quella di Google Scholar."
Acharya afferma che Google Scholar utilizza anche l'intelligenza artificiale per classificare gli articoli, suggerire ricerche aggiuntive e consigliare articoli correlati. E all’inizio di questo mese, l’azienda ha introdotto i riassunti degli articoli generati dall’intelligenza artificiale per il suo lettore PDF. Acharya aggiunge che lo strumento di ricerca tenta di comprendere l'intento e il contesto dietro una query. Questo approccio di ricerca semantica si basa su modelli linguistici ed è in uso da circa due anni, spiega.
Una cosa che Google Scholar non sta ancora facendo è incorporare panoramiche delle risposte generate dall'intelligenza artificiale a una query ricercata, simili a quelle che ora si trovano nella parte superiore di una tipica ricerca su Google. Acharya afferma che è difficile riassumere le conclusioni di più articoli in modo conciso e ricco di contesto. “Non abbiamo ancora visto una soluzione efficace a questa sfida”, aggiunge.