Czy Google Scholar może przetrwać rewolucję AI?
Google Scholar świętuje 20-lecie. W obliczu nowej konkurencji opartej na sztucznej inteligencji pytanie brzmi: czy da sobie radę?

Czy Google Scholar może przetrwać rewolucję AI?
Google Scholar, największa i najbardziej wszechstronna wyszukiwarka akademicka, obchodzi w tym tygodniu swoje 20. urodziny. W ciągu ostatnich dwudziestu lat niektórzy badacze zauważyli, że narzędzie to stało się jednym z najważniejszych narzędzi w nauce. Jednak w ostatnich latach pojawili się konkurenci wykorzystujący sztuczną inteligencję (AI) w celu usprawnienia wyszukiwania, a także inni, którzy umożliwiają użytkownikom pobieranie ich danych.
Wpływ Google Scholar, prowadzonego przez giganta internetowego Google w Mountain View w Kalifornii, jest niezwykły, twierdzi Jevin West, socjolog zajmujący się obliczeniami na Uniwersytecie Waszyngtońskim w Seattle, który codziennie korzysta z tej bazy danych. Ale „jeśli kiedykolwiek istniałby moment, w którym Google Scholar mógłby zostać zastąpiony jako podstawowa wyszukiwarka, mógł to nastąpić właśnie teraz, ze względu na niektóre z tych nowych narzędzi i innowacje wprowadzane gdzie indziej” – powiedział West.
Wiele zalet Google Scholar – bezpłatny dostęp, szeroki zakres informacji i zaawansowane opcje wyszukiwania – „jest teraz udostępnianych innym platformom” – mówi Alberto Martín Martín, bibliometrysta na Uniwersytecie w Granadzie w Hiszpanii.
Chatboty zasilane sztuczną inteligencją takie jak ChatGPT i inne narzędzia wykorzystujące duże modele językowe stały się preferowanymi aplikacjami dla niektórych badaczy podczas wyszukiwania, przeglądania i podsumowywania literatury. Niektórzy badacze zamienili Google Scholar na te narzędzia. „Do niedawna moją domyślną wyszukiwarką była Google Scholar” – mówi Aaron Tay, bibliotekarz akademicki na Singapore Management University. Nadal znajduje się na szczycie jego listy, ale „ostatnio zacząłem używać innych narzędzi sztucznej inteligencji”.
Jednak biorąc pod uwagę wielkość Google Scholar i jego głębokie zakorzenienie w społeczności naukowej, „zdetronizowanie go wymagałoby wiele wysiłku” – dodaje West.
Anuraga Aczarji, współzałożyciel Google Scholar, z zadowoleniem przyjmuje wszelkie wysiłki mające na celu ułatwienie wyszukiwania, zrozumienia i wykorzystywania informacji naukowych. „Im więcej wszyscy możemy zrobić, tym lepiej dla postępu nauki”.
Największy i najbardziej wszechstronny
Włączył się Google Scholar 2004 pojawiają się na scenie badań literaturowych i zmienił wszystko. W tamtych czasach badacze korzystali z bibliotek w celu wyszukiwania informacji lub wyszukiwali artykuły naukowe za pośrednictwem płatnych usług internetowych, takich jak baza danych cytowań Web of Science. W tym samym miesiącu, w którym uruchomiono Google Scholar, Elsevier uruchomił także płatną usługę Scopus – obszerną bazę danych z referencjami i abstraktami naukowymi.
Google Scholar przeszukiwał Internet pod kątem wszelkiego rodzaju prac naukowych, takich jak rozdziały książek, raporty, przeddruki i dokumenty internetowe – w tym także te w językach innych niż angielski. Celem było „zwiększenie efektywności światowych badaczy i umożliwienie wszystkim stanięcia na wspólnej granicy nauki” – mówi Acharya.
Umowy Google Scholar z wydawcami zapewniają mu niezrównany dostęp do pełnych tekstów artykułów znajdujących się za paywallami – a nie tylko do tytułów i streszczeń oferowanych przez większość wyszukiwarek. Artykuły są uszeregowane według ich związku z wyszukiwanym hasłem – zazwyczaj najczęściej cytowane artykuły są umieszczane na górze – i sugerowane są dalsze zapytania. Głębokość zasięgu pozwala na bardzo szczegółowe wyszukiwania.
Google nie ujawnił danych o użytkowaniu usługi, ale według miernika ruchu w sieci Likeweb Google Scholar odnotowuje ponad 100 milionów odwiedzin miesięcznie.
Baza danych bardzo dobrze wskazuje także użytkownikom darmowe wersje artykułów, mówi Martín Martín. To zachęca do ruchu otwartego dostępu, dodaje José Luis Ortega, bibliometrysta w Instytucie Zaawansowanych Studiów Społecznych Hiszpańskiej Krajowej Rady ds. Badań Naukowych w Kordobie.
Jednak Google Scholar jest nieprzejrzysty pod innymi względami. Kluczowym problemem jest brak wglądu w to, jakie treści, w tym jakie czasopisma, są przeszukiwane i jaki algorytm jest używany do rekomendowania artykułów. Ogranicza także masowe pobieranie wyników wyszukiwania, które można wykorzystać m.in. do analizy bibliometrycznej. „Nie mamy zbyt dużego wglądu w jedno z najcenniejszych narzędzi, jakie mamy w nauce” – mówi West.
Acharya wyjaśnia, że Google Scholar to przede wszystkim narzędzie wyszukiwania, a jego głównym celem jest pomaganie naukowcom w znajdowaniu najbardziej przydatnych badań.
Zaktualizowane wyszukiwarki
W ostatnich latach pojawiła się konkurencja oferująca takie dane bibliometryczne, choć żadna nie jest w stanie przebić Google Scholar pod względem wielkości i dostępu do pełnotekstowych artykułów za paywallami. Godnym uwagi przykładem jest OpenAlex, uruchomiony w 2022 r. Rok wcześniej Microsoft Academic Graph, który przeszukiwał Internet w poszukiwaniu informacji akademickich, został zamknięty, a cały jego zbiór danych został opublikowany. OpenAlex opiera się na tym i innych otwartych źródłach danych naukowych. Użytkownicy mogą przeszukiwać treści skatalogowane według autora, instytucji i cytatu, a także mogą bezpłatnie pobrać cały rekord. „Robią to, czego oczekiwaliśmy od Google Scholar” – mówi Martín-Martín.
Inne popularne narzędzie badawcze, Semantic Scholar, uruchomione w 2015 r., wykorzystuje sztuczną inteligencję do tworzenia czytelnych podsumowań artykułów i identyfikowania najtrafniejszych cytatów. Kolejne narzędzie, Zgoda, uruchomiony w 2022 r., korzysta z bazy danych Semantic Scholar w celu wyszukiwania odpowiedzi na pytania wynikające z badań (West jest konsultantem Consensus). Jednym z ulubionych Tay'a jest Podminować, która wykorzystuje wyrafinowane wyszukiwanie agentowe, w którym autonomiczny podmiot niczym człowiek skanuje literaturę naukową i dostosowuje wyszukiwanie na podstawie znalezionych treści. Uzyskanie wyników zajmuje kilka minut – w porównaniu do sekund w Google Scholar – ale Tay wyjaśnia, że warto poczekać. „Uważam, że jakość uzyskiwanych wyników jest lepsza niż w przypadku Google Scholar”.
Acharya twierdzi, że Google Scholar wykorzystuje sztuczną inteligencję także do oceniania artykułów, sugerowania dodatkowych wyszukiwań i polecania powiązanych artykułów. Na początku tego miesiąca firma wprowadziła do swojego czytnika plików PDF generowane przez sztuczną inteligencję streszczenia artykułów. Acharya dodaje, że narzędzie wyszukiwania próbuje zrozumieć intencję i kontekst zapytania. To podejście do wyszukiwania semantycznego opiera się na modelach językowych i jest stosowane od około dwóch lat – mówi.
Jedną z rzeczy, których Google Scholar jeszcze nie robi, jest uwzględnianie generowanych przez sztuczną inteligencję przeglądów odpowiedzi na wyszukiwane hasło, podobnych do tych, które obecnie znajdują się na górze typowej wyszukiwarki Google. Acharya twierdzi, że podsumowanie wniosków z wielu artykułów w zwięzły i bogaty w kontekst sposób jest trudne. „Nie widzieliśmy jeszcze skutecznego rozwiązania tego wyzwania” – dodaje.