Ali lahko Google Scholar preživi revolucijo AI?
Google Scholar praznuje 20 let. Z novim tekmovanjem, ki temelji na AI, je vprašanje: Ali lahko drži svoje?

Ali lahko Google Scholar preživi revolucijo AI?
Google Scholar, največji in najobsežnejši akademski iskalnik, ta teden praznuje svoj 20. rojstni dan. V zadnjih dveh desetletjih so nekateri raziskovalci ugotovili, da je to orodje postalo eno najpomembnejših orodij v znanosti. Vendar pa so se v zadnjih letih pojavili konkurenti, ki uporabljajo umetno inteligenco (AI) za izboljšanje iskalne izkušnje, pa tudi druge, ki uporabnikom omogočajo prenos podatkov.
Vpliv Google Scholar, ki ga vodi internetni velikan Google v Mountain View v Kaliforniji, je izjemen, pravi Jevin West, računalniški družboslovci na Univerzi v Washingtonu v Seattlu, ki dnevno uporablja bazo podatkov. Toda "če bi bil kdaj trenutek, ko bi Google Scholar lahko zamenjali kot glavni iskalnik, bi to lahko bilo zdaj zaradi nekaterih novih orodij in inovacij, ki se dogajajo drugje," je dejal West.
Številne prednosti Google Scholar - brezplačen dostop, širino informacij in prefinjene možnosti iskanja - "zdaj delijo druge platforme," pravi Alberto Martín Martín, bibliometrik na Univerzi v Granadi v Španiji.
Chatboti, ki jih poganja AI na primer chatgpt in druga orodja, ki uporabljajo velike jezikovne modele, so postala prednostna aplikacija za nekatere raziskovalce pri iskanju, pregledu in povzemanju literature. Einige Forscher Haben Google Scholar Gegen Diese Tools Eingetauscht. "Do nedavnega je bil Google Scholar moj privzeti iskalnik," pravi Aaron Tay, akademski knjižničar na Singapurski univerzi. Še vedno je na vrhu njegovega seznama, "v zadnjem času pa sem začel uporabljati druga orodja AI."
Kljub temu glede na velikost Google Scholar in kako globoko je uveljavljen v znanstveni skupnosti, "bi bilo potrebno veliko truda, da bi ga detronirali," dodaja West.
Anurag acharya, soustanovitelj Google Scholar, pozdravlja vsa prizadevanja za lažje iskanje, razumevanje in gradnjo znanstvenih informacij. "Bolj ko lahko vsi naredimo, bolje je za napredovanje znanosti."
Največji in najobsežnejši
Google Scholar je začel 2004 pojavljajo se na prizorišču raziskav literature in vse spremenil. Takrat so raziskovalci uporabili knjižnice za iskanje informacij ali iskali akademske dokumente s plačanimi spletnimi storitvami, kot je baza podatkov Web of Science Citation. Istega meseca, ko je Google Scholar predstavil, je Elsevier predstavil tudi svojo plačljivo storitev Scopus, celovito bazo podatkov o znanstvenih referencah in povzetkih.
Google Scholar je po spletu iskal znanstvena dela vseh vrst, kot so poglavja o knjigah, poročila, predprint in spletni dokumenti - vključno s tistimi v jezikih, ki niso angleščina. Cilj je bil "narediti svetovne raziskovalce bolj učinkovite in omogočiti vsem, da stojijo na skupni meji znanosti," pravi Acharya.
Dogovori Google Scholar z založniki dajejo neprimerljiv dostop do celotnega besedila člankov za Paywalls - ne le naslovov in povzetkov, ki jih ponuja večina iskalnikov. Članki so razvrščeni glede na njihovo pomembnost z iskalno poizvedbo - ponavadi so najbolj navedeni članki postavljeni na vrh - in predlagajo nadaljnje iskalne poizvedbe. Globina pokritosti omogoča zelo specifična iskanja.
Google ni razkril podatkov o uporabi za storitev, vendar je v skladu s spletnim merilom prometa podobnoweb Google Scholar prejel več kot 100 milijonov obiskov na mesec.
Baza podatkov je zelo dobra tudi pri tem, da uporabnike kaže na brezplačne različice članka, pravi Martín Martín. To spodbuja gibanje z odprtim dostopom, dodaja José Luis Ortega, bibliometrik na Inštitutu za napredne družbene študije španskega nacionalnega raziskovalnega sveta v Córdobi.
Vendar je Google Scholar v drugih pogledih neprozoren. Ključna skrb je pomanjkanje prepoznavnosti, v kateri vsebini, vključno s katerimi revijami, iščemo in kateri algoritem se uporablja za priporočilo člankov. Prav tako omejuje množične prenose rezultatov iskanja, ki bi jih lahko med drugim uporabili za bibliometrično analizo. "Nimamo veliko vpogleda v eno najdragocenejših orodij, ki jih imamo v znanosti," pravi West.
Acharya pojasnjuje, da je Google Scholar predvsem iskalno orodje, njegov glavni cilj pa je pomagati učenjakom najti najbolj koristne raziskave.
Posodobljeni iskalniki
V zadnjih letih so se pojavili konkurenti, ki ponujajo takšne bibliometrične podatke, čeprav nobena ne more premagati velikosti Google Scholar in dostopa do člankov v celotnem besedilu za plačilnimi stenami. Pomemben primer je OpenAlex, predstavljen leta 2022. Leto prej je bil Microsoft Academic Grap, ki je po spletu iskal akademske informacije, zaprl in objavljen celoten nabor podatkov. OpenAlex temelji na tem in drugih odprtih virih znanstvenih podatkov. Uporabniki lahko iščejo vsebino, ki jo katalogizira avtor, institucija in citiranje, in lahko tudi brezplačno prenesejo celoten zapis. "Delajo tisto, za kar smo upali, da bo Google Scholar storil," pravi Martín-Martín.
Drugo priljubljeno raziskovalno orodje, Semantic Scholar, se je začelo leta 2015 in uporablja AI za ustvarjanje berljivih povzetkov dokumentov in prepoznavanje najpomembnejših citatov. Drugo orodje, Soglasje, predstavljeno leta 2022, uporablja bazo podatkov Semantic Scholar's za iskanje odgovorov na vprašanja, ki so bila informirana za raziskave (West je svetovalec za soglasje). Eden izmed Tayjevih najljubših je Spodkopava, ki uporablja prefinjeno iskanje na podlagi agentov, v katerem avtonomna entiteta pregleduje znanstveno literaturo kot človek in prilagodi iskanje na podlagi najdene vsebine. V primerjavi z nekaj sekundami v Google Scholarju traja nekaj minut, da doseže rezultate, vendar Tay pojasnjuje, da je vredno počakati. "Mislim, da je kakovost rezultatov, ki se vračajo, boljša od Google Scholar."
Acharya pravi, da Google Scholar uporablja tudi AI za razvrščanje člankov, predlaga dodatna iskanja in priporoča povezane članke. In v začetku tega meseca je podjetje za svojega bralca PDF predstavilo povzetke člankov, ki jih ustvari AI. Acharya dodaja, da iskalno orodje poskuša razumeti namero in kontekst, ki stoji za poizvedbo. Ta semantični pristop iskanja temelji na jezikovnih modelih in se uporablja približno dve leti, pravi.
Ena stvar, ki ga Google Scholar še ne počne, je vključevanje AI-ustvarjenih pregledov odgovorov na iskano poizvedbo, podobno tistim, ki jih zdaj najdemo na vrhu tipičnega Googlovega iskanja. Acharya pravi, da je izziv povzeti zaključke iz več dokumentov na jedrnat in kontekst bogat način. "Za ta izziv še nismo videli učinkovite rešitve," doda.