Ar Google Scholar gali išgyventi AI revoliuciją?
„Google Scholar“ švenčia 20 metų jubiliejų. Dėl naujos AI pagrįstos konkurencijos kyla klausimas: ar jis gali išsilaikyti?

Ar Google Scholar gali išgyventi AI revoliuciją?
„Google Scholar“, didžiausia ir išsamiausia akademinė paieškos sistema, šią savaitę švenčia 20-ąjį gimtadienį. Per pastaruosius du dešimtmečius kai kurie tyrinėtojai pastebėjo, kad šis įrankis tapo vienu iš svarbiausių mokslo priemonių. Tačiau pastaraisiais metais atsirado konkurentų, kurie naudoja dirbtinį intelektą (AI), kad pagerintų paieškos patirtį, ir kitų, leidžiančių vartotojams atsisiųsti savo duomenis.
„Google Scholar“, kurią valdo interneto milžinė „Google“ Mauntin Vju mieste, Kalifornijoje, daro didelę įtaką, sako Jevinas Westas, skaičiavimo socialinis mokslininkas iš Vašingtono universiteto Sietle, kuris kasdien naudojasi duomenų baze. Tačiau „jei kada nors būtų galima pakeisti „Google Scholar“ kaip pagrindinį paieškos variklį, tai gali būti dabar dėl kai kurių šių naujų įrankių ir naujovių, kurios vyksta kitur“, – sakė Westas.
Daugelis „Google Scholar“ pranašumų – nemokama prieiga, informacijos platumas ir sudėtingos paieškos parinktys – „dabar dalijasi kitose platformose“, – sako Alberto Martinas Martínas, bibliometrikas iš Granados universiteto Ispanijoje.
AI varomi pokalbių robotai pvz., ChatGPT ir kiti įrankiai, naudojantys didelius kalbų modelius, kai kuriems tyrinėtojams tapo pageidaujamomis programomis ieškant, peržiūrint ir apibendrinant literatūrą. Kai kurie tyrinėtojai iškeitė „Google Scholar“ į šiuos įrankius. „Iki neseniai „Google Scholar“ buvo mano numatytasis paieškos variklis“, – sako Singapūro vadybos universiteto akademinis bibliotekininkas Aaronas Tay. Tai vis dar yra jo sąrašo viršuje, tačiau „pastaruoju metu pradėjau naudoti kitus AI įrankius“.
Vis dėlto, atsižvelgiant į „Google Scholar“ dydį ir tai, kaip jis giliai įsitvirtino mokslo bendruomenėje, „reikėtų įdėti daug pastangų, kad jį nuverstume“, priduria Westas.
Anurag Acharya, „Google Scholar“ įkūrėjas, sveikina visas pastangas, kad mokslinę informaciją būtų lengviau rasti, suprasti ir remtis. "Kuo daugiau mes visi galime padaryti, tuo geriau mokslo pažangai."
Didžiausias ir išsamiausias
„Google Scholar“ įsijungė 2004 m pasirodyti literatūros tyrinėjimų scenoje ir viską pakeitė. Tuomet tyrėjai naudojo bibliotekas informacijos paieškai arba akademinių darbų ieškojo naudodamiesi mokamų internetinių paslaugų, tokių kaip Web of Science citatų duomenų bazė, pagalba. Tą patį mėnesį, kai pradėjo veikti „Google Scholar“, „Elsevier“ taip pat pristatė mokamą paslaugą „Scopus“ – išsamią mokslinių nuorodų ir santraukų duomenų bazę.
„Google Scholar“ ieškojo žiniatinklyje visų rūšių mokslinių darbų, pvz., knygų skyrių, ataskaitų, išankstinių spaudinių ir žiniatinklio dokumentų, įskaitant tuos, kurie yra ne anglų kalba. Tikslas buvo „padidinti pasaulio mokslininkų veiksmingumą ir sudaryti sąlygas visiems stovėti ant bendros mokslo ribos“, – sako Acharya.
„Google Scholar“ sutartys su leidėjais suteikia neprilygstamą prieigą prie viso straipsnių teksto, esančio už mokamų sienų, – ne tik pavadinimus ir santraukas, kurias siūlo dauguma paieškos sistemų. Straipsniai reitinguojami pagal jų atitikimą paieškos užklausai – dažniausiai dažniausiai cituojami straipsniai iškeliami į viršų – ir siūlomos tolesnės paieškos užklausos. Aprėpties gylis leidžia atlikti labai specifines paieškas.
„Google“ neatskleidė paslaugos naudojimo duomenų, tačiau, remiantis žiniatinklio srauto matuokliu „Samathweb“, „Google Scholar“ sulaukia daugiau nei 100 milijonų apsilankymų per mėnesį.
Duomenų bazė taip pat labai gerai nukreipia vartotojus į nemokamas straipsnio versijas, sako Martínas Martínas. Tai skatina atviros prieigos judėjimą, priduria José Luis Ortega, Ispanijos nacionalinės tyrimų tarybos Kordoboje Pažangių socialinių studijų instituto bibliometrikas.
Tačiau kitais atžvilgiais „Google Scholar“ yra neskaidrus. Pagrindinis susirūpinimas yra tai, kad neaišku, kokio turinio, įskaitant žurnalus, ieškoma ir koks algoritmas naudojamas straipsniams rekomenduoti. Ji taip pat riboja masinį paieškos rezultatų atsisiuntimą, kurie, be kita ko, gali būti naudojami bibliometrinei analizei. „Neturime daug supratimo apie vieną vertingiausių mokslo priemonių“, – sako Westas.
Acharya paaiškina, kad „Google Scholar“ pirmiausia yra paieškos įrankis ir pagrindinis jos tikslas – padėti mokslininkams rasti naudingiausius tyrimus.
Atnaujinti paieškos varikliai
Pastaraisiais metais atsirado konkurentų, siūlančių tokius bibliometrinius duomenis, nors nė vienas negali įveikti „Google Scholar“ dydžio ir prieigos prie viso teksto straipsnių už mokamų sienų. Puikus pavyzdys yra „OpenAlex“, paleista 2022 m. Prieš metus „Microsoft Academic Graph“, kuri internete ieškojo akademinės informacijos, buvo uždaryta ir paskelbtas visas jo duomenų rinkinys. „OpenAlex“ remiasi šiuo ir kitais atvirais mokslinių duomenų šaltiniais. Vartotojai gali ieškoti turinio, kuris yra kataloguotas pagal autorių, instituciją ir citatą, taip pat gali nemokamai atsisiųsti visą įrašą. „Jie daro tai, ko tikėjomės, kad „Google Scholar“ padarys“, – sako Martín-Martín.
Kitas populiarus tyrimo įrankis „Semantic Scholar“, paleistas 2015 m., naudoja dirbtinį intelektą, kad sukurtų skaitomas straipsnių santraukas ir nustatytų aktualiausias citatas. Kitas įrankis, Sutarimas 2022 m. pradėtas naudoti „Semantic Scholar“ duomenų bazėje ieško atsakymų į moksliniais tyrimais pagrįstus klausimus (West yra „Consensus“ konsultantas). Vienas iš Tay mėgstamiausių yra Sumenkinti, kurioje naudojama sudėtinga agentais pagrįsta paieška, kai savarankiškas subjektas kaip žmogus nuskaito mokslinę literatūrą ir koreguoja paiešką pagal rastą turinį. Rezultatams gauti prireikia kelių minučių, palyginti su sekundėmis „Google Scholar“, bet Tay paaiškina, kad laukti verta. „Manau, kad grįžtančių rezultatų kokybė yra geresnė nei „Google Scholar“.
Acharya teigia, kad „Google Scholar“ taip pat naudoja dirbtinį intelektą, kad reitinguotų straipsnius, pasiūlytų papildomas paieškas ir rekomenduotų susijusius straipsnius. Ir anksčiau šį mėnesį bendrovė pristatė AI sukurtas straipsnių santraukas savo PDF skaitytuvui. Acharya priduria, kad paieškos įrankis bando suprasti užklausos tikslą ir kontekstą. Šis semantinės paieškos metodas yra pagrįstas kalbos modeliais ir buvo naudojamas maždaug dvejus metus, sako jis.
Vienas dalykas, kurio „Google Scholar“ dar nedaro, yra dirbtinio intelekto sugeneruotų atsakymų į ieškomos užklausos apžvalgas, panašias į tas, kurios dabar randamos įprastos „Google“ paieškos viršuje. Acharya sako, kad sudėtinga apibendrinti kelių straipsnių išvadas glaustai ir daug konteksto. „Dar nematėme veiksmingo šio iššūkio sprendimo“, – priduria jis.