Dirbtinio intelekto sukurti vaizdai kelia pavojų mokslui – taip mokslininkai nori juos atpažinti

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Tyrėjai kovoja su dirbtinio intelekto sukurtais netikrais vaizdais mokslinėse publikacijose. Kuriami nauji aptikimo metodai.

Forschende kämpfen gegen AI-generierte Fake-Bilder in wissenschaftlichen Publikationen. Neue Methoden zur Aufdeckung entwickeln sich.
Tyrėjai kovoja su dirbtinio intelekto sukurtais netikrais vaizdais mokslinėse publikacijose. Kuriami nauji aptikimo metodai.

Dirbtinio intelekto sukurti vaizdai kelia pavojų mokslui – taip mokslininkai nori juos atpažinti

Mokslininkai, manipuliuojantys skaičiais ir masiškai gaminantys netikrus popierius Privalomi leidėjai – probleminiai rankraščiai jau seniai trukdo mokslinei literatūrai. Moksliniai detektyvai dirba nenuilstamai, atskleisti šį pažeidimą ir ištaisyti mokslinius įrašus. Tačiau jų darbas darosi vis sunkesnis, nes atsirado naujas, galingas sukčių įrankis – generatyvus dirbtinis intelektas (AI).

„Generatyvusis AI vystosi labai greitai“, – sako Jana Christopher, FEBS Press, Heidelberge, Vokietijoje, vaizdo vientisumo analitikas. „Mano srityje dirbantys žmonės – vaizdų vientisumas ir leidybos politika – vis labiau nerimauja dėl jo teikiamų galimybių.

Lengvumas, su kuriuo generatyvūs AI įrankių tekstai, vaizdai ir duomenys kelia baimę dėl vis nepatikimos mokslinės literatūros, užplūdusios netikrų numerių, rankraščių ir išvadų, kurias žmogui sunku aptikti. Ginklavimosi varžybos jau kyla, nes sąžiningumo specialistai, leidėjai ir technologijų įmonės uoliai dirba Sukurkite AI įrankius, kuri gali padėti greitai atpažinti apgaulingus, dirbtinio intelekto sukurtus elementus specializuotuose straipsniuose.

„Tai bauginantis pokytis“, – sako Christopheris. „Tačiau taip pat yra protingų žmonių ir siūlomi geri struktūriniai pokyčiai.

Tyrimo vientisumo ekspertai praneša, kad nors dirbtinio intelekto sukurtas tekstas tam tikromis aplinkybėmis jau leidžiamas daugelyje žurnalų, tokių įrankių naudojimas vaizdams ar kitiems duomenims kurti gali būti laikomas mažiau priimtinu. „Artimiausiu metu mums gali patikti dirbtinio intelekto sukurtas tekstas“, – sakoma Elisabeth Bik, vaizdo kriminalistikos specialistas ir konsultantas San Franciske, Kalifornijoje. "Bet aš brėžiu liniją, kai reikia generuoti duomenis."

Bik, Christopher ir kiti teigia, kad duomenys, įskaitant vaizdus, ​​sukurti naudojant generatyvųjį dirbtinį intelektą, jau plačiai naudojami literatūroje, o privalomi leidėjai naudoja AI įrankius rankraščiams gaminti dideliais kiekiais (žr. „Viktorina: ar galite pastebėti dirbtinio intelekto klastojimus?“).

DI sukurtų vaizdų atpažinimas yra didžiulis iššūkis: jų dažnai plika akimi beveik neįmanoma atskirti nuo tikrų vaizdų. „Jaučiamės taip, lyg kiekvieną dieną susiduriame su AI sukurtais vaizdais“, – sako Christopheris. "Bet jei negalite to įrodyti, tikrai mažai ką galite padaryti."

Yra keletas aiškių generatyvinio AI naudojimo moksliniuose vaizduose pavyzdžių, pvz dabar liūdnai pagarsėjęs žiurkės vaizdas su absurdiškai dideliais lytiniais organais ir nesąmoningos etiketės, sukurtos naudojant „Midjourney“ vaizdo įrankį. Grafikas, kurį vasario mėnesį paskelbė prekybos žurnalas, sukėlė audrą socialiniuose tinkluose ir buvo atšauktas po kelių dienų.

Tačiau dauguma atvejų nėra tokie akivaizdūs. Figūros, sukurtos naudojant „Adobe Photoshop“ ar panašius įrankius prieš atsirandant generatyviniam dirbtiniam intelektui, ypač molekulinėje ir ląstelių biologijoje, dažnai turi ryškių bruožų, kuriuos detektyvai gali atpažinti, pavyzdžiui, identiškas fonas arba neįprastas dryžių ar dėmių trūkumas. Dirbtinio intelekto sukurti simboliai dažnai neparodo tokių savybių. „Matau daug popierių, kurie verčia manyti, kad šie Western blotai neatrodo tikroviški, bet nėra rūkomojo ginklo“, – sako Bikas. „Galite pasakyti tik tiek, kad jie tiesiog atrodo keistai, ir, žinoma, to nepakanka įrodymų susisiekti su redaktoriumi.

Tačiau yra ženklų, kad paskelbtuose rankraščiuose pasirodo dirbtinio intelekto sukurti personažai. Tekstų, parašytų naudojant tokius įrankius kaip „ChatGPT“, daugėja straipsnių, o tai matyti iš tipiškų pokalbių robotų frazių, kurias autoriai pamiršta pašalinti, ir išskirtinius žodžius, kuriuos AI modeliai dažniausiai naudoja. „Taigi turime daryti prielaidą, kad taip atsitinka ir duomenims bei vaizdams“, – sako Bikas.

Kitas požymis, kad sukčiai naudoja sudėtingas vaizdo gavimo priemones, yra tai, kad dauguma tyrėjų šiuo metu randamų problemų atsiranda kelerių metų senumo kūriniuose. „Pastaraisiais metais matėme vis mažiau problemų, susijusių su vaizdais“, - sako Bik. „Manau, kad dauguma žmonių, kurie buvo sugauti manipuliuojant vaizdais, pradėjo kurti švaresnius vaizdus.

Sukurti švarius vaizdus naudojant generatyvųjį AI nėra sunku. Kevinas Patrickas, mokslinis vaizdų detektyvas, socialinėje žiniasklaidoje žinomas Cheshire vardu, pademonstravo, kaip tai gali būti paprasta, ir paskelbė savo išvadas X. Naudodamas Photoshop AI įrankį Generative Fill, Patrick sukūrė tikroviškus vaizdus, ​​kurie gali būti rodomi moksliniuose darbuose, apie navikus, ląstelių kultūras, Western blot ir kt. Daugumai vaizdų sukurti prireikė mažiau nei minutės (žr. „Klaidingo mokslo generavimas“).

„Jei aš galiu tai padaryti, tai tikrai padarys tie, kuriems mokama už netikrų duomenų kūrimą“, – sako Patrickas. „Tikriausiai yra daug kitų duomenų, kuriuos būtų galima sugeneruoti naudojant tokius įrankius.

Kai kurie leidėjai skelbia, kad paskelbtuose tyrimuose rado AI sukurto turinio įrodymų. Tai apima PLoS, kuri buvo įspėta apie įtartiną turinį ir, atlikdama vidinius tyrimus, rado AI sukurto teksto ir duomenų, pateiktų straipsniuose ir pateiktuose duomenis, sako Renée Hoch, PLoS leidinių etikos komandos redaktorė San Franciske, Kalifornijoje. (Hoch pažymi, kad dirbtinio intelekto naudojimas nėra draudžiamas PLoS žurnaluose ir kad AI politika grindžiama autoriaus atsakomybe ir skaidriu atskleidimu.)

Kiti įrankiai taip pat galėtų suteikti galimybių žmonėms, norintiems kurti netikrą turinį. Praėjusį mėnesį mokslininkai paskelbė a 1 generatyvų AI modelį, skirtą didelės raiškos mikroskopo vaizdams kurti – ir kai kurie vientisumo specialistai išreiškė susirūpinimą dėl šio darbo. "Šią technologiją gali lengvai naudoti žmonės, turintys blogų ketinimų, kad greitai sukurtų šimtus ar tūkstančius netikrų vaizdų", - sako Bik.

Yoav Shechtman iš Technion-Israel technologijos instituto Haifoje, įrankio kūrėjas, teigia, kad įrankis yra naudingas kuriant modelių mokymo duomenis, nes sunku gauti didelės raiškos mikroskopo vaizdus. Tačiau jis priduria, kad tai nėra naudinga kuriant klastotes, nes vartotojai mažai kontroliuoja rezultatus. Esama vaizdų redagavimo programinė įranga, tokia kaip „Photoshop“, yra naudingesnė manipuliuojant figūromis, siūlo jis.

Nors žmogaus akys gali ir nepajėgti Atpažinti AI sukurtus vaizdus, AI galbūt galėtų tai padaryti (žr. „AI vaizdus sunku atpažinti“).

Įrankių, tokių kaip „Imagetwin“ ir „Proofig“, kūrėjai, kurie naudoja dirbtinį intelektą mokslinių vaizdų vientisumo problemoms aptikti, plečia savo programinę įrangą, kad galėtų filtruoti generatyvinio AI sukurtus vaizdus. Kadangi tokius vaizdus labai sunku atpažinti, abi įmonės kuria savo generuojamųjų dirbtinio intelekto vaizdų duomenų bazes, kad mokytų savo algoritmus.

„Proofig“ savo įrankyje jau išleido AI sukurtų mikroskopo vaizdų atpažinimo funkciją. Vienas iš įkūrėjų Droras Kolodkinas-Galas Rehovote (Izraelis) teigia, kad atliekant bandymus su tūkstančiais dirbtinio intelekto sukurtų ir tikrų vaizdų iš straipsnių, algoritmas teisingai identifikavo AI vaizdus 98 % atvejų, o klaidingai teigiamų rezultatų rodiklis buvo 0,02 %. Droras priduria, kad komanda dabar bando suprasti, ką tiksliai aptinka jų algoritmas.

„Su šiais įrankiais dedu daug vilčių“, – sako Christopheris. Tačiau ji pastebi, kad jų rezultatus visada turi įvertinti ekspertai, galintys patikrinti jų nurodytas problemas. Christopheris dar nematė jokių įrodymų, kad dirbtinio intelekto vaizdų atpažinimo programinė įranga yra patikima (vidinis „Proofig“ įvertinimas dar nepaskelbtas). Šios priemonės yra „ribotos, bet tikrai labai naudingos, kad galėtume išplėsti pateikimo peržiūros pastangas“, – priduria ji.

Daugelis leidėjų ir tyrimų institucijų jau naudojasi juo Įrodymas ir Imagetwin. Pavyzdžiui, mokslo žurnalai naudoja „Proofig“, kad patikrintų vaizdų vientisumo problemas. Pasak Vašingtono Mokslo komunikacijos direktoriaus Meagan Phelan, įrankis dar neaptiko jokių dirbtinio intelekto sukurtų vaizdų.

„Nature“ leidėjas „Springer Nature“ kuria savo teksto ir vaizdo aptikimo įrankius, vadinamus „Geppetto“ ir „SnapShot“, kurie žymi pažeidimus, kuriuos vėliau įvertina žmonės. (Gamtos naujienų komanda redakciniu požiūriu nepriklauso nuo savo leidėjo.)

Leidybos grupės taip pat imasi veiksmų, kad reaguotų į AI sukurtus vaizdus. Tarptautinės mokslo, technikos ir medicinos leidėjų asociacijos (STM) atstovas Oksforde (JK) sakė, kad ji į problemą žiūri „labai rimtai“ ir reaguoja į tokias iniciatyvas kaip United2Act ir STM Integrity Hub, kuris sprendžia aktualias problemas, susijusias su privalomu publikavimu ir kitais akademinio sąžiningumo klausimais.

Christopheris, vadovaujantis STM darbo grupei vaizdų keitimo ir dubliavimo klausimais, teigia, kad vis labiau suprantama, kad reikės sukurti būdus, kaip patikrinti neapdorotus duomenis, pavyzdžiui, mikroskopu darytas nuotraukas ženklinti nematomais vandens ženklais, panašiais į naudojamus. Vandenženkliai dirbtinio intelekto sukurtuose tekstuose – tai gali būti teisingas kelias. Ji priduria, kad tai reikalauja naujų technologijų ir naujų standartų įrenginių gamintojams.

Patrikas ir kiti nerimauja, kad leidėjai neveikia pakankamai greitai, kad pašalintų grėsmę. „Mes bijome, kad tai bus tik dar viena literatūros problemų karta, kurios nesprendžiamos tol, kol nevėlu“, – sako jis.

Vis dėlto kai kurie optimistiškai nusiteikę, kad AI sukurtas turinys, rodomas straipsniuose šiandien, bus atrastas ateityje.

„Aš visiškai tikiu, kad technologija tobulės tiek, kad atpažins šiandien kuriamus duomenis, nes tam tikru momentu tai bus laikoma gana grubiu“, – sako Patrickas. "Sukčiai neturėtų gerai miegoti naktimis. Jie gali apgauti dabartinį procesą, bet nemanau, kad jie gali apgauti visą procesą amžinai."

  1. Saguy, A. ir kt. Mažasis met. https://doi.org/10.1002/smtd.202400672 (2024).

    Straipsnis  

    Google Scholar
     

Atsisiųskite nuorodas