Google predstavlja nevidljive vodene žigove za tekstove generirane AI

Google DeepMind razvio je nevidljivi vodeni žig za tekstove generirane AI za borbu protiv lažnih podataka.
(Symbolbild/natur.wiki)

Google predstavlja nevidljive vodene žigove za tekstove generirane AI

Istraživači iz Google DeepMind u Londonu razvili su "vodeni žig" kako bi identificirali tekst koji generira umjetna inteligencija (AI)-to je već korišten u milijunima korisnika chatbota.

Vodeni žig koji je objavljen 23. listopada u časopisu Nature 1 nije prvi koji će biti stvoren za AI, što je, međutim, to što je najvažnije u mom mišljenju", u mom mišljenju. " Aaronson, računalni znanstvenik sa Sveučilišta u Teksasu u Austinu, koji je na vodenim žigovima radio do kolovoza do kolovoza, tvorca Chatta, sa sjedištem u San Franciscu u Kaliforniji.

Otkrivanje tekstova generiranih AI postaje sve važnije jer imate potencijalno rješenje za probleme Lažne vijesti i Akademska prijevara . Osim toga, moglo bi pomoći Izbor riječi

Teže je primijeniti vodeni žig na tekst nego na slike, jer je izbor riječi u osnovi jedina varijabla koja se može promijeniti. DeepMind-ov vodeni žigov koji se zove Synthid mijenja tekst kojim se model odabire, na tajno, ali formuliran način koji se može zabilježiti kriptografskim ključem. U usporedbi s drugim pristupima, vodeni žig DeepMind -a malo je lakše prepoznati, a aplikacija ne odgađa položaj teksta. "Čini se da premašuje koncepte konkurencije na LLMS vodenim žigovima", kaže Shumaylov, koji je bivši zaposlenik i brat jednog od autora studije.

Alat je također otkriven tako da programeri mogu primijeniti vlastiti vodeni žig na svoje modele. "Nadamo se da će drugi programeri AI modela to preuzeti i integrirati ih u svoje sustave", kaže Pushmeet Kohli, računalni znanstvenik iz DeepMind -a. Google čuva svoju ključnu tajnu tako da korisnici ne mogu koristiti alate za otkrivanje za prepoznavanje vodenog teksta modela Blizanca.

vlade . Ipak, postoje mnogi problemi, uključujući obvezu programera da koriste vodene žigove i koordinaciju svojih pristupa. Početkom ove godine, istraživači savezne tehnologije Zurich pokazali su da je

Token-turnir

Pristup DeepMinds temelji se na postojani altmark = "postoji teksta koji je odvojen od samog LLM -a.

LLM je mreža udruženja koje se izgrađuju obukom s milijardama riječi ili dijelova poznatih kao tokeni. Kad se unese tekst, model prikazuje svaki token u svom vokabularu vjerojatnost da će biti sljedeća riječ u rečenici. Zadatak algoritma za uzorkovanje je odabrati koji tokeni trebaju koristiti prema nizu pravila.

Algoritam uzorkovanja teksta Synthid koristi kriptografski ključ za dodjelu slučajnih vrijednosti svakom mogućem tokenu. Kandidatske karte proporcionalne su njihovoj vjerojatnosti distribucije i klasificirane na "turniru". Tamo algoritam uspoređuje vrijednosti u nizu jednosmjernih ° C.O.-ROUNDS, pri čemu najviša vrijednost dobiva sve dok nije ostalo samo jedan token koji je odabran za tekst.

Ova sofisticirana metoda olakšava otkrivanje vodenog žiga, jer se isti kriptografski kôd primjenjuje na generirani tekst za traženje visokih vrijednosti koje ukazuju na tokene "pobjede". To bi također moglo otežati udaljenost.

Nekoliko rundi na turniru može se promatrati kao kombinacija zaključavanja, u kojoj svaki krug predstavlja drugačiji broj koji je potrebno riješiti za otključavanje ili uklanjanje vodenog žiga, kaže Huang. "Ovaj mehanizam otežava pročišćavanje, razvijati ili razviti vodeni žig", dodaje ona. Za tekstove s oko 200 tokena, autori su pokazali da još uvijek mogu prepoznati vodeni žig, čak i ako je drugi LLM korišten za prepisivanje teksta. S kraćim tekstovima vodeni žig je manje robustan.

Istraživači nisu ispitali koliko je vodeni žig otporan na namjerne pokušaje uklanjanja. Otpor vodenih žigova protiv takvih napada je "masovno političko pitanje", kaže Yves-Alexandre de Montjoye, računalni znanstvenik na Imperial College London. "U kontekstu sigurnosti AI nije jasno u kojoj mjeri to nudi zaštitu", objašnjava on.

Kohli se nada da će vodeni žig u početku pomoći podržati dobronamjerno korištenje LLM -ova. "Filozofija vodiča bila je da želimo razviti alat koji zajednica može poboljšati", dodaje on.

  1. datthri, S. i sur. Priroda 634, 818–823 (2024).

  2. Preuzmite reference