Google prezintă filigrane invizibile pentru texte generate de AI

Google prezintă filigrane invizibile pentru texte generate de AI
Cercetătorii de la Google DeepMind din Londra au dezvoltat un „filigran” pentru a identifica textul care este generat de Intelligence Artificial (AI)-Acesta a fost deja folosit în milioane de utilizatori de chatbot.
Filigranul care a fost publicat pe 23 octombrie în revista Nature 1 nu este primul care a fost creat pentru AI generat. Cu toate acestea, este primul care este primul care a demonstrat într-un context mare. Aaronson, informatician la Universitatea din Texas din Austin, care a lucrat la filigrane la OpenAI până în august, creatorii Chatt, cu sediul în San Francisco, California
Detectarea textelor generate de AI devine din ce în ce mai importantă, deoarece aveți o soluție potențială pentru problemele știri false și Frauda academică . În plus, s-ar putea ajuta la pentru a proteja viitoarele modele de la Devalate de date de date de date =" " Conținut generat de AI .
Într -un studiu extins, utilizatorii modelului Google Gemini Language Language (LLM) au evaluat în 20 de milioane de răspunsuri texte filigranate ca fiind echivalente cu textele nemarcate. "Sunt entuziast să văd că Google face acest pas pentru comunitatea tehnologică", spune Furong Huang, informatician la Universitatea Maryland din College Park. „Este probabil ca majoritatea instrumentelor comerciale să conțină filigrane în viitorul apropiat”, adaugă Zakhar Shumaylov, informatician la Universitatea din Cambridge, Marea Britanie.
alegerea cuvintelor
Este mai dificil să aplici un filigran pe text decât la imagini, deoarece alegerea cuvintelor este în esență singura variabilă care poate fi schimbată. Filigranul DeepMind-Colled Synthid se schimbă pe care îl alege modelul, într-un mod secret, dar formulator, care poate fi înregistrat cu o cheie criptografică. În comparație cu alte abordări, filigranul DeepMind este ușor mai ușor de recunoscut, iar aplicația nu întârzie poziția textului. „Se pare că depășește conceptele de concurenți la LLMS Whatermarks”, spune Shumaylov, care este fost angajat și frate al unuia dintre autorii studiului.
Instrumentul a fost dezvăluit, de asemenea, astfel încât dezvoltatorii să își poată aplica propriul filigran la modelele lor. „Sperăm că alți dezvoltatori de modele AI vor lua acest lucru și îi vor integra în propriile lor sisteme”, spune Pushmeet Kohli, informatician la DeepMind. Google își păstrează secretul cheie, astfel încât utilizatorii să nu poată utiliza instrumente de detectare pentru a identifica textul filigranat al modelului Gemini.
guverne . Cu toate acestea, există multe probleme, inclusiv obligația dezvoltatorilor de a utiliza filigranele și coordonarea abordărilor lor. La începutul acestui an, cercetătorii de la Tehnologia Federală Zurich au arătat că Shoamberkkermarkes sunt cu excepția datelor pentru removalarea datelor--category = "Body Text"> Wakemarksmarkskermarks pentru a face parte din corp. , un proces care este denumit „spălare” sau „spoofing”, în care filigranele sunt aplicate la texte pentru a da impresia greșită că sunt generate de Ki.
Token-Turneu
Deepminds approach is based on a existing method Watermark integrated into a sampling algorithm, a step in the text of the text care este separat de LLM în sine
un LLM este o rețea de asociații care sunt construite prin instruire cu miliarde de cuvinte sau părți cunoscute sub numele de jetoane. Când este introdus un text, modelul arată fiecare jeton din vocabularul său o probabilitate de a fi următorul cuvânt din propoziție. Sarcina algoritmului de eșantionare este de a selecta ce jetoane ar trebui utilizate în conformitate cu o serie de reguli.
Algoritmul de eșantionare a textului sintetizat folosește o cheie criptografică pentru a atribui valori aleatorii fiecărui jeton posibil. Biletele candidate sunt proporționale cu probabilitatea de distribuție și clasificate într -un „turneu”. Acolo algoritmul compară valorile dintr-o serie de rotile unice-one-k.o.
Această metodă sofisticată facilitează detectarea filigranului, deoarece același cod criptografic este aplicat textului generat pentru a căuta valori ridicate care indică jetoane „câștigătoare”. Acest lucru ar putea face, de asemenea, distanța mai dificilă.
Cele mai multe runde din turneu pot fi văzute ca o combinație de blocare, în care fiecare rundă reprezintă un număr diferit care trebuie rezolvat pentru a debloca sau elimina filigranul, spune Huang. „Acest mecanism face considerabil mai dificil de frecat, de spol sau de dezvoltare a filigranului”, adaugă ea. Pentru textele cu aproximativ 200 de jetoane, autorii au arătat că mai pot recunoaște filigranul, chiar dacă un al doilea LLM a fost folosit pentru a rescrie textul. Cu texte mai scurte, filigranul este mai puțin robust.
Cercetătorii nu au examinat cât de bine este rezistent filigranul la încercările deliberate de a elimina. Rezistența filigranelor împotriva unor astfel de atacuri este o „întrebare politică masivă”, spune Yves-Alexandre de Montjoye, informatician la Imperial College London. „În contextul securității AI, nu este clar în ce măsură acest lucru oferă protecție”, explică el.
Kohli speră că filigranul va ajuta inițial să sprijine utilizarea bine intenționată a LLM -urilor. „Filosofia călăuzitoare a fost că am dorit să dezvoltăm un instrument care să poată fi îmbunătățit de comunitate”, adaugă el.
-
datthri, S. și colab. Natura 634, 818–823 (2024).