Google predstavlja nevidne vodne žige za besedila, ustvarjena z AI

Google Deepmind je razvil neviden vodni žig za besedila, ustvarjena z AI, za boj proti napačnim informacijam.
(Symbolbild/natur.wiki)

Google predstavlja nevidne vodne žige za besedila, ustvarjena z AI

Raziskovalci v Googlu Deepmind v Londonu so razvili "vodni žig" za identifikacijo besedila, ki ga ustvari umetna inteligenca (AI)-to je že uporabljeno pri milijonih uporabnikov Chatbota.

The watermark that was published on October 23 in the journal Nature 1 is not the first to be created for AI generated. However, it is the first to demonstrate in a large, real context. "In my opinion, the most important news here is that they actually use it," says Scott Aaronson, računalniški znanstvenik na Teksaški univerzi v Austinu, ki je do avgusta delal na vodnih žigah na OpenAI, ustvarjalci Chatt s sedežem v San Franciscu v Kaliforniji

Zaznavanje besedil, ustvarjenih z AI, postaja vse bolj pomembno, ker imate potencialno rešitev za težave lažne novice in akademska goljufija . In addition, it could help to to protect future models from devaluation by not being trained with Ai-generirane vsebine .

V obsežni študiji so uporabniki Google Gemini velikega jezikovnega modela (LLM) ocenjeni v 20 milijonih odgovorov besedil z vodnim žigom kot enakovredna z neoznačenimi besedili. "Navdušen sem, ko vidim, da Google dela ta korak za tehnološko skupnost," pravi Furong Huang, računalniški računalninec na Univerzi v Marylandu v College Parku. "Verjetno bo večina komercialnih orodij v bližnji prihodnosti vsebovala vodne žige," je dodal Zakhar Shumaylov, računalniški znanstvenik na Univerzi v Cambridgeu v Veliki Britaniji.

izbira besed

Težje je uporabiti vodni žig za besedilo kot za slike, saj je izbira besed v bistvu edina spremenljivka, ki jo je mogoče spremeniti. Deepmind's Watermark, imenovane sintetidne spremembe besedila, ki jih model izbere, na skriven, a formuliran način, ki ga je mogoče posneti s kriptografskim ključem. V primerjavi z drugimi pristopi je vodni žig DeepMind nekoliko lažje prepoznati in aplikacija ne odloži besedilnega položaja. "Zdi se, da presega koncepte konkurentov na vodnih žigah LLMS," pravi Shumaylov, ki je nekdanji uslužbenec in brat enega od avtorjev študije.

Orodje je bilo razkrito tudi tako, da lahko razvijalci na svoje modele uporabijo svoj vodni žig. "Upamo, da bodo drugi razvijalci AI modelov to prevzeli in jih vključili v svoje sisteme," pravi Pushmeet Kohli, računalniški računalniški znanstvenik Deepmind. Google hrani svojo ključno skrivnost, tako da uporabniki ne morejo uporabljati orodij za odkrivanje za identifikacijo besedila z vodnim žigom modela Gemini.

Vlade Katežna telesna povezava "> ON A-IN TOLES besedilo . Kljub temu obstaja veliko težav, vključno z obveznostjo razvijalcev, da uporabljajo vodne žige in usklajevanje njihovih pristopov. At the beginning of this year, researchers at the Federal Technology Zurich showed that Watermarks are susceptible Za odstranitev , postopek, ki se imenuje "čiščenje", ali "ponarejanje", v katerem se vodni žigi uporabljajo za besedila, da se napačen vtis, da jih ustvarjajo.

turnir žetona

DeepMinds pristop temelji na obstojna metoda" telesa "> obstoječa metoda", ki je v ALGORING "> obstoječa metoda" telesa, ki je v ALGORMING "> ABEMING ALGORMING"> Executing Metoda "> Executing Metoda"> Executing Metoda "Executing Metoda. besedilo besedila, ki je ločeno od samega LLM

LLM je mreža združenj, ki jih gradijo z usposabljanjem z milijardami besed ali delov, znanih kot žetoni. Ko vnesete besedilo, model prikazuje vsak žeton v svojem besedišču, verjetnost, da bo naslednja beseda v stavku. Naloga algoritma vzorčenja je izbrati, katere žetone je treba uporabiti v skladu s številnimi pravili.

Algoritem vzorčenja sintetida besedila uporablja kriptografski ključ za dodelitev naključnih vrednosti vsem možnim žetonom. Kandidatne vstopnice so sorazmerne z njihovo verjetnostjo distribucije in jih razvrstijo na "turnir". Tam algoritem primerja vrednosti v nizu ene proti eni-k.o.-krog, pri čemer se najvišja vrednost poveča, dokler ne ostane samo en žeton, ki je izbran za besedilo.

Ta prefinjena metoda olajša zaznavanje vodnega žiga, saj se za ustvarjeno besedilo uporablja ista kriptografska koda za iskanje visokih vrednosti, ki kažejo na "zmagovalne" žetone. To bi lahko tudi otežilo razdaljo.

Več krogov na turnirju je mogoče razumeti kot kombinacijo ključavnice, v kateri vsak krog predstavlja drugačno število, ki ga je treba rešiti za odklepanje ali odstranjevanje vodnega žiga, pravi Huang. "Ta mehanizem otežuje čiščenje, ki ga je otežil, da bi se razvijal ali razvijal vodni žig," doda. Za besedila z približno 200 žetoni so avtorji pokazali, da lahko še vedno prepoznajo vodni žig, četudi je bil za prepisovanje besedila uporabljen drugi LLM. S krajšimi besedili je vodni žig manj močan.

Raziskovalci niso preučili, kako dobro je vodni žig odporen proti namernim poskusom odstranitve. Odpor vodnih žigov proti takšnim napadom je "množično politično vprašanje," pravi Yves-Alexandre de Montjoye, računalniški znanstvenik na Imperial College London. "V okviru varnosti AI ni jasno, v kolikšni meri to nudi zaščito," pojasnjuje.

Kohli upa, da bo vodni žig sprva pomagal podpirati dobronamerno uporabo LLM -jev. "Vodilna filozofija je bila, da smo želeli razviti orodje, ki ga skupnost lahko izboljša," dodaja.

    >
  1. Datthri, S. et al. Narava 634, 818–823 (2024).

  2. Prenesite reference