A Google láthatatlan vízjeleket mutat be az AI által generált szövegekhez

A Google DeepMind láthatatlan vízjelet fejlesztett ki az AI által generált szövegek számára a hamis információk leküzdésére.
(Symbolbild/natur.wiki)

A Google láthatatlan vízjeleket mutat be az AI által generált szövegekhez

A londoni Google Deepmind kutatói kifejlesztettek egy „vízjelet” a mesterséges intelligencia (AI) által generált szöveg azonosítására-ezt már több millió chatbot-felhasználónál használták.

A vízjel, amelyet október 23-án tettek közzé a Nature 1 nem az első, amelyet az AI generáltak, hogy a legfontosabb, hogy a skót az első, hogy a skót, hanem az, hogy a Skot azt mondja, hogy a Skot azt mondja, hogy a skót a Skott. Aaronson, a texasi egyetemi számítógépes tudós, aki augusztusig az Openai -i Watermarks -on dolgozott, a kaliforniai San Francisco -ban székhellyel rendelkező Chatt alkotói.

Az AI által generált szövegek észlelése egyre fontosabbá válik, mivel potenciális megoldással rendelkezik a Fake News és Academic Csapat . Ezenkívül segíthet a "adatkatroncsok"> "Body Text Link" cloting By Deval-tól, nem pedig a Devaluation-tól. AI generált tartalom .

Egy kiterjedt tanulmányban a Google Gemini Nagy Nyelvi Modell (LLM) felhasználói 20 millió válaszban értékelték a vízjelű szövegeket, mint a jelöletlen szövegekkel. "Szívesen látom, hogy a Google megteszi ezt a lépést a tech közösség számára" - mondja Furong Huang, a College Park Marylandi Egyetem számítógépes tudósa. "Valószínű, hogy a legtöbb kereskedelmi eszköz a közeljövőben vízjeleket tartalmaz" - tette hozzá Zakhar Shumaylov, az Egyesült Királyság Cambridge -i Egyetem számítógépes tudósa.

szavak választása

Nehezebb vízjelet alkalmazni a szövegre, mint a képekre, mivel a szavak megválasztása lényegében az egyetlen változó, amely megváltoztatható. A DeepMind vízjel-nevű szintetikus szöveges változásai, amelyek a modellt választják, titokban, de formális módon, amelyet egy kriptográfiai kulccsal rögzíthetnek. Más megközelítésekhez képest a DeepMind vízjele kissé könnyebb felismerni, és az alkalmazás nem késlelteti a szöveges helyzetet. "Úgy tűnik, hogy meghaladja az LLMS Watermarks versenytársainak fogalmait" - mondja Shumaylov, aki a tanulmány egyik szerzője és testvére a tanulmány egyik szerzője.

Az eszközt szintén közzétették, hogy a fejlesztők saját vízjelet alkalmazhassanak modelleikre. "Reméljük, hogy az AI modellek más fejlesztői ezt fogják venni, és integrálják a saját rendszerükbe" - mondja Pusmmeet Kohli, a DeepMind számítógépes tudósának. A Google megőrzi a legfontosabb titkát, hogy a felhasználók ne használhassanak észlelési eszközöket a Gemini modell vízjelű szövegének azonosítására.

Kormányok ANYAG-FORRÁST"> ANYAG-FORSÁS A NYITUÁNI FORSÁS-t "> ANYAG MARMAL ANYAL oldat. . Ennek ellenére számos probléma merül fel, ideértve a fejlesztők kötelezettségét a vízjelek felhasználására és megközelítéseik koordinálására. Ez év elején a Zürich szövetségi technológiájának kutatói megmutatták, hogy Watermars. , egy olyan eljárás, amelyet "súrolásnak" vagy "hamisításnak" neveznek, amelyben a vízjeleket a szövegekre alkalmazzák, hogy rossz benyomást keltsenek, hogy ki által generáltak.

token-verseny

A DeepMinds megközelítés a Létrehozó módszer "> Létkezési módszer Vízjelző Integrált, a Sampling algpling algpling algorithm. A szöveg, amelyet elválasztanak az LLM -től.

Az LLM egy olyan társulási hálózat, amelyet milliárd szavakkal vagy tokenekkel ismert részekkel történő képzéssel építenek fel. A szöveg beírásakor a modell minden szókincsben szereplő tokent megmutatja annak valószínűségét, hogy a mondat következő szója legyen. A mintavételi algoritmus feladata annak kiválasztása, hogy mely tokeneket kell használni számos szabály szerint.

A szintid szövegmintavételi algoritmus egy kriptográfiai kulcsot használ a véletlenszerű értékek hozzárendeléséhez minden lehetséges tokenhez. A jelölt jegyek arányosak a disztribúció valószínűségével, és egy "versenyen" osztályoznak. Ott az algoritmus összehasonlítja az egy-a-one-K.O.-kerek sorozatának értékeit, ahol a legmagasabb érték-nyereség addig, amíg csak egy token marad, amelyet a szöveghez választanak ki.

Ez a kifinomult módszer megkönnyíti a vízjel észlelését, mivel ugyanazt a kriptográfiai kódot alkalmazzák a generált szövegre a magas értékek keresésére, amelyek jelzik a "nyerő" tokeneket. Ez megnehezítheti a távolságot is.

A verseny több fordulója a zár kombinációjaként tekinthető, amelyben minden forduló eltérő számot képvisel, amelyet meg kell oldani a vízjel feloldásához vagy eltávolításához - mondja Huang. "Ez a mechanizmus lényegesen nehezebbé teszi a súrolást, a vízjel spolitása vagy fejlesztése" - tette hozzá. Körülbelül 200 zsetonnal rendelkező szövegek esetében a szerzők megmutatták, hogy továbbra is felismerhetik a vízjelet, még akkor is, ha egy második LLM -et használtak a szöveg átírására. Rövidebb szövegekkel a vízjel kevésbé robusztus.

A kutatók nem vizsgálták meg, hogy a vízjel mennyire ellenáll a szándékos eltávolítási kísérleteknek. A vízjelek ellenállása az ilyen támadásokkal szemben "hatalmas politikai kérdés"-mondja Yves-Alexandre de Montjoye, a London Imperial College számítógépes tudósának. "Az AI biztonságával összefüggésben nem világos, hogy ez milyen mértékben kínál védelmet" - magyarázza.

Kohli reméli, hogy a vízjel kezdetben segíti az LLM -ek kút -szándékos használatának támogatását. "Az irányadó filozófia az volt, hogy olyan eszközt akartunk fejleszteni, amelyet a közösség javíthat" - tette hozzá.

  1. Datthri, S. et al. Nature 634, 818–823 (2024).

  2. Referenciák letöltése