A Google láthatatlan vízjeleket mutat be az AI által generált szövegekhez

A Google láthatatlan vízjeleket mutat be az AI által generált szövegekhez
A londoni Google Deepmind kutatói kifejlesztettek egy „vízjelet” a mesterséges intelligencia (AI) által generált szöveg azonosítására-ezt már több millió chatbot-felhasználónál használták.A vízjel, amelyet október 23-án tettek közzé a Nature 1 nem az első, amelyet az AI generáltak, hogy a legfontosabb, hogy a skót az első, hogy a skót, hanem az, hogy a Skot azt mondja, hogy a Skot azt mondja, hogy a skót a Skott. Aaronson, a texasi egyetemi számítógépes tudós, aki augusztusig az Openai -i Watermarks -on dolgozott, a kaliforniai San Francisco -ban székhellyel rendelkező Chatt alkotói.
Az AI által generált szövegek észlelése egyre fontosabbá válik, mivel potenciális megoldással rendelkezik a Fake News és Academic Csapat . Ezenkívül segíthet a "adatkatroncsok"> "Body Text Link" cloting By Deval-tól, nem pedig a Devaluation-tól. AI generált tartalom .
Egy kiterjedt tanulmányban a Google Gemini Nagy Nyelvi Modell (LLM) felhasználói 20 millió válaszban értékelték a vízjelű szövegeket, mint a jelöletlen szövegekkel. "Szívesen látom, hogy a Google megteszi ezt a lépést a tech közösség számára" - mondja Furong Huang, a College Park Marylandi Egyetem számítógépes tudósa. "Valószínű, hogy a legtöbb kereskedelmi eszköz a közeljövőben vízjeleket tartalmaz" - tette hozzá Zakhar Shumaylov, az Egyesült Királyság Cambridge -i Egyetem számítógépes tudósa.
szavak választása
Nehezebb vízjelet alkalmazni a szövegre, mint a képekre, mivel a szavak megválasztása lényegében az egyetlen változó, amely megváltoztatható. A DeepMind vízjel-nevű szintetikus szöveges változásai, amelyek a modellt választják, titokban, de formális módon, amelyet egy kriptográfiai kulccsal rögzíthetnek. Más megközelítésekhez képest a DeepMind vízjele kissé könnyebb felismerni, és az alkalmazás nem késlelteti a szöveges helyzetet. "Úgy tűnik, hogy meghaladja az LLMS Watermarks versenytársainak fogalmait" - mondja Shumaylov, aki a tanulmány egyik szerzője és testvére a tanulmány egyik szerzője.
Az eszközt szintén közzétették, hogy a fejlesztők saját vízjelet alkalmazhassanak modelleikre. "Reméljük, hogy az AI modellek más fejlesztői ezt fogják venni, és integrálják a saját rendszerükbe" - mondja Pusmmeet Kohli, a DeepMind számítógépes tudósának. A Google megőrzi a legfontosabb titkát, hogy a felhasználók ne használhassanak észlelési eszközöket a Gemini modell vízjelű szövegének azonosítására.
Kormányok ANYAG-FORRÁST"> ANYAG-FORSÁS A NYITUÁNI FORSÁS-t "> ANYAG MARMAL ANYAL oldat. . Ennek ellenére számos probléma merül fel, ideértve a fejlesztők kötelezettségét a vízjelek felhasználására és megközelítéseik koordinálására. Ez év elején a Zürich szövetségi technológiájának kutatói megmutatták, hogy Watermars. , egy olyan eljárás, amelyet "súrolásnak" vagy "hamisításnak" neveznek, amelyben a vízjeleket a szövegekre alkalmazzák, hogy rossz benyomást keltsenek, hogy ki által generáltak.
token-verseny
A DeepMinds megközelítés a Létrehozó módszer "> Létkezési módszer Vízjelző Integrált, a Sampling algpling algpling algorithm. A szöveg, amelyet elválasztanak az LLM -től.
Az LLM egy olyan társulási hálózat, amelyet milliárd szavakkal vagy tokenekkel ismert részekkel történő képzéssel építenek fel. A szöveg beírásakor a modell minden szókincsben szereplő tokent megmutatja annak valószínűségét, hogy a mondat következő szója legyen. A mintavételi algoritmus feladata annak kiválasztása, hogy mely tokeneket kell használni számos szabály szerint.
A szintid szövegmintavételi algoritmus egy kriptográfiai kulcsot használ a véletlenszerű értékek hozzárendeléséhez minden lehetséges tokenhez. A jelölt jegyek arányosak a disztribúció valószínűségével, és egy "versenyen" osztályoznak. Ott az algoritmus összehasonlítja az egy-a-one-K.O.-kerek sorozatának értékeit, ahol a legmagasabb érték-nyereség addig, amíg csak egy token marad, amelyet a szöveghez választanak ki.
Ez a kifinomult módszer megkönnyíti a vízjel észlelését, mivel ugyanazt a kriptográfiai kódot alkalmazzák a generált szövegre a magas értékek keresésére, amelyek jelzik a "nyerő" tokeneket. Ez megnehezítheti a távolságot is.
A verseny több fordulója a zár kombinációjaként tekinthető, amelyben minden forduló eltérő számot képvisel, amelyet meg kell oldani a vízjel feloldásához vagy eltávolításához - mondja Huang. "Ez a mechanizmus lényegesen nehezebbé teszi a súrolást, a vízjel spolitása vagy fejlesztése" - tette hozzá. Körülbelül 200 zsetonnal rendelkező szövegek esetében a szerzők megmutatták, hogy továbbra is felismerhetik a vízjelet, még akkor is, ha egy második LLM -et használtak a szöveg átírására. Rövidebb szövegekkel a vízjel kevésbé robusztus.
A kutatók nem vizsgálták meg, hogy a vízjel mennyire ellenáll a szándékos eltávolítási kísérleteknek. A vízjelek ellenállása az ilyen támadásokkal szemben "hatalmas politikai kérdés"-mondja Yves-Alexandre de Montjoye, a London Imperial College számítógépes tudósának. "Az AI biztonságával összefüggésben nem világos, hogy ez milyen mértékben kínál védelmet" - magyarázza.
Kohli reméli, hogy a vízjel kezdetben segíti az LLM -ek kút -szándékos használatának támogatását. "Az irányadó filozófia az volt, hogy olyan eszközt akartunk fejleszteni, amelyet a közösség javíthat" - tette hozzá.
-
Datthri, S. et al. Nature 634, 818–823 (2024).