Google presenterar osynliga vattenmärken för AI -genererade texter

Google presenterar osynliga vattenmärken för AI -genererade texter
Forskare på Google DeepMind i London har utvecklat ett "vattenstämpel" för att identifiera text som genereras av Artificial Intelligence (AI) -Detta har redan använts i miljoner chatbot-användare.
Vattenmärket som publicerades den 23 oktober i tidskriften Nature 1 är inte den första som skapas för AI-genererad. Aaronson, datavetare vid University of Texas i Austin, som arbetade på vattenmärken vid OpenAI fram till augusti, skaparna av Chatt, baserat i San Francisco, Kalifornien.
Upptäckt av AI-genererade texter blir allt viktigare eftersom du har en potentiell lösning för problemen med Fake News och Academic Fraud . Dessutom kan det hjälpa till att .
I en omfattande studie utvärderade användare av Google Gemini Large Language Model (LLM) i 20 miljoner svar vattenmärkta texter som motsvarande med omärkta texter. "Jag är entusiastisk för att se att Google tar detta steg för teknikgemenskapen," säger Furong Huang, datavetare vid University of Maryland i College Park. "Det är troligt att de flesta kommersiella verktyg kommer att innehålla vattenmärken inom en snar framtid", tillade Zakhar Shumaylov, datavetare vid University of Cambridge, Storbritannien.
val av ord
Det är svårare att tillämpa ett vattenmärke på text än på bilder, eftersom valet av ord i huvudsak är den enda variabeln som kan ändras. DeepMinds vattenmärkeskallade synthid textförändringar som ord modellen väljer, på ett hemligt men formellt sätt som kan spelas in med en kryptografisk nyckel. Jämfört med andra tillvägagångssätt är DeepMinds vattenstämpel något lättare att känna igen, och applikationen försenar inte textpositionen. "Det verkar som om det överskrider koncept för konkurrenter på LLMS -vattenmärken," säger Shumaylov, som är en tidigare anställd och bror till en av författarna till studien.
Verktyget avslöjades också så att utvecklare kan tillämpa sitt eget vattenstämpel på sina modeller. "Vi hoppas att andra utvecklare av AI -modeller kommer att ta detta och integrera dem i sina egna system," säger Pushmeet Kohli, datavetare på DeepMind. Google håller sin nyckelhemor så att användarna inte kan använda detekteringsverktyg för att identifiera vattenmärkt text i Gemini -modellen.
Regeringar BODY TEXP " . Ändå finns det många problem, inklusive utvecklarens skyldighet att använda vattenmärken och samordningen av deras tillvägagångssätt. I början av detta år visade forskare vid den federala tekniken Zürich att , en process som kallas "skrubba", eller "förfalskning", där vattenmärken tillämpas på texter för att ge fel intryck av att de är ki-genererade.
token-turnering
Deepminds approach is based on a existing method Watermark integrated into a sampling algorithm, a step in the text of Texten som är separerad från LLM själv.
AN LLM är ett nätverk av föreningar som är byggda upp genom att träna med miljarder ord eller delar kända som tokens. När en text matas in visar modellen varje symbol i sitt ordförråd en sannolikhet för att vara nästa ord i meningen. Provtagningsalgoritmens uppgift är att välja vilka tokens som ska användas enligt ett antal regler.
Synthidtextprovtagningsalgoritmen använder en kryptografisk nyckel för att tilldela slumpmässiga värden till alla möjliga token. Kandidatbiljetter är proportionella mot deras sannolikhet för distributionen och klassificeras i en "turnering". Där jämför algoritmen värdena i en serie av en-mot-en-K.O.-Rounds, varigenom det högsta värdet vinster tills det bara finns ett token kvar som väljs för texten.
Denna sofistikerade metod gör det lättare att upptäcka vattenmärket, eftersom samma kryptografiska kod tillämpas på genererad text för att söka efter de höga värdena som indikerar "vinnande" tokens. Detta kan också göra avståndet svårare.
De flera rundorna i turneringen kan ses som en Kombination av lås, där varje omgång representerar ett annat nummer som måste lösas för att låsa upp eller ta bort vattenmärket, säger Huang. "Denna mekanism gör det betydligt svårare att skrubba, spol eller utveckla vattenmärket," tillägger hon. För texter med cirka 200 tokens visade författarna att de fortfarande kunde känna igen vattenmärket, även om en andra LLM användes för att skriva om texten. Med kortare texter är vattenmärket mindre robust.
Forskarna har inte undersökt hur väl vattenmärket är motståndskraftigt mot avsiktliga försök att ta bort. Motståndet från vattenmärken mot sådana attacker är en "massiv politisk fråga", säger Yves-Alexandre de Montjoye, datavetare vid Imperial College London. "I samband med AI -säkerheten är det oklart i vilken utsträckning detta ger skydd," förklarar han.
Kohli hoppas att vattenmärket initialt kommer att hjälpa till att stödja den väl avsedda användningen av LLM. "Den vägledande filosofin var att vi ville utveckla ett verktyg som kan förbättras av samhället," tillägger han.
-
datthri, S. et al. Nature 634, 818–823 (2024).