Google presenteert onzichtbare watermerken voor door AI gegenereerde teksten

Google presenteert onzichtbare watermerken voor door AI gegenereerde teksten
Onderzoekers van Google Deepmind in Londen hebben een "watermerk" ontwikkeld om tekst te identificeren die wordt gegenereerd door Artificial Intelligence (AI)-dit is al gebruikt bij miljoenen chatbotgebruikers.
Het watermerk dat werd gepubliceerd op 23 oktober in het tijdschrift Nature 1 is echter niet de eerste die het belangrijkste is, het belangrijkste is dat het belangrijkste is, het belangrijkste is dat SCOTT SCOTT is, het belangrijkste is dat SCOTT is, het belangrijkste is dat SCOTT is, het belangrijkste is dat SCOTT is, het belangrijkste is dat SCOTT wordt gebruikt," zegt het meest belangrijke nieuws. Aaronson, computerwetenschapper aan de Universiteit van Texas in Austin, die tot augustus werkte op watermerken in Openai, de makers van Chatt, gevestigd in San Francisco, Californië.
De detectie van door AI gegenereerde teksten wordt steeds belangrijker omdat u een potentiële oplossing hebt voor de problemen van Fake News en Academische fraude . Bovendien kan het helpen om .
In een uitgebreide studie evalueerden gebruikers van het Google Gemini Large Language Model (LLM) in 20 miljoen antwoorden met watermerk gequekelde teksten als gelijkwaardig aan ongemarkeerde teksten. "Ik ben enthousiast om te zien dat Google deze stap zet voor de technische gemeenschap", zegt Furong Huang, computerwetenschapper aan de Universiteit van Maryland in College Park. "Het is waarschijnlijk dat de meeste commerciële hulpmiddelen in de nabije toekomst watermerken zullen bevatten," voegde Zakhar Shumaylov, computerwetenschapper aan de Universiteit van Cambridge, VK.
woordenkeuze
Het is moeilijker om een watermerk op tekst aan te brengen dan op afbeeldingen, omdat de keuze van woorden in wezen de enige variabele is die kan worden gewijzigd. De DeepMind's watermerk-called synthide tekst verandert welke woorden het model kiest, op een geheime maar formuele manier die kan worden vastgelegd met een cryptografische sleutel. In vergelijking met andere benaderingen is het watermerk van DeepMind iets gemakkelijker te herkennen en vertraagt de toepassing de tekstpositie niet. "Het lijkt erop dat het de concepten van concurrenten van LLMS -watermerken overschrijdt", zegt Shumaylov, een voormalige medewerker en broer van een van de auteurs van de studie.
De tool is ook bekendgemaakt zodat ontwikkelaars hun eigen watermerk op hun modellen kunnen toepassen. "We hopen dat andere ontwikkelaars van AI -modellen dit zullen nemen en ze in hun eigen systemen integreren", zegt PushMeet Kohli, computerwetenschapper bij DeepMind. Google houdt zijn sleutelgeheim vast, zodat de gebruikers geen detectietools kunnen gebruiken om getekte watermerk van het Gemini -model te identificeren.
regeringen waterkearks zijn suscepteerbaar to remema , een proces dat wordt aangeduid als "schrobben" of "spoofing", waarin watermerken worden toegepast op teksten om de verkeerde indruk te geven dat ze Ki-gegenereerd zijn.
token-toernooi
Deepminds-aanpak is gebaseerd op een Bestaande methode Watermarkt in de tekst De tekst die is gescheiden van de LLM zelf.
Een LLM is een netwerk van associaties die zijn opgebouwd door training met miljarden woorden of onderdelen die bekend staan als tokens. Wanneer een tekst wordt ingevoerd, toont het model elk token in zijn vocabulaire een kans om het volgende woord in de zin te zijn. De taak van het steekproefalgoritme is om te selecteren welke tokens moeten worden gebruikt volgens een aantal regels.
Het synthide tekstbemonsteringsalgoritme maakt gebruik van een cryptografische sleutel om willekeurige waarden toe te wijzen aan elk mogelijk token. Kandidaat -tickets zijn evenredig met hun kans op de distributie en geclassificeerd in een "toernooi". Daar vergelijkt het algoritme de waarden in een reeks van één-tegen-one-k.o.-rounds, waarbij de hoogste waarde wint totdat er nog maar één token over is dat voor de tekst is geselecteerd.
Deze geavanceerde methode maakt het gemakkelijker om het watermerk te detecteren, omdat dezelfde cryptografische code wordt toegepast op gegenereerde tekst om te zoeken naar de hoge waarden die aangeven "winnende" tokens. Dit kan de afstand ook moeilijker maken.
De verschillende rondes in het toernooi kunnen worden gezien als een combinatie van slot, waarin elke ronde een ander aantal vertegenwoordigt dat moet worden opgelost om het watermerk te ontgrendelen of te verwijderen, zegt Huang. "Dit mechanisme maakt het aanzienlijk moeilijker om te schrobben, te spol of het watermerk te ontwikkelen," voegt ze eraan toe. Voor teksten met ongeveer 200 tokens toonden de auteurs aan dat ze het watermerk nog steeds konden herkennen, zelfs als een tweede LLM werd gebruikt om de tekst te herschrijven. Met kortere teksten is het watermerk minder robuust.
De onderzoekers hebben niet onderzocht hoe goed het watermerk bestand is tegen opzettelijke pogingen om te verwijderen. Het verzet van watermerken tegen dergelijke aanvallen is een "massale politieke vraag", zegt Yves-Alexandre de Montjoye, computerwetenschapper aan het Imperial College London. "In de context van AI -beveiliging is het onduidelijk in hoeverre dit bescherming biedt", legt hij uit.
Kohli hoopt dat het watermerk in eerste instantie zal helpen om het goed geïnspecteerde gebruik van LLMS te ondersteunen. "De leidende filosofie was dat we een hulpmiddel wilden ontwikkelen dat door de gemeenschap kan worden verbeterd", voegt hij eraan toe.
- >
-
datthri, S. et al. Nature 634, 818–823 (2024).