Google esittelee näkymättömiä vesileimoja AI -luotuille teksteille

Google DeepMind hat ein unsichtbares Wasserzeichen für KI-generierte Texte entwickelt, um Falschinformationen zu bekämpfen.
Google Deepmind on kehittänyt näkymättömän vesileiman AI -luotuille teksteille väärien tietojen torjumiseksi. (Symbolbild/natur.wiki)

Google esittelee näkymättömiä vesileimoja AI -luotuille teksteille

Lontoon Google Deepmindin tutkijat ovat kehittäneet ”vesileiman”, joka tunnistaa tekstin, jonka syntyy tekoälyn (AI)-tätä on jo käytetty miljoonilla chatbot-käyttäjillä.

Vesilevy, joka julkaistiin 23. lokakuuta -lehdessä Nature 1 ei ole ensimmäinen luotu AI: lle. Tärkeintä on kuitenkin, että se on ensimmäinen." Teksasin yliopiston Austinin tietoteknikko Aaronson, joka työskenteli vesileimoilla Openaissa elokuuhun asti, Chattin luojat, jotka sijaitsevat San Franciscossa, Kaliforniassa. ; "https://www.nature.com/articles/d41586-024-01696-z" data-track-category = "Body Text Link"> Fake News ja Academic fraud . Lisäksi se voisi auttaa .

Laajassa tutkimuksessa Google Gemini LIKE -kielimallin (LLM) käyttäjiä arvioitiin 20 miljoonaan vastaukseen vesileimatut tekstejä vastaavat merkitsemättömiä tekstejä. "Olen innostunut näkemään, että Google ottaa tämän askeleen teknologiayhteisölle", sanoo Marylandin yliopiston yliopistopuiston tietoteknikko Furong Huang. "On todennäköistä, että useimmat kaupalliset työkalut sisältävät vesileimat lähitulevaisuudessa", lisäsi Cambridgen yliopiston tietotekniikan Zakhar Shumaylov, Iso -Britannia.

choice of words

Vesileimaa on vaikeampaa käyttää tekstiä kuin kuviin, koska sanojen valinta on olennaisesti ainoa muuttuja, jota voidaan muuttaa. DeepMindin vesileiman kutsuttu synthid-tekstivaihto, jotka malli valitsee, salaisella, mutta kaavaisella tavalla, joka voidaan tallentaa salausavaimella. Compared to other approaches, Deepmind's watermark is slightly easier to recognize, and the application does not delay the text position. "Vaikuttaa siltä, ​​että se ylittää LLMS -vesileimojen kilpailijoiden käsitteet", sanoo Shumaylov, joka on entinen työntekijä ja yhden tutkimuksen kirjoittajan veli.

The tool was also disclosed so that developers can apply their own watermark to their models. "Toivomme, että muut AI -mallien kehittäjät vievät tämän ja integroivat ne omiin järjestelmiinsä", sanoo Deepmindin tietokonetieteilijä Pushmeet Kohli. Google keeps its key secret so that the users cannot use detection tools to identify watermarked text of the Gemini model.

Hallitukset . Nevertheless, there are many problems, including the obligation of the developers to use watermarks and the coordination of their approaches. Tämän vuoden alussa liittovaltion teknologian Zürichin tutkijat osoittivat, että , prosessi, jota kutsutaan "hankaamiseksi" tai "huijaamiseksi", jossa vesileimat sovelletaan teksteihin, jotta väärään vaikutelmaan ne ovat ki-generoituja.

token-tournament

DeepMinds -lähestymistapa perustuu

An LLM is a network of associations that are built up by training with billions of words or parts known as tokens. When a text is entered, the model shows every token in its vocabulary a probability of being the next word in the sentence. The task of the sampling algorithm is to select which tokens should be used according to a number of rules.

The synthid text sampling algorithm uses a cryptographic key to assign random values ​​to every possible token. Candidate tickets are proportional to their probability of the distribution and classified in a "tournament". Siellä algoritmissa verrataan arvoja yksittäisten yhdellä-k.o. -kierroksen sarjassa, jolloin korkein arvo on, kunnes tekstille on valittu vain yksi merkki jäljellä.

Tämä hienostunut menetelmä helpottaa vesileiman havaitsemista, koska samaa kryptografista koodia käytetään luotuun tekstiin etsimään korkeita arvoja, jotka osoittavat "voittavan" rahakkeet. This could also make the distance more difficult.

Turnauksen useita kierroksia voidaan nähdä lukon yhdistelmänä, jossa kukin kierros edustaa erilaista lukua, joka on ratkaistava vesileiman avaamiseksi tai poistamiseksi, Huang sanoo. "This mechanism makes it considerably more difficult to scrub, to spol or develop the watermark," she adds. Noin 200 rahakkeella olevissa teksteissä kirjoittajat osoittivat, että he pystyivät silti tunnistamaan vesileiman, vaikka toista LLM: ää käytettiin tekstin uudelleenkirjoittamiseen. With shorter texts, the watermark is less robust.

The researchers have not examined how well the watermark is resistant to deliberate attempts to remove. Vesilevyjen vastustus tällaisiin hyökkäyksiin on "massiivinen poliittinen kysymys", sanoo Yves-Alexandre de Montjoye, Imperial College Lontoon tietotekniikka. "In the context of AI security it is unclear to what extent this offers protection," he explains.

Kohli hopes that the watermark will initially help to support the well -intentioned use of LLMs. "The guiding philosophy was that we wanted to develop a tool that can be improved by the community," he adds.

    Ra

    Datthri, S. et al. Nature 634, 818–823 (2024).

    Download references