Google præsenterer usynlige vandmærker til AI -genererede tekster

Google Deepmind har udviklet et usynligt vandmærke til AI -genererede tekster til bekæmpelse af falske oplysninger.
(Symbolbild/natur.wiki)

Google præsenterer usynlige vandmærker til AI -genererede tekster

Forskere ved Google Deepmind i London har udviklet et "vandmærke" til at identificere tekst, der genereres af kunstig intelligens (AI) -Dette er allerede blevet brugt i millioner af chatbot-brugere.

Vandmærket, der blev offentliggjort den 23. oktober i tidsskriftet Nature 1 er ikke den første, der er skabt til ai, der genereres. Dog er det den første til at demonstrere i en stor kontekst. Aaronson, computerforsker ved University of Texas i Austin, der arbejdede på vandmærker i Openai indtil august, skaberne af Chatt, med base i San Francisco, Californien

Påvisning af AI-genererede tekster bliver stadig vigtigere, fordi du har en potentiel løsning til problemerne med falske nyheder og Academic svig . In addition, it could help to to protect future models from devaluation by not being trained with AI-genereret indhold .

I en omfattende undersøgelse vurderede brugere af Google Gemini Large Language Model (LLM) i 20 millioner svar vandmærket tekster som ækvivalent med umærkede tekster. "Jeg er begejstret for at se, at Google tager dette skridt for det tekniske samfund," siger Furong Huang, computerforsker ved University of Maryland i College Park. "Det er sandsynligt, at de fleste kommercielle værktøjer vil indeholde vandmærker i den nærmeste fremtid," tilføjer Zakhar Shumaylov, computerforsker ved University of Cambridge, UK.

valg af ord

Det er vanskeligere at anvende et vandmærke på tekst end på billeder, da valg af ord i det væsentlige er den eneste variabel, der kan ændres. Deepminds vandmærke-kaldte syntid-tekstændringer, som ord modellen vælger, på en hemmelig, men formel måde, der kan registreres med en kryptografisk nøgle. Sammenlignet med andre tilgange er Deepminds vandmærke lidt lettere at genkende, og applikationen forsinker ikke tekstpositionen. "Det ser ud til, at det overskrider koncepterne konkurrenter på LLMS -vandmærker," siger Shumaylov, der er en tidligere medarbejder og bror til en af ​​forfatterne af undersøgelsen.

Værktøjet blev også afsløret, så udviklere kan anvende deres eget vandmærke på deres modeller. "Vi håber, at andre udviklere af AI -modeller vil tage dette og integrere dem i deres egne systemer," siger PushMeet Kohli, computerforsker hos Deepmind. Google holder sin vigtigste hemmelighed, så brugerne ikke kan bruge detektionsværktøjer til at identificere vandmærket tekst til Gemini -modellen.

Regeringer . Ikke desto mindre er der mange problemer, herunder udviklernes forpligtelse til at bruge vandmærker og koordinering af deres tilgange. I begyndelsen af ​​dette år viste forskere ved Federal Technology Zurich, at , en proces, der omtales som "skrubning" eller "forfalskning", hvor vandmærker anvendes til tekster for at give det forkerte indtryk, at de er ki-genereret.

token-turnering

Deepminds-tilgang er baseret på et

Denne sofistikerede metode gør det lettere at detektere vandmærket, da den samme kryptografiske kode anvendes på genereret tekst for at søge efter de høje værdier, der indikerer "vindende" tokens. Dette kan også gøre afstanden vanskeligere.

De flere runder i turneringen kan ses som en Kombination af lås, hvor hver runde repræsenterer et andet antal, der skal løses for at låse op eller fjerne vandmærket, siger Huang. "Denne mekanisme gør det betydeligt vanskeligere at skrubbe, spol eller udvikle vandmærket," tilføjer hun. For tekster med omkring 200 tokens viste forfatterne, at de stadig kunne genkende vandmærket, selvom en anden LLM blev brugt til at omskrive teksten. Med kortere tekster er vandmærket mindre robust.

Forskerne har ikke undersøgt, hvor godt vandmærket er modstandsdygtigt over for bevidste forsøg på at fjerne. Modstanden for vandmærker mod sådanne angreb er et "massivt politisk spørgsmål", siger Yves-Alexandre de Montjoye, computerforsker ved Imperial College London. "I forbindelse med AI -sikkerhed er det uklart, i hvilket omfang dette giver beskyttelse," forklarer han.

Kohli håber, at vandmærket oprindeligt vil hjælpe med at støtte den veludviklede brug af LLM'er. "Den vejledende filosofi var, at vi ønskede at udvikle et værktøj, der kan forbedres af samfundet," tilføjer han.

  1. >>

    Datthri, S. et al. Natur 634, 818–823 (2024).

  2. Download referencer