Google presenterer usynlige vannmerker for AI -genererte tekster

Google DeepMind har utviklet et usynlig vannmerke for AI -genererte tekster for å bekjempe falsk informasjon.
(Symbolbild/natur.wiki)

Google presenterer usynlige vannmerker for AI -genererte tekster

Forskere ved Google DeepMind i London har utviklet et "vannmerke" for å identifisere tekst som genereres av kunstig intelligens (AI)-Dette har allerede blitt brukt i millioner av chatbot-brukere.

Vannmerket som ble publisert 23. oktober i tidsskriftet Nature 1 er den første som er den første som er den første som er den første som er den første som er den første som er den første som er den første som er den første som er den første som er den første som er den første som er det som er det som er det som er det som er det. Aaronson, dataforsker ved University of Texas i Austin, som jobbet med vannmerker i Openai til august, skaperne av Chatt, med base i San Francisco, California

Deteksjonen av AI-genererte tekster blir stadig viktigere fordi du har en potensiell løsning for problemene med falske nyheter og Academic svindel . In addition, it could help to to protect future models from devaluation by not being trained with AI-generert innhold .

I en omfattende studie evaluert brukere av Google Gemini Large Language Model (LLM) i 20 millioner svar vannmerkede tekster som tilsvarende med umerkede tekster. "Jeg er begeistret for å se at Google tar dette skrittet for teknologisamfunnet," sier Furong Huang, dataforsker ved University of Maryland i College Park. "Det er sannsynlig at de fleste kommersielle verktøy vil inneholde vannmerker i løpet av en nær fremtid," la Zakhar Shumaylov, dataforsker ved University of Cambridge, Storbritannia til.

Valg av ord

Det er vanskeligere å bruke et vannmerke på tekst enn på bilder, siden ordvalget egentlig er den eneste variabelen som kan endres. DeepMinds vannmerke-kalte synthid tekstendringer som order modellen velger, på en hemmelig, men formel måte som kan registreres med en kryptografisk nøkkel. Sammenlignet med andre tilnærminger, er DeepMinds vannmerke litt lettere å gjenkjenne, og applikasjonen forsinker ikke tekstposisjonen. "Det ser ut til at det overskrider konseptene til konkurrenter på LLMS Watermarks," sier Shumaylov, som er en tidligere ansatt og bror til en av forfatterne av studien.

Verktøyet ble også avslørt slik at utviklere kan bruke sitt eget vannmerke på modellene sine. "Vi håper at andre utviklere av AI -modeller vil ta dette og integrere dem i sine egne systemer," sier Pushmeet Kohli, dataforsker ved DeepMind. Google holder nøkkelhemmeligheten slik at brukerne ikke kan bruke deteksjonsverktøy for å identifisere vannmerket tekst på Gemini -modellen.

Regjeringer . Likevel er det mange problemer, inkludert utviklernes forpliktelse til å bruke vannmerker og koordinering av deres tilnærminger. I begynnelsen av dette året viste forskere ved den føderale teknologien Zurich at , en prosess som blir referert til som "skrubbe", eller "forfalskning", der vannmerker brukes på tekster for å gi feil inntrykk av at de er Ki-genererte.

Token-Tournament

DeepMinds-tilnærmingen er basert på en eksistens. Teksten til teksten som er atskilt fra selve LLM

En LLM er et nettverk av assosiasjoner som er bygd opp ved å trene med milliarder av ord eller deler kjent som symboler. Når en tekst legges inn, viser modellen hvert symbol i ordforrådet som en sannsynlighet for å være det neste ordet i setningen. Oppgaven med prøvetakingsalgoritmen er å velge hvilke symboler som skal brukes i henhold til en rekke regler.

Synthid -tekstprøvetakingsalgoritmen bruker en kryptografisk nøkkel for å tilordne tilfeldige verdier til alle mulige token. Kandidatbilletter er proporsjonale med sannsynligheten for distribusjonen og klassifisert i en "turnering". Der sammenligner algoritmen verdiene i en serie med en-mot-en-K.O.-runder, hvorved den høyeste verdien til det bare er ett symbol som er valgt for teksten.

Denne sofistikerte metoden gjør det lettere å oppdage vannmerket, siden den samme kryptografiske koden brukes på generert tekst for å søke etter de høye verdiene som indikerer "vinnende" symboler. Dette kan også gjøre avstanden vanskeligere.

De flere rundene i turneringen kan sees på som en kombinasjon av lås, der hver runde representerer et annet tall som må løses for å låse opp eller fjerne vannmerket, sier Huang. "Denne mekanismen gjør det betydelig vanskeligere å skrubbe, spol eller utvikle vannmerket," legger hun til. For tekster med rundt 200 symboler, viste forfatterne at de fremdeles kunne gjenkjenne vannmerket, selv om en andre LLM ble brukt til å omskrive teksten. Med kortere tekster er vannmerket mindre robust.

Forskerne har ikke undersøkt hvor godt vannmerket er motstandsdyktig mot bevisste forsøk på å fjerne. Motstanden fra vannmerker mot slike angrep er et "massivt politisk spørsmål," sier Yves-Alexandre de Montoye, dataforsker ved Imperial College London. "I sammenheng med AI -sikkerhet er det uklart i hvilken grad dette gir beskyttelse," forklarer han.

Kohli håper at vannmerket i utgangspunktet vil bidra til å støtte den veloppsinnede bruken av LLM -er. "Den ledende filosofien var at vi ønsket å utvikle et verktøy som kan forbedres av samfunnet," legger han til.

  1. Dattri, S. et al. Nature 634, 818–823 (2024).

  2. Last ned referanser