Google представя невидими водни знаци за генерирани от AI текстове

Google DeepMind разработи невидим воден знак за генерирани от AI текстове за борба с фалшивата информация.
(Symbolbild/natur.wiki)

Google представя невидими водни знаци за генерирани от AI текстове

Изследователи от Google DeepMind в Лондон са разработили „воден знак“ за идентифициране на текст, който се генерира от изкуствен интелект (AI)-това вече е използвано в милиони потребители на чатбот.

Водният знак, публикуван на 23 октомври в списанието Nature 1 Не е първият, който се създава за генериран от AI. Въпреки това, това е първото, което да демонстрира в голям контекст." В моето мнение, най-важното е, че е, че те са в голям контекст, "в моето мнение, най-важното е, че е, че те са в голям контекст," в моето мнение, най-важното е, че е, че те са в голям контекст, "в моето мнение, най-важното е, че е, че те са в голям контекст," в моето мнение, най-важното е, че е, че те са в голям контекст ", в моя мнение. Аарънсън, компютърен учен в Тексаския университет в Остин, който работи върху водни знаци в Openai до август, създателите на Chatt, базирани в Сан Франциско, Калифорния ; "https://www.nature.com/articles/d41586-024-01696-z" data-track-category = "text text text"> фалшиви новини и Академична измама . В допълнение, това може да помогне на AI-генерирано съдържание .

В обширно проучване потребителите на модела на големи езици на Google Gemini (LLM), оценени в 20 милиона отговора, водна маркирана текстове като еквивалентни с немаркирани текстове. „Аз съм ентусиазиран да видя, че Google предприема тази стъпка за технологичната общност“, казва Фурунг Хуанг, компютърен учен от Университета на Мериленд в колежа Парк. "Вероятно е повечето търговски инструменти да съдържат водни знаци в близко бъдеще", добави Захар Шумайлов, компютърен учен от Университета в Кеймбридж, Великобритания.

Избор на думи

По -трудно е да се приложи воден знак към текста, отколкото върху изображенията, тъй като изборът на думи по същество е единствената променлива, която може да бъде променена. Synthid-Synthid-променя на текста на DeepMind, които думите, които моделът избира, по таен, но формулиран начин, който може да бъде записан с криптографски ключ. В сравнение с други подходи, водният знак на DeepMind е малко по -лесен за разпознаване и приложението не забавя текстовата позиция. „Изглежда, че надвишава концепциите на конкурентите в LLMS водни знаци“, казва Шумайлов, който е бивш служител и брат на един от авторите на изследването.

Инструментът също беше разкрит, така че разработчиците да могат да прилагат собствен воден знак към своите модели. „Надяваме се, че други разработчици на AI модели ще вземат това и ще ги интегрират в собствените си системи“, казва Pushmeet Kohli, компютърен учен от DeepMind. Google запазва ключовата си тайна, така че потребителите да не могат да използват инструменти за откриване, за да идентифицират воден текст на модела Gemini.

правителства , процес, който се нарича "почистване" или "подправяне", при който водните знаци се прилагат към текстове, за да създадат грешно впечатление, че те са генерирани.

Token-Tournament

Deepminds approach is based on a existing method Watermark integrated into a sampling algorithm, a step in the text of the text Това е отделено от самия LLM

LLM е мрежа от асоциации, които се изграждат чрез обучение с милиарди думи или части, известни като жетони. Когато е въведен текст, моделът показва всеки знак в речника си вероятност да бъде следващата дума в изречението. Задачата на алгоритъма за вземане на проби е да се избере кои маркери трябва да се използват в съответствие с редица правила.

Алгоритъмът за вземане на проби от Synthid Text използва криптографски ключ за присвояване на случайни стойности на всеки възможен маркер. Билетите на кандидатите са пропорционални на вероятността от дистрибуцията и се класифицират в „турнир“. Там алгоритъмът сравнява стойностите в серия от еднократно-един-k.o.-Round, при което най-високата стойност се повишава, докато има само един жетон, който е избран за текста.

Този сложен метод улеснява откриването на водния знак, тъй като се прилага един и същ криптографски код за генериран текст за търсене на високите стойности, които показват "печеливши" жетони. Това също може да затрудни разстоянието.

Няколко кръга в турнира могат да се разглеждат като комбинация от заключване, в която всеки кръг представлява различен брой, който трябва да бъде решен, за да отключи или премахне водния знак, казва Хуанг. „Този ​​механизъм прави значително по -трудно да се почиства, да се разпали или развие водния знак“, добавя тя. За текстове с около 200 жетона авторите показаха, че все още могат да разпознаят водния знак, дори ако се използва втори LLM за пренаписване на текста. С по -къси текстове водният знак е по -малко здрав.

Изследователите не са изследвали колко добре водният знак е устойчив на умишлени опити за отстраняване. Съпротивата на водните знаци срещу подобни атаки е "мащабен политически въпрос", казва Ив-Александър де Монджой, компютърен учен в Imperial College London. „В контекста на сигурността на AI не е ясно до каква степен това предлага защита“, обяснява той.

Kohli се надява, че водният знак първоначално ще помогне за поддържане на добре подразделеното използване на LLMS. „Водещата философия беше, че искахме да разработим инструмент, който може да бъде подобрен от общността“, добавя той.

  1. datthri, S. et al. Nature 634, 818–823 (2024).

  2. Изтеглете справки