Google przedstawia niewidzialne znaki wodne dla tekstów generowanych przez AI

Google Deepmind opracował niewidzialny znak wodny dla tekstów generowanych przez AI w celu zwalczania fałszywych informacji.
(Symbolbild/natur.wiki)

Google przedstawia niewidzialne znaki wodne dla tekstów generowanych przez AI

Naukowcy z Google Deepmind w Londynie opracowali „znak wodny” w celu zidentyfikowania tekstu generowanego przez sztuczną inteligencję (AI)-to było już używane w milionach użytkowników chatbota.

Znak wodny, który został opublikowany 23 października w czasopiśmie Nature 1 Nie jest pierwszą, która nie została utworzona dla AI, jednak jest to pierwsza, aby pokazać w dużym, prawdziwym kontekstie.” W mojej opinii najważniejsza jest to, że są one one faktycznie utworzone SCOTT. Aaronson, informatyk z University of Texas w Austin, który pracował nad znakami wodnymi w Openai do sierpnia, twórcy Chatt z siedzibą w San Francisco w Kalifornii

Wykrywanie tekstów generowanych przez AI staje się coraz ważniejsze, ponieważ masz potencjalne rozwiązanie problemów Fake News i Oszustwa akademickie . Ponadto może pomóc w chronić modele na przyszłość z programem serwisowym z nieruchomościami z nieruchomą z pociągiem z nieruchomościami z nieruchomą pociągiem z treningiem z Trenined with Trenined. Treść generowana przez AI .

W szerokim badaniu użytkownicy Google Gemini Large Language Model (LLM) ocenili w 20 milionach odpowiadających tekstom na wodach jako równoważne z nieoznakowanymi tekstami. „Jestem entuzjastycznie, widząc, że Google robi ten krok dla społeczności technologicznej” - mówi Furong Huang, informatyk z University of Maryland w College Park. „Jest prawdopodobne, że większość narzędzi komercyjnych będzie zawierać znaki wodne w najbliższej przyszłości” - dodał Zakhar Shumaylov, informatyk z University of Cambridge w Wielkiej Brytanii.

Wybór słów

Trudniej jest zastosować znak wodny do tekstu niż do obrazów, ponieważ wybór słów jest zasadniczo jedyną zmienną, którą można zmienić. Znak wodny Deepmind, syntezowy syntezator, które słowa wybierają, w sekretny, ale formalny sposób, który można zarejestrować za pomocą klucza kryptograficznego. W porównaniu z innymi podejściami, znak wodny DeepMind jest nieco łatwiejszy do rozpoznania, a aplikacja nie opóźnia pozycji tekstu. „Wygląda na to, że przekracza koncepcje konkurentów w LLMS Water Marks” - mówi Shumaylov, który jest byłym pracownikiem i bratem jednego z autorów badania.

Narzędzie zostało również ujawnione, aby programiści mogli zastosować własny znak wodny do swoich modeli. „Mamy nadzieję, że inni programiści modeli AI przyjmą to i zintegrują je z własnymi systemami”, mówi Pushmeet Kohli, informatyk w Deepmind. Google zachowuje kluczowy w tajemnicy, aby użytkownicy nie mogli używać narzędzi wykrywania do identyfikacji tekstu w modelu Gemini.

rządy LLM to sieć skojarzeń, które są budowane przez szkolenie z miliardami słów lub części zwanych tokenami. Po wprowadzeniu tekstu model pokazuje każdy token w jego słownictwie prawdopodobieństwo bycia następnym słowem w zdaniu. Zadaniem algorytmu próbkowania jest wybór, które tokeny należy używać zgodnie z wieloma regułami.

Algorytm próbkowania tekstu syntezatora używa klucza kryptograficznego do przypisania losowych wartości do każdego możliwego tokena. Bilety kandydatów są proporcjonalne do prawdopodobieństwa dystrybucji i sklasyfikowane w „turnieju”. Tam algorytm porównuje wartości w serii rund o jeden-listy-jeden-k.o., w których najwyższa wartość zysków, dopóki nie zostanie wybrany tylko jeden token dla tekstu.

Ta wyrafinowana metoda ułatwia wykrywanie znaku wodnego, ponieważ ten sam kod kryptograficzny jest stosowany do wygenerowanego tekstu w celu wyszukiwania wysokich wartości wskazujących „zwycięskie” tokeny. Może to również utrudnić odległość.

Kilka rund w turnieju można postrzegać jako kombinację zamka, w której każda runda reprezentuje inną liczbę, którą należy rozwiązać, aby odblokować lub usunąć znak wodny, mówi Huang. „Ten mechanizm utrudnia szorowanie, spol lub rozwój znaku wodnego” - dodaje. W przypadku tekstów z około 200 tokenami autorzy wykazali, że nadal mogą rozpoznać znak wodny, nawet jeśli do przepisania tekstu użyto drugiego LLM. Przy krótszych tekstach znak wodny jest mniej solidny.

The researchers have not examined how well the watermark is resistant to deliberate attempts to remove. Odporność znaków wodnych przeciwko takim atakom jest „masywnym pytaniem politycznym”, mówi Yves-Alexandre de Montjoye, informatyk w Imperial College London. „W kontekście bezpieczeństwa sztucznej inteligencji nie jest jasne, w jakim stopniu oferuje to ochronę”, wyjaśnia.

Kohli ma nadzieję, że znak wodny początkowo pomoże wesprzeć studencki użycie LLM. „Filozofia przewodnika polegała na tym, że chcieliśmy opracować narzędzie, które społeczność może poprawić” - dodaje.

  1. datythri, S. i in. Nature 634, 818–823 (2024).