Google predstavuje neviditeľné vodoznaky pre texty generované AI

Google predstavuje neviditeľné vodoznaky pre texty generované AI
Vedci spoločnosti Google DeepMind v Londýne vyvinuli „vodoznak“ na identifikáciu textu, ktorý generuje umelá inteligencia (AI)-to sa už používa u miliónov používateľov chatbotov.
vodoznak, ktorý bol uverejnený 23. októbra v časopise Nature 1 nie je vytvorený pre AI, ktorý je uvedený v AI, je však prvým, čo je prvým, je to prvé, aby demonštrovali vo veľkom, reálnom kontexte." Aaronson, počítačový vedec na University of Texas v Austine, ktorý pracoval na vodoznakoch v OpenAi, tvorcovia Chatta so sídlom v San Franciscu v Kalifornii.
Detekcia AI generovaných textov sa stáva čoraz dôležitejším, pretože máte potenciálne riešenie problémov Falošné správy a Akademický podvod . Okrem toho by to mohlo pomôcť Bleiben Sie informiert: Jeden Abend senden wir Ihnen die Artikel des Tages aus der Kategorie Allgemein – übersichtlich als Liste. Vlády . Existuje však veľa problémov, vrátane povinnosti vývojárov používať vodoznaky a koordináciu ich prístupov. Začiatkom tohto roka vedci z federálnej technológie Zürich ukázali, že , proces, ktorý sa označuje ako „čistenie“ alebo „spoofing“, v ktorom sa vodoznaky aplikujú na texty, aby vyvolali nesprávny dojem, že sú generované. Algoritmus odberu vzoriek syntetického textu používa kryptografický kľúč na priradenie náhodných hodnôt všetkým možným tokenom. Vstupenky kandidátov sú úmerné ich pravdepodobnosti distribúcie a klasifikované v „turnaji“. Tam algoritmus porovnáva hodnoty v sérii One Against-One-K.O., čím sa získa najvyššia hodnota, kým nezostane iba jeden token, ktorý sa pre text vybral. Táto sofistikovaná metóda uľahčuje detekciu vodoznaku, pretože na generovaný text sa používa rovnaký kryptografický kód na vyhľadávanie vysokých hodnôt, ktoré označujú „výhry“ tokeny. To by tiež mohlo sťažiť vzdialenosť. Niekoľko kôl v turnaji možno považovať za kombináciu zámku, v ktorom každé kolo predstavuje iné číslo, ktoré je potrebné vyriešiť na odomknutie alebo odstránenie vodoznak, hovorí Huang. „Tento mechanizmus sťažuje čistenie, vylúčenie alebo rozvoj vodoznaku,“ dodáva. V prípade textov s približne 200 žetónmi autori ukázali, že môžu stále rozpoznať vodoznak, aj keď na prepísanie textu sa použil druhý LLM. Pri kratších textoch je vodoznak menej robustný. Vedci neskúmali, ako dobre je vodoznak odolný voči úmyselným pokusom o odstránenie. Odolnosť vodoznakov proti týmto útokom je „masívna politická otázka“, hovorí Yves-Alexandre de Montjoye, počítačový vedec spoločnosti Imperial College London. „V kontexte bezpečnosti AI nie je jasné, do akej miery to ponúka ochranu,“ vysvetľuje. Kohli dúfa, že vodoznak spočiatku pomôže podporovať dobre zamerané používanie LLM. „Hlavnou filozofiou bolo, že sme chceli vyvinúť nástroj, ktorý môže komunita vylepšiť,“ dodáva. Datthri, S. a kol. Nature 634, 818 - 823 (2024). token-turnaj