Google esitleb AI genereeritud tekstide nähtamatuid vesimärke

Google DeepMind on välja töötanud AI genereeritud tekstide nähtamatu vesimärgi vale teabe vastu võitlemiseks.
(Symbolbild/natur.wiki)

Google esitleb AI genereeritud tekstide nähtamatuid vesimärke

Londonis asuva Google DeepMindi teadlased on välja töötanud „vesimärgi”, et tuvastada tehisintellekti (AI) genereeritud teksti tuvastamiseks-seda on juba kasutatud miljonites vestlusprogrammides.

Ajakirjas Nature 1 ei ole esimene, mis on loodud AI-le, on see, et see on kõige olulisem, mis on minu arvates", mis on minu arvates ", mis on minu arvates", mis on minu arvates ", mis on minu arvates", mis on minu arvates ", mis on minu arvates loodud", mis on kõige olulisemad ", mis minu arvates on esimene, mis minu arvates loob," on see "minu jaoks, on esimene, mis minu arvates on loodud". Scott Aaronson, Austini Texase ülikooli arvutiteadlane, kes töötas OpenAi vesimärkide kallal kuni augustini, Californias San Franciscos asuvad Chatt'i loojad.

AI genereeritud tekstide tuvastamine on muutumas üha olulisemaks, kuna teil on potentsiaalne lahendus probleemide jaoks võlts uudised ja akadeemiline pettus . Lisaks võiks see aidata Sõnade valik

Vesimärgi teksti kui piltide suhtes on keerulisem rakendada, kuna sõnade valik on sisuliselt ainus muutuja, mida saab muuta. DeepMindi vesimärgi nimega sünteesilised tekst muudavad, mis sõnad mudeli valib salajasel, kuid valemi viisil, mida saab krüptograafilise võtmega salvestada. Võrreldes teiste lähenemisviisidega on DeepMindi vesimärki pisut lihtsam ära tunda ja rakendus ei lükka teksti asukohta edasi. "Näib, et see ületab LLM -i vesimärkide konkurentide mõisteid," ütleb Shumaylov, kes on uuringu ühe autori endine töötaja ja vend.

Samuti avalikustati tööriist, et arendajad saaksid oma mudelitele oma vesimärgi rakendada. "Loodame, et teised AI -mudelite arendajad võtavad selle ja integreerivad need oma süsteemidesse," ütleb DeepMindi arvutiteadlane PushMeet Kohli. Google hoiab oma võtme saladuse, nii et kasutajad ei saaks tuvastusvahendeid kasutada Kaksikute mudeli vesimärgistatud teksti tuvastamiseks.

valitsused . Sellegipoolest on palju probleeme, sealhulgas arendajate kohustus kasutada vesimärke ja nende lähenemisviiside koordineerimist. Selle aasta alguses näitasid föderaalse tehnoloogia Zürichi teadlased, et , protsess, mida nimetatakse "nühkimiseks" või "peksmiseks", kus tekstidele rakendatakse vesimärke, et jätta vale mulje, et need on Ki-genereeritud.

token-turniir

DeepMinds lähenemisviis põhineb a LLM on assotsiatsioonide võrk, mis on üles ehitatud, koolitades miljardite sõnade või osidega, mida tuntakse märgidena. Teksti sisestamisel näitab mudel oma sõnavaras kõiki märgisid, mis on tõenäosus olla lauses järgmine sõna. Proovide võtmise algoritmi ülesanne on valida, milliseid märke tuleks kasutada vastavalt paljudele reeglitele.

Sünteesi tekstiproovide algoritm kasutab krüptograafilist võtit juhuslike väärtuste määramiseks igale võimalikule märgile. Kandidaadipiletid on proportsionaalsed nende levitamise tõenäosusega ja klassifitseeritakse "turniiril". Seal võrdleb algoritm väärtusi ühes kokkupuude-ühe-k.o-ringi seeriates, kusjuures kõrgeim väärtus on suurem, kuni teksti jaoks on valitud ainult üks märk.

See keerukas meetod hõlbustab vesimärgi tuvastamist, kuna genereeritud teksti jaoks rakendatakse sama krüptograafilist koodi, et otsida kõrgeid väärtusi, mis näitavad "võidu" märke. See võib ka distantsi raskemaks muuta.

Turniiri mitut vooru võib vaadelda kui lukukombinatsiooni, kus iga voor tähistab teistsugust arvu, mis tuleb vesimärgi avamiseks või eemaldamiseks lahendada, ütles Huang. "See mehhanism muudab tunduvalt keerukamaks nüristamise, SPOL -i või vesimärgi arendamise," lisab ta. Ligikaudu 200 märgisega tekstide puhul näitasid autorid, et nad oskasid siiski vesimärgi ära tunda, isegi kui teksti ümberkirjutamiseks kasutati teist LLM -i. Lühemate tekstidega on vesimärk vähem vastupidav.

Teadlased ei ole uurinud, kui hästi on vesimärk vastupidav tahtlikele eemaldamiskatsetele. Vesimärkide vastupanu selliste rünnakute vastu on "massiline poliitiline küsimus", ütles Londoni Imperial College'i arvutiteadlane Yves-Alexandre de Montjoye. "AI turvalisuse kontekstis pole ebaselge, mil määral see kaitset pakub," selgitab ta.

Kohli loodab, et vesimärk aitab algselt toetada LLM -ide hästi tahtlikku kasutamist. "Juhtfilosoofia oli see, et tahtsime välja töötada tööriista, mida kogukond saab parandada," lisab ta.

  1. datThri, S. et al. Loodus 634, 818–823 (2024).

  2. Laadige alla viited