O Google apresenta marcas d'água invisíveis para textos gerados pela IA

O Google Deepmind desenvolveu uma marca d'água invisível para textos gerados por IA para combater informações falsas.
(Symbolbild/natur.wiki)

O Google apresenta marcas d'água invisíveis para textos gerados pela IA

Pesquisadores do Google DeepMind em Londres desenvolveram uma "marca d'água" para identificar o texto gerado pela inteligência artificial (AI)-isso já foi usado em milhões de usuários de chatbot.

A marca d'água que foi publicada em 23 de outubro na revista Nature 1 Não é o primeiro a ser criado para a IA gerada. Aaronson, cientista da computação da Universidade do Texas em Austin, que trabalhou em marcas d'água no Openai até agosto, os criadores de Chatt, com sede em São Francisco, Califórnia

A detecção de textos gerados por IA está se tornando cada vez mais importante porque você tem uma solução em potencial para os problemas de notícias falsas e fraude acadêmica . Além disso, poderia ajudar a .

Em um extenso estudo, os usuários do Google Gemini Language Model (LLM) avaliaram em 20 milhões de respostas textos marcados com marcas d'água como equivalentes a textos não marcados. "Estou entusiasmado em ver que o Google está dando esse passo para a comunidade de tecnologia", diz Furong Huang, cientista da computação da Universidade de Maryland em College Park. "É provável que a maioria das ferramentas comerciais contenha marcas d'água em um futuro próximo", acrescentou Zakhar Shumaylov, cientista da computação da Universidade de Cambridge, Reino Unido.

Escolha de palavras

É mais difícil aplicar uma marca d'água ao texto do que às imagens, pois a escolha das palavras é essencialmente a única variável que pode ser alterada. As mudanças de texto sintid chamadas de marca d'água do DeepMind, que as palavras que o modelo escolhe, de maneira secreta, mas formulada, que pode ser registrada com uma chave criptográfica. Comparado a outras abordagens, a marca d'água do DeepMind é um pouco mais fácil de reconhecer e o aplicativo não atrasa a posição do texto. "Parece que ele excede os conceitos de concorrentes na LLMS Watermarks", diz Shumaylov, ex -funcionário e irmão de um dos autores do estudo.

A ferramenta também foi divulgada para que os desenvolvedores possam aplicar sua própria marca d'água aos seus modelos. "Esperamos que outros desenvolvedores de modelos de IA os levem e os integrem em seus próprios sistemas", diz Pushmeet Kohli, cientista da computação da DeepMind. O Google mantém seu principal segredo para que os usuários não possam usar ferramentas de detecção para identificar o texto com marca d'água do modelo Gemini.

governos . No entanto, existem muitos problemas, incluindo a obrigação dos desenvolvedores de usar marcas d'água e a coordenação de suas abordagens. No início deste ano, os pesquisadores da Tecnologia Federal Zurique mostraram que , um processo que é referido como "lavagem" ou "falsificação", no qual as marcas d'água são aplicadas aos textos para dar a impressão errada de que são gerados por Ki.

TOMENTO TOKEN

A abordagem DeepMinds é baseada em uma Métodos existentes do texto que é separado do próprio LLM

Um LLM é uma rede de associações que são construídas treinando com bilhões de palavras ou peças conhecidas como tokens. Quando um texto é inserido, o modelo mostra todos os tokens em seu vocabulário uma probabilidade de ser a próxima palavra na frase. A tarefa do algoritmo de amostragem é selecionar quais tokens devem ser usados ​​de acordo com várias regras.

O algoritmo de amostragem de texto Synthid usa uma chave criptográfica para atribuir valores aleatórios a todos os token possíveis. Os ingressos para candidatos são proporcionais à sua probabilidade de distribuição e classificados em um "torneio". Lá, o algoritmo compara os valores em uma série de um dos dois, um contra-one-k.o.

Esse método sofisticado facilita a detecção da marca d'água, uma vez que o mesmo código criptográfico é aplicado ao texto gerado para pesquisar os altos valores que indicam tokens "vencedores". Isso também pode dificultar a distância.

As várias rodadas no torneio podem ser vistas como uma combinação de trava, na qual cada rodada representa um número diferente que precisa ser resolvido para desbloquear ou remover a marca d'água, diz Huang. "Esse mecanismo torna consideravelmente mais difícil esfregar, espalhar ou desenvolver a marca d'água", acrescenta ela. Para textos com cerca de 200 tokens, os autores mostraram que ainda poderiam reconhecer a marca d'água, mesmo que um segundo LLM fosse usado para reescrever o texto. Com textos mais curtos, a marca d'água é menos robusta.

The researchers have not examined how well the watermark is resistant to deliberate attempts to remove. A resistência das marcas d'água contra esses ataques é uma "questão política maciça", diz Yves-Alexandre de Montjoye, cientista da computação do Imperial College London. "No contexto da segurança da IA, não está claro até que ponto isso oferece proteção", explica ele.

Kohli espera que a marca d'água inicialmente ajude a apoiar o uso bem -intencionado do LLMS. "A filosofia orientadora era que queríamos desenvolver uma ferramenta que possa ser melhorada pela comunidade", acrescenta.

    >
  1. >>

    Datthri, S. et al. Nature 634, 818-823 (2024).

    Download Referências