Google为AI生成的文本提供了无形的水印

Google DeepMind已为AI生成的文本开发了一个无形的水印,以打击虚假信息。
(Symbolbild/natur.wiki)

Google为AI生成的文本提供了无形的水印

伦敦Google Deepmind的研究人员开发了一个“水印”,以识别人工智能(AI)生成的文本 - 这已经用于数百万聊天机器人用户中。

在10月23日在日记杂志上发布的水印 1 并不是第一个为ai创建的新闻。但是,它是第一个创建的。 Aaronson是德克萨斯大学奥斯汀大学的计算机科学家,他在Openai的Watermarks工作,直到八月,总部位于加利福尼亚州旧金山的Chatt的创建者

AI生成的文本的检测变得越来越重要,因为您有潜在的解决方案解决假新闻学术欺诈。 In addition, it could help to to protect future models from devaluation by not being trained with AI生成的内容

在一项广泛的研究中,Google Gemini大语言模型(LLM)的用户在2000万个答案中评估了水印的文本,与未标记的文本相同。马里兰州大学公园大学的计算机科学家Furong Huang说:“我很高兴看到Google正在为科技界迈出这一步骤。”英国剑桥大学的计算机科学家Zakhar Shumaylov补充说:“大多数商业工具可能在不久的将来都包含水印。”

单词的选择

将水印应用于文本比图像更难,因为单词的选择本质上是可以更改的唯一变量。 DeepMind的水印合成文本变化,该文字可以以一种秘密但公式化的方式选择该模型选择,可以用加密密钥记录。与其他方法相比,DeepMind的水印稍微易于识别,并且应用不会延迟文本位置。 Shumaylov说:“看来它超出了LLMS水印上竞争对手的概念。”

该工具也被披露,以便开发人员可以将自己的水印应用于其模型。 DeepMind的计算机科学家Pushmeet Kohli说:“我们希望AI模型的其他开发人员将其集成到自己的系统中。” Google保留其关键秘密,因此用户无法使用检测工具来识别双子座模型的水印文本。

governments on a watermark as a solution for the distribution of AI generated文字。然而,存在许多问题,包括开发商使用水印及其方法协调的义务。在今年年初,苏黎世联邦技术的研究人员表明,,被称为“擦洗”或“欺骗”的过程,其中将水印应用于文本中,以给出错误的印象,即它们是Ki生成的。

令牌 - tournament

deepminds方法基于 llm是一个由数十亿个单词或称为令牌的部分培训来构建的关联网络。当输入文本时,该模型在其词汇中显示了每个令牌的概率,就是句子中的下一个单词。采样算法的任务是根据许多规则选择哪些令牌。

SynthID文本采样算法使用加密密钥将随机值分配给所有可能的令牌。候选门票与其分销的可能性成正比,并在“锦标赛”中分类。那里的算法比较了一系列单一的k.o.圈中的值,从而使最高值获得,直到只有一个为文本选择的剩下一个令牌为止。

这种复杂的方法使检测水印变得更容易,因为将相同的加密代码应用于生成的文本以搜索指示“获胜”令牌的高值。这也可能使距离更加困难。

可以将比赛中的几个回合视为锁的组合,其中每个回合代表需要解决的不同数字,以解锁或删除水印。她补充说:“这种机制使擦洗,旋转或开发水印变得更加困难。”对于大约200个代币的文本,作者表明,即使使用第二个LLM来重写文本,它们仍然可以识别水印。随着文本较短的文字,水印较不健壮。

研究人员尚未检查水印对故意去除尝试的抵抗力。伦敦帝国学院的计算机科学家Yves-Alexandre de Montjoye说,水印对此类攻击的抵抗是“大规模的政治问题”。他解释说:“在AI安全的背景下,尚不清楚这在多大程度上提供了保护。”

kohli希望水印最初能帮助支持LLM的良好使用。他补充说:“指导理念是我们想开发一种可以改善社区的工具。”

  1. datthri,S。等。自然634,818–823(2024)。