人工智能的水印SynthID是什么?

最后更新: 29/08/2025

  • SynthID 将难以察觉的水印嵌入文本、图像、音频和视频中,以识别 AI 生成的内容。
  • 在文本中,它充当具有键和 n-gram 的逻辑处理器,并具有可通过阈值配置的贝叶斯检测。
  • 该实现在 Transformers 4.46.0+ 中可用,并在 GitHub 上提供官方空间和参考。
  • 它有局限性(短文本、翻译、重写),但增强了透明度和可追溯性。
SynthID 水印

生成式人工智能的出现,推动了图像、文本、音频和视频的大规模生产,随之而来的是,人们对这些内容的来源的质疑也日益加深。在此背景下, 确定内容是否由模型创建或更改 成为数字信任的关键。 合成ID 可能是一个很好的解决方案。

这是 Google DeepMind 的提议, “隐形”水印技术系列 它们直接嵌入到人工智能生成的内容中,以便于后续验证,而不会降低人类感知的质量。

SynthID 是什么?它有什么用途?

Google 将 SynthID 描述为 人工智能生成内容的特定水印旨在提高透明度和可追溯性。它不局限于单一格式:涵盖图像、音频、文本和视频,因此单一技术方法可以应用于不同类型的媒体。

在 Google 生态系统中,它已经以多种方式得到应用:

  • 在文本中,该标志适用于 Gemini 响应。
  • 在音频中,与 Lyria 模型一起使用,并具有从 Notebook LM 中的文本创建播客等功能。
  • En 视频,被集成到 Veo creations 中,该模型能够生成 1080p 的剪辑。

在所有情况下 水印 它是不可察觉的,并且被设计成 承受频繁的修改 例如压缩、音频节奏变化或视频剪切,而不会降低质量。

除了技术之外,其实际目标也很明确: 帮助区分合成材料和非人工智能生产的材料,以便用户、媒体和机构能够对内容的消费和分发做出明智的决定。

合成ID

文本水印(SynthID Text)的工作原理

在实践中,SynthID Text 充当 逻辑处理器 它位于常用采样过滤器(Top-K 和 Top-P)之后,连接到语言模型生成流水线。该处理器巧妙地修改了模型得分,并 伪随机函数g,以概率模式对信息进行编码,而不会在文本的风格或质量中引入可见的伪影。

独家内容 - 点击这里  如何按分辨率过滤Google图像

结果是,乍一看,文本保留了 品质、精准度和流畅度,但它包含一个可被训练有素的验证者检测到的统计结构。

要生成带水印的文本,不需要 重新训练模型:只需为方法提供配置 .generate() 并激活 SynthID Text 的逻辑处理器。这简化了采用过程,并允许使用已部署的模型进行测试。

水印设置包括两个必不可少的参数: keys y ngram_len. 钥匙 是一个唯一的随机整数列表,用于使用 g 函数对词汇表进行评分;该列表的长度控制应用多少个“层”的水印。同时, ngram_len 设置可检测性和对变换的鲁棒性之间的平衡:较高的值使检测更容易,但使密封更容易受到变化的影响;5 的值作为起点效果很好。

此外,SynthID Text 使用 抽样表 具有两个属性: sampling_table_size y sampling_table_seed建议大小至少为 2^16,以确保函数 g 在采样时表现稳定且无偏差,同时考虑到 尺寸越大意味着内存越多 在推理过程中。种子可以是任意整数,这有助于在评估环境中实现可重复性。

改善信号有一个重要的细微差别: 重复的 n-gram 在最近的历史背景下(定义为 context_history_size) 未被标记,这有利于在其余文本中检测标记,并减少与语言自然重复相关的误报。

为了安全起见,每个水印配置(包括其密钥、种子和参数) 必须私密存储如果这些密钥被泄露,第三方可以轻松复制该品牌,或者更糟的是,试图在完全了解其结构的情况下操纵它。

独家内容 - 点击这里  Gemma 3n:谷歌的新项目将先进的人工智能带入任何设备

如何检测:使用阈值的概率验证

文本中水印的验证不是二进制的,而是 概率Google 在 Transformers 和 GitHub 上发布了一个贝叶斯检测器,在分析文本的统计模式后,返回三种可能的状态: 有品牌, 没有品牌 o 不确定此三元输出允许根据不同的风险和容错环境调整操作。

验证器的行为可以通过以下方式配置 两个门槛 控制误报率和漏报率。换句话说,你可以根据你的用例来校准检测的严格程度,牺牲灵敏度来提高准确性,反之亦然,这在 编辑环境,审核 或内部审计。

如果多个模型共享相同的 标记器,还可以分享 相同品牌配置和相同探测器只要验证者的训练集包含所有这些示例,就可以。这使得在拥有多个 LLM 的组织中构建“通用水印”变得更加容易。

一旦检测器经过训练,组织就可以决定其暴露级别:保持 完全私人的以某种方式提供 半私人 通过 API,或者以某种方式发布 公众 供第三方下载和使用。具体选择取决于各实体的基础设施运营能力、监管风险和透明度策略。

SynthID AI水印技术

图像、音频和视频上的水印

这个品牌旨在持久 常见的变换 例如裁剪、调整大小、旋转、更改颜色,甚至截图,而无需保留元数据。最初,它的使用是通过 Vertex AI 中的图像,用户可以选择在生成内容时激活水印。

在音频方面,该品牌 听不见 并支持 MP3 压缩、添加噪音、修改播放速度等常见操作。Google 将其集成到 里里亚 并且在基于 Notebook LM 的功能中,即使文件通过有损发布流,也可以增强信号。

在视频中,该方法复制了图像方法:品牌嵌入 每帧的像素,并且不受滤镜、刷新率、压缩或 修剪. 视频由 我见 VideoFX 等工具在创作过程中会加入此标记,从而降低后续编辑中意外删除的风险。

独家内容 - 点击这里  如何在 Google 中添加快捷方式

文本印章的采样算法和鲁棒性

SynthID Text 的核心是 采样算法它使用一个键(或一组键)为每个潜在标记分配伪随机分数。候选标记从模型分布中抽取(在 Top-K/Top-P 之后),并在淘汰赛后进行“竞争”,直到根据函数 g 选出得分最高的标记。

这种选择程序有利于 最终统计模式 概率带有品牌的标记,但不会强制非自然的选择。根据已发表的研究,该技术使得 删除、篡改或撤销 封印,总是在合理的范围内对抗有时间和动力的对手。

良好的实施和安全实践

  • 如果您正在部署 SynthID Text,请将配置视为 生产秘密:将密钥和种子存储在安全的管理器中,强制执行访问控制,并允许定期轮换。防止泄漏可以减少遭受逆向工程攻击的风险。
  • 设计一个计划 监控 对于你的检测器:记录误报率/误报率,根据上下文调整阈值并决定你的检测策略 曝光 (私有、通过 API 半私有或公开),并具有明确的法律和操作标准。如果多个模型共享一个标记器,请考虑训练一个 普通探测器 并提供所有这些的示例以简化维护。
  • 在绩效层面,它评估 sampling_table_size 在内存和延迟方面,选择一个 ngram_len 这可以平衡你对编辑的容忍度和对可靠检测的需求。记住要排除重复的 n-gram(通过 context_history_size)来改善流动文本中的信号。

SynthID 并不是对抗虚假信息的灵丹妙药,但是 为重建生成人工智能时代的信任链提供了基本构建模块。 通过在文本、图像、音频和视频中嵌入出处信号,并向社区开放文本部分,Google DeepMind 正在推动未来以实用、可衡量的方式审核真实性,最重要的是,以与内容的创造力和质量兼容的方式审核真实性。