Google DeepMind 开源 SynthID 用于 AI 内容水印

AIGC • 2024年10月24日上午11:34 • 技术文章

人工智能生成的内容发展迅速，既带来了机遇，也带来了挑战。随着生成式人工智能工具成为主流，人类和人工智能生成的文本的混合引发了人们对真实性、作者身份和错误信息的担忧。区分人类创作的内容和人工智能生成的内容是一项关键挑战，尤其是在人工智能变得更加自然的情况下，需要有效的解决方案来确保透明度。

SynthID：为负责任的 AI 开发而开源

Google 已将用于 AI 文本水印的 SynthID 开源，进一步履行了其对负责任的 AI 开发的承诺。通过免费提供 SynthID，Google 旨在让高级水印工具的访问更加民主化，这些工具可以在不改变 AI 生成内容可见特征的情况下识别 AI 生成内容。此举是增强 AI 生成内容的安全性、透明度和可追溯性的重要一步，有助于增强人们对不断扩展的 AI 生态系统的信任。

SynthID 的技术概述和优势

SynthID 使用先进的深度学习模型将不可察觉的水印直接集成到 AI 生成的文本中。与传统水印（容易看到或可以从文档中剥离）不同，SynthID 的水印是无缝嵌入的，并且具有很强的抗篡改能力。通过嵌入适用于 AI 文本格式的元数据类信号，SynthID 可以确定给定的文本是否由 AI 生成。如果不严重损害内容的语言完整性，这种水印很难被去除，这使其成为一种强大的内容验证工具。SynthID 的弹性，加上它在嘈杂环境中工作的能力（文本可能经过人工编辑），使其特别强大。

SynthID-Text 研究的见解

Google DeepMind 开源 SynthID 用于 AI 内容水印 — **图 1：LLM 文本生成和生成水印的概述**

《自然》杂志最近发表的一篇研究论文进一步深入介绍了 SynthID-Text 的开发和测试。SynthID-Text 是一种可用于生产的水印方案，可在保持文本质量的同时确保高检测准确率和最小延迟。值得注意的是，SynthID-Text 与推测采样相结合，推测采样是一种用于提高生产系统效率的技术，可在不影响文本生成速度的情况下实现可扩展的水印。对多个大型语言模型 (LLM) 的评估表明，与现有方法相比，SynthID-Text 具有更好的可检测性，而与人工审阅者的并排比较表明文本质量没有损失。在一项涉及近 2000 万个 Gemini 响应的大规模实验中，SynthID-Text 保留了文本质量，证明了其在实际应用中的可行性。

SynthID 的重要性

在人工智能生成内容迅速激增的世界中，SynthID 的重要性怎么强调都不为过。SynthID 不仅可用作验证工具，还可提供问责制，这对于打击虚假信息至关重要，尤其是在人工智能生成的内容与人类创作的作品越来越难以区分的情况下。

结果令人鼓舞：在测试期间，SynthID 识别带水印文本的准确率超过 95%。此外，SynthID-Text 中集成了一种名为“锦标赛采样”的新型采样算法，通过嵌入难以删除的统计签名，增强了检测性能。通过开源 SynthID，Google 还邀请开发者社区为提高人工智能生成文本的透明度做出贡献，促进更负责任的人工智能格局。

结论

Google 决定开源用于 AI 文本水印的 SynthID，这代表着朝着负责任的 AI 开发迈出了重要一步。SynthID 不仅可以有效识别 AI 生成的内容，还可以在不断发展的数字环境中推动透明的新时代。通过提供强大的水印技术并将其开放给社区，Google 为道德 AI 开发设定了高标准。随着 AI 生成的内容不断扩展，像 SynthID 这样的工具对于维护信息完整性和确保 AI 技术负责任地发展至关重要。

论文地址：https://www.nature.com/articles/s41586-024-08025-4

本文来自作者投稿，版权归原作者所有。如需转载，请注明出处：https://www.nxrte.com/jishu/53286.html