人工智慧的水印SynthID是什麼?

最後更新: 29/08/2025

  • SynthID 將難以察覺的浮水印嵌入文字、圖像、音訊和影片中,以識別 AI 生成的內容。
  • 在文本中,它充當具有鍵和 n-gram 的邏輯處理器,並具有可通過閾值配置的貝葉斯檢測。
  • 此實作在 Transformers 4.46.0+ 中可用,並在 GitHub 上提供官方空間和參考。
  • 它有局限性(短文本、翻譯、重寫),但增強了透明度和可追溯性。
SynthID 浮水印

生成式人工智慧的出現,推動了圖像、文字、音訊和視訊的大規模生產,隨之而來的是,人們對這些內容的來源的質疑也日益加深。在此背景下, 確定內容是否由模型建立或更改 成為數位信任的關鍵。 合成ID 可能是個很好的解決方案。

這是 Google DeepMind 的提議, “隱形”浮水印技術系列 它們直接嵌入到人工智慧生成的內容中,以便於後續驗證,而不會降低人類感知的品質。

SynthID 是什麼?它有什麼用途?

Google 將 SynthID 描述為 人工智慧生成內容的特定浮水印旨在提高透明度和可追溯性。它不局限於單一格式:涵蓋圖像、音頻、文字和視頻,因此單一技術方法可以應用於不同類型的媒體。

在 Google 生態系統中,它已經以多種方式應用:

  • 在文本中,此標誌適用於 Gemini 回應。
  • 在音訊中,與 Lyria 模型一起使用,並具有從 Notebook LM 中的文字建立播客等功能。
  • En 視頻,被整合到 Veo creations 中,該模型能夠產生 1080p 的剪輯。

在所有情況下 水印 它是不可察覺的,並且被設計成 承受頻繁的修改 例如壓縮、音訊節奏變化或視訊剪切,而不會降低品質。

除了技術之外,其實際目標也很明確: 幫助區分合成材料和非人工智慧生產的材料,以便使用者、媒體和機構能夠對內容的消費和分發做出明智的決定。

合成ID

文字浮水印(SynthID Text)的工作原理

在實踐中,SynthID Text 充當 邏輯處理器 它位於常用採樣過濾器(Top-K 和 Top-P)之後,連接到語言模型產生管線。該處理器巧妙地修改了模型得分,並 偽隨機函數g,以機率模式對資訊進行編碼,而不會在文字的風格或品質中引入可見的偽影。

獨家內容 - 點擊這裡  如何突出顯示 Google 表格中的單字

結果是,乍一看,文字保留了 品質、精準度和流暢度,但它包含一個可被訓練有素的驗證者檢測到的統計結構。

要產生帶有浮水印的文本,不需要 重新訓練模型:只需為方法提供配置 .generate() 並啟動 SynthID Text 的邏輯處理器。這簡化了採用過程,並允許使用已部署的模型進行測試。

水印設定包括兩個必不可少的參數: keys y ngram_len. 鑰匙 是一個唯一的隨機整數列表,用於使用 g 函數對詞彙表進行評分;該列表的長度控制應用多少個「層」的水印。同時, ngram_len 設定可偵測性和對變換的穩健性之間的平衡:較高的值使檢測更容易,但使密封更容易受到變化的影響;5 的值作為起點效果很好。

此外,SynthID Text 使用 抽樣表 具有兩個屬性: sampling_table_size y sampling_table_seed建議大小至少為 2^16,以確保函數 g 在取樣時表現穩定且無偏差,同時考慮到 尺寸越大意味著內存越多 在推理過程中。種子可以是任意整數,這有助於在評估環境中實現可重複性。

改善訊號有一個重要的細微差別: 重複的 n-gram 在最近的歷史背景下(定義為 context_history_size) 未被標記,這有利於在其餘文本中檢測標記,並減少與語言自然重複相關的誤報。

為了安全起見,每個浮水印配置(包括其金鑰、種子和參數) 必須私密存儲如果這些金鑰被洩露,第三方可以輕鬆複製該品牌,或者更糟的是,試圖在完全了解其結構的情況下操縱它。

獨家內容 - 點擊這裡  如何在 Google 文件中編寫數組

如何檢測:使用閾值的機率驗證

文本中水印的驗證不是二進制的,而是 機率Google 在 Transformers 和 GitHub 上發布了一個貝葉斯檢測器,在分析文本的統計模式後,返回三種可能的狀態: 有品牌, 沒有品牌 o 不確定此三元輸出允許根據不同的風險和容錯環境調整操作。

驗證器的行為可以透過以下方式配置 兩個門檻 控制誤報率和漏報率。換句話說,你可以根據你的用例來校準檢測的嚴格程度,犧牲靈敏度來提高準確性,反之亦然,這在 編輯環境,審核 或內部稽核。

如果多個模型共享相同的 標記器,還可以分享 相同品牌配置和相同探測器只要驗證者的訓練集包含所有這些範例,就可以。這使得在擁有多個 LLM 的組織中建立「通用浮水印」變得更加容易。

一旦檢測器經過訓練,組織就可以決定其暴露程度:保持 完全私人的以某種方式提供 半私人 透過 API,或以某種方式發布 公開的 供第三方下載使用。具體選擇取決於各實體的基礎設施營運能力、監管風險和透明度策略。

SynthID AI浮水印技術

影像、音訊和視訊上的浮水印

這個品牌旨在持久 常見的變換 例如裁剪、調整大小、旋轉、更改顏色,甚至截圖,而無需保留元資料。最初,它的使用是透過 Vertex AI 中的影像,用戶可以選擇在生成內容時啟動水印。

在音頻方面,該品牌 聽不見 並支援 MP3 壓縮、新增雜訊、修改播放速度等常見操作。 Google 將其整合到 利里亞 並且在基於 Notebook LM 的功能中,即使檔案通過有損發布流,也可以增強訊號。

在影片中,該方法複製了圖像方法:品牌嵌入在 每個畫面的像素,且不受濾鏡、刷新率、壓縮或 recortes. 影片由 我見 VideoFX 等工具在創作過程中會加入此標記,進而降低後續編輯中意外刪除的風險。

獨家內容 - 點擊這裡  如何從 Google Business 網站刪除照片

文本印章的採樣演算法和穩健性

SynthID Text 的核心是 採樣演算法它使用一個鍵(或一組鍵)為每個潛在標記分配偽隨機分數。候選標記從模型分佈中抽取(在 Top-K/Top-P 之後),並在淘汰賽後進行“競爭”,直到根據函數 g 選出得分最高的標記。

這種選擇程序有利於 最終統計模式 機率帶有品牌的標記,但不會強迫非自然的選擇。根據已發表的研究,該技術使得 刪除、竄改或撤銷 封印,總是在合理的範圍內對抗有時間和動力的對手。

良好的實施與安全實踐

  • 如果您正在部署 SynthID Text,請將設定視為 生產秘密:將金鑰和種子儲存在安全的管理器中,強制執行存取控制,並允許定期輪調。防止洩漏可以減少遭受逆向工程攻擊的風險。
  • 設計計劃 監控 對於你的偵測器:記錄誤報率/誤報率,根據上下文調整閾值並決定你的偵測策略 曝光 (私有、透過 API 半私有或公開),並具有明確的法律和操作標準。如果多個模型共用一個標記器,請考慮訓練一個 普通探測器 並提供所有這些的範例以簡化維護。
  • 在績效層面,它評估 sampling_table_size 在記憶體和延遲方面,選擇一個 ngram_len 這可以平衡你對編輯的容忍度和對可靠檢測的需求。記得要排除重複的 n-gram(透過 context_history_size)來改善流動文本中的訊號。

SynthID 並不是對抗假訊息的靈丹妙藥,但是 為重建生成人工智慧時代的信任鏈提供了基本建構模組。 透過在文字、圖像、音訊和視訊中嵌入出處訊號,並向社群開放文字部分,Google DeepMind 正在推動未來以實用、可衡量的方式審核真實性,最重要的是,以與內容的創造力和品質相容的方式審核真實性。