Что такое SynthID, водяной знак искусственного интеллекта?

Последнее обновление: 29/08/2025

  • SynthID встраивает незаметные водяные знаки в текст, изображения, аудио и видео для идентификации контента, созданного ИИ.
  • В тексте он действует как логит-процессор с ключами и n-граммами, с байесовским обнаружением, настраиваемым пороговыми значениями.
  • Реализация доступна в Transformers 4.46.0+, с официальным Space и ссылкой на GitHub.
  • Он имеет ограничения (короткие тексты, переводы, переписывания), но повышает прозрачность и прослеживаемость.
Водяной знак SynthID

Появление генеративного ИИ привело к росту производства изображений, текстов, аудио- и видеоматериалов в невиданных ранее масштабах, и вместе с этим возросли сомнения относительно их происхождения. В этом контексте Определить, был ли контент создан или изменен моделью становится ключом к цифровому доверию. SynthID может быть отличным решением.

Это предложение Google DeepMind, семейство «невидимых» методов создания водяных знаков которые встраиваются непосредственно в контент, создаваемый ИИ, чтобы облегчить последующую проверку без ухудшения качества, воспринимаемого людьми.

Что такое SynthID и для чего он предназначен?

Google описывает SynthID как инструмент для специальный водяной знак для контента, созданного ИИ, разработанный для обеспечения прозрачности и прослеживаемости. Он не ограничен одним форматом: он охватывает изображения, аудио, текст и видео, что позволяет применять единый технический подход к различным типам носителей.

В экосистеме Google он уже используется несколькими способами:

  • В тексте, флаг применяется к ответам Близнецов.
  • В аудио, используется с моделью Lyria и такими функциями, как создание подкастов из текста в Notebook LM.
  • En видео, интегрирован в Veo creations, модель, способную генерировать клипы в формате 1080p.

Во всех случаях водяной знак Он незаметен и был разработан для того, чтобы выдерживать частые модификации такие как компрессия, изменение ритма в аудио- или видеофрагментах без снижения качества.

Помимо технологии, практическая цель ясна: помочь отличить синтетический материал от того, что произведен без ИИ, чтобы пользователи, средства массовой информации и учреждения могли принимать обоснованные решения о потреблении и распространении контента.

synthID

Как работает текстовый водяной знак (SynthID Text)

На практике SynthID Text действует как логит-процессор который подключается к конвейеру генерации языковой модели после обычных фильтров выборки (Top-K и Top-P). Этот процессор тонко модифицирует оценки модели с помощью псевдослучайная функция g, кодируя информацию в вероятностном шаблоне без внесения видимых артефактов в стиль или качество текста.

Эксклюзивный контент – нажмите здесь  Как удалить учетную запись Google с телефона BLU

В результате получается текст, который, на первый взгляд, сохраняет качество, точность и плавность, но которая включает в себя статистическую структуру, обнаруживаемую обученным верификатором.

Для создания текста с водяным знаком не обязательно переобучить модель: просто укажите конфигурацию метода .generate() и активировать логит-процессор SynthID Text. Это упрощает внедрение и позволяет проводить тестирование с уже развёрнутыми моделями.

Настройки водяного знака включают два основных параметра: keys y ngram_len. Ключи — это список уникальных случайных целых чисел, используемых для оценки словарного запаса с помощью функции g; длина этого списка определяет количество «слоёв» водяных знаков. Между тем, ngram_len Устанавливает баланс между обнаруживаемостью и устойчивостью к преобразованиям: более высокие значения упрощают обнаружение, но делают печать более уязвимой к изменениям; значение 5 хорошо подходит в качестве отправной точки.

Кроме того, SynthID Text использует таблица выборки с двумя свойствами: sampling_table_size y sampling_table_seed. Рекомендуется размер не менее 2^16, чтобы гарантировать, что функция g будет вести себя стабильно и несмещенно при выборке, учитывая, что больший размер означает больше памяти во время вывода. Начальным числом может быть любое целое число, что облегчает воспроизводимость в условиях оценки.

Есть важный нюанс для улучшения сигнала: повторяющиеся n-граммы в недавней истории контекста (определяется context_history_size) не помечены, что способствует обнаружению пометки в остальной части текста и снижает количество ложных срабатываний, связанных с естественными повторами языка.

В целях безопасности каждая конфигурация водяного знака (включая ее ключи, начальное число и параметры) должны храниться в частном порядкеВ случае утечки этих ключей третьи лица могут легко скопировать бренд или, что еще хуже, попытаться манипулировать им, полностью зная его структуру.

Эксклюзивный контент – нажмите здесь  Google DeepMind совершает революцию в создании трехмерных миров с помощью Genie 3

Как обнаружить: вероятностная проверка с пороговыми значениями

Проверка водяного знака в тексте не является двоичной, а вероятностныйGoogle публикует на Transformers и GitHub байесовский детектор, который после анализа статистической картины текста возвращает три возможных состояния: с брендом, нет бренда o InciertoЭтот троичный выход позволяет адаптировать операцию к различным контекстам риска и допустимых ошибок.

Поведение верификатора настраивается два порога которые контролируют частоту ложноположительных и ложноотрицательных срабатываний. Другими словами, вы можете настроить необходимую строгость обнаружения, жертвуя чувствительностью ради точности или наоборот, в зависимости от вашего сценария использования. Это особенно полезно в редакционная среда, модерация или внутренний аудит.

Если несколько моделей имеют одинаковые токенизатор, также может поделиться та же конфигурация бренда и тот же детектор, при условии, что обучающий набор верификатора включает примеры всех этих типов. Это упрощает создание «общих водяных знаков» в организациях с несколькими LLM.

После того, как детектор обучен, организации могут определить уровень его воздействия: оставить его полностью приватный, предложите это таким образом получастный через API или выпустить его каким-либо образом общественность для загрузки и использования третьими лицами. Выбор зависит от пропускной способности инфраструктуры каждой организации, регуляторных рисков и стратегии прозрачности.

Технология водяных знаков SynthID AI

Водяной знак на изображениях, аудио и видео

Этот бренд создан, чтобы служить долго. общие преобразования Такие функции, как обрезка, изменение размера, поворот, изменение цвета и даже скриншоты, без необходимости сохранения метаданных. Изначально их использование предлагалось через Изображение в Vertex AI, где пользователи могут выбрать активацию водяного знака при создании контента.

В аудио бренд – это неслышный и поддерживает распространённые операции, такие как сжатие MP3, добавление шума или изменение скорости воспроизведения. Google интегрирует его в Лирия а в функциях Notebook LM — усиление сигнала даже в том случае, когда файл проходит через потоки публикации с потерями.

В видео подход повторяет подход к изображению: бренд встроен в пикселей каждого кадра, незаметно и остается устойчивым к фильтрам, изменениям частоты обновления, сжатию или отделка. Видеоролики сгенерированы Я вижу Такие инструменты, как VideoFX, добавляют эту метку в процессе создания, что снижает риск случайного удаления при последующем редактировании.

Эксклюзивный контент – нажмите здесь  Как размыть изображения в Google Slides

Алгоритмы выборки и надежность текстовой печати

Сердцем SynthID Text является его алгоритм выборки, который использует ключ (или набор ключей) для присвоения псевдослучайных баллов каждому потенциальному токену. Кандидаты выбираются из распределения модели (после Top-K/Top-P) и подвергаются «соревнованию» после раундов отбора, пока не будет выбран токен с наивысшим баллом в соответствии с функцией g.

Эта процедура отбора благоприятствует окончательная статистическая модель Вероятности несут на себе печать бренда, но без навязывания неестественных вариантов. Согласно опубликованным исследованиям, этот метод затрудняет стереть, подделать или отменить печать, всегда в разумных пределах против противников, имеющих время и мотивацию.

Надлежащие методы внедрения и обеспечения безопасности

  • Если вы развертываете SynthID Text, рассматривайте конфигурацию как производственный секрет: Храните ключи и начальные значения в безопасном хранилище, обеспечьте контроль доступа и обеспечьте периодическую ротацию. Предотвращение утечек уменьшает поверхность атаки при попытках реверс-инжиниринга.
  • Разработайте план мониторинг для вашего детектора: регистрируйте показатели ложных положительных/отрицательных срабатываний, корректируйте пороговые значения в соответствии с контекстом и выбирайте политику обнаружения экспозиция (частный, получастный через API или публичный) с чёткими юридическими и эксплуатационными критериями. Если несколько моделей используют один и тот же токенизатор, рассмотрите возможность обучения общий детектор с примерами всех из них для упрощения обслуживания.
  • На уровне производительности он оценивает влияние sampling_table_size в памяти и задержке, и выбрать ngram_len Это позволяет сбалансировать вашу терпимость к редактированию с необходимостью надёжного обнаружения. Не забудьте исключить повторяющиеся N-граммы (через context_history_size) для улучшения сигнала в потоке текста.

SynthID не является панацеей от дезинформации, но обеспечивает фундаментальный строительный блок для восстановления цепочки доверия в эпоху генеративного ИИ. Встраивая сигналы происхождения в текст, изображения, аудио и видео, а также открывая текстовый компонент сообществу, Google DeepMind движется к будущему, в котором подлинность можно будет проверить практичным, измеримым и, прежде всего, совместимым с креативностью и качеством контента способом.