인공지능의 워터마크, 신스ID란?

마지막 업데이트 : 29/08/2025

  • SynthID는 텍스트, 이미지, 오디오, 비디오에 감지할 수 없는 워터마크를 삽입하여 AI가 생성한 콘텐츠를 식별합니다.
  • 텍스트에서는 키와 n-그램을 사용하는 로짓 프로세서 역할을 하며, 임계값을 통해 베이지안 감지를 구성할 수 있습니다.
  • 해당 구현은 GitHub의 공식 Space와 참조를 포함하여 Transformers 4.46.0+에서 사용할 수 있습니다.
  • 이 방법에는 제약이 있습니다(짧은 텍스트, 번역, 재작성) 하지만 투명성과 추적성을 강화합니다.
SynthID 워터마크

생성적 AI의 등장으로 이미지, 텍스트, 오디오, 비디오의 생산이 전례 없는 규모로 확대되었으며, 이와 함께 이러한 이미지, 텍스트, 오디오, 비디오의 출처에 대한 의심이 커졌습니다. 모델에 의해 콘텐츠가 생성되었거나 변경되었는지 식별합니다. 디지털 신뢰의 핵심이 됩니다. SynthID 좋은 해결책이 될 수 있습니다.

이는 Google DeepMind의 제안입니다. "보이지 않는" 워터마킹 기술 계열 인간이 인지하는 품질을 저하시키지 않고 후속 검증을 용이하게 하기 위해 AI가 생성한 콘텐츠에 직접 내장됩니다.

SynthID란 무엇이고, 어떤 용도로 사용되나요?

Google에서는 SynthID를 도구로 설명합니다. AI가 생성한 콘텐츠에 대한 특정 워터마크투명성과 추적성을 증진하도록 설계되었습니다. 한 가지 형식에 국한되지 않고 이미지, 오디오, 텍스트, 비디오를 모두 포괄하므로 단일 기술적 접근 방식을 다양한 유형의 미디어에 적용할 수 있습니다.

Google 생태계에서는 이미 여러 가지 방법으로 사용되고 있습니다.

  • 텍스트에서, 플래그는 제미니 응답에 적용됩니다.
  • 오디오에서, Lyria 모델과 함께 사용되며 Notebook LM의 텍스트에서 팟캐스트를 만드는 기능과 함께 사용됩니다.
  • En 비디오, Veo Creations에 통합되어 있으며, 1080p 클립을 생성할 수 있는 모델입니다.

모든 경우에 양수표 그것은 감지할 수 없으며 설계되었습니다. 잦은 수정에도 견뎌내다 품질을 저하시키지 않고 오디오나 비디오 컷의 압축, 리듬 변경 등을 수행합니다.

기술을 넘어 실제적인 목표는 분명합니다. AI 없이 생산된 재료와 합성 재료를 구별하는 데 도움이 됩니다.이를 통해 사용자, 미디어, 기관이 콘텐츠 소비 및 배포에 대한 정보에 입각한 결정을 내릴 수 있습니다.

신스ID

텍스트 워터마크(SynthID Text) 작동 방식

실제로 SynthID Text는 다음과 같이 작동합니다. 로짓 프로세서 일반적인 샘플링 필터(Top-K 및 Top-P) 이후 언어 모델 생성 파이프라인에 연결됩니다. 이 프로세서는 모델 점수를 다음과 같이 미묘하게 수정합니다. 의사난수 함수 g텍스트의 스타일이나 품질에 눈에 띄는 인공물을 도입하지 않고 확률 패턴으로 정보를 인코딩합니다.

독점 콘텐츠 - 여기를 클릭하세요  Google+에서 사용자를 차단하는 방법

결과는 첫눈에 보면 유지되는 텍스트입니다. 품질, 정밀성 및 유동성하지만 훈련된 검증자가 감지할 수 있는 통계적 구조가 통합되어 있습니다.

워터마크가 있는 텍스트를 생성하려면 다음이 필요하지 않습니다. 모델을 다시 학습하다: 단순히 메서드에 구성을 제공합니다. .generate() SynthID Text의 로짓 프로세서를 활성화합니다. 이를 통해 도입이 간소화되고 이미 배포된 모델로 테스트할 수 있습니다.

워터마크 설정에는 두 가지 필수 매개변수가 포함됩니다. keys y ngram_len. 열쇠들 g 함수를 사용하여 어휘 점수를 매기는 데 사용되는 고유한 난수 정수 목록입니다. 이 목록의 길이는 적용되는 워터마킹 "계층" 수를 제어합니다. 한편, ngram_len 탐지 가능성과 변형에 대한 견고성 간의 균형을 설정합니다. 값이 높을수록 탐지가 쉬워지지만 봉인이 변경에 더 취약해집니다. 값 5는 시작점으로 적합합니다.

또한 SynthID Text는 다음을 사용합니다. 샘플링 테이블 두 가지 속성이 있습니다: sampling_table_size y sampling_table_seed샘플링할 때 함수 g가 안정적이고 편향되지 않은 방식으로 동작하도록 하려면 최소 2^16의 크기가 권장됩니다. 더 큰 크기는 더 많은 메모리를 의미합니다 추론 중. 시드는 어떤 정수든 될 수 있으며, 이는 평가 환경에서 재현성을 용이하게 합니다.

신호를 개선하는 데에는 중요한 뉘앙스가 있습니다. 반복된 n-그램 최근의 맥락 내 역사(정의됨) context_history_size)에는 표시가 없으므로 나머지 텍스트에서 표시를 쉽게 감지할 수 있고 언어의 자연스러운 반복과 관련된 거짓 양성 반응이 줄어듭니다.

보안을 위해 각 워터마크 구성(키, 시드 및 매개변수 포함) 비공개로 보관해야 함이러한 키가 유출되면 제3자가 해당 브랜드를 쉽게 복제할 수 있고, 더 나쁜 경우에는 브랜드의 구조를 완벽하게 알고 이를 조작하려고 시도할 수도 있습니다.

독점 콘텐츠 - 여기를 클릭하세요  Google 드라이브에 대한 다른 사람의 액세스 권한을 삭제하는 방법

감지 방법: 임계값을 사용한 확률적 검증

텍스트의 워터마크 검증은 이진법이 아니지만 확률론적Google은 텍스트의 통계적 패턴을 분석한 후 세 가지 가능한 상태를 반환하는 베이지안 감지기를 Transformers와 GitHub에 게시했습니다. 브랜드와 함께, 브랜드없이 o 불확실한이러한 3가지 출력을 통해 작업을 다양한 위험 및 오류 허용 범위에 맞게 조정할 수 있습니다.

검증자의 동작은 다음과 같이 구성 가능합니다. 두 개의 임계값 위양성 및 위음성 비율을 제어합니다. 다시 말해, 사용 사례에 따라 민감도를 희생하여 정확도를 높이거나, 반대로 민감도를 희생하여 탐지 강도를 조절할 수 있습니다. 특히 다음에서 유용합니다. 편집 환경, 조정 또는 내부 감사.

여러 모델이 동일한 것을 공유하는 경우 토크나이저, 또한 공유할 수 있습니다 동일한 브랜드 구성 및 동일한 감지기검증자의 훈련 세트에 이러한 모든 예시가 포함되어 있는 한, 여러 LLM을 보유한 조직에서 "공통 워터마크"를 구축하기가 더 쉬워집니다.

탐지기가 훈련되면 조직은 노출 수준을 결정할 수 있습니다. 완전히 비공개, 그것을 어떤 방식으로 제공하다 준개인 API를 통해 또는 다음과 같은 방식으로 릴리스합니다. 공공의 제3자가 다운로드하여 사용할 수 있습니다. 선택은 각 기관의 인프라 운영 역량, 규제 위험, 투명성 전략에 따라 달라집니다.

SynthID AI 워터마크 기술

이미지, 오디오 및 비디오에 워터마크 추가

이 브랜드는 오래 지속되도록 설계되었습니다. 일반적인 변환 메타데이터를 보관하지 않고도 자르기, 크기 조정, 회전, 색상 변경, 스크린샷 촬영 등의 작업을 수행할 수 있습니다. 처음에는 다음과 같은 기능을 제공했습니다. Vertex AI의 이미지사용자가 콘텐츠를 생성할 때 워터마크를 활성화할지 선택할 수 있습니다.

오디오에서는 브랜드가 알아들을 수없는 MP3 압축, 노이즈 추가, 재생 속도 수정과 같은 일반적인 작업을 지원합니다. Google은 이를 다음과 통합합니다. 리리아 Notebook LM 기반 기능에서는 파일이 손실 있는 게시 스트림을 통과할 때에도 신호를 증폭합니다.

비디오에서는 이미지 접근 방식을 복제합니다. 즉, 브랜드가 내장됩니다. 각 프레임의 픽셀, 눈에 띄지 않게, 필터, 새로 고침 빈도, 압축 또는 변경에 대해 안정적으로 유지됩니다. 트리밍. 에서 생성된 비디오 VideoFX와 같은 도구는 편집 과정에서 이 표시를 포함시켜서 후속 편집에서 실수로 삭제되는 위험을 줄입니다.

독점 콘텐츠 - 여기를 클릭하세요  Google 스프레드시트에 PDF 파일을 업로드하는 방법

샘플링 알고리즘과 텍스트 씰의 견고성

SynthID Text의 핵심은 다음과 같습니다. 샘플링 알고리즘키(또는 키 집합)를 사용하여 각 잠재적 토큰에 의사 난수 점수를 할당하는 방식입니다. 후보들은 모델의 분포(Top-K/Top-P 이후)에서 추출되어 제거 라운드를 거쳐 "경쟁"에 참여합니다. 이 라운드는 함수 g에 따라 가장 높은 점수를 받는 토큰이 선택될 때까지 진행됩니다.

이 선택 절차는 다음을 선호합니다. 최종 통계 패턴 확률은 브랜드의 특징을 반영하지만, 부자연스러운 옵션을 강요하지는 않습니다. 발표된 연구에 따르면, 이 기술은 지우다, 위조하다, 또는 뒤집다 시간과 동기를 갖춘 상대에 대해서는 항상 합리적인 한계 내에서 봉인을 합니다.

좋은 구현 및 보안 관행

  • SynthID Text를 배포하는 경우 구성을 다음과 같이 처리합니다. 생산 비밀: 키와 시드를 안전한 관리자에 저장하고, 접근 제어를 시행하며, 주기적인 순환을 허용하세요. 유출을 방지하면 리버스 엔지니어링 시도에 대한 공격 표면이 줄어듭니다.
  • 계획을 설계하다 모니터링 탐지기: 양성/음성 오류율을 기록하고, 상황에 따라 임계값을 조정하고 탐지 정책을 결정합니다. 노출 (비공개, API를 통한 준공개 또는 공개) 명확한 법적 및 운영 기준을 준수해야 합니다. 여러 모델이 토크나이저를 공유하는 경우, 공통 검출기 유지관리를 단순화하기 위해 모든 사례와 함께 설명합니다.
  • 성과 수준에서는 영향을 평가합니다. sampling_table_size 메모리와 대기 시간을 선택하고 ngram_len 편집 허용 범위와 신뢰할 수 있는 감지 필요성의 균형을 맞춰야 합니다. 반복되는 n-gram(예: context_history_size) 흐르는 텍스트의 신호를 개선합니다.

SynthID는 잘못된 정보에 대한 만병통치약은 아니지만 생성적 AI 시대에 신뢰 사슬을 재구축하기 위한 기본적인 구성 요소를 제공합니다. Google DeepMind는 텍스트, 이미지, 오디오, 비디오에 출처 신호를 내장하고 텍스트 구성 요소를 커뮤니티에 공개함으로써 실용적이고 측정 가능하며 무엇보다도 콘텐츠의 창의성과 품질과 호환되는 방식으로 진위성을 감사할 수 있는 미래를 향해 나아가고 있습니다.