Ano ang SynthID, ang watermark ng artificial intelligence?

Huling pag-update: 29/08/2025

  • Ang SynthID ay nag-e-embed ng mga hindi mahahalatang watermark sa text, mga larawan, audio, at video upang matukoy ang nilalamang binuo ng AI.
  • Sa text ito ay gumaganap bilang isang logit processor na may mga key at n-grams, na may Bayesian detection na nako-configure ng mga threshold.
  • Available ang pagpapatupad sa Transformers 4.46.0+, na may opisyal na Space at reference sa GitHub.
  • Mayroon itong mga limitasyon (maiikling teksto, pagsasalin, muling pagsusulat) ngunit pinalalakas ang transparency at traceability.
SynthID watermark

Ang paglitaw ng generative AI ay nagpalakas sa paggawa ng mga larawan, teksto, audio, at video sa sukat na hindi pa nakikita, at kasama nito, ang mga pagdududa tungkol sa kanilang pinagmulan ay lumaki; sa kontekstong ito, Tukuyin kung ang nilalaman ay ginawa o binago ng isang modelo nagiging susi sa digital trust. SynthID ay maaaring maging isang mahusay na solusyon.

Ito ang panukala ng Google DeepMind, a pamilya ng "invisible" watermarking techniques na direktang naka-embed sa nilalamang binuo ng AI upang mapadali ang kasunod na pag-verify nang hindi pinapababa ang kalidad na nakikita ng mga tao.

Ano ang SynthID at para saan ito?

Inilalarawan ng Google ang SynthID bilang isang tool para sa partikular na watermark para sa nilalamang binuo ng AI, na idinisenyo upang i-promote ang transparency at traceability. Hindi ito limitado sa isang format: sumasaklaw ito sa mga larawan, audio, text, at video, upang ang isang teknikal na diskarte ay mailapat sa iba't ibang uri ng media.

Sa Google ecosystem ay ginagamit na ito sa ilang paraan:

  • Sa text, nalalapat ang bandila sa mga tugon ng Gemini.
  • Sa audio, ay ginagamit sa modelong Lyria at may mga tampok tulad ng paggawa ng mga podcast mula sa teksto sa Notebook LM.
  • En video, ay isinama sa mga likha ng Veo, ang modelong may kakayahang bumuo ng mga clip sa 1080p.

Sa lahat ng kaso ang watermark Ito ay hindi mahahalata, at idinisenyo upang makatiis sa madalas na pagbabago gaya ng compression, mga pagbabago sa ritmo sa mga audio o video cut, nang hindi binabawasan ang kalidad.

Higit pa sa teknolohiya, ang praktikal na layunin nito ay malinaw: tumulong na makilala ang synthetic na materyal mula sa ginawa nang walang AI, upang ang mga user, media at mga institusyon ay makagawa ng matalinong mga pagpapasya tungkol sa pagkonsumo at pamamahagi ng nilalaman.

synthID

Paano gumagana ang watermark ng text (SynthID Text).

Sa pagsasagawa, gumaganap ang SynthID Text bilang isang logit processor na nakakabit sa pipeline ng pagbuo ng modelo ng wika pagkatapos ng karaniwang mga sampling filter (Top-K at Top-P). Ang processor na ito ay banayad na binabago ang mga marka ng modelo gamit ang a pseudorandom function g, pag-encode ng impormasyon sa pattern ng mga probabilidad nang hindi ipinapasok ang mga nakikitang artifact sa istilo o kalidad ng teksto.

Eksklusibong nilalaman - Mag-click Dito  Paano mo mamarkahan ang isang bagay sa Google Docs

Ang resulta ay isang text na, sa unang tingin, pinapanatili kalidad, katumpakan at pagkalikido, ngunit nagsasama ng istrukturang pang-istatistika na nakikita sa isang sinanay na verifier.

Upang makabuo ng teksto na may watermark, hindi ito kinakailangan sanayin muli ang modelo: magbigay lamang ng pagsasaayos sa pamamaraan .generate() at i-activate ang logit processor ng SynthID Text. Pinapasimple nito ang pag-aampon at nagbibigay-daan sa pagsubok sa mga naka-deploy na modelo.

Kasama sa mga setting ng watermark ang dalawang mahahalagang parameter: keys y ngram_len. Ang mga susi ay isang listahan ng mga natatangi, random na integer na ginagamit upang puntos ang bokabularyo gamit ang g function; kinokontrol ng haba ng listahang iyon kung gaano karaming "mga layer" ng watermarking ang inilalapat. Samantala, ngram_len Itinatakda ang balanse sa pagitan ng detectability at robustness sa mga pagbabagong-anyo: ang mas mataas na halaga ay nagpapadali sa pagtuklas ngunit ginagawang mas mahina ang selyo sa mga pagbabago; ang isang halaga ng 5 ay gumagana nang maayos bilang isang panimulang punto.

Bilang karagdagan, ang SynthID Text ay gumagamit ng a sampling table na may dalawang katangian: sampling_table_size y sampling_table_seed. Ang sukat na hindi bababa sa 2^16 ay inirerekomenda upang matiyak na ang function g ay kumikilos sa isang matatag at walang pinapanigan na paraan kapag nagsa-sample, na isinasaalang-alang na ang mas malaking sukat ay nangangahulugan ng mas maraming memorya sa panahon ng hinuha. Ang binhi ay maaaring maging anumang integer, na nagpapadali sa muling paggawa sa mga kapaligiran ng pagsusuri.

Mayroong isang mahalagang nuance upang mapabuti ang signal: paulit-ulit na n-grams sa loob ng kamakailang kasaysayan ng konteksto (tinukoy ng context_history_size) ay hindi minarkahan, na pinapaboran ang detectability ng marka sa natitirang bahagi ng teksto at binabawasan ang mga maling positibong nauugnay sa natural na pag-uulit ng wika.

Para sa seguridad, bawat pagsasaayos ng watermark (kabilang ang mga susi, binhi at mga parameter nito) dapat itago nang pribadoKung ang mga susi na ito ay na-leak, madaling gayahin ng mga third party ang tatak o, mas malala pa, subukang manipulahin ito nang may ganap na kaalaman sa istraktura nito.

Eksklusibong nilalaman - Mag-click Dito  Paano ayusin ang mga opsyon sa Google Forms

Paano mag-detect: probabilistic na pag-verify na may mga threshold

Ang pag-verify ng isang watermark sa text ay hindi binary, ngunit probabilistikoAng Google ay nag-publish ng isang Bayesian detector sa parehong Transformers at GitHub na, pagkatapos suriin ang istatistikal na pattern ng teksto, ay nagbabalik ng tatlong posibleng estado: may tatak, walang tatak o hindi siguradoBinibigyang-daan ng ternary output na ito ang operasyon na maisaayos sa iba't ibang konteksto ng pagpapaubaya sa panganib at error.

Ang pag-uugali ng verifier ay na-configure ng dalawang threshold na kumokontrol sa rate ng mga maling positibo at maling negatibo. Sa madaling salita, maaari mong i-calibrate kung gaano mo kahigpit ang pag-detect, na isinasakripisyo ang pagiging sensitibo para sa katumpakan o kabaligtaran depende sa iyong kaso ng paggamit, isang bagay na partikular na kapaki-pakinabang sa editoryal na kapaligiran, moderation o panloob na pag-audit.

Kung magkapareho ang ilang modelo tokenizer, maaari ding ibahagi ang parehong configuration ng brand at parehong detector, hangga't kasama sa set ng pagsasanay ng verifier ang mga halimbawa ng lahat ng ito. Ginagawa nitong mas madali ang pagbuo ng "mga karaniwang watermark" sa mga organisasyong may maraming LLM.

Kapag nasanay na ang detector, maaaring magpasya ang mga organisasyon sa antas ng pagkakalantad nito: panatilihin ito ganap na pribado, ialok ito sa isang paraan semi-pribado sa pamamagitan ng isang API, o ilabas ito sa isang paraan publiko para sa pag-download at paggamit ng mga third party. Ang pagpili ay depende sa kapasidad ng pagpapatakbo ng imprastraktura ng bawat entity, mga panganib sa regulasyon, at diskarte sa transparency.

Teknolohiya ng watermark ng SynthID AI

Watermark sa mga larawan, audio at video

Ang tatak na ito ay idinisenyo upang tumagal karaniwang pagbabago gaya ng pag-crop, pagbabago ng laki, pag-ikot, pagpapalit ng kulay, o kahit na mga screenshot, nang hindi kailangang panatilihin ang metadata. Sa una, ang paggamit nito ay inaalok sa pamamagitan ng Larawan sa Vertex AI, kung saan maaaring piliin ng mga user na i-activate ang watermark kapag bumubuo ng content.

Sa audio, ang tatak ay hindi maririnig at sumusuporta sa mga karaniwang operasyon gaya ng MP3 compression, pagdaragdag ng ingay, o pagbabago sa bilis ng pag-playback. Isinasama ito ng Google sa Lyria at sa Notebook LM-based na mga feature, nagpapalakas ng signal kahit na dumaan ang file sa mga lossy publishing stream.

Sa video, ginagaya ng diskarte ang diskarte sa imahe: ang tatak ay naka-embed sa pixel ng bawat frame, hindi mahahalata, at nananatiling stable laban sa mga filter, pagbabago sa refresh rate, compression o clippings. Mga video na nabuo ni Nakikita ko Ang mga tool tulad ng VideoFX ay isinasama ang markang ito sa panahon ng paggawa, na binabawasan ang panganib ng aksidenteng pagtanggal sa mga kasunod na pag-edit.

Eksklusibong nilalaman - Mag-click Dito  Paano i-off ang autocorrect sa Google Docs

Sampling algorithm at tibay ng text seal

Ang puso ng SynthID Text ay nito sampling algorithm, na gumagamit ng key (o set ng mga key) para magtalaga ng mga pseudo-random na marka sa bawat potensyal na token. Ang mga kandidato ay kinukuha mula sa pamamahagi ng modelo (pagkatapos ng Top-K/Top-P) at inilalagay sa "kumpetisyon" kasunod ng mga round ng elimination, hanggang sa mapili ang token na may pinakamataas na marka ayon sa function g.

Ang pamamaraang ito ng pagpili ay pinapaboran ang huling pattern ng istatistika ng mga probabilidad ay nagtataglay ng marka ng tatak, ngunit nang hindi pinipilit ang mga hindi likas na opsyon. Ayon sa nai-publish na mga pag-aaral, ang pamamaraan ay nagpapahirap burahin, huwad, o baligtarin ang selyo, palaging nasa loob ng makatwirang limitasyon laban sa mga kalaban na may oras at motibasyon.

Magandang pagpapatupad at mga kasanayan sa seguridad

  • Kung nagde-deploy ka ng SynthID Text, ituring ang configuration bilang lihim ng produksyon: Mag-imbak ng mga susi at buto sa isang secure na manager, ipatupad ang mga kontrol sa pag-access, at payagan ang pana-panahong pag-ikot. Ang pag-iwas sa pagtagas ay binabawasan ang ibabaw ng pag-atake laban sa mga pagtatangka ng reverse engineering.
  • Magdisenyo ng plano pagmamanman para sa iyong detector: magtala ng mga maling positibo/negatibong rate, ayusin ang mga threshold ayon sa konteksto at magpasya sa iyong patakaran sa pagtuklas pagkakalantad (pribado, semi-pribado sa pamamagitan ng API, o pampubliko) na may malinaw na pamantayang legal at pagpapatakbo. At kung maraming modelo ang nagbabahagi ng isang tokenizer, isaalang-alang ang pagsasanay a karaniwang detector na may mga halimbawa ng lahat ng mga ito upang gawing simple ang pagpapanatili.
  • Sa antas ng pagganap, tinatasa nito ang epekto ng sampling_table_size sa memorya at latency, at piliin ang a ngram_len na binabalanse ang iyong pagpapahintulot para sa mga pag-edit na may pangangailangan para sa maaasahang pagtuklas. Tandaan na ibukod ang paulit-ulit na n-grams (sa pamamagitan ng context_history_size) upang mapabuti ang signal sa dumadaloy na teksto.

Ang SynthID ay hindi isang silver bullet laban sa maling impormasyon, ngunit nagbibigay ng pangunahing gusali para sa muling pagtatayo ng chain of trust sa panahon ng generative AI. Sa pamamagitan ng pag-embed ng mga provenance signal sa text, mga larawan, audio, at video, at pagbubukas ng bahagi ng text sa komunidad, ang Google DeepMind ay nagtutulak patungo sa isang hinaharap kung saan ang pagiging tunay ay maaaring i-audit sa isang praktikal, nasusukat, at, higit sa lahat, tugmang paraan sa pagkamalikhain at kalidad ng nilalaman.