Hvad er SynthID, vandmærket for kunstig intelligens?

Sidste opdatering: 29/08/2025
Forfatter: Daniel Terrasa

  • SynthID integrerer umærkelige vandmærker i tekst, billeder, lyd og video for at identificere AI-genereret indhold.
  • I tekst fungerer den som en logit-processor med nøgler og n-grammer, med Bayesiansk detektion konfigurerbar af tærskler.
  • Implementeringen er tilgængelig i Transformers 4.46.0+, med officiel Space og reference på GitHub.
  • Det har begrænsninger (korte tekster, oversættelser, omskrivninger), men styrker gennemsigtighed og sporbarhed.
SynthID-vandmærke

Fremkomsten af ​​generativ kunstig intelligens har øget produktionen af ​​billeder, tekster, lyd og videoer i en skala, der aldrig er set før, og med den er tvivlen om deres oprindelse vokset; i denne sammenhæng, Identificer om indhold er blevet oprettet eller ændret af en model bliver nøglen til digital tillid. SynthID kan være en god løsning.

Dette er Google DeepMinds forslag, et familie af "usynlige" vandmærkningsteknikker som er integreret direkte i AI-genereret indhold for at lette efterfølgende verifikation uden at forringe den kvalitet, som mennesker opfatter.

Hvad er SynthID, og ​​hvad er det beregnet til?

Google beskriver SynthID som et værktøj til specifikt vandmærke til AI-genereret indhold, designet til at fremme gennemsigtighed og sporbarhed. Det er ikke begrænset til ét format: det omfatter billeder, lyd, tekst og video, så en enkelt teknisk tilgang kan anvendes på forskellige typer medier.

I Googles økosystem bruges det allerede på flere måder:

  • I teksten, flaget gælder for Gemini-svar.
  • I lyd, bruges med Lyria-modellen og med funktioner som at oprette podcasts fra tekst i Notebook LM.
  • En video, er integreret i Veo-creations, modellen der er i stand til at generere klip i 1080p.

I alle tilfælde vandmærke Den er umærkelig og er designet til at tåle hyppige ændringer såsom komprimering, rytmeændringer i lyd- eller videoklip, uden at reducere kvaliteten.

Ud over teknologien er dens praktiske mål klare: hjælpe med at skelne syntetisk materiale fra det, der er produceret uden kunstig intelligens, så brugere, medier og institutioner kan træffe informerede beslutninger om forbrug og distribution af indhold.

synthID

Sådan fungerer tekstvandmærket (SynthID Text)

I praksis fungerer SynthID Text som en Logit-processor som kobler sig til sprogmodellens genereringspipeline efter de sædvanlige samplingsfiltre (Top-K og Top-P). Denne processor ændrer subtilt modelscorerne med en pseudotilfældig funktion g, indkodning af information i sandsynlighedsmønsteret uden at introducere synlige artefakter i tekstens stil eller kvalitet.

Eksklusivt indhold - Klik her  Sådan ændres billeder i Google Business

Resultatet er en tekst, der ved første øjekast fastholder kvalitet, præcision og flydendehed, men som inkorporerer en statistisk struktur, der kan detekteres med en trænet verifikator.

Det er ikke nødvendigt at generere tekst med vandmærke omskole modellen: angiv blot en konfiguration til metoden .generate() og aktivere SynthID Texts logit-processor. Dette forenkler implementeringen og muliggør testning med allerede implementerede modeller.

Vandmærkeindstillingerne inkluderer to vigtige parametre: keys y ngram_len. Nøglerne er en liste over unikke, tilfældige heltal, der bruges til at score ordforrådet ved hjælp af g-funktionen; længden af ​​denne liste styrer, hvor mange "lag" vandmærkning der anvendes. I mellemtiden, ngram_len Sætter balancen mellem detekterbarhed og robusthed over for transformationer: højere værdier gør detektion lettere, men gør seglet mere sårbart over for ændringer; en værdi på 5 fungerer godt som et udgangspunkt.

Derudover bruger SynthID Text en prøveudtagningstabel med to egenskaber: sampling_table_size y sampling_table_seedEn størrelse på mindst 2^16 anbefales for at sikre, at funktionen g opfører sig stabilt og objektivt ved stikprøvetagning, idet der tages højde for, at en større størrelse betyder mere hukommelse under inferens. Frøet kan være et hvilket som helst heltal, hvilket letter reproducerbarheden i evalueringsmiljøer.

Der er en vigtig nuance for at forbedre signalet: gentagne n-grammer inden for kontekstens nyere historie (defineret af context_history_size) er ikke markeret, hvilket favoriserer mærkets sporbarhed i resten af ​​teksten og reducerer falske positiver forbundet med naturlige gentagelser af sproget.

Af sikkerhedsmæssige årsager, hver vandmærkekonfiguration (inklusive dens nøgler, frø og parametre) skal opbevares privatHvis disse nøgler lækkes, kan tredjeparter nemt kopiere brandet eller, endnu værre, forsøge at manipulere det med fuldt kendskab til dets struktur.

Eksklusivt indhold - Klik her  Sådan tilføjer du pile i Google Docs

Sådan detekteres: probabilistisk verifikation med tærskler

Bekræftelse af et vandmærke i tekst er ikke binær, men sandsynlighedsbaseretGoogle udgiver en Bayesiansk detektor på både Transformers og GitHub, der efter at have analyseret tekstens statistiske mønster returnerer tre mulige tilstande: mærkevare, umærket o usikkerDette ternære output gør det muligt at justere operationen til forskellige risiko- og fejltolerancesammenhænge.

Verifikatorens opførsel kan konfigureres af to tærskler der styrer antallet af falsk positive og falsk negative resultater. Med andre ord kan du kalibrere, hvor streng du ønsker, at detektionen skal være, og ofre følsomhed for nøjagtighed eller omvendt afhængigt af din brugsscene, noget der er særligt nyttigt i redaktionelle miljøer, moderering eller intern revision.

Hvis flere modeller deler den samme tokenizer, kan også dele samme mærkekonfiguration og samme detektor, så længe verifikatorens træningssæt indeholder eksempler på dem alle. Dette gør det nemmere at opbygge "fælles vandmærker" i organisationer med flere LLM'er.

Når detektoren er trænet, kan organisationer bestemme dens eksponeringsniveau: behold den helt privat, tilbyd det på en måde semi-privat gennem en API, eller frigiv den på en måde offentlig til download og brug af tredjeparter. Valget afhænger af hver enheds infrastrukturelle driftskapacitet, regulatoriske risici og gennemsigtighedsstrategi.

SynthID AI vandmærketeknologi

Vandmærke på billeder, lyd og video

Dette mærke er designet til at holde almindelige transformationer såsom beskæring, ændring af størrelse, rotation, ændring af farve eller endda skærmbilleder, uden behov for at gemme metadata. I starten blev brugen af ​​den tilbudt via Billede i Vertex AI, hvor brugerne kan vælge at aktivere vandmærket, når de genererer indhold.

Inden for lyd er brandet uhørlig og understøtter almindelige handlinger såsom MP3-komprimering, tilføjelse af støj eller ændring af afspilningshastighed. Google integrerer det i Lyria og i Notebook LM-baserede funktioner, hvilket forstærker signalet, selv når filen passerer gennem tabsgivende publiceringsstrømme.

I video replikerer tilgangen imagetilgangen: brandet er indlejret i pixels i hver ramme, umærkeligt, og forbliver stabil mod filtre, ændringer i opdateringshastighed, kompression eller nedskæringerVideoer genereret af Jeg ser Værktøjer som VideoFX inkorporerer dette mærke under oprettelsen, hvilket reducerer risikoen for utilsigtet sletning i efterfølgende redigeringer.

Eksklusivt indhold - Klik her  Sådan sender du et billede til baggrunden i Google Slides

Prøvetagningsalgoritmer og tekstforseglingens robusthed

Hjertet i SynthID Text er dens samplingsalgoritme, som bruger en nøgle (eller et sæt nøgler) til at tildele pseudo-tilfældige scorer til hver potentiel token. Kandidater udtrækkes fra modellens fordeling (efter Top-K/Top-P) og sættes i "konkurrence" efter elimineringsrunder, indtil den token med den højeste score er valgt i henhold til funktionen g.

Denne udvælgelsesprocedure favoriserer endeligt statistisk mønster af sandsynlighederne bærer mærkets præg, men uden at fremtvinge unaturlige muligheder. Ifølge publicerede undersøgelser gør teknikken det vanskeligt slette, forfalske eller omvende seglet, altid inden for rimelige grænser mod modstandere med tid og motivation.

God implementering og sikkerhedspraksis

  • Hvis du implementerer SynthID Text, skal du behandle konfigurationen som produktionshemmelighedOpbevar nøgler og seeds i en sikker manager, håndhæv adgangskontroller og tillad periodisk rotation. Forebyggelse af lækager reducerer angrebsfladen mod reverse engineering-forsøg.
  • Design en plan for at overvågning For din detektor: Registrer falsk positive/negative rater, juster tærskler i henhold til kontekst og bestem din detektionspolitik eksponering (privat, semi-privat via API eller offentlig) med klare juridiske og operationelle kriterier. Og hvis flere modeller deler en tokenizer, bør man overveje at træne en fælles detektor med eksempler på dem alle for at forenkle vedligeholdelsen.
  • På præstationsniveau vurderer den effekten af sampling_table_size i hukommelse og latenstid, og vælg en ngram_len der afbalancerer din tolerance for redigeringer med behovet for pålidelig detektion. Husk at udelukke gentagne n-grammer (via context_history_size) for at forbedre signalet i flydende tekst.

SynthID er ikke en mirror kugle mod misinformation, men giver en grundlæggende byggesten til at genopbygge tillidskæden i en æra med generativ AI. Ved at integrere provenienssignaler i tekst, billeder, lyd og video og åbne tekstkomponenten op for fællesskabet, bevæger Google DeepMind sig mod en fremtid, hvor autenticitet kan revideres på en praktisk, målbar og frem for alt kompatibel måde med indholdets kreativitet og kvalitet.