Wat is SynthID, het watermerk van kunstmatige intelligentie?

Laatste update: 29/08/2025

  • SynthID integreert onzichtbare watermerken in tekst, afbeeldingen, audio en video om door AI gegenereerde content te identificeren.
  • In tekst fungeert het als een logitprocessor met sleutels en n-grammen, waarbij de Bayesiaanse detectie kan worden geconfigureerd met behulp van drempelwaarden.
  • De implementatie is beschikbaar in Transformers 4.46.0+, met officiële Space en referentie op GitHub.
  • Er zijn beperkingen (korte teksten, vertalingen, herschrijvingen), maar de transparantie en traceerbaarheid zijn wel verbeterd.
SynthID-watermerk

De opkomst van generatieve AI heeft de productie van afbeeldingen, teksten, audio en video op een schaal die we nog nooit eerder hebben gezien, een impuls gegeven, en daarmee zijn de twijfels over hun oorsprong gegroeid; in deze context, Identificeer of de inhoud door een model is gemaakt of gewijzigd wordt de sleutel tot digitaal vertrouwen. SynthID kan een geweldige oplossing zijn.

Dit is het voorstel van Google DeepMind, een familie van "onzichtbare" watermerktechnieken die rechtstreeks in door AI gegenereerde content worden geïntegreerd, zodat ze later eenvoudig kunnen worden geverifieerd zonder dat dit ten koste gaat van de door mensen waargenomen kwaliteit.

Wat is SynthID en waarvoor is het bedoeld?

Google beschrijft SynthID als een hulpmiddel voor specifiek watermerk voor door AI gegenereerde inhoud, ontworpen om transparantie en traceerbaarheid te bevorderen. Het is niet beperkt tot één formaat: het omvat afbeeldingen, audio, tekst en video, zodat één technische aanpak kan worden toegepast op verschillende soorten media.

In het ecosysteem van Google wordt het al op verschillende manieren gebruikt:

  • In de tekst, de vlag is van toepassing op Gemini-reacties.
  • In audio, wordt gebruikt met het Lyria-model en met functies zoals het maken van podcasts van tekst in Notebook LM.
  • En video, is geïntegreerd in Veo Creations, een model dat clips in 1080p kan genereren.

In alle gevallen is de watermerk Het is onmerkbaar en is ontworpen om bestand zijn tegen frequente wijzigingen zoals compressie, ritmeveranderingen in audio- of videofragmenten, zonder dat de kwaliteit hierdoor afneemt.

Naast de technologie is het praktische doel duidelijk: helpen synthetisch materiaal te onderscheiden van materiaal dat zonder AI is geproduceerd, zodat gebruikers, media en instellingen weloverwogen beslissingen kunnen nemen over de consumptie en distributie van content.

synthID

Hoe het tekstwatermerk (SynthID-tekst) werkt

In de praktijk fungeert SynthID Text als een logit-processor die na de gebruikelijke bemonsteringsfilters (Top-K en Top-P) in de pijplijn voor het genereren van taalmodellen wordt gekoppeld. Deze processor wijzigt de modelscores subtiel met een pseudowillekeurige functie g, waarbij informatie wordt gecodeerd in een patroon van waarschijnlijkheden zonder zichtbare artefacten te introduceren in de stijl of kwaliteit van de tekst.

Exclusieve inhoud - Klik hier  Hoe u in regels schrijft in Google Documenten

Het resultaat is een tekst die op het eerste gezicht dezelfde inhoud heeft kwaliteit, precisie en vloeiendheid, maar die een statistische structuur bevat die door een getrainde verificateur kan worden gedetecteerd.

Om tekst met watermerk te genereren is het niet nodig het model opnieuw trainen: geef eenvoudigweg een configuratie aan de methode .generate() en activeer de logit-processor van SynthID Text. Dit vereenvoudigt de implementatie en maakt testen met reeds geïmplementeerde modellen mogelijk.

De watermerkinstellingen bevatten twee essentiële parameters: keys y ngram_len. De sleutels zijn een lijst met unieke, willekeurige gehele getallen die worden gebruikt om de woordenschat te beoordelen met behulp van de g-functie; de ​​lengte van die lijst bepaalt hoeveel "lagen" watermerken er worden toegepast. ngram_len Bepaalt de balans tussen detecteerbaarheid en robuustheid voor transformaties: hogere waarden maken detectie eenvoudiger, maar maken de zegel kwetsbaarder voor wijzigingen. Een waarde van 5 is een goed startpunt.

Bovendien gebruikt SynthID Text een bemonsteringstabel met twee eigenschappen: sampling_table_size y sampling_table_seedEen grootte van ten minste 2^16 wordt aanbevolen om ervoor te zorgen dat de functie g zich stabiel en onbevooroordeeld gedraagt ​​bij het bemonsteren, rekening houdend met het feit dat een groter formaat betekent meer geheugen Tijdens de inferentie. De seed kan elk geheel getal zijn, wat de reproduceerbaarheid in evaluatieomgevingen vergemakkelijkt.

Er is een belangrijke nuance om het signaal te verbeteren: herhaalde n-grammen binnen de recente geschiedenis van de context (gedefinieerd door context_history_size) zijn niet gemarkeerd, waardoor de vindbaarheid van de markering in de rest van de tekst wordt bevorderd en het aantal foutpositieve resultaten als gevolg van natuurlijke herhalingen van de taal wordt verminderd.

Voor de veiligheid wordt elke watermerkconfiguratie (inclusief de sleutels, seed en parameters) moeten privé worden opgeslagenAls deze sleutels uitlekken, kunnen derden het merk eenvoudig kopiëren of, nog erger, proberen te manipuleren met volledige kennis van de structuur ervan.

Exclusieve inhoud - Klik hier  Tabbladen vergrendelen in Google Spreadsheets

Hoe te detecteren: probabilistische verificatie met drempels

Het verifiëren van een watermerk in tekst is niet binair, maar waarschijnlijkGoogle publiceert op zowel Transformers als GitHub een Bayesiaanse detector die, na analyse van het statistische patroon van de tekst, drie mogelijke toestanden retourneert: met merk, geen merk o onzekerDankzij deze ternaire uitvoer kan de bewerking worden aangepast aan verschillende risico- en fouttolerantiecontexten.

Het gedrag van de verificator is configureerbaar door twee drempels die het aantal fout-positieve en fout-negatieve resultaten regelen. Met andere woorden, u kunt kalibreren hoe strikt u de detectie wilt hebben, waarbij u gevoeligheid opoffert voor nauwkeurigheid of andersom, afhankelijk van uw gebruikssituatie. Dit is vooral handig in redactionele omgevingen, moderatie of interne audit.

Als meerdere modellen dezelfde tokenis, kan ook de dezelfde merkconfiguratie en dezelfde detector, zolang de trainingsset van de verificator voorbeelden van al deze bronnen bevat. Dit maakt het gemakkelijker om "gemeenschappelijke watermerken" te bouwen in organisaties met meerdere LLM's.

Zodra de detector is getraind, kunnen organisaties het blootstellingsniveau bepalen: houd het volledig privé, bied het op een manier aan semi-privé via een API, of op een manier vrijgeven publiek voor download en gebruik door derden. De keuze hangt af van de operationele capaciteit van de infrastructuur van elke entiteit, de regelgevingsrisico's en de transparantiestrategie.

SynthID AI-watermerktechnologie

Watermerk op afbeeldingen, audio en video

Dit merk is ontworpen om lang mee te gaan gemeenschappelijke transformaties zoals bijsnijden, formaat wijzigen, roteren, kleur wijzigen of zelfs screenshots maken, zonder dat metadata bewaard hoeft te worden. Aanvankelijk werd het gebruik ervan aangeboden via Afbeelding in Vertex AI, waar gebruikers ervoor kunnen kiezen om het watermerk te activeren bij het genereren van inhoud.

In audio is het merk onhoorbaar en ondersteunt veelvoorkomende bewerkingen zoals MP3-compressie, het toevoegen van ruis of het wijzigen van de afspeelsnelheid. Google integreert het in lyria en in op Notebook LM gebaseerde functies, het signaal versterken, zelfs wanneer het bestand door verlieslatende publicatiestromen gaat.

In video repliceert de aanpak de beeldbenadering: het merk is ingebed in de pixels van elk frame, onmerkbaar, en blijft stabiel tegen filters, veranderingen in vernieuwingsfrequentie, compressie of toeters en bellen. Video's gegenereerd door Ik begrijp het Hulpmiddelen als VideoFX verwerken deze markering al tijdens het maken, waardoor het risico op onbedoelde verwijdering bij latere bewerkingen wordt verkleind.

Exclusieve inhoud - Klik hier  Hoe foto's te groeperen in Google Documenten

Bemonsteringsalgoritmen en robuustheid van de tekstzegel

Het hart van SynthID Text is zijn bemonsteringsalgoritme, waarbij een sleutel (of set sleutels) wordt gebruikt om pseudo-willekeurige scores toe te kennen aan elk potentieel token. Kandidaten worden geselecteerd uit de verdeling van het model (na Top-K/Top-P) en na eliminatierondes in een "competitie" geplaatst, totdat het token met de hoogste score is gekozen volgens de functie g.

Deze selectieprocedure bevoordeelt de definitief statistisch patroon van de waarschijnlijkheden dragen het merkteken van het merk, maar zonder onnatuurlijke opties te forceren. Volgens gepubliceerde studies maakt de techniek het moeilijk wissen, vervalsen of omkeren het zegel, altijd binnen redelijke grenzen tegen tegenstanders met tijd en motivatie.

Goede implementatie- en beveiligingspraktijken

  • Als u SynthID Text implementeert, behandel de configuratie dan als productiegeheim: Bewaar sleutels en seeds in een veilige manager, handhaaf toegangscontrole en sta periodieke rotatie toe. Het voorkomen van lekken verkleint het aanvalsoppervlak tegen reverse engineering-pogingen.
  • Ontwerp een plan toezicht houden voor uw detector: registreer vals-positieve/-negatieve percentages, pas drempels aan op basis van de context en bepaal uw detectiebeleid blootstelling (privé, semi-privé via API of openbaar) met duidelijke juridische en operationele criteria. En als meerdere modellen een tokenizer delen, overweeg dan om een gemeenschappelijke detector met voorbeelden van alle onderdelen om het onderhoud te vereenvoudigen.
  • Op het prestatieniveau wordt de impact van sampling_table_size in geheugen en latentie, en kies een ngram_len die uw tolerantie voor bewerkingen in evenwicht brengt met de behoefte aan betrouwbare detectie. Vergeet niet om herhaalde n-grammen uit te sluiten (via context_history_size) om het signaal in vloeiende tekst te verbeteren.

SynthID is geen wondermiddel tegen desinformatie, maar biedt een fundamentele bouwsteen voor het heropbouwen van de vertrouwensketen in het tijdperk van generatieve AI. Door herkomstsignalen in te bedden in tekst, afbeeldingen, audio en video en het tekstcomponent open te stellen voor de community, draagt ​​Google DeepMind bij aan een toekomst waarin authenticiteit op een praktische, meetbare en vooral compatibele manier kan worden gecontroleerd op de creativiteit en kwaliteit van de content.