Kaj je SynthID, vodni žig umetne inteligence?

Zadnja posodobitev: 01.02.2024

  • SynthID v besedilo, slike, zvok in video vdela neopazne vodne žige za prepoznavanje vsebine, ustvarjene z umetno inteligenco.
  • V besedilu deluje kot logit procesor s ključi in n-grami, z Bayesovim zaznavanjem, ki ga je mogoče konfigurirati s pragovi.
  • Implementacija je na voljo v Transformers 4.46.0+, z uradnim prostorom in referenco na GitHubu.
  • Ima omejitve (kratka besedila, prevodi, predelave), vendar krepi preglednost in sledljivost.
Vodni žig SynthID

Pojav generativne umetne inteligence je spodbudil produkcijo slik, besedil, zvoka in videoposnetkov v obsegu, kakršnega še nismo videli, in s tem so se povečali dvomi o njihovem izvoru; v tem kontekstu, Ugotovite, ali je model ustvaril ali spremenil vsebino postane ključ do digitalnega zaupanja. SynthID je lahko odlična rešitev.

To je predlog podjetja Google DeepMind. družina tehnik "nevidnega" vodnega žiga ki so vdelani neposredno v vsebino, ki jo ustvari umetna inteligenca, da bi olajšali naknadno preverjanje, ne da bi pri tem poslabšali kakovost, ki jo zaznavajo ljudje.

Kaj je SynthID in čemu je namenjen?

Google opisuje SynthID kot orodje za poseben vodni žig za vsebino, ustvarjeno z umetno inteligenco, zasnovan za spodbujanje preglednosti in sledljivosti. Ni omejen na eno samo obliko: zajema slike, zvok, besedilo in video, tako da se lahko en sam tehnični pristop uporabi za različne vrste medijev.

V Googlovem ekosistemu se že uporablja na več načinov:

  • V besedilu, zastavica velja za odgovore Gemini.
  • V zvoku, se uporablja z modelom Lyria in s funkcijami, kot je ustvarjanje podkastov iz besedila v Notebook LM.
  • En videoposnetek, je integriran v Veo creations, model, ki lahko ustvarja posnetke v ločljivosti 1080p.

V vseh primerih vodni žig Je neopazen in zasnovan tako, da prenese pogoste spremembe kot so kompresija, spremembe ritma v zvočnih ali video rezih, brez zmanjšanja kakovosti.

Poleg tehnologije je njen praktični cilj jasen: pomagajo razlikovati sintetične materiale od tistih, proizvedenih brez umetne inteligence, da se lahko uporabniki, mediji in institucije informirano odločajo o porabi in distribuciji vsebin.

synthID

Kako deluje besedilni vodni žig (SynthID Text)

V praksi SynthID Text deluje kot logitni procesor ki se po običajnih filtrih vzorčenja (Top-K in Top-P) poveže s cevovodom za generiranje jezikovnega modela. Ta procesor subtilno spreminja rezultate modela z psevdonaključna funkcija g, kodiranje informacij v vzorcu verjetnosti brez vnašanja vidnih artefaktov v slog ali kakovost besedila.

Ekskluzivna vsebina - Kliknite tukaj  Starlink v Iranu: Satelitska povezljivost kljubuje izpadom interneta po izraelskih napadih

Rezultat je besedilo, ki na prvi pogled ohranja kakovost, natančnost in pretočnost, vendar ki vključuje statistično strukturo, ki jo je mogoče zaznati z usposobljenim preveriteljem.

Za ustvarjanje besedila z vodnim žigom ni potrebno preusposobiti model: preprosto navedite konfiguracijo metode .generate() in aktivirajte logit procesor SynthID Text. To poenostavi uvedbo in omogoči testiranje z že nameščenimi modeli.

Nastavitve vodnega žiga vključujejo dva bistvena parametra: keys y ngram_len. Ključi je seznam edinstvenih, naključnih celih števil, ki se uporabljajo za točkovanje besedišča z uporabo funkcije g; dolžina tega seznama nadzoruje, koliko "plasti" vodnega žiga se uporabi. Medtem, ngram_len Določa ravnovesje med zaznavnostjo in robustnostjo transformacij: višje vrednosti olajšajo zaznavanje, vendar naredijo pečat bolj ranljiv za spremembe; vrednost 5 se dobro obnese kot izhodišče.

Poleg tega SynthID Text uporablja vzorčna tabela z dvema lastnostma: sampling_table_size y sampling_table_seedPriporočljiva je velikost vsaj 2^16, da se zagotovi stabilno in nepristransko delovanje funkcije g pri vzorčenju, pri čemer se upošteva, da večja velikost pomeni več pomnilnika med sklepanjem. Seme je lahko katero koli celo število, kar olajša ponovljivost v okoljih ocenjevanja.

Za izboljšanje signala je pomemben odtenek: ponavljajoči se n-grami v nedavni zgodovini konteksta (opredeljenega z context_history_size) niso označeni, kar spodbuja zaznavnost oznake v preostalem besedilu in zmanjšuje lažno pozitivne rezultate, povezane z naravnimi ponovitvami jezika.

Zaradi varnosti je vsaka konfiguracija vodnega žiga (vključno s ključi, semenom in parametri) mora biti shranjeno zasebnoČe bi ti ključi ušli v javnost, bi lahko tretje osebe zlahka replicirale blagovno znamko ali, še huje, poskušale manipulirati z njo s popolnim poznavanjem njene strukture.

Ekskluzivna vsebina - Kliknite tukaj  Goldeno: Atomsko debele zlate plošče revolucionirajo tehnologijo

Kako zaznati: verjetnostno preverjanje s pragovi

Preverjanje vodnega žiga v besedilu ni binarno, ampak verjetnostniGoogle objavlja Bayesov detektor tako na Transformerjih kot na GitHubu, ki po analizi statističnega vzorca besedila vrne tri možna stanja: blagovna znamka, brez blagovne znamke o negotovTa ternarni izhod omogoča prilagoditev delovanja različnim kontekstom tolerance tveganja in napak.

Obnašanje preveritelja je mogoče konfigurirati z dva praga ki nadzorujejo stopnjo lažno pozitivnih in lažno negativnih rezultatov. Z drugimi besedami, lahko kalibrirate, kako natančno želite zaznavanje, pri čemer žrtvujete občutljivost za natančnost ali obratno, odvisno od primera uporabe, kar je še posebej uporabno v uredniška okolja, moderiranje ali notranjo revizijo.

Če si več modelov deli isto tokenizer, lahko tudi deli ista konfiguracija znamke in isti detektor, če učni nabor preveritelja vključuje primere vseh. To olajša gradnjo "skupnih vodnih žigov" v organizacijah z več LLM-ji.

Ko je detektor usposobljen, se lahko organizacije odločijo o njegovi ravni izpostavljenosti: naj ostane popolnoma zasebno, ponudite ga na nek način polzasebno prek API-ja ali pa ga objavite na način javno za prenos in uporabo s strani tretjih oseb. Izbira je odvisna od operativne zmogljivosti infrastrukture posameznega subjekta, regulativnih tveganj in strategije preglednosti.

Tehnologija vodnega žiga umetne inteligence SynthID

Vodni žig na slikah, zvoku in videoposnetkih

Ta blagovna znamka je zasnovana tako, da traja pogoste transformacije kot so obrezovanje, spreminjanje velikosti, vrtenje, spreminjanje barve ali celo posnetki zaslona, ​​brez potrebe po ohranjanju metapodatkov. Sprva je bila njegova uporaba na voljo prek Slika v Vertex AI, kjer lahko uporabniki izberejo aktivacijo vodnega žiga pri ustvarjanju vsebine.

V avdio industriji je blagovna znamka neslišno in podpira običajne operacije, kot so stiskanje MP3, dodajanje šuma ali spreminjanje hitrosti predvajanja. Google ga integrira v Lirija in v funkcijah, ki temeljijo na Notebook LM, krepitev signala tudi, ko datoteka prehaja skozi izgubne objavljalske tokove.

V videoposnetku pristop ponavlja slikovni pristop: blagovna znamka je vpeta v slikovnih pik vsakega okvirja, neopazno in ostane stabilen glede na filtre, spremembe hitrosti osveževanja, kompresijo ali kosiVideoposnetki, ki jih je ustvaril Vidim Orodja, kot je VideoFX, to oznako vključijo med ustvarjanjem, kar zmanjša tveganje nenamernega brisanja pri poznejših urejanjih.

Ekskluzivna vsebina - Kliknite tukaj  Kako priložiti zvok Googlovim predstavitvam v španščini

Algoritmi vzorčenja in robustnost besedilnega pečata

Srce SynthID Text je njegovo algoritem vzorčenja, ki uporablja ključ (ali niz ključev) za dodelitev psevdonaključnih rezultatov vsakemu potencialnemu žetonu. Kandidati so izžrebani iz porazdelitve modela (po Top-K/Top-P) in po izločilnih krogih postavljeni v "tekmovanje", dokler ni izbran žeton z najvišjim rezultatom v skladu s funkcijo g.

Ta izbirni postopek daje prednost končni statistični vzorec verjetnosti nosijo pečat blagovne znamke, vendar brez vsiljevanja nenaravnih možnosti. Glede na objavljene študije tehnika otežuje izbrisati, ponarediti ali obrniti pečat, vedno v razumnih mejah proti nasprotnikom s časom in motivacijo.

Dobre prakse izvajanja in varnosti

  • Če uvajate SynthID Text, konfiguracijo obravnavajte kot proizvodna skrivnostShranjevanje ključev in semen v varnem upravitelju, uveljavljanje nadzora dostopa in omogočanje periodične rotacije. Preprečevanje uhajanja podatkov zmanjšuje površino za napade proti poskusom obratnega inženiringa.
  • Oblikujte načrt za spremljanje za vaš detektor: zabeležite stopnje lažno pozitivnih/negativnih rezultatov, prilagodite pragove glede na kontekst in določite svojo politiko zaznavanja izpostavljenost (zasebno, polzasebno prek API-ja ali javno) z jasnimi pravnimi in operativnimi merili. In če si več modelov deli tokenizer, razmislite o usposabljanju skupni detektor s primeri vseh za poenostavitev vzdrževanja.
  • Na ravni uspešnosti ocenjuje vpliv sampling_table_size v spominu in latenci ter izberite ngram_len ki uravnoteži vašo toleranco do urejanj s potrebo po zanesljivem zaznavanju. Ne pozabite izključiti ponavljajočih se n-gramov (prek context_history_size) za izboljšanje signala v tekočem besedilu.

SynthID ni čarobno zdravilo proti dezinformacijam, ampak zagotavlja temeljni gradnik za obnovo verige zaupanja v dobi generativne umetne inteligence. Z vdelavo signalov o izvoru v besedilo, slike, zvok in video ter z odpiranjem besedilne komponente skupnosti si Google DeepMind prizadeva za prihodnost, kjer je mogoče avtentičnost preverjati na praktičen, merljiv in predvsem združljiv način z ustvarjalnostjo in kakovostjo vsebine.