SynthID: kuidas Google vesimärke tekstile, piltidele, helile ja videole lisab

SynthID lisab teksti, piltidesse, helisse ja videosse märkamatuid vesimärke, et tuvastada tehisintellekti loodud sisu.
Tekstis toimib see logitprotsessorina, millel on võtmed ja n-grammid, kusjuures Bayesi tuvastamist saab läviväärtuste abil konfigureerida.
Rakendus on saadaval Transformers 4.46.0+ versioonis, ametliku Space'i ja viitega GitHubis.
Sellel on piirangud (lühikesed tekstid, tõlked, ümberkirjutused), kuid see tugevdab läbipaistvust ja jälgitavust.

Generatiivse tehisintellekti teke on suurendanud piltide, tekstide, helisalvestiste ja videote tootmist enneolematus ulatuses ning koos sellega on kasvanud kahtlused nende päritolu osas; selles kontekstis Tuvastage, kas sisu on loodud või muudetud mudeli abil muutub digitaalse usalduse võtmeks. SynthID võib olla suurepärane lahendus.

See on Google DeepMindi ettepanek "nähtamatute" vesimärgitehnikate perekond mis on otse tehisintellekti loodud sisusse sisse põimitud, et hõlbustada hilisemat kontrollimist ilma inimeste poolt tajutavat kvaliteeti halvendamata.

Mis on SynthID ja milleks see mõeldud on?

Google kirjeldab SynthID-d kui tööriista, mis on mõeldud tehisintellekti loodud sisu spetsiifiline vesimärk, mis on loodud läbipaistvuse ja jälgitavuse edendamiseks. See ei piirdu ühe vorminguga: see hõlmab pilte, heli, teksti ja videot, nii et ühte tehnilist lähenemisviisi saab rakendada erinevat tüüpi meediale.

Google'i ökosüsteemis kasutatakse seda juba mitmel viisil:

Tekstis, lipp kehtib Kaksikute vastuste kohta.
Helis, kasutatakse Lyria mudeli ja selliste funktsioonidega nagu taskuhäälingusaadete loomine tekstist Notebook LM-is.
En video, on integreeritud Veo loomingusse, mudel, mis on võimeline genereerima klippe 1080p resolutsiooniga.

Kõigil juhtudel vesimärk See on märkamatu ja loodud selleks, et taluma sagedasi muudatusi näiteks tihendamine, rütmimuutused heli- või videolõikudes, ilma kvaliteeti vähendamata.

Lisaks tehnoloogiale on selle praktiline eesmärk selge: aidata eristada sünteetilist materjali tehisintellektita toodetud materjalist, et kasutajad, meedia ja institutsioonid saaksid teha teadlikke otsuseid sisu tarbimise ja levitamise kohta.

sünteesi ID

Kuidas tekstivesimärk (SynthID Text) töötab

Praktikas toimib SynthID Text järgmiselt: Logiti protsessor mis lülitub keelemudeli genereerimise torujuhtmesse pärast tavapäraseid valimifiltreid (Top-K ja Top-P). See protsessor muudab mudeli skoori peenelt a-ga pseudojuhuslik funktsioon g, kodeerides teavet tõenäosuste mustri järgi ilma teksti stiili või kvaliteeti nähtavaid artefakte lisamata.

Eksklusiivne sisu – klõpsake siin Canva slaidide kasutamine teenuses Google Slides

Tulemuseks on tekst, mis esmapilgul säilitab kvaliteet, täpsus ja sujuvus, kuid mis sisaldab statistilist struktuuri, mida on võimalik tuvastada koolitatud kontrollijaga.

Vesimärgiga teksti genereerimine pole vajalik mudeli ümberõpetamine: lihtsalt esitage meetodile konfiguratsioon .generate() ja aktiveerida SynthID Texti logiprotsessor. See lihtsustab kasutuselevõttu ja võimaldab testida juba juurutatud mudelitega.

Vesimärgi seaded sisaldavad kahte olulist parameetrit: keys y ngram_len. Võtmed on unikaalsete, juhuslike täisarvude loend, mida kasutatakse sõnavara hindamiseks funktsiooni g abil; selle loendi pikkus määrab, mitu vesimärgi "kihti" rakendatakse. Samal ajal ngram_len Määrab tasakaalu tuvastatavuse ja transformatsioonide vastupidavuse vahel: kõrgemad väärtused muudavad tuvastamise lihtsamaks, kuid muudavad plommi muutuste suhtes haavatavamaks; väärtus 5 sobib hästi alguspunktiks.

Lisaks kasutab SynthID Text a proovivõtulaud kahe omadusega: sampling_table_size y sampling_table_seedSoovitatav suurus on vähemalt 2^16, et tagada funktsiooni g stabiilne ja erapooletu käitumine valimi võtmisel, võttes arvesse, et suurem suurus tähendab rohkem mälu Järeldamise ajal. Seeme võib olla mis tahes täisarv, mis hõlbustab reprodutseeritavust hindamiskeskkondades.

Signaali parandamiseks on oluline nüanss: korduvad n-grammid konteksti hiljutises ajaloos (määratletud kui context_history_size) ei ole märgistatud, mis soodustab märgi tuvastatavust ülejäänud tekstis ja vähendab keele loomulike kordustega seotud valepositiivseid tulemusi.

Turvalisuse huvides iga vesimärgi konfiguratsioon (sh selle võtmed, algandmed ja parameetrid) tuleb privaatselt hoiustadaKui need võtmed lekivad, saavad kolmandad osapooled brändi hõlpsalt kopeerida või, mis veelgi hullem, proovida seda manipuleerida, olles selle struktuurist täielikult teadlik.

Eksklusiivne sisu – klõpsake siin Kuidas Google'i esitluses videot korrata

Kuidas tuvastada: tõenäosuslik verifitseerimine läviväärtustega

Tekstis oleva vesimärgi kontrollimine ei ole binaarne, vaid tõenäosuslikGoogle avaldab nii Transformersis kui ka GitHubis Bayesi detektori, mis pärast teksti statistilise mustri analüüsimist tagastab kolm võimalikku olekut: brändiga, pole brändi o ebakindelSee kolmekomponentne väljund võimaldab operatsiooni kohandada vastavalt erinevatele riski- ja veataluvuse kontekstidele.

Kontrollija käitumist saab konfigureerida järgmiselt: kaks lävendit mis kontrollivad valepositiivsete ja valenegatiivsete tulemuste määra. Teisisõnu, saate kalibreerida tuvastamise rangust, ohverdades tundlikkust täpsuse nimel või vastupidi, olenevalt teie kasutusjuhtumist, mis on eriti kasulik toimetuskeskkonnad, modereerimine või siseaudit.

Kui mitmel mudelil on sama tokenisaator, saab jagada ka sama kaubamärgi konfiguratsioon ja sama detektor, kui kontrollija koolituskomplekt sisaldab kõigi nende näiteid. See lihtsustab "ühiste vesimärkide" loomist organisatsioonides, kus on mitu õigusteaduse magister (LLM).

Kui detektor on treenitud, saavad organisatsioonid otsustada selle kokkupuute taseme üle: hoida seda täiesti privaatne, paku seda mingil moel poolprivaatne API kaudu või avaldada see viisil avalik allalaadimiseks ja kolmandate isikute poolt kasutamiseks. Valik sõltub iga üksuse infrastruktuuri tegevusvõimsusest, regulatiivsetest riskidest ja läbipaistvusstrateegiast.

Vesimärk piltidel, helil ja videol

See bränd on loodud kestma tavalised transformatsioonid näiteks kärpimine, suuruse muutmine, pööramine, värvi muutmine või isegi ekraanipiltide tegemine ilma metaandmeid säilitamata. Algselt pakuti selle kasutamist läbi Pilt Vertex AI-s, kus kasutajad saavad sisu loomisel vesimärgi aktiveerida.

Helis on bränd kuuldamatu ja toetab tavalisi toiminguid, nagu MP3-de tihendamine, müra lisamine või taasesituse kiiruse muutmine. Google integreerib selle Lüüria ja Notebook LM-põhistes funktsioonides võimendatakse signaali isegi siis, kui fail läbib kadudega avaldamisvooge.

Videos korratakse lähenemist kuvandile: bränd on sisse põimitud iga kaadri pikslidmärkamatult ja jääb stabiilseks filtrite, värskendussageduse, tihendamise või muude tegurite suhtes. kaunistusedVideod on loodud Ma näen Tööriistad nagu VideoFX lisavad selle märgi loomisel, vähendades juhusliku kustutamise ohtu järgnevatel redigeerimistel.

Eksklusiivne sisu – klõpsake siin Parimad tehisintellektiga loodud mängud, mida saate kohe proovida

Valimi moodustamise algoritmid ja tekstitihendi robustsus

SynthID Texti süda on selle valimi algoritm, mis kasutab võtit (või võtmete komplekti), et määrata igale potentsiaalsele märgile pseudojuhuslikud skoorid. Kandidaadid loositakse mudeli jaotusest (pärast Top-K/Top-P) ja pannakse pärast väljalangemisringe "võistlusele", kuni funktsiooni g kohaselt valitakse kõrgeima skooriga märk.

See valikumenetlus soosib lõplik statistiline muster tõenäosustest kannavad brändi märki, kuid ilma ebaloomulikke valikuid sundimata. Avaldatud uuringute kohaselt muudab see tehnika keeruliseks kustutada, võltsida või ümber pöörata pitser, alati mõistlike piiride piires vastaste vastu, kellel on aega ja motivatsiooni.

Head juurutamis- ja turvatavad

SynthID Texti juurutamisel käsitlege konfiguratsiooni järgmiselt tootmissaladusHoidke võtmeid ja seemneid turvalises halduris, jõustage juurdepääsukontrollid ja lubage perioodilist rotatsiooni. Lekete vältimine vähendab rünnakupinda pöördprojekteerimise katsete vastu.
Koostage plaan jälgimine detektori jaoks: salvestage valepositiivsete/-negatiivsete tulemuste määr, kohandage läviväärtusi vastavalt kontekstile ja määrake oma tuvastuspoliitika säritus (privaatne, poolprivaatne API kaudu või avalik) selgete juriidiliste ja operatiivsete kriteeriumidega. Ja kui mitu mudelit jagavad tokenisaatorit, kaaluge a-tokenisaatori treenimist tavaline detektor koos kõigi näidetega hoolduse lihtsustamiseks.
Tulemuslikkuse tasandil hinnatakse selle mõju sampling_table_size mälu ja latentsuse osas ning valige a ngram_len mis tasakaalustab teie muudatuste taluvuse usaldusväärse tuvastamise vajadusega. Pidage meeles, et tuleb välistada korduvad n-grammid (via context_history_size) voolava teksti signaali parandamiseks.

SynthID ei ole küll imerohi väärinfo vastu, aga pakub olulise aluse usaldusahela taastamiseks generatiivse tehisintellekti ajastul. Lisades päritolumärke teksti, piltidesse, helisse ja videosse ning avades tekstikomponendi kogukonnale, liigub Google DeepMind tuleviku poole, kus autentsust saab auditeerida praktiliselt, mõõdetavalt ja ennekõike sisu loovuse ja kvaliteediga kooskõlas oleval viisil.

Daniel Terrasa

Toimetaja on spetsialiseerunud tehnoloogiale ja internetiprobleemidele, omades rohkem kui kümneaastast kogemust erinevates digitaalsetes meediates. Olen töötanud toimetajana ja sisuloojana e-kaubanduse, kommunikatsiooni, veebiturunduse ja reklaamiettevõtetes. Olen kirjutanud ka majanduse, rahanduse ja teiste sektorite veebisaitidele. Minu töö on ka minu kirg. Nüüd minu artiklite kaudu Tecnobits, püüan uurida kõiki uudiseid ja uusi võimalusi, mida tehnoloogiamaailm meile iga päev oma elu parandamiseks pakub.