- SynthID fellur ógreinanleg vatnsmerki inn í texta, myndir, hljóð og myndbönd til að bera kennsl á efni sem er búið til með gervigreind.
- Í texta virkar það sem logit örgjörvi með lyklum og n-grömmum, með Bayesískri greiningu sem hægt er að stilla með þröskuldum.
- Útfærslan er fáanleg í Transformers 4.46.0+, með opinberu Space og tilvísun á GitHub.
- Það hefur takmarkanir (stuttir textar, þýðingar, endurskrifanir) en styrkir gagnsæi og rekjanleika.
Tilkoma gervigreindar hefur aukið framleiðslu mynda, texta, hljóðs og myndbanda á mælikvarða sem aldrei hefur sést áður, og með henni hafa efasemdir um uppruna þeirra aukist; í þessu samhengi, Greina hvort efni hefur verið búið til eða breytt af líkani verður lykillinn að stafrænu trausti. SynthID getur verið frábær lausn.
Þetta er tillaga Google DeepMind, fjölskylda „ósýnilegra“ vatnsmerkjatækni sem eru felld beint inn í efni sem er búið til með gervigreind til að auðvelda síðari staðfestingu án þess að það skerði gæðin sem menn skynja.
Hvað er SynthID og til hvers er það ætlað?
Google lýsir SynthID sem tóli fyrir sérstakt vatnsmerki fyrir efni sem búið er til með gervigreind, hannað til að stuðla að gagnsæi og rekjanleika. Það er ekki takmarkað við eitt snið: það nær yfir myndir, hljóð, texta og myndbönd, þannig að hægt sé að beita einni tæknilegri nálgun á mismunandi gerðir miðla.
Í vistkerfi Google er það þegar notað á nokkra vegu:
- Í texta, fáninn á við um svör frá Gemini.
- Í hljóði, er notað með Lyria líkaninu og með eiginleikum eins og að búa til hlaðvörp úr texta í Notebook LM.
- En vídeó, er samþætt í Veo sköpunarverk, líkanið sem getur búið til myndskeið í 1080p.
Í öllum tilvikum er vatnsmerki Það er óáberandi og hefur verið hannað til að þola tíðar breytingar eins og þjöppun, taktbreytingar í hljóð- eða myndklippum, án þess að skerða gæði.
Fyrir utan tæknina er hagnýtt markmið hennar skýrt: hjálpa til við að greina á milli tilbúins efnis og þess sem framleitt er án gervigreindar, svo að notendur, fjölmiðlar og stofnanir geti tekið upplýstar ákvarðanir um neyslu og dreifingu efnis.

Hvernig vatnsmerki textans (SynthID Text) virkar
Í reynd virkar SynthID Text sem Logit örgjörvi sem tengist við myndunarferlið fyrir tungumálalíkanið eftir venjulegu úrtökusíurnar (Top-K og Top-P). Þessi örgjörvi breytir líkanstigunum lúmskt með sýndarhandahófsfall g, að kóða upplýsingar í líkindamynstri án þess að fella sýnilegar skemmdir á stíl eða gæðum textans.
Niðurstaðan er texti sem við fyrstu sýn heldur fram á gæði, nákvæmni og flæði, en sem inniheldur tölfræðilega uppbyggingu sem þjálfaður sannprófandi getur greint.
Til að búa til texta með vatnsmerki er ekki nauðsynlegt endurþjálfa líkanið: einfaldlega gefðu upp stillingu fyrir aðferðina .generate() og virkja innskráningarvinnslu SynthID Text. Þetta einfaldar innleiðingu og gerir kleift að prófa með þegar uppsettum líkönum.
Vatnsmerkisstillingarnar innihalda tvær nauðsynlegar breytur: keys y ngram_len. Lyklarnir eru listi af einstökum, handahófskenndum heiltölum sem notaðar eru til að gefa orðaforðanum einkunn með g-fallinu; lengd þess lista stýrir því hversu mörg „lög“ af vatnsmerki eru notuð. Á sama tíma, ngram_len Setur jafnvægið á milli greinanleika og seiglu gagnvart umbreytingum: hærri gildi auðvelda greiningu en gera innsiglið viðkvæmara fyrir breytingum; gildið 5 virkar vel sem upphafspunktur.
Að auki notar SynthID Text sýnatökutafla með tveimur eiginleikum: sampling_table_size y sampling_table_seedMælt er með að fallið g hegði sér stöðugt og óhlutdrægt við úrtöku, að teknu tilliti til þess að Stærri stærð þýðir meira minni við ályktun. Fræið getur verið hvaða heiltala sem er, sem auðveldar endurtekningarhæfni í matsumhverfi.
Það er mikilvægt smáatriði til að bæta merkið: endurteknar n-grömm innan nýlegrar sögu samhengisins (skilgreint með context_history_size) eru ekki merktar, sem eykur greinileika merkisins í restinni af textanum og dregur úr fölskum jákvæðum niðurstöðum sem tengjast náttúrulegum endurtekningum tungumálsins.
Til öryggis, hver vatnsmerkisstilling (þar með talið lyklar, fræ og breytur) verður að geyma í einrúmiEf þessir lyklar leka út gætu þriðju aðilar auðveldlega afritað vörumerkið eða, enn verra, reynt að stjórna því með fullri vitneskju um uppbyggingu þess.
Hvernig á að greina: líkindafræðileg staðfesting með þröskuldum
Staðfesting vatnsmerkis í texta er ekki tvíundarleg, heldur líkindafræðiGoogle birtir Bayesískan mæli bæði á Transformers og GitHub sem, eftir að hafa greint tölfræðilegt mynstur textans, skilar þremur mögulegum stöðum: með vörumerki, ekkert vörumerki o óvissÞessi þríþætta úttak gerir kleift að aðlaga aðgerðina að mismunandi áhættu- og villuþolssamhengi.
Hegðun sannprófarans er stillanleg með tveir þröskuldar sem stjórna tíðni falskra jákvæðra og falskra neikvæðra niðurstaðna. Með öðrum orðum, þú getur stillt hversu nákvæm þú vilt að greiningin sé, fórnað næmi fyrir nákvæmni eða öfugt eftir notkunartilviki, eitthvað sem er sérstaklega gagnlegt í ritstjórnarumhverfi, stjórnun eða innri endurskoðun.
Ef nokkrar gerðir deila sama táknmyndari, getur einnig deilt Sama vörumerkisstilling og sami skynjari, svo framarlega sem þjálfunarsett sannprófandans inniheldur dæmi um þau öll. Þetta auðveldar að búa til „sameiginleg vatnsmerki“ í stofnunum með mörg lögfræðinámskeið.
Þegar skynjarinn hefur verið þjálfaður geta stofnanir ákveðið útsetningarstig hans: haldið honum algjörlega einkamál, bjóða það upp á einhvern hátt hálf-einkarétt í gegnum API, eða gefa það út á þann hátt opinber til niðurhals og notkunar fyrir þriðja aðila. Valið fer eftir rekstrargetu innviða hvers aðila, eftirlitsáhættu og gagnsæisstefnu.

Vatnsmerki á myndum, hljóði og myndböndum
Þetta vörumerki er hannað til að endast algengar umbreytingar eins og að klippa, breyta stærð, snúa, breyta lit eða jafnvel taka skjáskot, án þess að þurfa að geyma lýsigögn. Upphaflega var notkun þess boðin í gegnum Mynd í Vertex AI, þar sem notendur geta valið að virkja vatnsmerkið þegar þeir búa til efni.
Í hljóði er vörumerkið óheyrilegt og styður algengar aðgerðir eins og MP3 þjöppun, að bæta við hávaða eða að breyta spilunarhraða. Google samþættir það í Lýría og í eiginleikum sem byggja á Notebook LM, sem eykur merkið jafnvel þegar skráin fer í gegnum tapsstrauma fyrir útgáfu.
Í myndbandi endurtekur aðferðin ímyndaraðferðina: vörumerkið er innbyggt í pixlar hvers ramma, ómerkjanlega, og helst stöðugt gagnvart síum, breytingum á endurnýjunartíðni, þjöppun eða kvartarMyndbönd búin til af Ég sé Tól eins og VideoFX nota þetta merki við gerð myndarinnar, sem dregur úr hættu á óvart eyðingu í síðari breytingum.
Úrtaksreiknirit og áreiðanleiki textainnsiglisins
Hjarta SynthID Text er þess sýnatökualgrím, sem notar lykil (eða lyklasett) til að úthluta sýndarhandahófskenndum stigum til hvers mögulegs tákns. Frambjóðendur eru dregnir úr dreifingu líkansins (eftir Top-K/Top-P) og settir í „keppni“ eftir útsláttarumferðir, þar til táknið með hæstu stigin er valið samkvæmt fallinu g.
Þessi valferli er í hag þess að lokatölfræðilegt mynstur af líkunum bera merki vörumerkisins, en án þess að þvinga fram óeðlilega valkosti. Samkvæmt birtum rannsóknum gerir þessi tækni það erfitt eyða, falsa eða snúa við innsiglið, alltaf innan eðlilegra marka gegn andstæðingum með tíma og hvatningu.
Góð framkvæmd og öryggisvenjur
- Ef þú ert að setja upp SynthID texta skaltu meðhöndla stillingarnar sem framleiðsluleyndarmálGeymið lykla og fræ í öruggum stjórnanda, framfylgið aðgangsstýringum og leyfið reglubundna skiptingu. Að koma í veg fyrir leka minnkar árásarflötinn gegn tilraunum til öfugrar verkfræði.
- Hannaðu áætlun eftirlit fyrir skynjarann þinn: skráðu falskt jákvætt/neikvæð tíðni, aðlagaðu þröskulda eftir samhengi og ákveddu skynjunarstefnu þína útsetningu (einkafyrirtæki, hálfeinkafyrirtæki í gegnum API eða opinbert) með skýrum lagalegum og rekstrarlegum skilyrðum. Og ef margar gerðir deila táknara, íhugaðu að þjálfa a sameiginlegur skynjari með dæmum um þau öll til að einfalda viðhald.
- Á frammistöðustigi metur það áhrifin af
sampling_table_sizeí minni og seinkun, og veldu angram_lensem vegur á móti umburðarlyndi þínu fyrir breytingum og þörfinni fyrir áreiðanlega greiningu. Mundu að útiloka endurteknar n-grömm (í gegnumcontext_history_size) til að bæta merkið í flæðandi texta.
SynthID er ekki lausn gegn rangfærslum, en veitir grundvallareiningu til að endurbyggja traustkeðjuna á tímum skapandi gervigreindar. Með því að fella upprunamerki inn í texta, myndir, hljóð og myndbönd, og opna textaþáttinn fyrir samfélaginu, stefnir Google DeepMind að framtíð þar sem hægt er að endurskoða áreiðanleika á hagnýtan, mælanlegan og umfram allt samhæfan hátt við sköpunargáfu og gæði efnis.
Ritstjóri sérhæfður í tækni- og netmálum með meira en tíu ára reynslu í mismunandi stafrænum miðlum. Ég hef starfað sem ritstjóri og efnishöfundur fyrir rafræn viðskipti, samskipti, markaðssetningu á netinu og auglýsingafyrirtæki. Ég hef einnig skrifað á vefsíður hagfræði, fjármála og annarra geira. Vinnan mín er líka ástríða mín. Nú, í gegnum greinar mínar í Tecnobits, Ég reyni að kanna allar fréttir og ný tækifæri sem tækniheimurinn býður okkur á hverjum degi til að bæta líf okkar.