- Mae SynthID yn ymgorffori dyfrnodau anweledig mewn testun, delweddau, sain a fideo i adnabod cynnwys a gynhyrchir gan AI.
- Mewn testun mae'n gweithredu fel prosesydd logit gydag allweddi ac n-gramau, gyda chanfod Bayesaidd y gellir ei ffurfweddu gan drothwyon.
- Mae'r gweithrediad ar gael yn Transformers 4.46.0+, gyda Space swyddogol a chyfeirnod ar GitHub.
- Mae ganddo gyfyngiadau (testunau byr, cyfieithiadau, ailysgrifennu) ond mae'n atgyfnerthu tryloywder ac olrheinedd.
Mae ymddangosiad deallusrwydd artiffisial cynhyrchiol wedi rhoi hwb i gynhyrchu delweddau, testunau, sain a fideos ar raddfa na welwyd erioed o'r blaen, a chyda hynny, mae amheuon ynghylch eu tarddiad wedi tyfu; yn y cyd-destun hwn, Nodwch a yw cynnwys wedi'i greu neu ei newid gan fodel yn dod yn allweddol i ymddiriedaeth ddigidol. SynthID gall fod yn ateb gwych.
Dyma gynnig Google DeepMind, a teulu o dechnegau dyfrnodi “anweledig” sydd wedi'u hymgorffori'n uniongyrchol mewn cynnwys a gynhyrchir gan AI i hwyluso gwirio dilynol heb ddirywio'r ansawdd a ganfyddir gan fodau dynol.
Beth yw SynthID a beth yw ei fwriad?
Mae Google yn disgrifio SynthID fel offeryn ar gyfer dyfrnod penodol ar gyfer cynnwys a gynhyrchwyd gan AI, wedi'i gynllunio i hyrwyddo tryloywder ac olrheinedd. Nid yw wedi'i gyfyngu i un fformat: mae'n cwmpasu delweddau, sain, testun a fideo, fel y gellir cymhwyso un dull technegol i wahanol fathau o gyfryngau.
Yn ecosystem Google mae eisoes yn cael ei ddefnyddio mewn sawl ffordd:
- Yn y testun, mae'r faner yn berthnasol i ymatebion Gemini.
- En audio, yn cael ei ddefnyddio gyda'r model Lyria a chyda nodweddion fel creu podlediadau o destun yn Notebook LM.
- En fideo, wedi'i integreiddio i greadigaethau Veo, y model sy'n gallu cynhyrchu clipiau mewn 1080p.
En todos los casos la dyfrnod Mae'n anweledig, ac mae wedi'i gynllunio i gwrthsefyll addasiadau mynych megis cywasgu, newidiadau rhythm mewn toriadau sain neu fideo, heb leihau ansawdd.
Y tu hwnt i'r dechnoleg, mae ei amcan ymarferol yn glir: helpu i wahaniaethu rhwng deunydd synthetig a deunydd a gynhyrchwyd heb AI, fel y gall defnyddwyr, y cyfryngau a sefydliadau wneud penderfyniadau gwybodus ynglŷn â defnyddio a dosbarthu cynnwys.

Sut mae'r dyfrnod testun (SynthID Text) yn gweithio
Yn ymarferol, mae Testun SynthID yn gweithredu fel prosesydd logit sy'n cysylltu â'r biblinell gynhyrchu model iaith ar ôl yr hidlwyr samplu arferol (Top-K a Top-P). Mae'r prosesydd hwn yn addasu sgoriau'r model yn gynnil gyda ffwythiant ffug-ar hap g, amgodio gwybodaeth ym mhatrwm tebygolrwyddau heb gyflwyno arteffactau gweladwy i arddull nac ansawdd y testun.
Y canlyniad yw testun sydd, ar yr olwg gyntaf, yn cynnal ansawdd, cywirdeb a hylifedd, ond sy'n ymgorffori strwythur ystadegol y gellir ei ganfod gyda gwiriwr hyfforddedig.
I gynhyrchu testun gyda dyfrnod nid oes angen ailhyfforddi'r model: dim ond darparu ffurfweddiad i'r dull .generate() ac actifadu prosesydd logit SynthID Text. Mae hyn yn symleiddio mabwysiadu ac yn caniatáu profi gyda modelau sydd eisoes wedi'u defnyddio.
Mae'r gosodiadau dyfrnod yn cynnwys dau baramedr hanfodol: keys y ngram_len. Yr allweddi yn rhestr o gyfanrifau unigryw, ar hap a ddefnyddir i sgorio'r geirfa gan ddefnyddio'r ffwythiant g; mae hyd y rhestr honno'n rheoli faint o "haenau" o ddyfrnodi sy'n cael eu rhoi. Yn y cyfamser, ngram_len Yn gosod y cydbwysedd rhwng canfyddadwyedd a chadernid i drawsffurfiadau: mae gwerthoedd uwch yn gwneud canfod yn haws ond yn gwneud y sêl yn fwy agored i newidiadau; mae gwerth o 5 yn gweithio'n dda fel man cychwyn.
Yn ogystal, mae SynthID Text yn defnyddio a tabl samplu gyda dau briodwedd: sampling_table_size y sampling_table_seedArgymhellir maint o leiaf 2^16 i sicrhau bod y ffwythiant g yn ymddwyn mewn modd sefydlog a diduedd wrth samplu, gan ystyried bod mae maint mwy yn golygu mwy o gof yn ystod casgliad. Gall yr had fod yn unrhyw gyfanrif, sy'n hwyluso atgynhyrchadwyedd mewn amgylcheddau gwerthuso.
Mae naws bwysig i wella'r signal: n-gramau ailadroddus o fewn hanes diweddar y cyd-destun (a ddiffinnir gan context_history_size) heb eu marcio, sy'n ffafrio canfyddadwyedd y marc yng ngweddill y testun ac yn lleihau canlyniadau positif ffug sy'n gysylltiedig ag ailadroddiadau naturiol o'r iaith.
Er diogelwch, pob cyfluniad dyfrnod (gan gynnwys ei allweddi, had a pharamedrau) rhaid ei storio'n breifatOs caiff yr allweddi hyn eu gollwng, gallai trydydd partïon efelychu'r brand yn hawdd neu, yn waeth byth, geisio ei drin gyda gwybodaeth lawn am ei strwythur.
Sut i ganfod: gwirio tebygolrwydd gyda throthwyon
Nid yw gwirio dyfrnod mewn testun yn ddeuaidd, ond probabilísticaMae Google yn cyhoeddi synhwyrydd Bayesaidd ar Transformers a GitHub sydd, ar ôl dadansoddi patrwm ystadegol y testun, yn dychwelyd tri chyflwr posibl: con marca, heb frand o inciertoMae'r allbwn teiran hwn yn caniatáu i'r llawdriniaeth gael ei haddasu i wahanol gyd-destunau goddefgarwch risg a gwallau.
Mae ymddygiad y gwiriwr yn ffurfweddadwy gan dau drothwy sy'n rheoli cyfradd y canlyniadau positif ffug a'r canlyniadau negatif ffug. Mewn geiriau eraill, gallwch chi galibro pa mor llym rydych chi eisiau i'r canfod fod, gan aberthu sensitifrwydd er mwyn cywirdeb neu i'r gwrthwyneb yn dibynnu ar eich achos defnydd, rhywbeth sy'n arbennig o ddefnyddiol yn amgylcheddau golygyddol, cymedroli neu archwilio mewnol.
Os yw sawl model yn rhannu'r un peth tocynydd, gall hefyd rannu'r cyfluniad yr un brand a'r un synhwyrydd, cyn belled â bod set hyfforddi'r gwiriwr yn cynnwys enghreifftiau o bob un ohonynt. Mae hyn yn ei gwneud hi'n haws adeiladu "dyfrnodau cyffredin" mewn sefydliadau sydd â nifer o LLMs.
Unwaith y bydd y synhwyrydd wedi'i hyfforddi, gall sefydliadau benderfynu ar ei lefel o amlygiad: ei gadw completamente privado, ei gynnig mewn ffordd lled-breifat drwy API, neu ei ryddhau mewn ffordd cyhoeddus i'w lawrlwytho a'i ddefnyddio gan drydydd partïon. Mae'r dewis yn dibynnu ar gapasiti gweithredu seilwaith pob endid, risgiau rheoleiddio, a strategaeth tryloywder.

Dyfrnod ar ddelweddau, sain a fideo
Mae'r brand hwn wedi'i gynllunio i bara trawsnewidiadau cyffredin megis cnydio, newid maint, cylchdroi, newid lliw, neu hyd yn oed sgrinluniau, heb yr angen i gadw metadata. I ddechrau, cynigiwyd ei ddefnydd trwy Delwedd yn Vertex AI, lle gall defnyddwyr ddewis actifadu'r dyfrnod wrth gynhyrchu cynnwys.
Mewn sain, y brand yw inaudible ac yn cefnogi gweithrediadau cyffredin fel cywasgu MP3, ychwanegu sŵn, neu addasu cyflymder chwarae. Mae Google yn ei integreiddio i mewn Lyria ac mewn nodweddion sy'n seiliedig ar Notebook LM, gan roi hwb i'r signal hyd yn oed pan fydd y ffeil yn mynd trwy ffrydiau cyhoeddi colledus.
Mewn fideo, mae'r dull yn efelychu'r dull delwedd: mae'r brand wedi'i fewnosod yn y picseli pob ffrâm, yn anweledig, ac yn parhau i fod yn sefydlog yn erbyn hidlwyr, newidiadau yn y gyfradd adnewyddu, cywasgu neu recortesFideos a gynhyrchwyd gan Veo Mae offer fel VideoFX yn ymgorffori'r marc hwn yn ystod y greadigaeth, gan leihau'r risg o ddileu damweiniol mewn golygiadau dilynol.
Algorithmau samplu a chadernid y sêl destun
Calon Testun SynthID yw ei algorithm samplu, sy'n defnyddio allwedd (neu set o allweddi) i aseinio sgoriau ffug-ar hap i bob tocyn posibl. Mae ymgeiswyr yn cael eu dewis o ddosbarthiad y model (ar ôl Top-K/Top-P) a'u rhoi mewn "cystadleuaeth" yn dilyn rowndiau dileu, nes bod y tocyn â'r sgôr uchaf yn cael ei ddewis yn ôl y ffwythiant g.
Mae'r weithdrefn ddethol hon yn ffafrio'r patrwm ystadegol terfynol o'r tebygolrwyddau yn dwyn marc y brand, ond heb orfodi dewisiadau annaturiol. Yn ôl astudiaethau cyhoeddedig, mae'r dechneg yn ei gwneud hi'n anodd dileu, ffugio, neu wrthdroi y sêl, bob amser o fewn terfynau rhesymol yn erbyn gwrthwynebwyr gydag amser a chymhelliant.
Arferion gweithredu a diogelwch da
- Os ydych chi'n defnyddio Testun SynthID, trinwch y ffurfweddiad fel cyfrinach cynhyrchuStoriwch allweddi a hadau mewn rheolwr diogel, gorfodwch reolaethau mynediad, a chaniatáu cylchdroi cyfnodol. Mae atal gollyngiadau yn lleihau'r arwyneb ymosod yn erbyn ymdrechion peirianneg gwrthdro.
- Diseña un plan de monitro ar gyfer eich synhwyrydd: cofnodwch gyfraddau positif/negatif ffug, addaswch drothwyon yn ôl y cyd-destun a phenderfynwch ar eich polisi canfod cysylltiad (preifat, lled-breifat drwy API, neu gyhoeddus) gyda meini prawf cyfreithiol a gweithredol clir. Ac os yw sawl model yn rhannu tocynydd, ystyriwch hyfforddi synhwyrydd cyffredin gydag enghreifftiau o bob un ohonynt i symleiddio cynnal a chadw.
- Ar lefel perfformiad, mae'n asesu effaith
sampling_table_sizemewn cof a latency, a dewiswchngram_lensy'n cydbwyso eich goddefgarwch ar gyfer golygiadau â'r angen am ganfod dibynadwy. Cofiwch eithrio n-gramau ailadroddus (trwycontext_history_size) i wella'r signal mewn testun llifo.
Nid yw SynthID yn ateb gwerthfawr yn erbyn gwybodaeth anghywir, ond yn darparu bloc adeiladu sylfaenol ar gyfer ailadeiladu'r gadwyn ymddiriedaeth yn oes AI cynhyrchiol. Drwy fewnosod signalau tarddiad mewn testun, delweddau, sain a fideo, ac agor y gydran testun i'r gymuned, mae Google DeepMind yn gwthio tuag at ddyfodol lle gellir archwilio dilysrwydd mewn ffordd ymarferol, fesuradwy, ac, yn anad dim, gydnaws â chreadigrwydd ac ansawdd cynnwys.
Roedd golygydd yn arbenigo mewn technoleg a materion rhyngrwyd gyda mwy na deng mlynedd o brofiad mewn gwahanol gyfryngau digidol. Rwyf wedi gweithio fel golygydd a chrëwr cynnwys ar gyfer cwmnïau e-fasnach, cyfathrebu, marchnata ar-lein a hysbysebu. Rwyf hefyd wedi ysgrifennu ar wefannau economeg, cyllid a sectorau eraill. Fy ngwaith hefyd yw fy angerdd. Nawr, trwy fy erthyglau yn Tecnobits, Rwy'n ceisio archwilio'r holl newyddion a chyfleoedd newydd y mae byd technoleg yn eu cynnig i ni bob dydd i wella ein bywydau.