- SynthID ji bo destnîşankirina naveroka ku ji hêla AI ve hatî çêkirin, nîşanên avê yên nediyar di nav nivîs, wêne, deng û vîdyoyê de bicîh dike.
- Di nivîsê de ew wekî pêvajoyek logit bi mifte û n-graman tevdigere, bi tespîtkirina Bayesian ku bi astên sînorkirî ve tê mîheng kirin.
- Ev pêkanîn di Transformers 4.46.0+ de, bi Space fermî û referansê li ser GitHub-ê heye.
- Sînorkirinên wê hene (nivîsên kurt, wergerandin, ji nû ve nivîsandin) lê şefafî û şopandinê xurt dike.
Derketina holê ya AI-ya afirîner hilberîna wêne, nivîs, deng û vîdyoyan di asteke ku berê qet nehatiye dîtin de zêde kiriye, û bi wê re, gumanên li ser eslê wan zêde bûne; di vê çarçoveyê de, Diyar bikin ka naverok ji hêla modelekê ve hatiye afirandin an guhertin dibe mifteya baweriya dîjîtal. SynthID dikare çareseriyek mezin be.
Ev pêşniyara Google DeepMind e, a malbata teknîkên nîşankirina avê ya "nexuya" ku rasterast di nav naveroka ku ji hêla AI ve hatî çêkirin de têne bicîh kirin da ku verastkirina paşê hêsan bikin bêyî ku kalîteya ku ji hêla mirovan ve tê dîtin xirab bikin.
SynthID çi ye û ji bo çi ye?
Google SynthID wekî amûrek ji bo... nîşana avê ya taybetî ji bo naveroka ku ji hêla AI-ê ve hatî çêkirin, ji bo pêşvebirina şefafî û şopandinê hatiye sêwirandin. Ew bi yek formatê ve sînordar nîne: ew wêne, deng, nivîs û vîdyoyê vedihewîne, da ku rêbazek teknîkî ya yekane dikare li ser celebên cûda yên medyayê were sepandin.
Di ekosîstema Google de ew jixwe bi çend awayan tê bikar anîn:
- Di nivîsê de, ev al li ser bersivên Gemini derbas dibe.
- Di deng de, bi modela Lyria û bi taybetmendiyên wekî çêkirina podcastan ji nivîsê di Notebook LM de tê bikar anîn.
- En video, di nav Veo creations de hatiye entegrekirin, modela ku dikare klîpên 1080p çêbike.
Di hemû rewşan de watermark Ew nayê famkirin, û ji bo wê hatiye sêwirandin li hember guhertinên dubare li ber xwe bidin wek pêlkirin, guhertinên rîtmê di qutkirinên deng an vîdyoyê de, bêyî kêmkirina kalîteyê.
Ji bilî teknolojiyê, armanca wê ya pratîkî diyar e: alîkariya cudakirina materyalên sentetîk ji yên bêyî AI-ê hatine hilberandin dike, da ku bikarhêner, medyayê û sazî bikaribin biryarên agahdar li ser xerckirin û belavkirina naverokê bidin.

Çawa nîşana avê ya nivîsê (SynthID Text) dixebite
Di pratîkê de, SynthID Text wekî tevdigere pêvajoya logit ku piştî fîlterên nimûnegirtinê yên asayî (Top-K û Top-P) dikeve nav lûleya çêkirina modela ziman. Ev pêvajo bi nermî puanên modelê bi fonksiyona pseudorandom g, kodkirina agahdariyê li gorî şêweya îhtimalan bêyî ku artefaktên xuya têxin nav şêwaz an kalîteya nivîsê.
Encam nivîsek e ku, di nihêrîna pêşîn de, xwe diparêze kalîte, rastbûn û şilbûn, lê ku avahiyek îstatîstîkî vedihewîne ku bi verastkerek perwerdekirî ve tê tesbîtkirin.
Ji bo çêkirina nivîsê bi nîşana avê ne hewce ye modelê ji nû ve perwerde bike: tenê mîhengekê ji bo rêbazê peyda bike .generate() û pêvajoya logit a SynthID Text çalak bike. Ev pejirandinê hêsan dike û destûrê dide ceribandinê bi modelên ku berê hatine bicîhkirin.
Mîhengên nîşana avê du parametreyên bingehîn dihewîne: keys y ngram_len. Mifteyên lîsteyek ji hejmarên tam ên bêhempa û rasthatî ne ku ji bo nirxandina ferhengê bi karanîna fonksiyona g têne bikar anîn; dirêjahiya wê lîsteyê kontrol dike ka çend "qatên" nîşankirina avê têne sepandin. Di heman demê de, ngram_len Hevsengiya di navbera tespîtkirin û xurtbûnê de ji bo veguherînan datîne: nirxên bilindtir tespîtkirinê hêsantir dikin lê mohrê ji guhertinan re hesastir dikin; nirxa 5 wekî xalek destpêkê baş dixebite.
Wekî din, SynthID Text bikar tîne tabloya nimûneyê bi du taybetmendiyan: sampling_table_size y sampling_table_seedMezinahiyek herî kêm 2^16 tê pêşniyar kirin da ku fonksiyona g dema nimûnegirtinê bi awayekî stabîl û bêalî tevbigere, bi berçavgirtina vê yekê Mezinahiyek mezintir tê wateya bêtir bîranîn di dema texmînkirinê de. Tov dikare her hejmareke tevahî be, ku dubarekirinê di hawîrdorên nirxandinê de hêsan dike.
Ji bo baştirkirina sînyalê nuwazeyek girîng heye: n-gramên dubarekirî di dîroka dawî ya çarçoveyê de (ku ji hêla context_history_size) nehatine nîşankirin, ku ev yek tespîtkirina nîşanê di mayîna nivîsê de baştir dike û pozîtîfên derewîn ên bi dubarekirinên xwezayî yên ziman ve girêdayî kêm dike.
Ji bo ewlehiyê, her mîhengê nîşana avê (tevî mifteyên wê, tov û parametreyên wê) divê bi taybetî were hilanînEger ev mifte werin eşkerekirin, aliyên sêyemîn dikarin bi hêsanî marqeyê dubare bikin an jî, ya xerabtir, hewl bidin ku bi zanîna tevahî ya avahiya wê wê manîpule bikin.
Çawa tesbît bikin: verastkirina îhtimalî bi eşikan
Verastkirina nîşana avê di nivîsê de ne dualî ye, lê îhtimalîGoogle detektorek Bayesian li ser hem Transformers û hem jî GitHub diweşîne ku, piştî analîzkirina qaliba îstatîstîkî ya nivîsê, sê rewşên gengaz vedigerîne: bi marqeyê, bê brand o bêgûmanEv derana sêalî dihêle ku operasyon li gorî çarçoveyên toleransa rîsk û xeletiyê yên cûda were sererast kirin.
Reftara verastker ji hêla ve tê mîhengkirin du eşik ku rêjeya pozîtîfên derewîn û negatîfên derewîn kontrol dikin. Bi gotineke din, hûn dikarin kalîbre bikin ka hûn dixwazin tespît çiqas hişk be, hesasiyetê ji bo rastbûnê feda bikin an jî berevajî vê li gorî rewşa karanîna we, tiştek bi taybetî di jîngehên edîtorî, moderasyon an denetima navxweyî.
Ger çend model heman tiştî parve bikin tokenîzator, her wiha dikare parve bike heman konfigurasyona marqeyê û heman detektor, heta ku koma perwerdehiyê ya verastker mînakên hemûyan dihewîne. Ev yek di rêxistinên bi gelek LLM-an de avakirina "nîşanên avê yên hevpar" hêsantir dike.
Dema ku detektor hat perwerdekirin, rêxistin dikarin asta wê ya eşkerekirinê diyar bikin: wê bihêlin bi temamî taybet, bi awayekî pêşkêş bike nîv-taybet bi rêya API-yê, an jî bi awayekî berde gelemperî ji bo dakêşandin û bikaranîna ji aliyê aliyên sêyemîn ve. Hilbijartin bi kapasîteya xebitandina binesaziyê, rîskên rêziknameyî û stratejiya şefafiyetê ya her saziyekê ve girêdayî ye.

Nîşana avê li ser wêne, deng û vîdyoyê
Ev marqe ji bo mayînde hatî çêkirin veguherînên hevpar wek birrîn, guhertina mezinahîyê, zivirandin, guhertina reng, an jî wêneyên ekranê, bêyî ku hewcedariya parastina metadatayê hebe. Di destpêkê de, karanîna wê bi rêya Wêne di Vertex AI de, ku bikarhêner dikarin hilbijêrin ku nîşana avê dema çêkirina naverokê çalak bikin.
Di deng de, marqe ev e nabihîze û operasyonên hevpar ên wekî pêçandina MP3, zêdekirina deng, an guhertina leza lêdanê piştgirî dike. Google wê bi Lyria û di taybetmendiyên Notebook LM-ê de, sînyalê xurt dike tewra dema ku pel di herikên weşanê yên windaker re derbas dibe.
Di vîdyoyê de, ev rêbaz rêbaza wêneyê dubare dike: marqe di nav de cih digire. pîkselên her çarçovê, bi awayekî nediyar, û li hember fîlteran, guhertinên di rêjeya nûvekirinê de, zextkirinê an jî sabît dimîne veguhestinVîdyoyên ku ji hêla Ez dibînim Amûrên mîna VideoFX vê nîşanê di dema afirandinê de bikar tînin, û xetera jêbirina qezayî di guherandinên paşîn de kêm dikin.
Algorîtmayên nimûnegirtinê û xurtbûna mohra nivîsê
Dilê SynthID Text ew e algorîtmaya nimûnegirtinê, ku mifteyek (an komek mifteyan) bikar tîne da ku puanên sexte-rasthatî bide her nîşanek potansiyel. Namzed ji belavkirina modelê (piştî Top-K/Top-P) têne hilbijartin û piştî tûrên eleminasyonê dikevin "pêşbirkê", heta ku nîşana herî zêde puan digire li gorî fonksiyona g were hilbijartin.
Ev prosedûra hilbijartinê kêrî qaliba îstatîstîkî ya dawî ji îhtimalan nîşana marqeyê hildigirin, lê bêyî ku vebijarkên ne xwezayî ferz bikin. Li gorî lêkolînên weşandî, teknîk wê dijwar dike jêbirin, sextekirin, an berevajîkirin mohr, her gav di nav sînorên maqûl de li dijî dijberên bi dem û motîvasyonê.
Pêkanîn û pratîkên ewlehiyê yên baş
- Heke hûn SynthID Text bicîh dikin, mîhengê wekî sirra hilberînêMifte û tovan di rêveberekî ewle de hilînin, kontrolên gihîştinê bicîh bînin, û rê bidin zivirîna periyodîk. Pêşîlêgirtina rijandinan rûbera êrîşê li dijî hewldanên endezyariya berevajî kêm dike.
- Planekê dîzayn bike şopandin ji bo detektora we: rêjeyên erênî/neyînî yên derewîn tomar bikin, li gorî rewşê eşikan rast bikin û polîtîkaya tespîtkirina xwe diyar bikin xerîb (taybet, nîv-taybet bi rêya API, an giştî) bi pîvanên qanûnî û operasyonel ên zelal. Û heke gelek model tokenîzatorek parve bikin, perwerdekirina detektora hevpar bi mînakên hemûyan re ji bo hêsankirina lênêrînê.
- Di asta performansê de, ew bandora nirxandinê dike,
sampling_table_sizedi bîr û latency de, û hilbijêrekngram_lenku toleransa we ji bo guherandinan bi hewcedariya tespîtkirina pêbawer re hevseng dike. Ji bîr mekin ku n-gramên dubarekirî ji holê rakin (bi rêyacontext_history_size) ji bo baştirkirina sînyala di nivîsa herikbar de.
SynthID ne guleyek zîvîn e li dijî agahdariya xelet, lê di serdema AI-ya hilberîner de ji bo ji nû ve avakirina zincîra baweriyê blokek avahîsaziyê ya bingehîn peyda dike. Bi bicihkirina nîşanên çavkaniyan di nivîs, wêne, deng û vîdyoyê de, û vekirina pêkhateya nivîsê ji bo civakê, Google DeepMind ber bi pêşerojekê ve diçe ku tê de rastbûn dikare bi awayekî pratîkî, pîvandî û, berî her tiştî, lihevhatî bi afirînerî û kalîteya naverokê re were vekolandin.
Edîtorê pisporê teknolojî û pirsgirêkên înternetê bi zêdetirî deh salan ezmûna xwe di medyaya dîjîtal a cihêreng de heye. Min ji bo pargîdaniyên e-bazirganî, ragihandinê, kirrûbirra serhêl û reklamê wekî edîtor û afirînerê naverokê xebitî. Min li ser malperên aborî, darayî û sektorên din jî nivîsandiye. Karê min jî hewesa min e. Naha, bi gotarên min di nav de Tecnobits, Ez hewl didim ku hemî nûçe û derfetên nû yên ku cîhana teknolojiyê her roj pêşkêşî me dike ji bo baştirkirina jiyana me bikolim.