Kedu ihe bụ SynthID, akara mmiri nke ọgụgụ isi mmadụ?

Mmelite ikpeazụ: 29/08/2025

  • SynthID na-etinye akara mmiri na-enweghị nghọta n'ime ederede, onyonyo, ọdịyo na vidiyo iji chọpụta ọdịnaya sitere na AI.
  • N'ime ederede ọ na-arụ ọrụ dị ka ihe nhazi logit nwere igodo na n-gram, yana nchọpụta Bayesian nwere ike ịhazi ya site na ọnụ ụzọ.
  • Mmejuputa a dị na Transformers 4.46.0+, yana oghere gọọmentị na ntụnye aka na GitHub.
  • O nwere oke (obere ederede, ntụgharị asụsụ, degharịa) mana na-akwalite nghọta na nchọta.
SynthID watermark

Mpụta nke generative AI emewo ka mmepụta nke ihe oyiyi, ederede, audios, na vidiyo na ọnụ ọgụgụ a na-ahụtụbeghị mbụ, na ya, obi abụọ banyere mmalite ha amụbawo; n'okwu a, Chọpụta ma e mepụtara ma ọ bụ gbanwee ọdịnaya site na ihe nlereanya na-aghọ isi ihe na ntụkwasị obi dijitalụ. SynthID nwere ike ịbụ nnukwu ngwọta.

Nke a bụ atụmatụ Google DeepMind, a ezinụlọ nke "adịghị ahụ anya" watermarking usoro nke etinyere ozugbo na ọdịnaya AI mepụtara iji kwado nkwenye na-esote na-ewedaghị ogo mmadụ chere.

Kedu ihe bụ SynthID na gịnị kpatara ya?

Google na-akọwa SynthID dị ka ngwá ọrụ maka akara mmiri akọwapụtara maka ọdịnaya sitere na AI, emebere iji kwalite nghọta na traceability. Ọ bụghị naanị otu usoro: ọ na-agụnye onyonyo, ọdịyo, ederede na vidiyo, ka e wee nwee ike itinye otu usoro nka n'ọrụ na ụdị mgbasa ozi dị iche iche.

Na gburugburu ebe obibi Google ejirila ya mee ihe n'ọtụtụ ụzọ:

  • Na ederede, ọkọlọtọ na-emetụta nzaghachi Gemini.
  • Na audio, a na-eji ụdị Lyria na njiri mara dị ka ịmepụta pọdkastị site na ederede na Notebook LM.
  • En video, etinyere n'ime ihe okike Veo, ihe nlereanya nwere ike iwepụta vidiyo na 1080p.

N'ọnọdụ niile na akara mmiri Ọ bụ ihe a na-apụghị ịghọta aghọta, ma emebere ya ka ọ bụrụ nagide mgbanwe ugboro ugboro dị ka mkpakọ, mgbanwe ụda na mbelata ọdịyo ma ọ bụ vidiyo, na-ebelataghị mma.

E wezụga teknụzụ, ebumnobi ya bara uru doro anya: nyere aka ịmata ọdịiche dị na ihe sịntetik na nke emepụtara na-enweghị AI, nke mere na ndị ọrụ, mgbasa ozi na ụlọ ọrụ nwere ike ime mkpebi ziri ezi gbasara oriri na nkesa nke ọdịnaya.

synthID

Kedu ka akara mmiri ederede (SynthID Text) si arụ ọrụ

Na omume, Ederede SynthID na-eme ka a ihe nhazi logit nke na-abanye n'ime pipeline ọgbọ ụdị asụsụ mgbe ihe nzacha nlele mbụ (Top-K na Top-P). Ihe nhazi a na-eji a ọrụ pseudorandom g, na-edobe ozi n'ụdị nke puru omume na-ewebataghị ihe ndị a na-ahụ anya n'ụdị ma ọ bụ ịdịmma nke ederede.

Ọdịnaya pụrụiche - Pịa ebe a  Pixel Watch 4 na-akawanye mma n'ime: nke a bụ mgbawa ọhụrụ na batrị nke Google chọrọ iji mpi Apple Watch.

Nsonaazụ bụ ederede nke, na nlele mbụ, na-akwado àgwà, nkenke na fluidity, mana nke na-agụnye nhazi ndekọ aha nwere ike ịchọpụta ya na onye nyocha zụrụ azụ.

Iji mepụta ederede na watermark ọ dịghị mkpa nwetaghachi ihe nlereanya: naanị nye nhazi maka usoro ahụ .generate() ma mee ka SynthID Text's logit processor rụọ ọrụ. Nke a na-eme ka nkuchi dị mfe ma na-enye ohere ịnwale ụdị etinyegoro.

Ntọala watermark gụnyere paramita abụọ dị mkpa: keys y ngram_len. igodo bụ ndepụta nke pụrụ iche, ọnụọgụ ọnụọgụ nke ejiri iji akara g; ogologo nke ndepụta ahụ na-achịkwa ole "layers" nke watermarking na-etinye. Ka ọ dị ugbu a, ngram_len Na-edozi nguzozi n'etiti nchọpụta na ike siri ike na mgbanwe: ụkpụrụ dị elu na-eme ka nchọpụta dị mfe ma mee ka akara ahụ dịkwuo mfe maka mgbanwe; uru nke 5 na-arụ ọrụ nke ọma dị ka mmalite.

Na mgbakwunye, Ederede SynthID na-eji a tebụl nlele nwere ihe abụọ: sampling_table_size y sampling_table_seed. A na-atụ aro nha ma ọ dịkarịa ala 2 ^ 16 iji hụ na ọrụ g na-akpa àgwà n'ụzọ kwụsiri ike na enweghị mmasị mgbe ị na-atụle, na-eburu n'uche na nnukwu nha pụtara ebe nchekwa karịa n'oge inference. Mkpụrụ ahụ nwere ike ịbụ integer ọ bụla, nke na-eme ka mmepụtagharị na gburugburu nyocha.

Enwere nuance dị mkpa iji melite mgbama: n-gram ugboro ugboro n'ime akụkọ ihe mere eme na nso nso a nke gburugburu (akọwapụtara site na context_history_size) enweghị akara, nke na-akwado nchọta akara n'ime ederede ndị ọzọ ma na-ebelata ihe ndị na-ezighị ezi jikọtara ya na nkwughachi anụ ahụ nke asụsụ.

Maka nchekwa, nhazi akara mmiri ọ bụla (gụnyere igodo ya, mkpụrụ na paramita ya) ga-echekwara na nzuzoỌ bụrụ na agbapụrụ igodo ndị a, ndị ọzọ nwere ike ịmegharị akara ahụ n'ụzọ dị mfe ma ọ bụ, nke ka njọ, nwaa iji ihe ọmụma zuru oke maka nhazi ya megharịa ya.

Ọdịnaya pụrụiche - Pịa ebe a  Otu esi esi pụọ na foto Google

Otu esi achọpụta: nkwenye puru omume nwere oke

Nkwenye nke akara mmiri na ederede abụghị ọnụọgụ abụọ, kama puru omumeGoogle na-ebipụta ihe nchọta Bayesian na ma Transformers na GitHub na, mgbe nyochachara usoro ndekọ aha nke ederede, weghachite steeti atọ enwere ike: na ika, enweghi ika o ejighi n'akaMmepụta ternary a na-enye ohere ịhazigharị ọrụ ahụ ka ọ bụrụ ihe egwu dị iche iche yana ọnọdụ nnabata njehie.

A na-ahazi omume nke onye nyocha site na ọnụ ụzọ abụọ nke na-achịkwa ọnụ ọgụgụ nke ihe ndị na-adịghị mma na ndị na-adịghị mma. N'ikwu ya n'ụzọ ọzọ, ị nwere ike ịhazigharị otu ịchọrọ ka nchọpụta ahụ dị, na-achụ uche maka izi ezi ma ọ bụ nke ọzọ dabere na ikpe ojiji gị, ihe bara uru karịsịa na gburugburu nchịkọta akụkọ, imeru ihe n'ókè ma ọ bụ nyocha nke ime.

Ọ bụrụ na ọtụtụ ụdị na-ekerịta otu tokenizer, nwekwara ike ịkọrọ ndị otu ụdị nhazi na otu ihe nchọpụta, ọ bụrụhaala na usoro ọzụzụ nke onye nyocha gụnyere ihe atụ nke ha niile. Nke a na-eme ka ọ dịrị mfe ịrụ "akara mmiri nkịtị" n'ime ụlọ ọrụ nwere ọtụtụ LLM.

Ozugbo a zụrụ ihe nchọpụta ahụ, òtù dị iche iche nwere ike ikpebi ọkwa ya: debe ya kpamkpam nzuzo, na-enye ya n'ụzọ ọkara nke onwe site na API, ma ọ bụ hapụ ya n'ụzọ ọha maka nbudata na ojiji nke ndị ọzọ. Nhọrọ a dabere n'ikike akụrụngwa akụrụngwa nke ụlọ ọrụ ọ bụla, ihe egwu na-achịkwa, yana atụmatụ nghọta.

Teknụzụ SynthID AI watermark

Watermark na onyonyo, ọdịyo na vidiyo

Emebere ika a ka ọ dịgide mgbanwe nkịtị dị ka akuku, mezie nha, ntụgharị, ịgbanwe agba, ma ọ bụ ọbụna nseta ihuenyo, na-enweghị mkpa idowe metadata. Na mbụ, ejiri ya mee ihe Foto dị na Vertex AI, ebe ndị ọrụ nwere ike họrọ ịgbalite watermark mgbe ha na-emepụta ọdịnaya.

Na audio, ika bụ enweghị ike ịnụ ihe ma na-akwado ọrụ a na-ahụkarị dị ka mkpakọ MP3, ịgbakwụnye mkpọtụ, ma ọ bụ gbanwee ọsọ ọkpụkpọ azụ. Google na-ejikọta ya na ya Lyria na n'ime akwụkwọ ndetu atụmatụ LM, na-ebuli mgbama ahụ ọbụlagodi mgbe faịlụ na-agafe na iyi mbipụta na-efu.

Na vidiyo, usoro a na-emeghachi usoro onyonyo: a na-etinye akara ahụ n'ime pikselụ nke etiti ọ bụla, na-enweghị nghọta, ma na-anọgide na-eguzosi ike megide nzacha, mgbanwe na ọnụego ume ọhụrụ, mkpakọ ma ọ bụ weghachite. Ihe onyonyo ewepụtara site na M na-ahụ Ngwa dị ka VideoFX na-etinye akara a n'oge okike, na-ebelata ihe ize ndụ nke ihichapụ mberede na ndezi ndị na-esote.

Ọdịnaya pụrụiche - Pịa ebe a  Otu esi etinye ndetu ọkà okwu na Google Slides

Nlereanya algọridim na ike nke akara ederede

Obi SynthID Text bụ ya sample algọridim, nke na-eji igodo (ma ọ bụ set nke igodo) kenye akara pseudo-random na akara ngosi ọ bụla nwere ike. A na-adọta ndị Candidates site na nkesa ihe nlereanya (mgbe Top-K/Top-P) na-etinye na "asọmpi" na-esochi mkpochapụ, ruo mgbe ahọpụtara akara kachasị elu dịka ọrụ g.

Usoro nhọrọ a na-amasị ndị ụkpụrụ ndekọ ọnụ ọgụgụ ikpeazụ nke ihe gbasara puru omume na-ebu akara nke ika ahụ, ma na-enweghị ịmanye nhọrọ ndị na-ekwekọghị n'okike. Dị ka ọmụmụ ndị e bipụtara si kwuo, usoro ahụ na-eme ka ọ sie ike hichapụ, ụgha, ma ọ bụ tụgharịa akara ahụ, mgbe niile n'ime oke ezi uche megide ndị mmegide na oge na mkpali.

Ezi mmejuputa iwu na omume nchekwa

  • Ọ bụrụ na ị na-ebuga SynthID Ederede, were nhazi dị ka mmepụta nzuzo: Chekwaa igodo na mkpụrụ n'ime onye njikwa echedoro, manye njikwa nnweta, ma nye ohere maka ntụgharị oge. Mgbochi ntapu na-ebelata mbuso agha megide mbọ injinịa ntụgharị.
  • Chepụta atụmatụ nlekota oru maka onye nchọta gị: dekọọ ọnụego adịgboroja/nke na-adịghị mma, dozie ọnụ ụzọ dabere na okirikiri wee kpebie amụma nchọpụta gị. ngosi (nkeonwe, ọkara nkeonwe site na API, ma ọ bụ ọha) nwere ụkpụrụ iwu na arụmọrụ doro anya. Ma ọ bụrụ na ọtụtụ ụdị na-ekekọrịta tokenizer, tụlee ọzụzụ a ihe nchọpụta nkịtị na ihe atụ nke ha niile iji mee ka mmezi dị mfe.
  • Na ọkwa arụmọrụ, ọ na-enyocha mmetụta nke sampling_table_size na ebe nchekwa na latency, ma họrọ a ngram_len nke na-edozi nnabata gị maka ndezi ya na mkpa maka nchọpụta a pụrụ ịdabere na ya. Cheta ewepu n-gram ugboro ugboro (site context_history_size) iji kwalite mgbama na ederede na-erugharị.

SynthID abụghị mgbọ ọlaọcha megide ozi na-ezighi ezi, mana na-enye ngọngọ ntọala ntọala maka iwughachi agbụ ntụkwasị obi n'oge nke generative AI. Site n'itinye akara ngosi na ederede, onyonyo, ọdịyo, na vidiyo, na imepe mpaghara ederede na obodo, Google DeepMind na-aga n'ihu n'ọdịniihu ebe enwere ike inyocha eziokwu n'ụzọ bara uru, enwere ike tụọ ya, na, karịa ihe niile, dabara na okike na ịdị mma nke ọdịnaya.