- SynthID na-etinye akara mmiri na-enweghị nghọta n'ime ederede, onyonyo, ọdịyo na vidiyo iji chọpụta ọdịnaya sitere na AI.
- N'ime ederede ọ na-arụ ọrụ dị ka ihe nhazi logit nwere igodo na n-gram, yana nchọpụta Bayesian nwere ike ịhazi ya site na ọnụ ụzọ.
- Mmejuputa a dị na Transformers 4.46.0+, yana oghere gọọmentị na ntụnye aka na GitHub.
- O nwere oke (obere ederede, ntụgharị asụsụ, degharịa) mana na-akwalite nghọta na nchọta.
Mpụta nke generative AI emewo ka mmepụta nke ihe oyiyi, ederede, audios, na vidiyo na ọnụ ọgụgụ a na-ahụtụbeghị mbụ, na ya, obi abụọ banyere mmalite ha amụbawo; n'okwu a, Chọpụta ma e mepụtara ma ọ bụ gbanwee ọdịnaya site na ihe nlereanya na-aghọ isi ihe na ntụkwasị obi dijitalụ. SynthID nwere ike ịbụ nnukwu ngwọta.
Nke a bụ atụmatụ Google DeepMind, a ezinụlọ nke "adịghị ahụ anya" watermarking usoro nke etinyere ozugbo na ọdịnaya AI mepụtara iji kwado nkwenye na-esote na-ewedaghị ogo mmadụ chere.
Kedu ihe bụ SynthID na gịnị kpatara ya?
Google na-akọwa SynthID dị ka ngwá ọrụ maka akara mmiri akọwapụtara maka ọdịnaya sitere na AI, emebere iji kwalite nghọta na traceability. Ọ bụghị naanị otu usoro: ọ na-agụnye onyonyo, ọdịyo, ederede na vidiyo, ka e wee nwee ike itinye otu usoro nka n'ọrụ na ụdị mgbasa ozi dị iche iche.
Na gburugburu ebe obibi Google ejirila ya mee ihe n'ọtụtụ ụzọ:
- Na ederede, ọkọlọtọ na-emetụta nzaghachi Gemini.
- Na audio, a na-eji ụdị Lyria na njiri mara dị ka ịmepụta pọdkastị site na ederede na Notebook LM.
- En video, etinyere n'ime ihe okike Veo, ihe nlereanya nwere ike iwepụta vidiyo na 1080p.
N'ọnọdụ niile na akara mmiri Ọ bụ ihe a na-apụghị ịghọta aghọta, ma emebere ya ka ọ bụrụ nagide mgbanwe ugboro ugboro dị ka mkpakọ, mgbanwe ụda na mbelata ọdịyo ma ọ bụ vidiyo, na-ebelataghị mma.
E wezụga teknụzụ, ebumnobi ya bara uru doro anya: nyere aka ịmata ọdịiche dị na ihe sịntetik na nke emepụtara na-enweghị AI, nke mere na ndị ọrụ, mgbasa ozi na ụlọ ọrụ nwere ike ime mkpebi ziri ezi gbasara oriri na nkesa nke ọdịnaya.

Kedu ka akara mmiri ederede (SynthID Text) si arụ ọrụ
Na omume, Ederede SynthID na-eme ka a ihe nhazi logit nke na-abanye n'ime pipeline ọgbọ ụdị asụsụ mgbe ihe nzacha nlele mbụ (Top-K na Top-P). Ihe nhazi a na-eji a ọrụ pseudorandom g, na-edobe ozi n'ụdị nke puru omume na-ewebataghị ihe ndị a na-ahụ anya n'ụdị ma ọ bụ ịdịmma nke ederede.
Nsonaazụ bụ ederede nke, na nlele mbụ, na-akwado àgwà, nkenke na fluidity, mana nke na-agụnye nhazi ndekọ aha nwere ike ịchọpụta ya na onye nyocha zụrụ azụ.
Iji mepụta ederede na watermark ọ dịghị mkpa nwetaghachi ihe nlereanya: naanị nye nhazi maka usoro ahụ .generate() ma mee ka SynthID Text's logit processor rụọ ọrụ. Nke a na-eme ka nkuchi dị mfe ma na-enye ohere ịnwale ụdị etinyegoro.
Ntọala watermark gụnyere paramita abụọ dị mkpa: keys y ngram_len. igodo bụ ndepụta nke pụrụ iche, ọnụọgụ ọnụọgụ nke ejiri iji akara g; ogologo nke ndepụta ahụ na-achịkwa ole "layers" nke watermarking na-etinye. Ka ọ dị ugbu a, ngram_len Na-edozi nguzozi n'etiti nchọpụta na ike siri ike na mgbanwe: ụkpụrụ dị elu na-eme ka nchọpụta dị mfe ma mee ka akara ahụ dịkwuo mfe maka mgbanwe; uru nke 5 na-arụ ọrụ nke ọma dị ka mmalite.
Na mgbakwunye, Ederede SynthID na-eji a tebụl nlele nwere ihe abụọ: sampling_table_size y sampling_table_seed. A na-atụ aro nha ma ọ dịkarịa ala 2 ^ 16 iji hụ na ọrụ g na-akpa àgwà n'ụzọ kwụsiri ike na enweghị mmasị mgbe ị na-atụle, na-eburu n'uche na nnukwu nha pụtara ebe nchekwa karịa n'oge inference. Mkpụrụ ahụ nwere ike ịbụ integer ọ bụla, nke na-eme ka mmepụtagharị na gburugburu nyocha.
Enwere nuance dị mkpa iji melite mgbama: n-gram ugboro ugboro n'ime akụkọ ihe mere eme na nso nso a nke gburugburu (akọwapụtara site na context_history_size) enweghị akara, nke na-akwado nchọta akara n'ime ederede ndị ọzọ ma na-ebelata ihe ndị na-ezighị ezi jikọtara ya na nkwughachi anụ ahụ nke asụsụ.
Maka nchekwa, nhazi akara mmiri ọ bụla (gụnyere igodo ya, mkpụrụ na paramita ya) ga-echekwara na nzuzoỌ bụrụ na agbapụrụ igodo ndị a, ndị ọzọ nwere ike ịmegharị akara ahụ n'ụzọ dị mfe ma ọ bụ, nke ka njọ, nwaa iji ihe ọmụma zuru oke maka nhazi ya megharịa ya.
Otu esi achọpụta: nkwenye puru omume nwere oke
Nkwenye nke akara mmiri na ederede abụghị ọnụọgụ abụọ, kama puru omumeGoogle na-ebipụta ihe nchọta Bayesian na ma Transformers na GitHub na, mgbe nyochachara usoro ndekọ aha nke ederede, weghachite steeti atọ enwere ike: na ika, enweghi ika o ejighi n'akaMmepụta ternary a na-enye ohere ịhazigharị ọrụ ahụ ka ọ bụrụ ihe egwu dị iche iche yana ọnọdụ nnabata njehie.
A na-ahazi omume nke onye nyocha site na ọnụ ụzọ abụọ nke na-achịkwa ọnụ ọgụgụ nke ihe ndị na-adịghị mma na ndị na-adịghị mma. N'ikwu ya n'ụzọ ọzọ, ị nwere ike ịhazigharị otu ịchọrọ ka nchọpụta ahụ dị, na-achụ uche maka izi ezi ma ọ bụ nke ọzọ dabere na ikpe ojiji gị, ihe bara uru karịsịa na gburugburu nchịkọta akụkọ, imeru ihe n'ókè ma ọ bụ nyocha nke ime.
Ọ bụrụ na ọtụtụ ụdị na-ekerịta otu tokenizer, nwekwara ike ịkọrọ ndị otu ụdị nhazi na otu ihe nchọpụta, ọ bụrụhaala na usoro ọzụzụ nke onye nyocha gụnyere ihe atụ nke ha niile. Nke a na-eme ka ọ dịrị mfe ịrụ "akara mmiri nkịtị" n'ime ụlọ ọrụ nwere ọtụtụ LLM.
Ozugbo a zụrụ ihe nchọpụta ahụ, òtù dị iche iche nwere ike ikpebi ọkwa ya: debe ya kpamkpam nzuzo, na-enye ya n'ụzọ ọkara nke onwe site na API, ma ọ bụ hapụ ya n'ụzọ ọha maka nbudata na ojiji nke ndị ọzọ. Nhọrọ a dabere n'ikike akụrụngwa akụrụngwa nke ụlọ ọrụ ọ bụla, ihe egwu na-achịkwa, yana atụmatụ nghọta.

Watermark na onyonyo, ọdịyo na vidiyo
Emebere ika a ka ọ dịgide mgbanwe nkịtị dị ka akuku, mezie nha, ntụgharị, ịgbanwe agba, ma ọ bụ ọbụna nseta ihuenyo, na-enweghị mkpa idowe metadata. Na mbụ, ejiri ya mee ihe Foto dị na Vertex AI, ebe ndị ọrụ nwere ike họrọ ịgbalite watermark mgbe ha na-emepụta ọdịnaya.
Na audio, ika bụ enweghị ike ịnụ ihe ma na-akwado ọrụ a na-ahụkarị dị ka mkpakọ MP3, ịgbakwụnye mkpọtụ, ma ọ bụ gbanwee ọsọ ọkpụkpọ azụ. Google na-ejikọta ya na ya Lyria na n'ime akwụkwọ ndetu atụmatụ LM, na-ebuli mgbama ahụ ọbụlagodi mgbe faịlụ na-agafe na iyi mbipụta na-efu.
Na vidiyo, usoro a na-emeghachi usoro onyonyo: a na-etinye akara ahụ n'ime pikselụ nke etiti ọ bụla, na-enweghị nghọta, ma na-anọgide na-eguzosi ike megide nzacha, mgbanwe na ọnụego ume ọhụrụ, mkpakọ ma ọ bụ weghachite. Ihe onyonyo ewepụtara site na M na-ahụ Ngwa dị ka VideoFX na-etinye akara a n'oge okike, na-ebelata ihe ize ndụ nke ihichapụ mberede na ndezi ndị na-esote.
Nlereanya algọridim na ike nke akara ederede
Obi SynthID Text bụ ya sample algọridim, nke na-eji igodo (ma ọ bụ set nke igodo) kenye akara pseudo-random na akara ngosi ọ bụla nwere ike. A na-adọta ndị Candidates site na nkesa ihe nlereanya (mgbe Top-K/Top-P) na-etinye na "asọmpi" na-esochi mkpochapụ, ruo mgbe ahọpụtara akara kachasị elu dịka ọrụ g.
Usoro nhọrọ a na-amasị ndị ụkpụrụ ndekọ ọnụ ọgụgụ ikpeazụ nke ihe gbasara puru omume na-ebu akara nke ika ahụ, ma na-enweghị ịmanye nhọrọ ndị na-ekwekọghị n'okike. Dị ka ọmụmụ ndị e bipụtara si kwuo, usoro ahụ na-eme ka ọ sie ike hichapụ, ụgha, ma ọ bụ tụgharịa akara ahụ, mgbe niile n'ime oke ezi uche megide ndị mmegide na oge na mkpali.
Ezi mmejuputa iwu na omume nchekwa
- Ọ bụrụ na ị na-ebuga SynthID Ederede, were nhazi dị ka mmepụta nzuzo: Chekwaa igodo na mkpụrụ n'ime onye njikwa echedoro, manye njikwa nnweta, ma nye ohere maka ntụgharị oge. Mgbochi ntapu na-ebelata mbuso agha megide mbọ injinịa ntụgharị.
- Chepụta atụmatụ nlekota oru maka onye nchọta gị: dekọọ ọnụego adịgboroja/nke na-adịghị mma, dozie ọnụ ụzọ dabere na okirikiri wee kpebie amụma nchọpụta gị. ngosi (nkeonwe, ọkara nkeonwe site na API, ma ọ bụ ọha) nwere ụkpụrụ iwu na arụmọrụ doro anya. Ma ọ bụrụ na ọtụtụ ụdị na-ekekọrịta tokenizer, tụlee ọzụzụ a ihe nchọpụta nkịtị na ihe atụ nke ha niile iji mee ka mmezi dị mfe.
- Na ọkwa arụmọrụ, ọ na-enyocha mmetụta nke
sampling_table_sizena ebe nchekwa na latency, ma họrọ angram_lennke na-edozi nnabata gị maka ndezi ya na mkpa maka nchọpụta a pụrụ ịdabere na ya. Cheta ewepu n-gram ugboro ugboro (sitecontext_history_size) iji kwalite mgbama na ederede na-erugharị.
SynthID abụghị mgbọ ọlaọcha megide ozi na-ezighi ezi, mana na-enye ngọngọ ntọala ntọala maka iwughachi agbụ ntụkwasị obi n'oge nke generative AI. Site n'itinye akara ngosi na ederede, onyonyo, ọdịyo, na vidiyo, na imepe mpaghara ederede na obodo, Google DeepMind na-aga n'ihu n'ọdịniihu ebe enwere ike inyocha eziokwu n'ụzọ bara uru, enwere ike tụọ ya, na, karịa ihe niile, dabara na okike na ịdị mma nke ọdịnaya.
Onye nchịkọta akụkọ ọkachamara na teknụzụ na okwu ịntanetị nwere ahụmahụ karịa afọ iri na mgbasa ozi dijitalụ dị iche iche. Arụla m ọrụ dị ka onye nchịkọta akụkọ na onye na-emepụta ọdịnaya maka e-azụmahịa, nkwurịta okwu, ịzụ ahịa n'ịntanetị na ụlọ ọrụ mgbasa ozi. Edewokwa m akwụkwọ na webụsaịtị akụ na ụba, ego na ngalaba ndị ọzọ. Ọrụ m bụkwa agụụ m. Ugbu a, site na akụkọ m na Tecnobits, M na-agbalị ịchọpụta akụkọ niile na ohere ọhụrụ nke ụwa nke nkà na ụzụ na-enye anyị kwa ụbọchị iji meziwanye ndụ anyị.