- Bidh SynthID a’ cur comharran-uisge do-fhaicsinneach a-steach do theacsa, ìomhaighean, claisneachd agus bhidio gus susbaint a chaidh a chruthachadh le AI aithneachadh.
- Ann an teacsa bidh e ag obair mar phròiseasar logit le iuchraichean agus n-graman, le lorg Bayesian air a rèiteachadh le stairsnich.
- Tha an cur an gnìomh ri fhaighinn ann an Transformers 4.46.0+, le Space oifigeil agus fiosrachadh air GitHub.
- Tha cuingealachaidhean ann (teacsaichean goirid, eadar-theangachaidhean, ath-sgrìobhaidhean) ach tha e a’ neartachadh follaiseachd agus comas lorg.
Tha nochdadh AI gineadach air cinneasachadh ìomhaighean, teacsaichean, claisneachd agus bhideothan a bhrosnachadh air sgèile nach fhacas a-riamh roimhe, agus leis an sin, tha teagamhan mun tùs aca air fàs; anns a’ cho-theacsa seo, Comharraich a bheil susbaint air a chruthachadh no air atharrachadh le modail a’ fàs na phrìomh rud airson earbsa didseatach. SynthID faodaidh e bhith na fhuasgladh math.
Seo moladh Google DeepMind, a teaghlach de dhòighean-obrach comharra-uisge “do-fhaicsinneach” a tha air an leabachadh gu dìreach a-steach do shusbaint a chaidh a chruthachadh le AI gus dearbhadh às dèidh sin a dhèanamh nas fhasa gun a bhith a’ lughdachadh a’ chàileachd a tha daoine a’ mothachadh.
Dè a th’ ann an SynthID agus carson a tha e an dùil?
Tha Google a’ toirt cunntas air SynthID mar inneal airson comharra-uisge sònraichte airson susbaint a chaidh a chruthachadh le AI, air a dhealbhadh gus follaiseachd agus lorg-leantainn adhartachadh. Chan eil e cuingealaichte ri aon chruth: tha e a’ toirt a-steach ìomhaighean, claisneachd, teacsa agus bhidio, gus an gabh aon dòigh-obrach theicnigeach a chur an sàs ann an diofar sheòrsaichean meadhanan.
Ann an eag-shiostam Google tha e air a chleachdadh ann an grunn dhòighean mu thràth:
- Anns an teacsa, tha a’ bhratach a’ buntainn ri freagairtean Gemini.
- Ann an claisneachd, air a chleachdadh leis a’ mhodail Lyria agus le feartan leithid cruthachadh podcastan bho theacsa ann an Notebook LM.
- En bhidio, air a thoirt a-steach do chruthachaidhean Veo, am modail comasach air criomagan a ghineadh ann an 1080p.
Anns a h-uile cùis an comharra-uisge Tha e do-fhaicsinneach, agus chaidh a dhealbhadh gus seasamh an aghaidh atharrachaidhean tric leithid teannachadh, atharrachaidhean ruitheam ann an gearraidhean claisneachd no bhidio, gun a bhith a’ lughdachadh càileachd.
A bharrachd air an teicneòlas, tha an amas practaigeach aige soilleir: cuideachadh le bhith ag eadar-dhealachadh stuth synthetigeach bho stuth a chaidh a dhèanamh às aonais AI, gus am bi e comasach do luchd-cleachdaidh, meadhanan agus ionadan co-dhùnaidhean fiosraichte a dhèanamh mu bhith a’ caitheamh agus a’ sgaoileadh susbaint.

Mar a tha comharra-uisge an teacsa (SynthID Text) ag obair
Ann an cleachdadh, bidh SynthID Text ag obair mar pròiseasar logit a bhios a’ ceangal ris a’ phìob-loidhne gineadh modail cànain às dèidh nan criathragan samplachaidh àbhaisteach (Top-K agus Top-P). Bidh am pròiseasar seo ag atharrachadh sgòran a’ mhodail gu seòlta le a gnìomh meallta-air-thuaiream g, a’ còdachadh fiosrachaidh ann am pàtran nan coltachdan gun a bhith a’ toirt a-steach nithean follaiseach a-steach do stoidhle no càileachd an teacsa.
Is e an toradh teacsa a tha, aig a’ chiad sealladh, a’ cumail suas càileachd, mionaideachd agus leaghanachd, ach anns a bheil structar staitistigeil a ghabhas lorg le dearbhaiche air a thrèanadh.
Chan eil feum air teacsa a chruthachadh le comharra-uisge ath-thrèanadh a’ mhodail: dìreach thoir rèiteachadh don mhodh .generate() agus pròiseasar logit SynthID Text a ghnìomhachadh. Tha seo a’ sìmpleachadh uchd-mhacachd agus a’ ceadachadh deuchainn le modalan a tha air an cleachdadh mu thràth.
Tha dà pharamadair riatanach anns na roghainnean comharra-uisge: keys y ngram_len. Na h-iuchraichean ’S e liosta de dh’àireamhan slàn sònraichte, air thuaiream a th’ annta a thathar a’ cleachdadh gus sgòr a thoirt don bhriathrachas a’ cleachdadh an gnìomh g; tha fad na liosta sin a’ cumail smachd air cia mheud “sreath” de chomharradh-uisge a thèid a chur an sàs. Aig an aon àm, ngram_len A’ suidheachadh a’ chothromachaidh eadar comas lorg agus seasmhachd ri cruth-atharrachaidhean: bidh luachan nas àirde a’ dèanamh lorg nas fhasa ach a’ dèanamh an ròin nas so-leònte ri atharrachaidhean; tha luach 5 ag obair gu math mar thoiseach tòiseachaidh.
A bharrachd air sin, bidh SynthID Text a’ cleachdadh a clàr samplachaidh le dà fheart: sampling_table_size y sampling_table_seedThathar a’ moladh meud co-dhiù 2^16 gus dèanamh cinnteach gum bi an gnìomh g ag obair ann an dòigh sheasmhach agus neo-chlaon nuair a thathar a’ samplachadh, a’ toirt aire do sin Tha meud nas motha a’ ciallachadh barrachd cuimhne rè co-dhùnadh. Faodaidh an sìol a bhith na shlàn-àireamh sam bith, a tha a’ dèanamh ath-riochdachadh nas fhasa ann an àrainneachdan measaidh.
Tha mion-fhiosrachadh cudromach ann gus an comharra a leasachadh: n-graman ath-aithrisichte taobh a-staigh eachdraidh o chionn ghoirid a’ cho-theacsa (air a mhìneachadh le context_history_size) nach eil air an comharrachadh, a tha a’ fàbharachadh follaiseachd a’ chomharra anns a’ chòrr den teacsa agus a’ lughdachadh toraidhean meallta dearbhach co-cheangailte ri ath-aithris nàdarrach a’ chànain.
Airson tèarainteachd, gach rèiteachadh comharra-uisge (a’ gabhail a-steach na h-iuchraichean, an sìol agus na paramadairean aige) feumar a stòradh gu prìobhaideachMa thèid na h-iuchraichean seo a leigeil a-mach, dh’ fhaodadh treas phàrtaidhean am brannd ath-riochdachadh gu furasta no, nas miosa fhathast, feuchainn ri a làimhseachadh le làn eòlas air a structar.
Mar a lorgas tu: dearbhadh coltachd le stairsnich
Chan eil dearbhadh comharra-uisge ann an teacsa dà-thaobhach, ach coltachdBidh Google a’ foillseachadh lorgaire Bayesian air Transformers agus GitHub a bhios, às dèidh dha pàtran staitistigeil an teacsa a sgrùdadh, a’ tilleadh trì staidean a dh’ fhaodadh a bhith ann: le branda, gun bhrand o mì-chinnteachLeigidh an toradh trì-fhillte seo leis an obrachadh atharrachadh a rèir diofar cho-theacsan fulangas cunnairt is mearachd.
Tha giùlan an dearbhaiche so-rèiteichte le dà stairsneach a bhios a’ cumail smachd air ìre nan toraidhean dearbhach is àicheil meallta. Ann am faclan eile, faodaidh tu calibratadh a dhèanamh air cho teann ‘s a tha thu ag iarraidh gum bi an lorg, a’ ìobairt cugallachd airson cruinneas no a chaochladh a rèir do chùis cleachdaidh, rudeigin gu sònraichte feumail ann an àrainneachdan deasachaidh, modaireataireachd no sgrùdadh a-staigh.
Ma tha grunn mhodalan a’ roinn an aon rud comharraiche, faodaidh iad cuideachd an roinn rèiteachadh an aon bhrand agus an aon lorgaire, fhad ’s a tha eisimpleirean dhiubh uile anns an t-seata trèanaidh aig an dearbhaiche. Tha seo ga dhèanamh nas fhasa “comharran-uisge cumanta” a thogail ann am buidhnean le iomadh LLM.
Cho luath ‘s a bhios an lorgaire air a thrèanadh, faodaidh buidhnean co-dhùnadh dè an ìre nochdaidh a bhios ann: cùm e gu tur prìobhaideach, ga thabhann ann an dòigh leth-phrìobhaideach tro API, no ga leigeil ma sgaoil ann an dòigh poblach airson luchdachadh sìos agus cleachdadh le treas phàrtaidhean. Tha an roghainn an urra ri comas obrachaidh bun-structair gach eintiteas, cunnartan riaghlaidh, agus ro-innleachd follaiseachd.

Comharra-uisge air ìomhaighean, claisneachd agus bhidio
Tha am brannd seo air a dhealbhadh gus mairsinn cruth-atharrachaidhean cumanta leithid bearradh, ath-mheudachadh, rothladh, atharrachadh dath, no eadhon dealbhan-sgrìn, gun fheum air meata-dhàta a chumail. An toiseach, chaidh a chleachdadh a thabhann tro Ìomhaigh ann an Vertex AI, far am faod luchd-cleachdaidh roghnachadh an comharra-uisge a ghnìomhachadh nuair a bhios iad a’ gineadh susbaint.
Ann an claisneachd, is e am brannd neo-chluinntinn agus a’ toirt taic do ghnìomhachdan cumanta leithid teannachadh MP3, fuaim a chur ris, no astar ath-chluich atharrachadh. Bidh Google ga thoirt a-steach do Liria agus ann am feartan stèidhichte air Notebook LM, a’ neartachadh an t-soidhne eadhon nuair a thèid am faidhle tro shruthan foillseachaidh calltach.
Ann am bhidio, tha an dòigh-obrach ag ath-aithris an dòigh-obrach ìomhaigh: tha am brannd air a leabachadh a-steach don piogsail gach frèam, gu do-fhaicsinneach, agus a’ fuireach seasmhach an aghaidh sìoltachain, atharrachaidhean ann an ìre ùrachaidh, teannachadh no air aisBhideothan air an gineadh le Chi mi Bidh innealan mar VideoFX a’ toirt a’ chomharra seo a-steach rè na cruthachaidh, a’ lughdachadh cunnart sguabadh às gun fhiosta ann an deasachaidhean às dèidh sin.
Algairim samplachaidh agus neart seula teacsa
Is e cridhe SynthID Text a algairim samplachaidh, a bhios a’ cleachdadh iuchair (no seata iuchraichean) gus sgòran meallta-air-thuaiream a shònrachadh do gach comharra a dh’fhaodadh a bhith ann. Thèid tagraichean a thaghadh bho sgaoileadh a’ mhodail (às dèidh Top-K/Top-P) agus a chur ann am “farpais” às dèidh cuairtean cuir às, gus an tèid an comharra leis an sgòr as àirde a thaghadh a rèir an gnìomh g.
Tha am modh-obrach taghaidh seo a’ toirt buannachd don pàtran staitistigeil deireannach de na coltachdan a’ giùlan comharra a’ bhrand, ach gun a bhith a’ sparradh roghainnean mì-nàdarrach. A rèir sgrùdaidhean foillsichte, tha an dòigh-obrach ga dhèanamh duilich cuir às, dèan mealltaireachd, no tionndaidh air ais an ròn, an-còmhnaidh taobh a-staigh crìochan reusanta an aghaidh luchd-dùbhlain le ùine agus brosnachadh.
Deagh chleachdaidhean cur an gnìomh agus tèarainteachd
- Ma tha thu a’ cleachdadh SynthID Text, làimhsich an rèiteachadh mar dìomhaireachd cinneasachaidhStòraich iuchraichean agus sìol ann am manaidsear tèarainte, cuir smachdan ruigsinneachd an gnìomh, agus leig le rothladh bho àm gu àm. Bidh casg a chur air aodion a’ lughdachadh an uachdar ionnsaigh an aghaidh oidhirpean innleadaireachd cùil.
- Dealbhaich plana cumail sùil airson an lorgaire agad: clàraich ìrean dearbhach/àicheil meallta, atharraich stairsnich a rèir co-theacsa agus co-dhùin do phoileasaidh lorg nochd (prìobhaideach, leth-phrìobhaideach tro API, no poblach) le slatan-tomhais laghail is obrachaidh soilleir. Agus ma tha grunn mhodalan a’ roinn comharraiche, smaoinich air trèanadh a lorgaire cumanta le eisimpleirean dhiubh uile gus cumail suas a dhèanamh nas sìmplidhe.
- Aig ìre coileanaidh, bidh e a’ measadh buaidh
sampling_table_sizeann an cuimhne agus latency, agus tagh angram_lena chothromaicheas do fhulangas airson deasachaidhean leis an fheum air lorg earbsach. Cuimhnich gun cuir thu às do n-graman a-rithist (trocontext_history_size) gus an comharra a leasachadh ann an teacsa sruthach.
Chan e fuasgladh airgid a th’ ann an SynthID an aghaidh fiosrachadh ceàrr, ach a’ toirt seachad bloc togail bunaiteach airson slabhraidh an earbsa ath-thogail ann an linn AI gineadach. Le bhith a’ cur comharran tùsachd ann an teacsa, ìomhaighean, claisneachd agus bhidio, agus a’ fosgladh a’ phàirt teacsa don choimhearsnachd, tha Google DeepMind a’ putadh a dh’ionnsaigh àm ri teachd far am faodar dearbhadh-sanasachd a sgrùdadh ann an dòigh phractaigeach, tomhaiste, agus, os cionn a h-uile càil, co-chòrdail ri cruthachalachd agus càileachd susbaint.
Neach-deasachaidh speisealaichte ann an teicneòlas agus cùisean eadar-lìn le còrr air deich bliadhna de eòlas ann an diofar mheadhanan didseatach. Tha mi air a bhith ag obair mar neach-deasachaidh agus neach-cruthachaidh susbaint airson e-malairt, conaltradh, margaidheachd air-loidhne agus companaidhean sanasachd. Tha mi cuideachd air sgrìobhadh air làraich-lìn eaconamachd, ionmhais agus roinnean eile. Tha an obair agam cuideachd na thoileachas dhomh. A-nis, tro na h-artaigilean agam ann an Tecnobits, Bidh mi a’ feuchainn ri sgrùdadh a dhèanamh air na naidheachdan agus na cothroman ùra a tha saoghal teicneòlais a’ tabhann dhuinn gach latha gus ar beatha adhartachadh.