Menene SynthID, alamar ruwa na basirar wucin gadi?

Sabuntawa ta ƙarshe: 29/08/2025

  • SynthID yana haɗa alamomin ruwa marasa fahimta cikin rubutu, hotuna, sauti, da bidiyo don gano abubuwan da AI suka ƙirƙira.
  • A cikin rubutu yana aiki azaman na'ura mai sarrafa logit mai maɓalli da n-grams, tare da ganowar Bayesian ta hanyar ƙofa.
  • Ana aiwatar da aiwatarwa a cikin Masu Canzawa 4.46.0+, tare da Sarari na hukuma da tunani akan GitHub.
  • Yana da iyakoki (gajerun rubutu, fassarorin, sake rubutawa) amma yana ƙarfafa bayyana gaskiya da ganowa.
Alamar ruwa ta SynthID

Bayyanar AI mai haɓakawa ya haɓaka samar da hotuna, rubutu, sauti, da bidiyo akan sikelin da ba a taɓa gani ba, kuma tare da shi, shakku game da asalinsu sun girma; a cikin wannan mahallin, Gano ko an ƙirƙira abun ciki ko abin ƙirƙira ta samfuri ya zama mabuɗin aminci na dijital. SynthID zai iya zama babban bayani.

Wannan shine shawarar Google DeepMind, a iyali na "marasa ganuwa" dabarun watermarking waɗanda aka haɗa kai tsaye cikin abubuwan da aka samar da AI don sauƙaƙe tabbatarwa na gaba ba tare da ɓata ingancin da mutane ke fahimta ba.

Menene SynthID kuma menene ake nufi da shi?

Google ya bayyana SynthID a matsayin kayan aiki don takamaiman alamar ruwa don abun ciki da aka samar da AI, wanda aka tsara don inganta gaskiya da ganowa. Ba'a iyakance ga tsari ɗaya kawai ba: ya ƙunshi hotuna, sauti, rubutu, da bidiyo, ta yadda za'a iya amfani da hanyar fasaha guda ɗaya akan nau'ikan kafofin watsa labarai daban-daban.

A cikin yanayin yanayin Google an riga an yi amfani da shi ta hanyoyi da yawa:

  • A cikin rubutu, Tuta ta shafi martanin Gemini.
  • A cikin sauti, ana amfani da shi tare da ƙirar Lyria kuma tare da fasali kamar ƙirƙirar kwasfan fayiloli daga rubutu a cikin littafin rubutu LM.
  • En bidiyo, an haɗa shi cikin abubuwan ƙirƙirar Veo, ƙirar da ke iya ƙirƙirar shirye-shiryen bidiyo a cikin 1080p.

A duk waɗannan lokutan alamar ruwa Ba shi yiwuwa, kuma an tsara shi don jure gyare-gyare akai-akai kamar matsawa, canje-canjen rhythm a cikin yanke sauti ko bidiyo, ba tare da rage inganci ba.

Bayan fasahar, manufarta mai amfani a bayyane take: taimaka bambance kayan haɗin gwiwa daga abin da aka samar ba tare da AI ba, don masu amfani, kafofin watsa labaru da cibiyoyi su iya yanke shawara game da amfani da rarraba abun ciki.

synthID

Yadda alamar ruwa ta rubutu (SynthID Text) ke aiki

A aikace, Rubutun SynthID yana aiki azaman a mai sarrafa logit wanda ke shiga cikin bututun samar da samfurin harshe bayan abubuwan tacewa na yau da kullun (Top-K da Top-P). Wannan na'ura mai sarrafawa da dabara yana canza makin ƙirar tare da a aikin pseudorandom g, shigar da bayanai cikin tsarin yuwuwar ba tare da gabatar da kayan tarihi na bayyane a cikin salo ko ingancin rubutu ba.

Keɓaɓɓen abun ciki - Danna nan  Yadda ake ba da kyauta a cikin kakar fortnite 5

Sakamakon rubutu ne wanda, a kallon farko, yana kiyayewa inganci, daidaito da ruwa, amma wanda ya ƙunshi tsarin ƙididdiga wanda ake iya ganowa tare da ƙwararren mai tantancewa.

Don ƙirƙirar rubutu tare da alamar ruwa ba lallai ba ne sake horar da samfurin: kawai samar da tsari ga hanyar .generate() kuma kunna SynthID Text's logit processor. Wannan yana sauƙaƙa ɗauka kuma yana ba da damar gwaji tare da samfuran riga an tura su.

Saitunan alamar ruwa sun haɗa da mahimman sigogi guda biyu: keys y ngram_len. Maɓallai jeri ne na musamman, bazuwar adadin da aka yi amfani da su don tantance ƙamus ta amfani da aikin g; Tsawon wancan jeri yana sarrafa adadin "yadudduka" na alamar ruwa. A halin yanzu, ngram_len Yana saita ma'auni tsakanin ganowa da ƙarfi zuwa canje-canje: ƙima mafi girma suna sa ganowa cikin sauƙi amma sanya hatimin ya zama mai rauni ga canje-canje; darajar 5 yana aiki da kyau a matsayin farawa.

Bugu da ƙari, Rubutun SynthID yana amfani da a tebur samfurin da kaddarori biyu: sampling_table_size y sampling_table_seed. An ba da shawarar girman aƙalla 2 ^ 16 don tabbatar da cewa aikin g yana aiki a cikin kwanciyar hankali da rashin son zuciya lokacin yin samfur, la'akari da cewa. girman girman yana nufin ƙarin ƙwaƙwalwar ajiya a lokacin bincike. Irin na iya zama kowace lamba, wanda ke sauƙaƙe sake haifuwa a cikin mahallin ƙima.

Akwai muhimmin nuance don inganta siginar: maimaita n-grams a cikin tarihin kwanan nan na mahallin (an bayyana ta context_history_size) ba a yi musu alama ba, wanda ke ba da fifiko ga gano alamar a cikin sauran rubutun kuma yana rage halayen ƙarya masu alaƙa da maimaitawar yanayi na yanayi.

Don tsaro, kowane saitin alamar ruwa (gami da makullinsa, iri da sigogi) dole ne a adana a keɓeIdan waɗannan maɓallan sun leko, ɓangarori na uku za su iya yin kwafin alamar cikin sauƙi ko kuma, mafi muni tukuna, yunƙurin sarrafa shi da cikakken ilimin tsarin sa.

Keɓaɓɓen abun ciki - Danna nan  Yadda ake ganin hanyoyin bas akan Google Maps

Yadda ake ganowa: tabbaci mai yiwuwa tare da ƙofa

Tabbatar da alamar ruwa a cikin rubutu ba binary bane, amma mai yiwuwaGoogle ya buga na'urar ganowa ta Bayesian akan duka Transformers da GitHub wanda, bayan nazarin tsarin ƙididdiga na rubutun, ya dawo da yuwuwar jihohi uku: mai alama, ba a yi wa alama ba o rashin tabbasWannan fitowar ta uku tana ba da damar daidaita aiki zuwa haɗari daban-daban da mahallin haƙurin kuskure.

Ana iya daidaita halayen mai tabbatarwa ta kofa biyu wanda ke kula da ƙimar ƙima da ƙima. A takaice dai, zaku iya daidaita girman yadda kuke son ganowa ya kasance, sadaukar da hankali don daidaito ko akasin haka ya danganta da yanayin amfaninku, wani abu musamman mai amfani a ciki yanayin edita, daidaitawa ko dubawa na ciki.

Idan samfura da yawa suna raba iri ɗaya tokenizer, kuma za a iya raba daidai iri iri da kuma mai gano iri ɗaya, muddin tsarin horo na mai tantancewa ya ƙunshi misalan duka. Wannan yana sauƙaƙe gina "alamomin ruwa na gama gari" a cikin ƙungiyoyi masu LLMs da yawa.

Da zarar an horar da mai ganowa, ƙungiyoyi za su iya yanke shawarar matakin bayyanarsa: kiyaye shi gaba ɗaya mai zaman kansa, bayar da shi ta hanya na masu zaman kansu ta hanyar API, ko sake shi ta wata hanya jama'a don saukewa da amfani da wasu na uku. Zaɓin ya dogara da ƙarfin aikin kowace mahalli, haɗarin tsari, da dabarun bayyana gaskiya.

SynthID AI fasahar alamar ruwa

Alamar ruwa akan hotuna, sauti da bidiyo

An tsara wannan alamar don ɗorewa sauye-sauye na kowa kamar yankan, sake girma, juyawa, canza launi, ko ma hotunan kariyar kwamfuta, ba tare da buƙatar riƙe metadata ba. Da farko, an ba da amfani da shi ta hanyar Hoto a cikin Vertex AI, inda masu amfani za su iya zaɓar kunna alamar ruwa lokacin samar da abun ciki.

A cikin sauti, alamar ita ce ba a ji ba kuma yana goyan bayan ayyuka gama gari kamar matsawa MP3, ƙara ƙara, ko canza saurin sake kunnawa. Google yana haɗa shi a ciki Lyria kuma a cikin fasalulluka na tushen Littafin rubutu na LM, haɓaka siginar koda lokacin da fayil ɗin ya wuce ta rafukan wallafe-wallafen asara.

A cikin bidiyo, hanyar da ake bi tana maimaita tsarin hoto: an saka alamar a cikin pixels na kowane firam, ba tare da fahimta ba, kuma ya kasance barga a kan masu tacewa, canje-canje a ƙimar wartsakewa, matsawa ko yanke. Bidiyoyin da aka kirkira ta Na gani Kayan aiki kamar VideoFX sun haɗa wannan alamar yayin ƙirƙira, rage haɗarin shafewar haɗari a cikin gyare-gyare na gaba.

Keɓaɓɓen abun ciki - Danna nan  Yadda ake cire Hotunan Google daga Google Drive

Samfuran algorithms da ƙarfin hatimin rubutu

Zuciyar SynthID Text ita ce samfurin algorithm, wanda ke amfani da maɓalli (ko saitin maɓallai) don sanya ƙima-bazuwar ga kowane alama mai yuwuwa. Ana zana 'yan takara daga rarraba samfurin (bayan Top-K/Top-P) kuma a sanya su cikin "gasa" biyo bayan zagaye na kawar, har sai an zaɓi alamar mafi girma bisa ga aikin g.

Wannan tsarin zaɓin ya fi dacewa da tsarin ƙididdiga na ƙarshe na yiwuwar ɗaukar alamar alamar, amma ba tare da tilasta zaɓuɓɓukan da ba na dabi'a ba. Bisa ga binciken da aka buga, fasaha ya sa ya zama mai wahala goge, gurbata, ko baya hatimin, ko da yaushe a cikin m iyaka a kan abokan adawar tare da lokaci da dalili.

Kyakkyawan aiwatarwa da ayyukan tsaro

  • Idan kuna tura Rubutun SynthID, bi da tsarin kamar sirrin samarwa: Ajiye maɓallai da tsaba a cikin amintaccen manajan, tilasta ikon sarrafawa, da ba da izinin juyawa lokaci-lokaci. Hana yadudduka na rage kai hari kan yunƙurin injiniyan baya.
  • Tsara tsarin da zai sa ido don mai gano ku: yi rikodin ƙimar inganci/mara kyau, daidaita ƙofofin bisa ga mahallin kuma yanke shawarar manufofin gano ku bayyana (masu zaman kansu, masu zaman kansu ta hanyar API, ko na jama'a) tare da tabbataccen ƙa'idodin doka da aiki. Kuma idan ƙila da yawa suna raba alamar tokenizer, la'akari da horo a na kowa ganewa tare da misalan dukkan su don sauƙaƙe kulawa.
  • A matakin aiki, yana kimanta tasirin sampling_table_size a ƙwaƙwalwar ajiya da latency, kuma zaɓi a ngram_len wanda ke daidaita juriyar ku don gyarawa tare da buƙatar ingantaccen ganowa. Ka tuna don ware maimaita n-grams (ta context_history_size) don inganta sigina a cikin rubutu mai gudana.

SynthID ba harsashi na azurfa ba ne akan rashin fahimta, amma yana ba da tushe mai mahimmanci don sake gina sarkar amana a cikin zamanin AI. Ta hanyar shigar da siginar tabbatarwa a cikin rubutu, hotuna, sauti, da bidiyo, da buɗe sashin rubutu ga al'umma, Google DeepMind yana turawa zuwa gaba inda za'a iya tantance sahihancin a aikace, aunawa, kuma, sama da duka, hanya mai dacewa tare da kerawa da ingancin abun ciki.