- SynthID በ AI የመነጨ ይዘትን ለመለየት የማይታዩ የውሃ ምልክቶችን ወደ ጽሑፍ፣ ምስሎች፣ ኦዲዮ እና ቪዲዮ አካቷል።
- በጽሁፍ ውስጥ እንደ ሎጊት ፕሮሰሰር ከቁልፍ እና n-ግራም ጋር ይሰራል፣ የቤኤዥያን ማወቂያ በገደቦች ሊዋቀር ይችላል።
- አተገባበሩ በTransformers 4.46.0+፣ ከኦፊሴላዊ ክፍተት እና ከ GitHub ማጣቀሻ ጋር ይገኛል።
- ገደቦች አሉት (አጫጭር ጽሑፎች፣ ትርጉሞች፣ እንደገና ይጽፋሉ) ነገር ግን ግልጽነትን እና ክትትልን ያጠናክራል።
የጄኔሬቲቭ AI መፈጠር ምስሎችን ፣ ጽሑፎችን ፣ ኦዲዮዎችን እና ቪዲዮዎችን ከዚህ በፊት ታይቶ በማይታወቅ መጠን እንዲመረቱ አድርጓል ፣ እና በእሱ አመጣጥ ላይ ጥርጣሬዎች ጨምረዋል ። በዚህ አውድ ውስጥ ይዘት በአምሳያ መፈጠሩን ወይም መቀየሩን ይለዩ ለዲጂታል እምነት ቁልፍ ይሆናል. SynthID ትልቅ መፍትሄ ሊሆን ይችላል።
ይህ የGoogle DeepMind ሃሳብ ነው፣ ሀ "የማይታዩ" የውሃ ምልክት ዘዴዎች ቤተሰብ በሰዎች የሚስተዋለውን ጥራት ሳይቀንስ ተከታይ ማረጋገጫን ለማመቻቸት በቀጥታ ወደ AI የመነጨ ይዘት ውስጥ የተካተቱት።
SynthID ምንድን ነው እና ለምን ዓላማ ነው?
Google SynthID እንደ መሳሪያ አድርጎ ይገልፃል። ለ AI-የመነጨ ይዘት የተወሰነ የውሃ ምልክትግልጽነት እና ክትትልን ለማስፋፋት የተነደፈ። በአንድ ፎርማት ብቻ የተገደበ አይደለም፡ ምስሎችን፣ ኦዲዮን፣ ጽሑፍን እና ቪዲዮን ያቀፈ ነው፣ ስለዚህም አንድ ነጠላ ቴክኒካል አቀራረብ ለተለያዩ የመገናኛ ብዙኃን ዓይነቶች ሊተገበር ይችላል።
በ Google ሥነ-ምህዳር ውስጥ ቀድሞውኑ በብዙ መንገዶች ጥቅም ላይ ውሏል።
- በጽሑፍ, ባንዲራ የጌሚኒ ምላሾችን ይመለከታል.
- በድምጽ, ከሊሪያ ሞዴል ጋር እና በማስታወሻ ደብተር LM ውስጥ ከጽሑፍ ፖድካስቶችን መፍጠር ከመሳሰሉ ባህሪያት ጋር ጥቅም ላይ ይውላል.
- En ቪድዮ, በ 1080 ፒ ክሊፖችን ማመንጨት የሚችል ሞዴል በ Veo ፈጠራዎች ውስጥ የተዋሃደ ነው።
በሁሉም ሁኔታዎች የ የውሃ ምልክት ለመረዳት የማይቻል ነው፣ እና እንዲሆን ተደርጎ ተዘጋጅቷል። ተደጋጋሚ ማሻሻያዎችን መቋቋም ጥራትን ሳይቀንሱ እንደ መጭመቅ፣የድምፅ ወይም የምስል መቆራረጥ የሪትም ለውጦች።
ከቴክኖሎጂው ባሻገር ተግባራዊ ዓላማው ግልፅ ነው፡- ያለ AI ከተመረተው ሰው ሰራሽ ቁስ ለመለየት ይረዳልተጠቃሚዎች፣ ሚዲያዎች እና ተቋማት ስለ ይዘት ፍጆታ እና ስርጭት በመረጃ ላይ የተመሰረተ ውሳኔ እንዲያደርጉ።

የጽሑፍ የውሃ ምልክት (SynthID ጽሑፍ) እንዴት እንደሚሰራ
በተግባር፣ SynthID ጽሑፍ እንደ ሀ ሎጊት ፕሮሰሰር ከተለመዱት የናሙና ማጣሪያዎች (ቶፕ-ኬ እና ቶፕ-ፒ) በኋላ ወደ ቋንቋው ሞዴል ማመንጨት ቧንቧ የሚገጣጠም. ይህ አንጎለ ኮምፒውተር የሞዴል ውጤቶችን በዘዴ በ ሀ pseudorandom ተግባር ሰየሚታዩ ቅርሶችን ወደ ፅሁፉ ዘይቤ እና ጥራት ሳያስገባ መረጃን በፕሮባቢሊቲ ንድፍ ውስጥ መክተት።
ውጤቱ በመጀመሪያ በጨረፍታ የሚይዘው ጽሑፍ ነው። ጥራት, ትክክለኛነት እና ፈሳሽነትነገር ግን ከሰለጠነ አረጋጋጭ ጋር ሊታወቅ የሚችል ስታቲስቲካዊ መዋቅርን ያካትታል።
በውሃ ምልክት ጽሑፍ ለመፍጠር አስፈላጊ አይደለም ሞዴሉን እንደገና ማሰልጠን: በቀላሉ ወደ ዘዴው ውቅር ያቅርቡ .generate() እና SynthID Text's Logit ፕሮሰሰርን ያግብሩ። ይህ ጉዲፈቻን ያቃልላል እና አስቀድሞ በተሰማሩ ሞዴሎች መሞከርን ይፈቅዳል።
የውሃ ምልክት ቅንጅቶች ሁለት አስፈላጊ መለኪያዎችን ያካትታሉ: keys y ngram_len. ቁልፎች የ g ተግባርን በመጠቀም መዝገበ ቃላትን ለማስቆጠር የሚያገለግሉ ልዩ፣ የዘፈቀደ ኢንቲጀሮች ዝርዝር ናቸው። የዚያ ዝርዝር ርዝመት ምን ያህል "ንብርብሮች" የውሃ ምልክት እንደሚተገበሩ ይቆጣጠራል. ይህ በእንዲህ እንዳለ፣ ngram_len በተለዋዋጭነት እና በጥንካሬ መካከል ያለውን ሚዛን ወደ ለውጦች ያዘጋጃል-ከፍተኛ እሴቶች መለየት ቀላል ያደርጉታል ነገር ግን ማህተሙን ለለውጦች የበለጠ ተጋላጭ ያደርገዋል። የ 5 እሴት እንደ መነሻ ሆኖ በደንብ ይሰራል.
በተጨማሪ፣ SynthID Text ሀ የናሙና ሰንጠረዥ ከሁለት ንብረቶች ጋር; sampling_table_size y sampling_table_seed. ናሙና በሚወሰድበት ጊዜ ተግባሩ ሰ በተረጋጋ እና በገለልተኛ መንገድ መያዙን ለማረጋገጥ ቢያንስ 2^16 መጠን ይመከራል። ትልቅ መጠን ማለት የበለጠ ማህደረ ትውስታ ማለት ነው በማጣቀሻ ጊዜ. ዘሩ ማንኛውም ኢንቲጀር ሊሆን ይችላል፣ ይህም በግምገማ አካባቢዎች መራባትን ያመቻቻል።
ምልክቱን ለማሻሻል አስፈላጊ የሆነ ልዩነት አለ: ተደጋጋሚ n-grams በዐውደ-ጽሑፉ የቅርብ ጊዜ ታሪክ ውስጥ (የተገለፀው በ context_history_size) ምልክት አይደረግባቸውም ፣ ይህም ምልክቱ በተቀረው ጽሑፍ ውስጥ እንዲገኝ የሚደግፍ እና ከቋንቋው ተፈጥሯዊ ድግግሞሽ ጋር የተገናኙ የውሸት አወንቶችን የሚቀንስ ነው።
ለደህንነት ሲባል፣ እያንዳንዱ የውሃ ምልክት ውቅር (ቁልፎቹን፣ ዘሩን እና ግቤቶችን ጨምሮ) በግል መቀመጥ አለበትእነዚህ ቁልፎች ከወጡ፣ ሶስተኛ ወገኖች የምርት ስሙን በቀላሉ ሊደግሙት ይችላሉ ወይም ይባስ ብሎ ስለ መዋቅሩ ሙሉ እውቀት ለመጠቀም ሊሞክሩ ይችላሉ።
እንዴት ማግኘት እንደሚቻል፡ ከገደቦች ጋር የፕሮባቢሊቲ ማረጋገጫ
በጽሁፍ ውስጥ የውሃ ምልክት ማረጋገጥ ሁለትዮሽ አይደለም፣ ግን ሊሆን የሚችልጎግል የByesian detector በሁለቱም ትራንስፎርመሮች እና GitHub ላይ አትሟል ይህም የጽሑፉን ስታቲስቲካዊ ንድፍ ከመረመረ በኋላ ሶስት ሊሆኑ የሚችሉ ሁኔታዎችን ይመልሳል፡ ከብራንድ ጋር, መለያ የለም o እርግጠኛ ያልሆነይህ የሶስተኛ ደረጃ ውፅዓት ክዋኔውን ወደ ተለያዩ የአደጋ እና የስህተት መቻቻል አውዶች ለማስተካከል ያስችላል።
የማረጋገጫው ባህሪ የሚዋቀረው በ ሁለት ደረጃዎች የውሸት አወንታዊ እና የውሸት አሉታዊ መጠንን የሚቆጣጠሩ። በሌላ አነጋገር፣ ማወቂያው ምን ያህል ጥብቅ እንዲሆን እንደሚፈልጉ መለካት፣ ትብነትን ለትክክለኛነት መስዋዕት ማድረግ ወይም በተቃራኒው እንደ የአጠቃቀም ጉዳይዎ ላይ በመመስረት በተለይ ጠቃሚ የሆነ ነገር የአርትዖት አከባቢዎች, ልከኝነት ወይም የውስጥ ኦዲት.
ብዙ ሞዴሎች ተመሳሳይ ከሆኑ tokenizer፣ እንዲሁም ማጋራት ይችላል። ተመሳሳይ የምርት ስም ውቅር እና ተመሳሳይ መፈለጊያ, የአረጋጋጭ የስልጠና ስብስብ የሁሉንም ምሳሌዎች እስካካተተ ድረስ. ይህ ብዙ ኤል ኤም ኤስ ባለባቸው ድርጅቶች ውስጥ "የጋራ የውሃ ምልክቶችን" መገንባትን ቀላል ያደርገዋል።
መርማሪው ከሰለጠነ በኋላ ድርጅቶች የተጋላጭነት ደረጃውን ሊወስኑ ይችላሉ፡ ያቆዩት። ሙሉ በሙሉ የግል፣ በሆነ መንገድ ያቅርቡ ከፊል-የግል በኤፒአይ በኩል፣ ወይም በሆነ መንገድ ይልቀቁት ህዝባዊ ለማውረድ እና በሶስተኛ ወገኖች ለመጠቀም. ምርጫው በእያንዳንዱ አካል የመሠረተ ልማት አውታር አቅም፣ የቁጥጥር ስጋቶች እና ግልጽነት ስትራቴጂ ላይ ይወሰናል።

በምስሎች፣ ኦዲዮ እና ቪዲዮ ላይ የውሃ ምልክት
ይህ የምርት ስም እንዲቆይ ነው የተቀየሰው የተለመዱ ለውጦች እንደ መከርከም፣ መጠን መቀየር፣ ማሽከርከር፣ ቀለም መቀየር፣ ወይም ቅጽበታዊ ገጽ እይታዎች፣ ያለ ሜታዳታ ማቆየት ሳያስፈልግ። መጀመሪያ ላይ አጠቃቀሙ የቀረበው በ ምስል በ Vertex AIተጠቃሚዎች ይዘትን በሚያመነጩበት ጊዜ የውሃ ምልክቱን ለማንቃት መምረጥ የሚችሉበት።
በድምጽ, የምርት ስም ነው የማይሰማ እና እንደ MP3 መጭመቅ፣ ጫጫታ መጨመር ወይም የመልሶ ማጫወት ፍጥነትን ማስተካከል ያሉ የተለመዱ ስራዎችን ይደግፋል። ጎግል ወደ ውስጥ ያዋህደዋል ሊዲያ እና በማስታወሻ ደብተር ኤልኤም ላይ የተመሰረቱ ባህሪያት፣ ፋይሉ በኪሳራ የህትመት ዥረቶች ውስጥ ሲያልፍም ምልክቱን ያሳድጋል።
በቪዲዮ ውስጥ, አቀራረቡ የምስል አቀራረብን ይደግማል: የምርት ስሙ በ ውስጥ ተካቷል የእያንዳንዱ ፍሬም ፒክስሎች፣ በማይታወቅ ሁኔታ ፣ እና በማጣሪያዎች ፣ በእድሳት ፍጥነት ላይ በሚደረጉ ለውጦች ፣ በመጭመቅ ወይም በፀና ይቆያል ማታለያዎች. የተፈጠሩ ቪዲዮዎች አየዋለሁ እንደ VideoFX ያሉ መሳሪያዎች በሚፈጠሩበት ጊዜ ይህንን ምልክት ያካተቱ ሲሆን ይህም በሚቀጥሉት አርትዖቶች ውስጥ በአጋጣሚ የመሰረዝ አደጋን ይቀንሳል።
የናሙና ስልተ ቀመሮች እና የጽሑፍ ማህተም ጥንካሬ
የSynthID ጽሑፍ ልብ የእሱ ነው። ናሙና አልጎሪዝም, ለእያንዳንዱ እምቅ ማስመሰያ የውሸት-ነሲብ ነጥቦችን ለመመደብ ቁልፍ (ወይም የቁልፎች ስብስብ) ይጠቀማል። እጩዎች ከአምሳያው ስርጭቱ (ከ Top-K/Top-P በኋላ) ይወሰዳሉ እና የማስወገጃ ዙሮችን ተከትለው ወደ "ውድድር" እንዲገቡ ይደረጋሉ፣ እስከ ከፍተኛው ነጥብ አስመዝግቦ በተግባሩ ሰ.
ይህ የምርጫ ሂደት ለ የመጨረሻው የስታቲስቲክስ ንድፍ የፕሮባቢሊቲዎች የምርት ስም ምልክት አላቸው ፣ ግን ከተፈጥሮ ውጭ የሆኑ አማራጮችን ሳያስገድዱ። በታተሙ ጥናቶች መሰረት, ዘዴው አስቸጋሪ ያደርገዋል መደምሰስ፣ ማጭበርበር ወይም መቀልበስ ማኅተም ፣ ሁል ጊዜ በተቃዋሚዎች ላይ በጊዜ እና ተነሳሽነት በተመጣጣኝ ገደቦች ውስጥ።
ጥሩ ትግበራ እና የደህንነት ልምዶች
- SynthID ጽሑፍን እያሰማራህ ከሆነ፣ አወቃቀሩን እንደ ተመልከት የምርት ሚስጥርቁልፎችን እና ዘሮችን ደህንነቱ በተጠበቀ አስተዳዳሪ ውስጥ ያከማቹ፣ የመዳረሻ መቆጣጠሪያዎችን ያስፈጽሙ እና በየጊዜው እንዲሽከረከሩ ይፍቀዱ። ፍሳሾችን መከላከል በተገላቢጦሽ የምህንድስና ሙከራዎች ላይ ያለውን የጥቃት ገጽታ ይቀንሳል።
- እቅድ ይንደፉ ክትትል ለፈላጊዎ፡ የውሸት አወንታዊ/አሉታዊ ተመኖችን ይመዝግቡ፣ እንደ አውድ መጠን ያስተካክሉ እና የማወቅ ፖሊሲዎን ይወስኑ። ተጋላጭነት (የግል፣ ከፊል-ግል በኤፒአይ ወይም በሕዝብ) ግልጽ ሕጋዊ እና የአሠራር መመዘኛዎች። እና ብዙ ሞዴሎች ማስመሰያ የሚጋሩ ከሆነ፣ ሀ ማሰልጠን ያስቡበት የጋራ መፈለጊያ ጥገናን ለማቃለል ከሁሉም ምሳሌዎች ጋር.
- በአፈፃፀሙ ደረጃ, ተጽእኖውን ይገመግማል
sampling_table_sizeበማስታወስ እና በማዘግየት, እና ይምረጡngram_lenለአርትዖቶች ያለዎትን መቻቻል ከአስተማማኝ የማወቅ ፍላጎት ጋር የሚመጣጠን ነው። ተደጋጋሚ n-ግራሞችን ማግለልዎን ያስታውሱ (በcontext_history_size) በወራጅ ጽሑፍ ውስጥ ምልክቱን ለማሻሻል.
SynthID የተሳሳተ መረጃን የሚቃወም የብር ጥይት አይደለም፣ ነገር ግን በጄኔሬቲቭ AI ዘመን ውስጥ የመተማመን ሰንሰለትን እንደገና ለመገንባት መሰረታዊ የግንባታ ቁሳቁስ ይሰጣል። የፕሮቬንሽን ምልክቶችን በጽሁፍ፣ በምስል፣ በድምጽ እና በቪዲዮ በማካተት እና የፅሁፍ ክፍሉን ለህብረተሰቡ ክፍት በማድረግ፣ ጎግል DeepMind ለወደፊት እየገፋው ነው ትክክለኛነት በተግባራዊ፣ በሚለካ እና ከሁሉም በላይ ከይዘት ፈጠራ እና ጥራት ጋር ተኳሃኝ በሆነ መንገድ።
በተለያዩ ዲጂታል ሚዲያዎች ከአስር አመት በላይ ልምድ ያለው በቴክኖሎጂ እና በይነመረብ ጉዳዮች ላይ ልዩ አርታኢ። ለኢ-ኮሜርስ፣ ለግንኙነት፣ ለኦንላይን ግብይት እና ለማስታወቂያ ኩባንያዎች እንደ አርታዒ እና የይዘት ፈጣሪ ሆኜ ሰርቻለሁ። በኢኮኖሚክስ፣ በፋይናንስ እና በሌሎች ዘርፎች ድረ-ገጾች ላይም ጽፌያለሁ። ስራዬም የኔ ፍላጎት ነው። አሁን በጽሑፎቼ በኩል Tecnobits, ህይወታችንን ለማሻሻል በየቀኑ የቴክኖሎጂ አለም የሚሰጠንን ዜና እና አዲስ እድሎችን ለመዳሰስ እሞክራለሁ.