- AI-உருவாக்கிய உள்ளடக்கத்தை அடையாளம் காண, SynthID, உரை, படங்கள், ஆடியோ மற்றும் வீடியோவில் புலப்படாத வாட்டர்மார்க்குகளை உட்பொதிக்கிறது.
- உரையில் இது விசைகள் மற்றும் n-கிராம்களுடன் ஒரு லாஜிட் செயலியாக செயல்படுகிறது, பேய்சியன் கண்டறிதலை வரம்புகளால் கட்டமைக்க முடியும்.
- இந்த செயல்படுத்தல் டிரான்ஸ்ஃபார்மர்ஸ் 4.46.0+ இல் கிடைக்கிறது, அதிகாரப்பூர்வ இடம் மற்றும் GitHub இல் குறிப்புடன்.
- இது வரம்புகளைக் கொண்டுள்ளது (குறுகிய உரைகள், மொழிபெயர்ப்புகள், மீண்டும் எழுதுதல்) ஆனால் வெளிப்படைத்தன்மை மற்றும் கண்டறியும் தன்மையை வலுப்படுத்துகிறது.
ஜெனரேட்டிவ் AI இன் தோற்றம் படங்கள், உரைகள், ஆடியோக்கள் மற்றும் வீடியோக்களின் உற்பத்தியை இதற்கு முன்பு பார்த்திராத அளவில் அதிகரித்துள்ளது, மேலும் அதன் தோற்றம் குறித்த சந்தேகங்களும் அதிகரித்துள்ளன; இந்த சூழலில், உள்ளடக்கம் ஒரு மாதிரியால் உருவாக்கப்பட்டதா அல்லது மாற்றப்பட்டதா என்பதைக் கண்டறியவும். டிஜிட்டல் நம்பிக்கைக்கு திறவுகோலாக மாறுகிறது. சிந்த்ஐடி ஒரு சிறந்த தீர்வாக இருக்க முடியும்.
இது கூகிள் டீப் மைண்டின் திட்டம், ஒரு "கண்ணுக்குத் தெரியாத" வாட்டர்மார்க்கிங் நுட்பங்களின் குடும்பம் மனிதர்களால் உணரப்படும் தரத்தை குறைக்காமல், அடுத்தடுத்த சரிபார்ப்பை எளிதாக்க, AI-உருவாக்கிய உள்ளடக்கத்தில் நேரடியாக உட்பொதிக்கப்படுகின்றன.
SynthID என்றால் என்ன, அது எதற்காக?
கூகிள் SynthID ஐ ஒரு கருவியாக விவரிக்கிறது AI-உருவாக்கிய உள்ளடக்கத்திற்கான குறிப்பிட்ட வாட்டர்மார்க், வெளிப்படைத்தன்மை மற்றும் கண்டறியும் தன்மையை ஊக்குவிக்க வடிவமைக்கப்பட்டுள்ளது. இது ஒரு வடிவத்திற்கு மட்டுப்படுத்தப்படவில்லை: இது படங்கள், ஆடியோ, உரை மற்றும் வீடியோவை உள்ளடக்கியது, இதனால் பல்வேறு வகையான ஊடகங்களுக்கு ஒரே தொழில்நுட்ப அணுகுமுறையைப் பயன்படுத்த முடியும்.
கூகிள் சுற்றுச்சூழல் அமைப்பில் இது ஏற்கனவே பல வழிகளில் பயன்படுத்தப்படுகிறது:
- உரையில், கொடி மிதுன ராசி பதில்களுக்குப் பொருந்தும்.
- ஆடியோவில், லைரியா மாதிரியுடன் பயன்படுத்தப்படுகிறது மற்றும் நோட்புக் LM இல் உரையிலிருந்து பாட்காஸ்ட்களை உருவாக்குவது போன்ற அம்சங்களுடன் பயன்படுத்தப்படுகிறது.
- En வீடியோ, 1080p இல் கிளிப்களை உருவாக்கும் திறன் கொண்ட மாடலான Veo படைப்புகளில் ஒருங்கிணைக்கப்பட்டுள்ளது.
எல்லா சந்தர்ப்பங்களிலும், வாட்டர்மார்க் இது கண்ணுக்குப் புலப்படாதது, மேலும் வடிவமைக்கப்பட்டுள்ளது அடிக்கடி ஏற்படும் மாற்றங்களைத் தாங்கும் தரத்தை குறைக்காமல், சுருக்கம், ஆடியோ அல்லது வீடியோ வெட்டுக்களில் தாள மாற்றங்கள் போன்றவை.
தொழில்நுட்பத்திற்கு அப்பால், அதன் நடைமுறை நோக்கம் தெளிவாக உள்ளது: செயற்கைப் பொருளை செயற்கை நுண்ணறிவு இல்லாமல் தயாரிக்கப்பட்ட பொருட்களிலிருந்து வேறுபடுத்திப் பார்க்க உதவும்., இதனால் பயனர்கள், ஊடகங்கள் மற்றும் நிறுவனங்கள் உள்ளடக்கத்தின் நுகர்வு மற்றும் விநியோகம் குறித்து தகவலறிந்த முடிவுகளை எடுக்க முடியும்.

உரை வாட்டர்மார்க் (SynthID உரை) எவ்வாறு செயல்படுகிறது?
நடைமுறையில், SynthID உரை ஒரு லாஜிட் செயலி இது வழக்கமான மாதிரி வடிப்பான்களுக்குப் பிறகு (டாப்-கே மற்றும் டாப்-பி) மொழி மாதிரி உருவாக்க பைப்லைனில் இணைகிறது. இந்த செயலி மாதிரி மதிப்பெண்களை நுட்பமாக மாற்றியமைக்கிறது. போலி சீரற்ற செயல்பாடு g, உரையின் பாணி அல்லது தரத்தில் புலப்படும் கலைப்பொருட்களை அறிமுகப்படுத்தாமல் நிகழ்தகவுகளின் வடிவத்தில் தகவல்களை குறியாக்கம் செய்தல்.
இதன் விளைவாக, முதல் பார்வையில், பராமரிக்கப்படும் ஒரு உரை தரம், துல்லியம் மற்றும் திரவத்தன்மை, ஆனால் இது ஒரு பயிற்சி பெற்ற சரிபார்ப்பாளருடன் கண்டறியக்கூடிய புள்ளிவிவர கட்டமைப்பை உள்ளடக்கியது.
வாட்டர்மார்க் மூலம் உரையை உருவாக்க அது அவசியமில்லை. மாதிரியை மீண்டும் பயிற்சி செய்.: முறைக்கு ஒரு உள்ளமைவை வழங்கவும். .generate() மற்றும் SynthID Text இன் லாஜிட் செயலியை செயல்படுத்தவும். இது தத்தெடுப்பை எளிதாக்குகிறது மற்றும் ஏற்கனவே பயன்படுத்தப்பட்ட மாதிரிகளுடன் சோதனை செய்ய அனுமதிக்கிறது.
வாட்டர்மார்க் அமைப்புகளில் இரண்டு அத்தியாவசிய அளவுருக்கள் உள்ளன: keys y ngram_len. சாவிகள் g செயல்பாட்டைப் பயன்படுத்தி சொற்களஞ்சியத்தை மதிப்பிடப் பயன்படுத்தப்படும் தனித்துவமான, சீரற்ற முழு எண்களின் பட்டியல்; அந்தப் பட்டியலின் நீளம் எத்தனை "அடுக்குகள்" வாட்டர்மார்க்கிங் பயன்படுத்தப்படுகிறது என்பதைக் கட்டுப்படுத்துகிறது. இதற்கிடையில், ngram_len கண்டறிதல் மற்றும் வலிமைக்கு இடையிலான சமநிலையை மாற்றங்களுக்கு அமைக்கிறது: அதிக மதிப்புகள் கண்டறிதலை எளிதாக்குகின்றன, ஆனால் முத்திரையை மாற்றங்களுக்கு மிகவும் பாதிக்கக்கூடியதாக ஆக்குகின்றன; 5 இன் மதிப்பு ஒரு தொடக்க புள்ளியாக நன்றாக வேலை செய்கிறது.
கூடுதலாக, SynthID உரை ஒரு மாதிரி அட்டவணை இரண்டு பண்புகளுடன்: sampling_table_size y sampling_table_seed. மாதிரி எடுக்கும்போது g செயல்பாடு நிலையானதாகவும் பாரபட்சமற்றதாகவும் செயல்படுவதை உறுதிசெய்ய குறைந்தபட்சம் 2^16 அளவு பரிந்துரைக்கப்படுகிறது, கணக்கில் எடுத்துக்கொள்ளும்போது பெரிய அளவு என்றால் அதிக நினைவகம் என்று பொருள். அனுமானத்தின் போது. விதை எந்த முழு எண்ணாகவும் இருக்கலாம், இது மதிப்பீட்டு சூழல்களில் இனப்பெருக்கத்தை எளிதாக்குகிறது.
சிக்னலை மேம்படுத்த ஒரு முக்கியமான நுணுக்கம் உள்ளது: மீண்டும் மீண்டும் n-கிராம்கள் சூழலின் சமீபத்திய வரலாற்றில் (வரையறுக்கப்பட்டது context_history_size) குறிக்கப்படவில்லை, இது உரையின் மீதமுள்ள பகுதியில் குறியைக் கண்டறியும் தன்மையை ஆதரிக்கிறது மற்றும் மொழியின் இயல்பான மறுநிகழ்வுகளுடன் இணைக்கப்பட்ட தவறான நேர்மறைகளைக் குறைக்கிறது.
பாதுகாப்பிற்காக, ஒவ்வொரு வாட்டர்மார்க் உள்ளமைவும் (அதன் விசைகள், விதை மற்றும் அளவுருக்கள் உட்பட) தனிப்பட்ட முறையில் சேமிக்கப்பட வேண்டும்இந்த சாவிகள் கசிந்தால், மூன்றாம் தரப்பினர் அந்த பிராண்டை எளிதாகப் பிரதிபலிக்கலாம் அல்லது, இன்னும் மோசமாக, அதன் அமைப்பைப் பற்றிய முழு அறிவோடு அதைக் கையாள முயற்சிக்கலாம்.
கண்டறிவது எப்படி: வரம்புகளுடன் நிகழ்தகவு சரிபார்ப்பு
உரையில் ஒரு வாட்டர்மார்க்கின் சரிபார்ப்பு பைனரி அல்ல, ஆனால் நிகழ்தகவு சார்ந்தகூகிள் டிரான்ஸ்ஃபார்மர்கள் மற்றும் கிட்ஹப் இரண்டிலும் ஒரு பேய்சியன் டிடெக்டரை வெளியிடுகிறது, இது உரையின் புள்ளிவிவர வடிவத்தை பகுப்பாய்வு செய்த பிறகு, மூன்று சாத்தியமான நிலைகளைத் தருகிறது: பிராண்டுடன், பிராண்ட் இல்லை o நிச்சயமற்றதுஇந்த மும்மை வெளியீடு செயல்பாட்டை வெவ்வேறு ஆபத்து மற்றும் பிழை சகிப்புத்தன்மை சூழல்களுக்கு ஏற்ப சரிசெய்ய அனுமதிக்கிறது.
சரிபார்ப்பாளரின் நடத்தையை இவ்வாறு உள்ளமைக்க முடியும் இரண்டு வரம்புகள் தவறான நேர்மறைகள் மற்றும் தவறான எதிர்மறைகளின் விகிதத்தைக் கட்டுப்படுத்துகின்றன. வேறு வார்த்தைகளில் கூறுவதானால், கண்டறிதல் எவ்வளவு கண்டிப்பாக இருக்க வேண்டும் என்பதை நீங்கள் அளவீடு செய்யலாம், துல்லியத்திற்காக உணர்திறனை தியாகம் செய்யலாம் அல்லது உங்கள் பயன்பாட்டு வழக்கைப் பொறுத்து நேர்மாறாகவும், குறிப்பாக பயனுள்ளதாக இருக்கும் தலையங்க சூழல்கள், மிதமான தன்மை அல்லது உள் தணிக்கை.
பல மாதிரிகள் ஒரே மாதிரியாக இருந்தால் டோக்கனைசர், மேலும் பகிரலாம் அதே பிராண்ட் உள்ளமைவு மற்றும் அதே கண்டறிப்பான்சரிபார்ப்பாளரின் பயிற்சித் தொகுப்பில் அவை அனைத்திற்கும் எடுத்துக்காட்டுகள் இருந்தால். இது பல LLMகளைக் கொண்ட நிறுவனங்களில் "பொதுவான வாட்டர்மார்க்குகளை" உருவாக்குவதை எளிதாக்குகிறது.
கண்டுபிடிப்பான் பயிற்சி பெற்றவுடன், நிறுவனங்கள் அதன் வெளிப்பாட்டின் அளவை தீர்மானிக்கலாம்: அதை வைத்திருங்கள் முற்றிலும் தனிப்பட்டது, ஒரு வழியில் அதை வழங்குங்கள் பகுதி தனியார் ஒரு API வழியாக, அல்லது அதை ஒரு வழியில் வெளியிடுங்கள் பொது மூன்றாம் தரப்பினரால் பதிவிறக்கம் செய்து பயன்படுத்துவதற்கு. தேர்வு ஒவ்வொரு நிறுவனத்தின் உள்கட்டமைப்பு இயக்க திறன், ஒழுங்குமுறை அபாயங்கள் மற்றும் வெளிப்படைத்தன்மை உத்தியைப் பொறுத்தது.

படங்கள், ஆடியோ மற்றும் வீடியோவில் வாட்டர்மார்க்
இந்த பிராண்ட் நீடித்து உழைக்கும் வகையில் வடிவமைக்கப்பட்டுள்ளது பொதுவான மாற்றங்கள் மெட்டாடேட்டாவைத் தக்கவைத்துக்கொள்ள வேண்டிய அவசியமின்றி, செதுக்குதல், மறுஅளவிடுதல், சுழற்றுதல், நிறத்தை மாற்றுதல் அல்லது ஸ்கிரீன்ஷாட்கள் போன்றவை. ஆரம்பத்தில், இதன் பயன்பாடு வெர்டெக்ஸ் AI இல் படம், உள்ளடக்கத்தை உருவாக்கும் போது பயனர்கள் வாட்டர்மார்க்கை செயல்படுத்த தேர்வு செய்யலாம்.
ஆடியோவில், பிராண்ட் என்பது செவிக்கு புலப்படாமல் மேலும் MP3 சுருக்கம், சத்தத்தைச் சேர்ப்பது அல்லது பிளேபேக் வேகத்தை மாற்றுவது போன்ற பொதுவான செயல்பாடுகளை ஆதரிக்கிறது. கூகிள் இதை ஒருங்கிணைக்கிறது லிரியா மற்றும் நோட்புக் LM-அடிப்படையிலான அம்சங்களில், கோப்பு இழப்புள்ள வெளியீட்டு ஸ்ட்ரீம்கள் வழியாகச் சென்றாலும் கூட சிக்னலை அதிகரிக்கிறது.
வீடியோவில், அணுகுமுறை பட அணுகுமுறையை நகலெடுக்கிறது: பிராண்ட் இதில் உட்பொதிக்கப்பட்டுள்ளது ஒவ்வொரு சட்டகத்தின் பிக்சல்கள், புலப்படாமல், வடிப்பான்கள், புதுப்பிப்பு விகிதத்தில் ஏற்படும் மாற்றங்கள், சுருக்கம் அல்லது recortes. வீடியோக்கள் உருவாக்கியது நான் பார்க்கிறேன் VideoFX போன்ற கருவிகள் உருவாக்கத்தின் போது இந்தக் குறியைச் சேர்த்து, அடுத்தடுத்த திருத்தங்களில் தற்செயலான நீக்கத்தின் அபாயத்தைக் குறைக்கின்றன.
மாதிரி வழிமுறைகள் மற்றும் உரை முத்திரையின் வலிமை
SynthID உரையின் இதயம் அதன் மாதிரி வழிமுறை, இது ஒவ்வொரு சாத்தியமான டோக்கனுக்கும் போலி-சீரற்ற மதிப்பெண்களை ஒதுக்க ஒரு விசையை (அல்லது விசைகளின் தொகுப்பை) பயன்படுத்துகிறது. மாதிரியின் விநியோகத்திலிருந்து (டாப்-கே/டாப்-பிக்குப் பிறகு) வேட்பாளர்கள் எடுக்கப்பட்டு, g செயல்பாட்டின் படி அதிக மதிப்பெண் பெற்ற டோக்கன் தேர்ந்தெடுக்கப்படும் வரை, நீக்குதல் சுற்றுகளுக்குப் பிறகு "போட்டியில்" வைக்கப்படுகிறார்கள்.
இந்த தேர்வு நடைமுறை சாதகமாக உள்ளது இறுதி புள்ளிவிவர முறை நிகழ்தகவுகளில் பிராண்டின் அடையாளத்தைக் கொண்டுள்ளன, ஆனால் இயற்கைக்கு மாறான விருப்பங்களை கட்டாயப்படுத்தாமல். வெளியிடப்பட்ட ஆய்வுகளின்படி, நுட்பம் அதை கடினமாக்குகிறது அழிக்கவும், பொய்யாக்கவும் அல்லது தலைகீழாக மாற்றவும். நேரம் மற்றும் உந்துதலுடன் எதிரிகளுக்கு எதிராக எப்போதும் நியாயமான வரம்புகளுக்குள் முத்திரை.
நல்ல செயல்படுத்தல் மற்றும் பாதுகாப்பு நடைமுறைகள்
- நீங்கள் SynthID உரையைப் பயன்படுத்தினால், உள்ளமைவை இவ்வாறு கையாளவும் உற்பத்தி ரகசியம்: பாதுகாப்பான மேலாளரில் சாவிகள் மற்றும் விதைகளை சேமித்து வைக்கவும், அணுகல் கட்டுப்பாடுகளைச் செயல்படுத்தவும், அவ்வப்போது சுழற்சியை அனுமதிக்கவும். கசிவுகளைத் தடுப்பது தலைகீழ் பொறியியல் முயற்சிகளுக்கு எதிரான தாக்குதல் மேற்பரப்பைக் குறைக்கிறது.
- ஒரு திட்டத்தை வடிவமைக்கவும் கண்காணிப்பு உங்கள் கண்டுபிடிப்பாளருக்கு: தவறான நேர்மறை/எதிர்மறை விகிதங்களைப் பதிவுசெய்து, சூழலுக்கு ஏற்ப வரம்புகளை சரிசெய்து, உங்கள் கண்டறிதல் கொள்கையை முடிவு செய்யுங்கள். வெளிப்பாடு (தனியார், API வழியாக அரை-தனியார் அல்லது பொது) தெளிவான சட்ட மற்றும் செயல்பாட்டு அளவுகோல்களுடன். மேலும் பல மாதிரிகள் டோக்கனைசரைப் பகிர்ந்து கொண்டால், பயிற்சி அளிப்பதைக் கருத்தில் கொள்ளுங்கள் a பொதுவான கண்டுபிடிப்பான் பராமரிப்பை எளிதாக்குவதற்கு அவை அனைத்திற்கும் எடுத்துக்காட்டுகளுடன்.
- செயல்திறன் மட்டத்தில், இது இதன் தாக்கத்தை மதிப்பிடுகிறது
sampling_table_sizeநினைவகம் மற்றும் தாமதத்தில், மற்றும் ஒரு தேர்வு செய்யவும்ngram_lenஇது நம்பகமான கண்டறிதலின் தேவையுடன் திருத்தங்களுக்கான உங்கள் சகிப்புத்தன்மையை சமநிலைப்படுத்துகிறது. மீண்டும் மீண்டும் n-கிராம்களைத் தவிர்க்க நினைவில் கொள்ளுங்கள் (வழியாகcontext_history_size) பாயும் உரையில் சமிக்ஞையை மேம்படுத்த.
தவறான தகவல்களுக்கு எதிரான ஒரு வெள்ளி தோட்டா SynthID அல்ல, ஆனால் உருவாக்கும் AI சகாப்தத்தில் நம்பிக்கைச் சங்கிலியை மீண்டும் கட்டியெழுப்புவதற்கான அடிப்படை கட்டுமானத் தொகுதியை வழங்குகிறது. உரை, படங்கள், ஆடியோ மற்றும் வீடியோவில் மூல சமிக்ஞைகளை உட்பொதிப்பதன் மூலமும், உரை கூறுகளை சமூகத்திற்குத் திறப்பதன் மூலமும், கூகிள் டீப் மைண்ட், நம்பகத்தன்மையை நடைமுறை, அளவிடக்கூடிய மற்றும் எல்லாவற்றிற்கும் மேலாக, உள்ளடக்கத்தின் படைப்பாற்றல் மற்றும் தரத்துடன் இணக்கமான முறையில் தணிக்கை செய்யக்கூடிய எதிர்காலத்தை நோக்கி முன்னேறி வருகிறது.
பல்வேறு டிஜிட்டல் மீடியாக்களில் பத்து வருடங்களுக்கும் மேலான அனுபவத்துடன் தொழில்நுட்பம் மற்றும் இணைய சிக்கல்களில் நிபுணத்துவம் பெற்ற ஆசிரியர். நான் ஈ-காமர்ஸ், கம்யூனிகேஷன், ஆன்லைன் மார்க்கெட்டிங் மற்றும் விளம்பர நிறுவனங்களுக்கு எடிட்டராகவும், உள்ளடக்கத்தை உருவாக்குபவராகவும் பணியாற்றியுள்ளேன். பொருளாதாரம், நிதி மற்றும் பிற துறைகளின் இணையதளங்களிலும் நான் எழுதியுள்ளேன். என் வேலையும் என் விருப்பம். இப்போது, என் கட்டுரைகள் மூலம் Tecnobits, நமது வாழ்க்கையை மேம்படுத்த தொழில்நுட்ப உலகம் ஒவ்வொரு நாளும் நமக்கு வழங்கும் அனைத்து செய்திகளையும் புதிய வாய்ப்புகளையும் ஆராய முயற்சிக்கிறேன்.