- SynthID AI тарабынан түзүлгөн мазмунду аныктоо үчүн сезилбеген суу белгилерин текстке, сүрөттөргө, аудиого жана видеого киргизет.
- Текстте ал ачкычтары жана n-граммдары бар логит процессорунун ролун аткарат, босого боюнча конфигурациялануучу Байес аныктоосу менен.
- Ишке ашыруу Transformers 4.46.0+ версиясында, расмий мейкиндик жана GitHub шилтемеси менен жеткиликтүү.
- Анын чектөөлөрү бар (кыска тексттер, котормолор, кайра жазуулар), бирок ачыктыкты жана байкоо жүргүзүүнү күчөтөт.
Генеративдик интеллекттин пайда болушу мурда болуп көрбөгөндөй масштабда сүрөттөрдү, тексттерди, аудиолорду жана видеолорду чыгарууну күчөттү жана муну менен бирге алардын келип чыгышына шектенүү күчөдү; бул контекстте, Мазмун түзүлгөнүн же модел тарабынан өзгөртүлгөнүн аныктаңыз санариптик ишенимдин ачкычы болуп калат. SynthID сонун чечим болушу мүмкүн.
Бул Google DeepMindдин сунушу, а "көрүнбөгөн" суу белгисин коюу ыкмаларынын үй-бүлөсү адамдар кабыл алган сапатты төмөндөтпөстөн, кийинки текшерүүнү жеңилдетүү үчүн AI тарабынан түзүлгөн мазмунга түздөн-түз киргизилген.
SynthID деген эмне жана ал эмнеге арналган?
Google SynthIDди курал катары сүрөттөйт AI тарабынан түзүлгөн мазмун үчүн атайын суу белгиси, айкындуулукту жана байкоо жүргүзүүнү илгерилетүү үчүн иштелип чыккан. Ал бир формат менен эле чектелбейт: ал сүрөттөрдү, аудиону, текстти жана видеону камтыйт, ошондуктан бир техникалык ыкманы медианын ар кандай түрлөрүнө колдонууга болот.
Google экосистемасында ал буга чейин бир нече жолдор менен колдонулат:
- Текстте, желек Gemini жоопторуна тиешелүү.
- Аудиодо, Lyria модели жана Notebook LMдеги тексттен подкасттарды түзүү сыяктуу функциялар менен колдонулат.
- En Video, 1080p форматында клиптерди жаратууга жөндөмдүү болгон Veo чыгармаларына интеграцияланган.
Бардык учурларда суу белгиси Бул сезилбейт жана иштелип чыккан тез-тез өзгөрүүлөргө туруштук сапатты төмөндөтпөстөн, кысуу, ритмдин өзгөрүшү, аудио же видео кесүү сыяктуу.
Технологиядан тышкары, анын практикалык максаты айкын: синтетикалык материалды AI жок өндүрүлгөн материалдан айырмалоого жардам берет, колдонуучулар, ЖМКлар жана мекемелер мазмунду керектөө жана жайылтуу боюнча негизделген чечим кабыл алышы үчүн.

Тексттин суу белгиси (SynthID Text) кантип иштейт
Иш жүзүндө, SynthID Текст катары иштейт логит процессору кадимки үлгү алуу чыпкаларынан (Top-K жана Top-P) кийин тил моделин генерациялоо түтүгүнө илинип турат. Бул процессор моделдин упайларын а менен кылдаттык менен өзгөртөт псевдордук функция g, тексттин стилине же сапатына көзгө көрүнгөн артефакттарды киргизбестен, маалыматты ыктымалдуулук үлгүсүндө коддоо.
Натыйжада, биринчи караганда, сакталган текст болуп саналат сапат, тактык жана агымдуулук, бирок үйрөтүлгөн текшерүүчү менен аныктала турган статистикалык структураны камтыган.
Суу белгиси менен текстти түзүү үчүн зарыл эмес моделин кайра даярдоо: жөн гана методдун конфигурациясын бериңиз .generate() жана SynthID Тексттин логит процессорун иштетиңиз. Бул кабыл алууну жеңилдетет жана мурунтан эле орнотулган моделдер менен тестирлөөгө мүмкүндүк берет.
Суу белгисинин орнотуулары эки маанилүү параметрди камтыйт: keys y ngram_len. ачкычтар g функциясын колдонуу менен лексиканы балл үчүн колдонулган уникалдуу, кокус бүтүн сандардын тизмеси; ал тизменин узундугу суу белгисинин канча "катмары" колдонуларын көзөмөлдөйт. Ошол эле учурда, ngram_len Өзгөртүүлөрдүн табыла тургандыгы менен бекемдигинин ортосундагы тең салмактуулукту орнотот: жогорку маанилер аныктоону жеңилдетет, бирок мөөрдү өзгөрүүлөргө алсызыраак кылат; 5 мааниси баштапкы чекит катары жакшы иштейт.
Кошумча, SynthID Text a колдонот үлгү алуу таблицасы эки касиеттери менен: sampling_table_size y sampling_table_seed. 2^16дан кем эмес өлчөм g функциясынын үлгү алууда туруктуу жана калыс иштешин камсыз кылуу үчүн сунушталат, муну эске алуу менен чоңураак өлчөм көбүрөөк эстутумду билдирет тыянак учурунда. Үрөн ар кандай бүтүн сан болушу мүмкүн, бул баалоо чөйрөлөрүндө кайталанууну жеңилдетет.
Сигналды жакшыртуу үчүн маанилүү нюанс бар: кайталанган n-грамм контексттин жакынкы тарыхында (аныкталган context_history_size) белгиленбеген, бул тексттин калган бөлүгүндө белгинин табылышын жакшыртат жана тилдин табигый кайталанышына байланыштуу жалган позитивдерди азайтат.
Коопсуздук үчүн, ар бир суу белгисинин конфигурациясы (анын ичинде анын ачкычтары, уруктары жана параметрлери) жеке сакталышы керекЭгерде бул ачкычтар сыртка чыгып кетсе, үчүнчү тараптар брендди оңой эле көчүрүп алышы мүмкүн же андан да жаманы, анын түзүмүн толук билип туруп, аны манипуляциялоого аракет кылышы мүмкүн.
Кантип аныктоо керек: босого менен ыктымалдык текшерүү
Тексттеги суу белгисин текшерүү бинардык эмес, бирок ыктымалдыкGoogle Transformers жана GitHub экөө тең Bayesian детекторун жарыялайт, ал тексттин статистикалык үлгүсүн талдоодон кийин үч мүмкүн болгон абалды кайтарат: бренд менен, бренд жок o белгисизБул үчтүк чыгаруу операцияны ар кандай тобокелдиктерге жана каталарга сабырдуулук контексттерине ылайыкташтырууга мүмкүндүк берет.
Текшерүүчүнүн жүрүм-турумун конфигурациялайт эки босого жалган позитивдүү жана жалган терс көрсөткүчтөрдүн ылдамдыгын көзөмөлдөйт. Башкача айтканда, сиз аныктоонун канчалык катуу болушун кааласаңыз, тактык үчүн сезгичтикти жоготуп же тескерисинче колдонуу жагдайыңызга жараша, өзгөчө пайдалуу нерсени калибрлей аласыз. редакциялык чөйрөлөр, модерация же ички аудит.
Эгерде бир нече моделдер бирдей бөлүшсө токенизатор, ошондой эле бөлүшө алат бирдей бренд конфигурациясы жана ошол эле детектор, Текшерүүчүнүн окуу топтому алардын бардыгынын мисалдарын камтыса. Бул бир нече LLM бар уюмдарда "жалпы суу белгилерин" курууну жеңилдетет.
Детектор үйрөтүлгөндөн кийин, уюмдар анын таасиринин деңгээлин чечиши мүмкүн: аны сактап калыңыз толугу менен жеке, бир жол менен сунуш жарым жеке API аркылуу же кандайдыр бир жол менен чыгарыңыз мамлекеттик жүктөө жана үчүнчү жактар тарабынан колдонуу үчүн. Тандоо ар бир субъекттин инфраструктурасынын иштөө мүмкүнчүлүгүнө, жөнгө салуучу тобокелдиктерге жана ачыктык стратегиясына жараша болот.

Сүрөттөргө, аудиого жана видеолорго суу белгиси
Бул бренд узакка созулушу үчүн иштелип чыккан жалпы трансформациялар мисалы, кесүү, өлчөмүн өзгөртүү, айлантуу, түсүн өзгөртүү, жада калса скриншоттор, метадайындарды сактоонун зарылдыгы жок. Башында, аны пайдалануу аркылуу сунушталган Vertex AIдеги сүрөт, бул жерде колдонуучулар мазмунду жаратууда суу белгисин активдештирүүнү тандай алышат.
Аудиодо бренд болуп саналат угулбайт жана MP3 кысуу, ызы-чуу кошуу же ойнотуу ылдамдыгын өзгөртүү сыяктуу жалпы операцияларды колдойт. Google аны бириктирет Лирия жана Notebook LM негизиндеги функцияларда файл жоголгон жарыялоо агымдары аркылуу өткөндө да сигналды күчөтөт.
Видеодо бул ыкма имидждик ыкманы кайталайт: бренд ичине камтылган ар бир кадрдын пикселдери, сезилбестен жана чыпкаларга, жаңыртуу ылдамдыгынын өзгөрүшүнө, кысууга же болгон жасалгаларын чечип. тарабынан түзүлгөн видеолор Мен көрүп, VideoFX сыяктуу инструменттер түзүү учурунда бул белгини кошуп, кийинки түзөтүүлөрдө кокусунан жок кылуу коркунучун азайтат.
Үлгү алуу алгоритмдери жана текст мөөрүнүн бекемдиги
SynthID Тексттин жүрөгү - бул үлгү алуу алгоритми, ар бир потенциалдуу токенге псевдо-кокус упайларды дайындоо үчүн ачкычты (же баскычтардын топтомун) колдонот. Талапкерлер моделдин бөлүштүрүлүшүнөн (Top-K/Top-Pден кийин) тандалып алынат жана жок кылуу раунддарынан кийин, g функциясына ылайык эң жогорку балл алган белги тандалганга чейин "атаандашууга" коюлат.
Бул тандоо процедурасы артыкчылык берет акыркы статистикалык үлгү ыктымалдыктардын бренд белгиси бар, бирок табигый эмес варианттарды мажбурлоосуз. Жарыяланган изилдөөлөргө ылайык, техника аны кыйындатат өчүрүү, бурмалоо же артка кайтаруу мөөр, ар дайым убакыт жана мотивация менен оппоненттерге каршы акылга сыярлык чектерде.
Жакшы ишке ашыруу жана коопсуздук тажрыйбалары
- Эгер сиз SynthID Текстти орнотуп жатсаңыз, конфигурацияны ошондой кабыл алыңыз өндүрүш сыры: Ачкычтарды жана үрөндөрдү коопсуз башкаруучуга сактаңыз, кирүү көзөмөлүн күчөтүңүз жана мезгил-мезгили менен айланууга уруксат бериңиз. Агышууларды алдын алуу тескери инженердик аракеттерге каршы чабуулдун бетин азайтат.
- Планды иштеп чыгуу мониторинг детекторуңуз үчүн: жалган оң/терс көрсөткүчтөрдү жазыңыз, босоголорду контекстке ылайык тууралаңыз жана аныктоо саясатыңызды чечиңиз көрсөтүү (жеке, жарым-жартылай жеке, API аркылуу же коомдук) так юридикалык жана оперативдүү критерийлер менен. Жана эгер бир нече моделдер токенизаторду бөлүшсө, анда а жалпы детектор тейлөөнү жөнөкөйлөтүү үчүн алардын бардыгынын мисалдары менен.
- Аткаруу деңгээлинде анын таасирин баалайт
sampling_table_sizeэстутумда жана күтүүдө жана a тандаңызngram_lenбул сиздин түзөтүүлөргө болгон сабырдуулугуңуз менен ишенимдүү аныктоо зарылдыгын тең салмактайт. Кайталануучу n-граммдарды алып салууну унутпаңыз (аркылууcontext_history_size) агып жаткан тексттеги сигналды жакшыртуу.
SynthID туура эмес маалыматка каршы күмүш ок эмес, бирок генеративдик AI доорунда ишеним чынжырын кайра куруу үчүн негизги курулуш материалы болуп саналат. Текстке, сүрөттөргө, аудиого жана видеолорго келип чыгуу сигналдарын киргизүү жана текст компонентин коомчулукка ачуу менен, Google DeepMind аныктыгын практикалык, өлчөөчү жана баарынан мурда мазмундун креативдүүлүгү жана сапаты менен шайкеш келген жол менен текшере турган келечекке умтулууда.
Ар кандай санариптик медиада он жылдан ашык тажрыйбасы бар технология жана интернет маселелери боюнча адистешкен редактор. Мен электрондук коммерция, байланыш, онлайн маркетинг жана жарнама компанияларында редактор жана мазмун жаратуучусу болуп иштедим. Мен экономика, каржы жана башка тармактардын веб-сайттарында да жаздым. Менин ишим да менин каалоом. Эми менин макалаларым аркылуу Tecnobits, Жашообузду жакшыртуу үчүн күн сайын технология дүйнөсү сунуштаган бардык жаңылыктарды жана жаңы мүмкүнчүлүктөрдү изилдөөгө аракет кылам.