Apa itu SynthID, tanda air kecerdasan buatan?

Pembaharuan Terakhir: 29/08/2025

  • SynthID menanamkan tanda air yang tidak terlihat ke dalam teks, gambar, audio, dan video untuk mengidentifikasi konten yang dihasilkan AI.
  • Dalam teks ia bertindak sebagai prosesor logit dengan kunci dan n-gram, dengan deteksi Bayesian yang dapat dikonfigurasi berdasarkan ambang batas.
  • Implementasinya tersedia di Transformers 4.46.0+, dengan Space resmi dan referensi di GitHub.
  • Memiliki keterbatasan (teks pendek, terjemahan, penulisan ulang) tetapi memperkuat transparansi dan keterlacakan.
Tanda air SynthID

Munculnya AI generatif telah meningkatkan produksi gambar, teks, audio, dan video dalam skala yang belum pernah terlihat sebelumnya, dan seiring dengan itu, keraguan tentang asal-usulnya pun meningkat; dalam konteks ini, Mengidentifikasi apakah konten telah dibuat atau diubah oleh model menjadi kunci kepercayaan digital. SynthID bisa menjadi solusi yang bagus.

Ini adalah proposal Google DeepMind, sebuah keluarga teknik watermarking “tak terlihat” yang tertanam langsung ke dalam konten yang dihasilkan AI untuk memfasilitasi verifikasi selanjutnya tanpa menurunkan kualitas yang dirasakan oleh manusia.

Apa itu SynthID dan apa tujuannya?

Google menggambarkan SynthID sebagai alat untuk tanda air khusus untuk konten yang dihasilkan AI, dirancang untuk meningkatkan transparansi dan keterlacakan. Tidak terbatas pada satu format: ia mencakup gambar, audio, teks, dan video, sehingga pendekatan teknis tunggal dapat diterapkan ke berbagai jenis media.

Di ekosistem Google sudah digunakan dalam beberapa cara:

  • Dalam teks, bendera tersebut berlaku untuk respons Gemini.
  • Dalam audio, digunakan dengan model Lyria dan dengan fitur-fitur seperti membuat podcast dari teks di Notebook LM.
  • En Video, diintegrasikan ke dalam kreasi Veo, model yang mampu menghasilkan klip dalam 1080p.

Dalam semua kasus tanda air Itu tidak terlihat, dan telah dirancang untuk tahan terhadap modifikasi yang sering terjadi seperti kompresi, perubahan irama dalam potongan audio atau video, tanpa mengurangi kualitas.

Di luar teknologi, tujuan praktisnya jelas: membantu membedakan bahan sintetis dari bahan yang diproduksi tanpa AI, sehingga pengguna, media, dan lembaga dapat membuat keputusan yang tepat tentang konsumsi dan distribusi konten.

ID Sintesis

Cara kerja tanda air teks (Teks SynthID)

Dalam praktiknya, SynthID Text bertindak sebagai prosesor logit yang terhubung ke jalur pembuatan model bahasa setelah filter pengambilan sampel biasa (Top-K dan Top-P). Prosesor ini secara halus memodifikasi skor model dengan fungsi pseudorandom g, mengkodekan informasi dalam pola probabilitas tanpa memasukkan artefak yang terlihat ke dalam gaya atau kualitas teks.

Konten eksklusif - Klik Disini  Cara memutar video di Google Slide

Hasilnya adalah sebuah teks yang sekilas tampak kualitas, presisi dan fluiditas, tetapi menggabungkan struktur statistik yang dapat dideteksi dengan verifikator yang terlatih.

Untuk membuat teks dengan tanda air tidak perlu melatih ulang model: cukup berikan konfigurasi ke metode tersebut .generate() dan mengaktifkan prosesor logit SynthID Text. Ini menyederhanakan adopsi dan memungkinkan pengujian dengan model yang sudah diterapkan.

Pengaturan tanda air mencakup dua parameter penting: keys y ngram_len. Kunci-kunci adalah daftar bilangan bulat acak unik yang digunakan untuk menilai kosakata menggunakan fungsi g; panjang daftar tersebut menentukan berapa banyak "lapisan" tanda air yang diterapkan. Sementara itu, ngram_len Mengatur keseimbangan antara kemampuan deteksi dan ketahanan terhadap transformasi: nilai yang lebih tinggi membuat deteksi lebih mudah tetapi membuat segel lebih rentan terhadap perubahan; nilai 5 berfungsi dengan baik sebagai titik awal.

Selain itu, SynthID Text menggunakan tabel pengambilan sampel dengan dua properti: sampling_table_size y sampling_table_seedUkuran minimal 2^16 direkomendasikan untuk memastikan bahwa fungsi g berperilaku stabil dan tidak bias saat pengambilan sampel, dengan mempertimbangkan bahwa ukuran yang lebih besar berarti lebih banyak memori selama inferensi. Benihnya bisa berupa bilangan bulat apa pun, yang memudahkan reproduktifitas dalam lingkungan evaluasi.

Ada nuansa penting untuk meningkatkan sinyal: n-gram berulang dalam sejarah konteks terkini (didefinisikan oleh context_history_size) tidak diberi tanda, yang mendukung deteksi tanda di bagian teks lainnya dan mengurangi positif palsu yang terkait dengan pengulangan alami bahasa.

Demi keamanan, setiap konfigurasi tanda air (termasuk kunci, benih, dan parameternya) harus disimpan secara pribadiJika kunci-kunci ini bocor, pihak ketiga dapat dengan mudah meniru merek tersebut atau, lebih buruk lagi, mencoba memanipulasinya dengan pengetahuan penuh tentang strukturnya.

Konten eksklusif - Klik Disini  Bagaimana cara menghapus penangguhan sementara Google

Cara mendeteksi: verifikasi probabilistik dengan ambang batas

Verifikasi tanda air dalam teks tidak biner, tetapi probabilistikGoogle menerbitkan detektor Bayesian di Transformers dan GitHub yang, setelah menganalisis pola statistik teks, mengembalikan tiga kemungkinan status: dengan merek, tidak ada merek o tidak pastiKeluaran terner ini memungkinkan operasi disesuaikan dengan konteks risiko dan toleransi kesalahan yang berbeda.

Perilaku verifier dapat dikonfigurasi oleh dua ambang batas yang mengontrol tingkat positif palsu dan negatif palsu. Dengan kata lain, Anda dapat mengkalibrasi seberapa ketat deteksi yang Anda inginkan, mengorbankan sensitivitas demi akurasi atau sebaliknya, tergantung pada kasus penggunaan Anda, sesuatu yang sangat berguna dalam lingkungan editorial, moderasi atau audit internal.

Jika beberapa model berbagi hal yang sama pembuat token, juga bisa berbagi konfigurasi merek yang sama dan detektor yang sama, asalkan set pelatihan verifikator mencakup contoh dari semuanya. Hal ini memudahkan pembuatan "tanda air umum" di organisasi dengan beberapa LLM.

Setelah detektor dilatih, organisasi dapat memutuskan tingkat paparannya: pertahankan sepenuhnya pribadi, tawarkan dengan cara setengah swasta melalui API, atau merilisnya dengan cara publik untuk diunduh dan digunakan oleh pihak ketiga. Pilihannya bergantung pada kapasitas operasional infrastruktur, risiko regulasi, dan strategi transparansi masing-masing entitas.

Teknologi tanda air SynthID AI

Tanda air pada gambar, audio, dan video

Merek ini dirancang untuk bertahan lama transformasi umum seperti memotong, mengubah ukuran, memutar, mengubah warna, atau bahkan mengambil tangkapan layar, tanpa perlu menyimpan metadata. Awalnya, penggunaannya ditawarkan melalui Gambar di Vertex AI, di mana pengguna dapat memilih untuk mengaktifkan tanda air saat membuat konten.

Dalam audio, mereknya adalah tak terdengar dan mendukung operasi umum seperti kompresi MP3, penambahan noise, atau modifikasi kecepatan pemutaran. Google mengintegrasikannya ke dalam Liria dan pada fitur berbasis Notebook LM, meningkatkan sinyal bahkan saat file melewati aliran penerbitan yang mengalami lossy.

Dalam video, pendekatan ini meniru pendekatan gambar: merek tertanam dalam piksel setiap bingkai, tanpa terasa, dan tetap stabil terhadap filter, perubahan kecepatan refresh, kompresi atau hiasanVideo yang dibuat oleh Saya lihat Alat seperti VideoFX menyertakan tanda ini selama pembuatan, mengurangi risiko terhapus secara tidak sengaja pada pengeditan berikutnya.

Konten eksklusif - Klik Disini  Cara mengatur ulang Google Pixel 3

Algoritma pengambilan sampel dan ketahanan segel teks

Inti dari SynthID Text adalah algoritma pengambilan sampel, yang menggunakan kunci (atau serangkaian kunci) untuk menetapkan skor pseudo-acak pada setiap token potensial. Kandidat diambil dari distribusi model (setelah Top-K/Top-P) dan dimasukkan ke dalam "kompetisi" setelah babak eliminasi, hingga token dengan skor tertinggi dipilih berdasarkan fungsi g.

Prosedur seleksi ini menguntungkan pola statistik akhir probabilitas tersebut memiliki ciri khas merek, tetapi tanpa memaksakan pilihan yang tidak wajar. Menurut penelitian yang dipublikasikan, teknik ini menyulitkan menghapus, memalsukan, atau membalikkan segel, selalu dalam batas yang wajar terhadap lawan dengan waktu dan motivasi.

Penerapan yang baik dan praktik keamanan

  • Jika Anda menerapkan SynthID Text, perlakukan konfigurasi sebagai rahasia produksiSimpan kunci dan seed dalam pengelola yang aman, terapkan kontrol akses, dan izinkan rotasi berkala. Mencegah kebocoran mengurangi permukaan serangan terhadap upaya rekayasa balik.
  • Merancang sebuah rencana pemantauan untuk detektor Anda: catat tingkat positif/negatif palsu, sesuaikan ambang batas sesuai konteks dan tentukan kebijakan deteksi Anda pencahayaan (pribadi, semi-pribadi melalui API, atau publik) dengan kriteria hukum dan operasional yang jelas. Dan jika beberapa model berbagi tokenizer, pertimbangkan untuk melatih detektor umum dengan contoh semuanya untuk menyederhanakan pemeliharaan.
  • Pada tingkat kinerja, ia menilai dampak sampling_table_size dalam memori dan latensi, dan pilih ngram_len yang menyeimbangkan toleransi Anda terhadap suntingan dengan kebutuhan akan deteksi yang andal. Ingatlah untuk mengecualikan n-gram berulang (melalui context_history_size) untuk meningkatkan sinyal dalam teks mengalir.

SynthID bukanlah solusi ajaib untuk melawan misinformasi, tapi menyediakan landasan fundamental untuk membangun kembali rantai kepercayaan di era AI generatif. Dengan menanamkan sinyal asal-usul dalam teks, gambar, audio, dan video, serta membuka komponen teks kepada komunitas, Google DeepMind mendorong masa depan di mana keaslian dapat diaudit dengan cara yang praktis, terukur, dan, yang terpenting, kompatibel dengan kreativitas dan kualitas konten.