Google meluncurkan Gemini 2.5 Flash-Lite: model tercepat dan paling efisien dalam keluarga AI-nya

Pembaharuan Terakhir: 24/06/2025

  • Gemini 2.5 Flash-Lite menonjol karena kecepatan dan biaya rendahnya
  • Model ini ideal untuk tugas berskala besar dan latensi rendah seperti penerjemahan dan klasifikasi.
  • Saat ini masih dalam tahap pratinjau, sementara Flash dan Pro tersedia secara umum.
  • Ia menawarkan integrasi multimoda dan harga yang jauh lebih rendah dari model sebelumnya.
Gemini 2.5 Flash Lite

Google terus memperluas jangkauan model kecerdasan buatannya dengan kedatangan Gemini 2.5 Flash-Lite, model yang berfokus pada efisiensi biaya dan kecepatan maksimum. Dalam beberapa hari terakhir, perusahaan mengumumkan ketersediaan umum model 2.5 Pro dan Flash, sementara Flash-Lite diluncurkan dalam format pratinjau untuk pengembang dan perusahaan yang tertarik pada solusi yang tangkas dan hemat biaya.

Gerakan ini menanggapi permintaan yang semakin meningkat akan model yang menggabungkan volume pemrosesan tinggi dan latensi rendah, memfasilitasi tugas-tugas seperti penerjemahan, klasifikasi data, atau operasi apa pun yang memerlukan kecepatan tanpa mengorbankan anggaran. Flash-Lite hadir sebagai pilihan yang disukai bagi mereka yang ingin memproses sejumlah besar informasi dengan cepat dan dengan harga yang kompetitif, tanpa harus selalu mengandalkan kapasitas penalaran maksimal dari keluarga Gemini.

Flash-Lite: Model Gemini yang tercepat dan paling terjangkau

Gemini 2.5

Versi baru Gemini 2.5 Flash-Lite jelas mengungguli pendahulunya (2.0 Flash-Lite) dalam pemrograman, matematika, sains, penalaran logis, dan tolok ukur tugas multimodal. Menurut Google, model ini sangat efektif dalam skenario input data besar-besaran, seperti penerjemahan teks panjang atau klasifikasi skala besar, dengan hasil unggul dalam kecepatan dan kualitas dibandingkan dengan proposal lain dalam seri ini.

Konten eksklusif - Klik Disini  Cara keluar kelas di Google Classroom

Latensi, salah satu parameter penentu dalam aplikasi waktu nyata, juga minimal di Flash-Lite, melampaui versi sebelumnya dalam hal kecepatan dan memposisikan dirinya sebagai pilihan yang disukai bagi mereka yang mengutamakan kedekatan.

Fitur teknis dan peningkatan dibandingkan dengan versi sebelumnya

Gemini 2.5 Flash Lite 0

Gemini 2.5 Flash-Lite mempertahankan banyak fitur canggih dari keluarga tersebut: dukungan multimodal (teks, gambar, video, dan bahkan audio), integrasi dengan alat-alat utama seperti Google Search, eksekusi kode, atau konteks hingga satu juta token. Lebih jauh lagi, arsitektur pencampuran pakar yang digunakan oleh Gemini 2.5 memaksimalkan efisiensi dengan hanya mengaktifkan jaringan saraf penting untuk setiap kueri, sehingga mengurangi konsumsi sumber daya.

Keunggulan khas lainnya adalah pengendalian 'anggaran berpikir' melalui parameter API, yang memungkinkan pengembang memutuskan sejauh mana model harus menggunakan kemampuan penalarannya untuk setiap tugas. Secara default, di Flash-Lite, fitur ini dinonaktifkan, untuk mencari keseimbangan optimal antara kecepatan dan biaya, tetapi fitur ini selalu dapat diaktifkan jika akurasi menjadi prioritas.

Konten eksklusif - Klik Disini  Sepasang suami istri berkendara lebih dari tiga jam untuk melihat tempat yang tidak ada: AI telah menghasilkan tujuan wisata palsu.

Los tolok ukur internal terbaru Skor luar biasa yang ditunjukkan Flash-Lite adalah: 86,8% dalam FACTS Grounding, 84,5% dalam Multilingual MMLU dan angka yang sama kompetitifnya dalam pemahaman visualMetrik ini mengonfirmasi kesesuaiannya untuk aplikasi yang mengutamakan akurasi dan kecepatan.

edit foto gemini flash-4
Artikel terkait:
Cara mengedit foto dengan Gemini Flash 2.0 tanpa pengetahuan editing apa pun

Ketersediaan dan harga terbaru untuk keluarga Gemini

Selain kedatangan Flash-Lite, Gemini 2.5 Pro dan Flash sekarang tersedia secara umum, setelah melewati fase pengujian. Google telah mengambil kesempatan untuk menyederhanakan sistem penetapan harga, menghilangkan perbedaan sebelumnya antara tarif berpikir dan tidak berpikir, yang menyebabkan kebingungan di kalangan pengembang. Sekarang, Model Flash mengenakan biaya $0,30 per juta token masukan untuk teks, gambar, dan video, dan $2,50 per juta token keluaran., dengan harga terpisah untuk audio.

Dalam kasus Flash-Lite, harganya bahkan lebih disesuaikan, mengkonsolidasikan dirinya sebagai model entri bagi mereka yang menangani data dalam jumlah besar tetapi tidak memerlukan kecanggihan maksimal dalam penalaran otomatis.

Konten eksklusif - Klik Disini  Cara mengubah kata sandi di Google Pixel 4a

Kasus penggunaan dan akses ke model Flash-Lite

Gemini 2.5 Flash-Lite Google AI Studio

Google menargetkan pengembang dan bisnis yang memiliki kebutuhan Terjemahan massal, klasifikasi data dan analisis skala besar sebagai penerima manfaat utama Flash-Lite. Model ini juga berguna untuk organisasi informasi otomatis, pemrosesan konten multimedia, dan operasi yang setiap milidetiknya sangat berarti, seperti respons instan dalam alat layanan pelanggan atau sistem peringatan dan pemantauan.

Gemini 2.5 Flash-Lite sekarang tersedia tersedia dalam mode pratinjau melalui Google AI Studio dan Vertex AISementara itu, model Flash dan Pro dapat digunakan dalam layanan ini dan dalam aplikasi Gemini. Semua opsi ini memungkinkan Anda menyesuaikan anggaran dan beradaptasi dengan profil setiap proyek atau kebutuhan.

Google ingin menawarkan solusi untuk semua audiens dan anggaran, mengintegrasikan model-model ini ke dalam mesin pencari AI Overviews dan produk produktivitas seperti Meet, Docs, dan Sheets. Dengan diperkenalkannya Flash Lite, Google memperluas jangkauan opsi yang tersedia, membuat AI generatif semakin mudah diakses untuk tugas-tugas yang volume, kecepatan, dan harga merupakan faktor penentu.

Artikel terkait:
Gemini Flash 2.0 akan memperlihatkan kepada Anda bagaimana pakaian akan terlihat pada seseorang.