Google onthult Gemini 2.5 Flash-Lite: het snelste en meest efficiënte model in zijn AI-familie

Laatste update: 24/06/2025

  • Gemini 2.5 Flash-Lite valt op door zijn snelheid en lage kosten
  • Het model is ideaal voor grootschalige taken met een lage latentie, zoals vertaling en classificatie.
  • Het bevindt zich nog in de previewfase, terwijl Flash en Pro algemeen beschikbaar worden.
  • Het biedt multimodale integratie en prijzen die aanzienlijk lager liggen dan bij eerdere modellen.
Gemini 2.5 Flash-Lite

Google breidt zijn aanbod van modellen voor kunstmatige intelligentie verder uit met de komst van Gemini 2.5 Flash-Lite, een model dat zich richt op maximale kostenefficiëntie en snelheid. Het bedrijf heeft de afgelopen dagen de algemene beschikbaarheid van zijn 2.5 Pro- en Flash-modellen aangekondigd, terwijl Flash-Lite in preview-formaat wordt gelanceerd voor ontwikkelaars en bedrijven die geïnteresseerd zijn in flexibele en kosteneffectieve oplossingen.

Deze beweging speelt in op de groeiende vraag naar modellen die hoog verwerkingsvolume en lage latentie, waardoor taken zoals vertaling, dataclassificatie of andere handelingen die snelheid vereisen, eenvoudiger worden zonder dat dit ten koste gaat van het budget. Flash-Lite is de voorkeursoptie voor degenen die op zoek zijn naar een snelle verwerking grote hoeveelheden informatie snel en tegen concurrerende prijzen, zonder dat daarbij altijd een beroep hoeft te worden gedaan op het maximale redeneervermogen van de Gemini-familie.

Flash-Lite: het snelste en meest betaalbare model van Gemini

Tweeling 2.5

De nieuwe versie Gemini 2.5 Flash-Lite presteert duidelijk beter dan zijn voorganger (2.0 Flash-Lite) in programmeren, wiskunde, wetenschap, logisch redeneren en multimodale taakbenchmarks. Volgens Google is dit model vooral effectief in scenario's met grootschalige gegevensinvoer, zoals het vertalen van lange teksten of grootschalige classificatie, met resultaten superieur in snelheid en kwaliteit vergeleken met andere voorstellen in de serie.

Exclusieve inhoud - Klik hier  Zo verlaat u een les in Google Classroom

Latency, een andere beslissende parameter in realtimetoepassingen, is ook minimaal in Flash-Lite, overtreft eerdere versies in snelheid en positioneert zichzelf als de voorkeursoptie voor degenen die prioriteit geven aan directheid.

Technische kenmerken en verbeteringen ten opzichte van eerdere versies

Gemini 2.5 Flash Lite 0

De Gemini 2.5 Flash-Lite behoudt veel van de geavanceerde functies van de familie: multimodale ondersteuning (tekst, beeld, video en zelfs audio), integratie met belangrijke tools zoals Google Zoeken, code-uitvoering of contexten tot wel een miljoen tokens. Bovendien maximaliseert de expert-mixingarchitectuur van Gemini 2.5 de efficiëntie door alleen het essentiële neurale netwerk voor elke query te activeren, waardoor het resourceverbruik wordt verminderd.

Een ander onderscheidend voordeel is de controle over het 'denkbudget' via een API-parameter, waarmee ontwikkelaars kunnen bepalen in hoeverre het model zijn redeneercapaciteiten voor elke taak moet gebruiken. Standaard is deze functie in Flash-Lite uitgeschakeld om de optimale balans tussen snelheid en kosten te bereiken, maar kan altijd worden ingeschakeld wanneer nauwkeurigheid prioriteit heeft.

Exclusieve inhoud - Klik hier  Een stel reed meer dan drie uur om een plek te bezoeken die niet bestond: AI genereert nu al nep-toeristenbestemmingen.

De laatste interne benchmarks Flash-Lite's uitstekende scores: 86,8% in FACTS Grounding, 84,5% in Multilingual MMLU en even concurrerende cijfers in visueel begripDeze meetgegevens bevestigen de geschiktheid ervan voor toepassingen waarbij nauwkeurigheid en snelheid het verschil maken.

foto's bewerken gemini flash-4
Gerelateerd artikel:
Hoe je foto's kunt bewerken met Gemini Flash 2.0 zonder enige bewerkingskennis

Bijgewerkte beschikbaarheid en prijzen voor de Gemini-familie

Naast de komst van Flash-Lite, Gemini 2.5 Pro en Flash zijn nu algemeen beschikbaar, na het doorlopen van de testfase. Google heeft van de gelegenheid gebruik gemaakt om vereenvoudig het prijssysteem en elimineer het eerdere onderscheid tussen denkende en niet-denkende tarieven, wat voor verwarring zorgde bij ontwikkelaars. Nu, Het Flash-model rekent $ 0,30 per miljoen input-tokens voor tekst, afbeeldingen en video, en $ 2,50 per miljoen output-tokens., met aparte prijzen voor audio.

In het geval van Flash-Lite zijn de prijzen nog meer aangepast, zich consolideren als het instapmodel voor degenen die grote hoeveelheden data verwerken, maar geen maximale verfijning in automatisch redeneren nodig hebben.

Exclusieve inhoud - Klik hier  Hoe u het wachtwoord op Google Pixel 4a kunt wijzigen

Gebruiksscenario's en toegang tot het Flash-Lite-model

Gemini 2.5 Flash-Lite Google AI Studio

Google richt zich op ontwikkelaars en bedrijven met behoeften Massatranslatie, dataclassificatie en grootschalige analyse als de belangrijkste begunstigden van Flash-Lite. Het model is ook nuttig voor geautomatiseerde informatieorganisatie, verwerking van multimediacontent en bewerkingen waarbij elke milliseconde telt, zoals directe respons in klantenservicetools of waarschuwings- en monitoringsystemen.

Gemini 2.5 Flash-Lite is nu beschikbaar beschikbaar in preview-modus door Google AI Studio en Vertex AIDe Flash- en Pro-modellen kunnen in deze services en in de Gemini-app worden gebruikt. Met al deze opties kunt u het budget aanpassen en inspelen op het profiel van elk project of elke behoefte.

Google wil bieden oplossingen voor alle doelgroepen en budgetten, waarbij deze modellen worden geïntegreerd in zowel de AI Overviews-zoekmachine als productiviteitsproducten zoals Meet, Docs en Sheets. Met de introductie van Flash Lite breidt Google het aanbod aan beschikbare opties uit, waardoor generatieve AI nog toegankelijker wordt voor taken waarbij volume, snelheid en prijs doorslaggevende factoren zijn.

Gerelateerd artikel:
Met Gemini Flash 2.0 kunt u zien hoe een kledingstuk bij iemand staat.