Google avduker Gemini 2.5 Flash-Lite: den raskeste og mest effektive modellen i sin AI-familie

Siste oppdatering: 24/06/2025

  • Gemini 2.5 Flash-Lite skiller seg ut med sin hastighet og lave kostnad.
  • Modellen er ideell for store oppgaver med lav latens, som oversettelse og klassifisering.
  • Den er i forhåndsvisningsfasen, mens Flash og Pro blir allment tilgjengelige.
  • Den tilbyr multimodal integrasjon og priser som er betydelig lavere enn tidligere modeller.
Gemini 2.5 Flash-Lite

Google fortsetter å utvide utvalget av kunstig intelligens-modeller med ankomsten av Gemini 2.5 Flash-Lite., en modell som fokuserer på maksimal kostnadseffektivitet og hastighet. I de siste dagene annonserte selskapet den generelle tilgjengeligheten av sine 2.5 Pro- og Flash-modeller, mens Flash-Lite lanseres i forhåndsvisningsformat for utviklere og selskaper som er interessert i smidige og kostnadseffektive løsninger.

Denne bevegelsen svarer på den økende etterspørselen etter modeller som kombinerer høyt prosesseringsvolum og lav latens, som forenkler oppgaver som oversettelse, dataklassifisering eller enhver operasjon som krever hastighet uten at det går på bekostning av budsjettet. Flash-Lite er det foretrukne alternativet for de som ønsker å behandle store mengder informasjon raskt og til konkurransedyktige priser, uten alltid å måtte ty til Gemini-familiens maksimale resonneringsevne.

Flash-Lite: Gemini sin raskeste og rimeligste modell

Gemini 2.5

Den nye versjonen Gemini 2.5 Flash-Lite overgår forgjengeren (2.0 Flash-Lite) klart. innen programmering, matematikk, naturfag, logisk resonnering og multimodale oppgavetesting. Ifølge Google er denne modellen spesielt effektiv i scenarier med massiv datainndata, for eksempel oversettelse av lang tekst eller storskala klassifisering, med resultater overlegen i hastighet og kvalitet sammenlignet med andre forslag i serien.

Eksklusivt innhold - Klikk her  Slik forlater du et kurs i Google Classroom

Latens, en annen av de avgjørende parameterne i sanntidsapplikasjoner, er også minimum i Flash-Lite, som overgår tidligere versjoner i hastighet og posisjonerer seg som det foretrukne alternativet for de som prioriterer umiddelbarhet.

Tekniske funksjoner og forbedringer sammenlignet med tidligere versjoner

Gemini 2.5 Flash Lite 0

Gemini 2.5 Flash-Lite har mange av familiens avanserte funksjoner: multimodal støtte (tekst, bilde, video og til og med lyd), integrasjon med viktige verktøy som Google Søk, kodeutførelse eller kontekster på opptil én million tokens. Videre maksimerer ekspertmiksarkitekturen som brukes av Gemini 2.5 effektiviteten ved kun å aktivere det essensielle nevrale nettverket for hver spørring, noe som reduserer ressursforbruket.

En annen særegen fordel er kontroll over «tenkebudsjettet» gjennom en API-parameter, som lar utviklere bestemme i hvilken grad modellen skal bruke sine resonneringsmuligheter for hver oppgave. Som standard er denne funksjonen deaktivert i Flash-Lite, og søker etter den optimale balansen mellom hastighet og kostnad, men den kan alltid aktiveres når nøyaktighet er en prioritet.

Eksklusivt innhold - Klikk her  Et par kjørte i over tre timer for å se et sted som ikke eksisterte: AI genererer allerede falske turistmål.

den siste interne benchmarks Flash-Lites fremragende poengsummer: 86,8 % i FACTS Grounding, 84,5 % i Multilingual MMLU og like konkurransedyktige tall i visuell forståelseDisse målene bekrefter at den er egnet for applikasjoner der nøyaktighet og hastighet utgjør forskjellen.

rediger bilder gemini flash-4
Relatert artikkel:
Hvordan redigere bilder med Gemini Flash 2.0 uten redigeringskunnskap

Oppdatert tilgjengelighet og priser for Gemini-familien

I tillegg til ankomsten av Flash-Lite, Gemini 2.5 Pro og Flash er nå generelt tilgjengelige, etter å ha bestått testfasen. Google har benyttet anledningen til å forenkle prissystemet, og eliminere det tidligere skillet mellom tenkende og ikke-tenkende tariffer, noe som forårsaket forvirring blant utviklere. Nå, Flash-modellen tar 0,30 dollar per million input-tokener for tekst, bilder og video, og 2,50 dollar per million output-tokener., med separate priser for lyd.

Når det gjelder Flash-Lite, er prisene enda mer justert, konsoliderer seg som inngangsmodellen for de som håndterer store datamengder, men ikke trenger maksimal sofistikering innen automatisk resonnering.

Eksklusivt innhold - Klikk her  Slik endrer du passordet på Google Pixel 4a

Brukstilfeller og tilgang til Flash-Lite-modellen

Gemini 2.5 Flash-Lite Google AI Studio

Google retter seg mot utviklere og bedrifter med behov Masseoversettelse, dataklassifisering og storskalaanalyse som de viktigste drar nytte av Flash-Lite. Modellen er også nyttig for automatisert informasjonsorganisering, behandling av multimedieinnhold og operasjoner der hvert millisekund teller, for eksempel umiddelbar respons i kundeserviceverktøy eller varslings- og overvåkingssystemer.

Gemini 2.5 Flash-Lite er nå tilgjengelig tilgjengelig i forhåndsvisningsmodus gjennom Google AI Studio og Vertex AIFlash- og Pro-modellene kan derimot brukes i disse tjenestene og i Gemini-appen. Alle disse alternativene lar deg justere budsjettet og tilpasse deg profilen til hvert prosjekt eller behov.

Google ønsker å tilby løsninger for alle målgrupper og budsjetter, og integrerer disse modellene i både AI Overviews-søkemotoren og produktivitetsprodukter som Meet, Docs og Sheets. Med introduksjonen av Flash Lite utvider Google utvalget av tilgjengelige alternativer, noe som gjør generativ AI enda enklere å få tilgang til for oppgaver der volum, hastighet og pris er avgjørende faktorer.

Relatert artikkel:
Gemini Flash 2.0 lar deg se hvordan et plagg ville se ut på hvem som helst.