Google afslører Gemini 2.5 Flash-Lite: den hurtigste og mest effektive model i sin AI-familie

Sidste ændring: 24/06/2025

  • Gemini 2.5 Flash-Lite skiller sig ud ved sin hastighed og lave pris
  • Modellen er ideel til store opgaver med lav latenstid, såsom oversættelse og klassificering.
  • Det er i forhåndsvisningsfasen, mens Flash og Pro bliver generelt tilgængelige.
  • Den tilbyder multimodal integration og priser, der er betydeligt lavere end tidligere modeller.
Gemini 2.5 Flash-Lite

Google fortsætter med at udvide sit udvalg af kunstig intelligens-modeller med ankomsten af ​​Gemini 2.5 Flash-Lite., en model der fokuserer på maksimal omkostningseffektivitet og hastighed. I de seneste dage har virksomheden annonceret den generelle tilgængelighed af sine 2.5 Pro- og Flash-modeller, mens Flash-Lite lanceres i preview-format for udviklere og virksomheder, der er interesserede i agile og omkostningseffektive løsninger.

Denne bevægelse reagerer på den stigende efterspørgsel efter modeller, der kombinerer høj processorvolumen og lav latenstid, hvilket letter opgaver som oversættelse, dataklassificering eller enhver anden operation, der kræver hastighed, uden at gå på kompromis med budgettet. Flash-Lite er den foretrukne løsning for dem, der ønsker at behandle store mængder information hurtigt og til konkurrencedygtige priser, uden altid at skulle ty til Gemini-familiens maksimale ræsonnementskapacitet.

Flash-Lite: Gemini's hurtigste og mest prisvenlige model

Gemini 2.5

Den nye version Gemini 2.5 Flash-Lite klarer sig klart bedre end sin forgænger (2.0 Flash-Lite) inden for programmering, matematik, naturvidenskab, logisk ræsonnement og multimodale opgavebenchmarks. Ifølge Google er denne model særligt effektiv i scenarier med massiv datainput, såsom oversættelse af lange tekster eller storstilet klassificering, med resultater bedre i hastighed og kvalitet sammenlignet med andre forslag i serien.

Eksklusivt indhold - Klik her  Sådan forlader du et hold i Google Classroom

Latens, en anden af ​​de afgørende parametre i realtidsapplikationer, er også minimum i Flash-Lite, der overgår tidligere versioner i hastighed og positionerer sig som den foretrukne løsning for dem, der prioriterer umiddelbarhed.

Tekniske funktioner og forbedringer sammenlignet med tidligere versioner

Gemini 2.5 Flash Lite 0

Gemini 2.5 Flash-Lite har mange af familiens avancerede funktioner: multimodal støtte (tekst, billede, video og endda lyd), integration med nøgleværktøjer som Google-søgning, kodeudførelse eller kontekster på op til en million tokens. Derudover maksimerer den ekspertblandingsarkitektur, der anvendes i Gemini 2.5, effektiviteten ved kun at aktivere det essentielle neurale netværk for hver forespørgsel, hvilket reducerer ressourceforbruget.

En anden markant fordel er kontrol over det 'tænkende budget' gennem en API-parameter, som giver udviklere mulighed for at bestemme, i hvilket omfang modellen skal bruge sine ræsonnementsmuligheder for hver opgave. Som standard er denne funktion deaktiveret i Flash-Lite, da den søger den optimale balance mellem hastighed og omkostninger, men den kan altid aktiveres, når nøjagtighed er en prioritet.

Eksklusivt indhold - Klik her  Et par kørte mere end tre timer for at se et sted, der ikke eksisterede: AI genererer allerede falske turistdestinationer.

masse seneste interne benchmarks Flash-Lites fremragende scorer: 86,8% i FACTS Grounding, 84,5% i Multilingual MMLU og lige så konkurrencedygtige tal i visuel forståelseDisse målinger bekræfter dens egnethed til applikationer, hvor nøjagtighed og hastighed gør forskellen.

rediger billeder gemini flash-4
relateret artikel:
Sådan redigeres fotos med Gemini Flash 2.0 uden nogen form for redigeringsviden

Opdateret tilgængelighed og priser for Gemini-familien

Udover ankomsten af ​​Flash-Lite, Gemini 2.5 Pro og Flash er nu generelt tilgængelige, efter at have bestået testfasen. Google har benyttet lejligheden til at forenkle prissystemet og fjerne den tidligere sondring mellem tænkende og ikke-tænkende takster, hvilket skabte forvirring blandt udviklerne. Nu, Flash-modellen opkræver 0,30 dollars pr. million input-tokens for tekst, billeder og video og 2,50 dollars pr. million output-tokens., med separate priser for lyd.

I tilfældet med Flash-Lite er priserne endnu mere justerede, konsoliderer sig som indgangsmodellen for dem, der håndterer store datamængder, men ikke har brug for maksimal sofistikering inden for automatisk ræsonnement.

Eksklusivt indhold - Klik her  Sådan ændres adgangskoden på Google Pixel 4a

Brugsscenarier og adgang til Flash-Lite-modellen

Gemini 2.5 Flash-Lite Google AI Studio

Google henvender sig til udviklere og virksomheder med behov Masseoversættelse, dataklassificering og storskalaanalyse som de vigtigste modtagere af Flash-Lite. Modellen er også nyttig til automatiseret informationsorganisering, behandling af multimedieindhold og operationer, hvor hvert millisekund tæller, såsom øjeblikkelig respons i kundeserviceværktøjer eller alarm- og overvågningssystemer.

Gemini 2.5 Flash-Lite er nu tilgængelig tilgængelig i forhåndsvisningstilstand igennem Google AI Studio og Vertex AIFlash- og Pro-modellerne kan derimod bruges i disse tjenester og i Gemini-appen. Alle disse muligheder giver dig mulighed for at justere budgettet og tilpasse dig til profilen for hvert projekt eller behov.

Google søger at tilbyde løsninger til alle målgrupper og budgetter, og integrerer disse modeller i både sin AI Overviews-søgemaskine og produktivitetsprodukter som Meet, Docs og Sheets. Med introduktionen af ​​Flash Lite udvider Google udvalget af tilgængelige muligheder, hvilket gør generativ AI endnu nemmere at få adgang til til opgaver, hvor volumen, hastighed og pris er afgørende faktorer.

relateret artikel:
Gemini Flash 2.0 vil lade dig se, hvordan en beklædningsgenstand ville se ud på nogen.