- Gemini 2.5 Flash-Lite destaca per la seva velocitat i baix cost
- El model és idoni per a tasques a gran escala i baixa latència, com a traducció i classificació
- Es troba en fase de vista prèvia, mentre que Flash i Pro passen a disponibilitat general
- Ofereix integració multimodal i preus notablement inferiors a models anteriors
Google segueix ampliant la gamma de models d'intel·ligència artificial amb l'arribada de Gemini 2.5 Flash-Lite, un model que aposta per la màxima eficiència en cost i velocitat. En els darrers dies, la companyia ha anunciat la disponibilitat general dels seus models 2.5 Pro i Flash, mentre que Flash-Lite desembarca en format de vista prèvia per a desenvolupadors i empreses interessades en solucions àgils i econòmiques.
Aquest moviment respon a la demanda creixent de models que combinin alt volum de processament i baixa latènciafacilitant tasques com traducció, classificació de dades o qualsevol operació que requereixi velocitat sense comprometre el pressupost. Flash-Lite arriba com l'opció predilecta per als que busquen processar grans quantitats d'informació ràpidament ia preus competitius, sense necessitat de recórrer sempre a la màxima capacitat de raonament de la família Gemini.
Flash-Lite: el model més ràpid i econòmic de Gemini

La nova versió Gemini 2.5 Flash-Lite supera clarament la seva predecessora (2.0 Flash-Lite) en benchmarks de programació, matemàtiques, ciències, raonament lògic i tasques multimodals. Segons Google, aquest model és especialment eficaç en escenaris d'entrada massiva de dades, com ara la traducció de textos extensos o la classificació a gran escala, amb resultats superiors en velocitat i qualitat en comparació amb altres propostes de la sèrie.
La latència, un altre dels paràmetres decisius en aplicacions en temps real, també és mínima en Flash-Lite, superant en rapidesa les versions anteriors i posicionant-se com l'opció preferent per a qui prioritzi la immediatesa.
Característiques tècniques i millores respecte a versions anteriors

Gemini 2.5 Flash-Lite manté moltes de les funcionalitats avançades de la família: suport multimodal (text, imatge, vídeo i fins i tot àudio), integració amb eines clau com Google Search, execució de codi o contextos de fins a un milió de tokens. A més, l'arquitectura de mescla d'experts emprada per Gemini 2.5 maximitza l'eficiència, ja que només activa la xarxa neuronal imprescindible a cada consulta, reduint el consum de recursos.
Un altre avantatge distintiu és el control del 'thinking budget' a través d'un paràmetre d'API, que permet als desenvolupadors decidir fins a quin punt el model ha de fer servir les seves capacitats de raonament per a cada tasca. Per defecte, a Flash-Lite aquesta funció està desactivada, cercant l'equilibri òptim entre velocitat i cost, però sempre es pot activar quan la precisió és prioritària.
Els últims benchmarks interns de Flash-Lite mostren puntuacions destacades: 86,8% a FACTS Grounding, 84,5% a Multilingual MMLU i xifres igualment competitives en comprensió visual. Aquestes mètriques confirmen la seva idoneïtat per a aplicacions on l'exactitud i la rapidesa marquen la diferència.
Disponibilitat i preus renovats a la família Gemini
A més de l'arribada de Flash-Lite, Gemini 2.5 Pro i Flash ja estan disponibles de forma general, després de superar la fase de proves. Google ha aprofitat l'ocasió per simplificar el sistema de preus, eliminant la distinció anterior entre tarifes de pensament i no pensament, que generava confusió entre desenvolupadors. Ara, el model Flash cobra 0,30 dòlars per milió de tokens d'entrada per a text, imatge i vídeo, i 2,50 dòlars per milió de tokens de sortida, amb preus separats per a àudio.
En el cas de Flash-Lite, els preus encara són més ajustats, consolidant-se com el model d'entrada per als que manegen grans volums de dades però no necessiten la màxima sofisticació en raonament automàtic.
Casos d'ús i accés al model Flash-Lite

Google apunta a desenvolupadors i empreses amb necessitats de traducció massiva, classificació de dades i anàlisi a gran escala com els principals beneficiaris de Flash-Lite. El model també és útil per a lorganització automàtica dinformació, processament de contingut multimèdia i operacions on cada mil·lisegon compte, com la resposta instantània en eines datenció al client o sistemes dalerta i monitoratge.
Gemini 2.5 Flash-Lite es troba ja disponible en mode vista prèvia a través de Google AI Studio i Vertex AI. Els models Flash i Pro, per la seva banda, es poden utilitzar en aquests serveis ia l'app de Gemini. Totes aquestes opcions permeten ajustar el pressupost de raonament i adaptar-se al perfil de cada projecte o necessitat.
Google busca oferir solucions per a tots els públics i butxaques, integrant aquests models tant al motor de cerca amb AI Overviews com en productes de productivitat com Meet, Docs o Sheets. Amb la irrupció de Flash-Lite, Google amplia el ventall d'opcions disponibles, facilitant encara més l'accés a la intel·ligència artificial generativa per a tasques on el volum, la rapidesa i el preu són factors
Sóc un apassionat de la tecnologia que ha convertit els seus interessos frikis en professió. Porto més de 10 anys de la meva vida utilitzant tecnologia d'avantguarda i traslladant tota mena de programes per pura curiositat. Ara he especialitzat en tecnologia d'ordinador i videojocs. Això és perquè des de fa més de 5 anys que treballo redactant per a diverses webs en matèria de tecnologia i videojocs, creant articles que busquen donar-te la informació que necessites amb un llenguatge comprensible per tothom.
Si tens qualsevol pregunta, els meus coneixements van des de tot allò relacionat amb el sistema operatiu Windows així com Android per a mòbils. I és que el meu compromís és amb tu, sempre estic disposat a dedicar-te uns minuts i ajudar-te a resoldre qualsevol dubte que tinguis a aquest món d'internet.