Google dévoile Gemini 2.5 Flash-Lite : le modèle le plus rapide et le plus efficace de sa famille IA

Dernière mise à jour: 24/06/2025

  • Gemini 2.5 Flash-Lite se distingue par sa vitesse et son faible coût
  • Le modèle est idéal pour les tâches à grande échelle et à faible latence telles que la traduction et la classification.
  • Il est en phase de prévisualisation, tandis que Flash et Pro deviennent généralement disponibles.
  • Il offre une intégration multimodale et des prix nettement inférieurs aux modèles précédents.
Gemini 2.5 Flash Lite

Google continue d'élargir sa gamme de modèles d'intelligence artificielle avec l'arrivée de Gemini 2.5 Flash-Lite, un modèle axé sur une rentabilité et une rapidité maximales. Ces derniers jours, l'entreprise a annoncé la disponibilité générale de ses modèles 2.5 Pro et Flash, tandis que Flash-Lite est lancé en avant-première pour les développeurs et les entreprises recherchant des solutions agiles et économiques.

Ce mouvement répond à la demande croissante de modèles combinant volume de traitement élevé et faible latence, facilitant des tâches telles que la traduction, la classification de données ou toute opération nécessitant de la rapidité sans compromettre le budget. Flash-Lite arrive comme l'option préférée pour ceux qui cherchent à traiter de grandes quantités d'informations rapidement et à des prix compétitifs, sans avoir toujours besoin de recourir à la capacité de raisonnement maximale de la famille des Gémeaux.

Flash-Lite : le modèle le plus rapide et le plus abordable de Gemini

Gemini 2.5

La nouvelle version Gemini 2.5 Flash-Lite surpasse clairement son prédécesseur (2.0 Flash-Lite) en programmation, mathématiques, sciences, raisonnement logique et tests de performances multimodaux. Selon Google, ce modèle est particulièrement efficace dans les scénarios de saisie de données volumineuses, comme la traduction de longs textes ou la classification à grande échelle, avec des résultats probants. supérieur en vitesse et en qualité par rapport aux autres propositions de la série.

Contenu exclusif - Cliquez ici  Comment bloquer la mise en forme conditionnelle dans Google Sheets

La latence, un autre des paramètres décisifs dans les applications en temps réel, est également minimum dans Flash-Lite, surpassant les versions précédentes en termes de vitesse et se positionnant comme l'option préférée de ceux qui privilégient l'immédiateté.

Caractéristiques techniques et améliorations par rapport aux versions précédentes

Gemini 2.5 Flash Lite 0

Gemini 2.5 Flash-Lite conserve de nombreuses fonctionnalités avancées de la famille : support multimodal (texte, image, vidéo et même audio), intégration avec des outils clés comme la recherche Google, exécution de code ou contextes jusqu'à un million de jetons. De plus, l'architecture de mixage expert de Gemini 2.5 maximise l'efficacité en activant uniquement le réseau neuronal essentiel pour chaque requête, réduisant ainsi la consommation de ressources.

Un autre avantage distinctif est la contrôle du « budget de réflexion » Grâce à un paramètre d'API, les développeurs peuvent déterminer dans quelle mesure le modèle doit exploiter ses capacités de raisonnement pour chaque tâche. Par défaut, dans Flash Lite, cette fonctionnalité est désactivée afin de trouver le juste équilibre entre rapidité et coût. Elle peut toutefois être activée lorsque la précision est une priorité.

Contenu exclusif - Cliquez ici  Enregistrer un document Google au format PNG

Les derniers benchmarks internes Les scores exceptionnels de Flash-Lite : 86,8 % en FACTS Grounding, 84,5 % en Multilingual MMLU et des chiffres tout aussi compétitifs en compréhension visuelleCes mesures confirment son adéquation aux applications où la précision et la rapidité font la différence.

éditer des photos avec Gemini Flash-4
Article connexe:
Comment éditer des photos avec Gemini Flash 2.0 sans aucune connaissance en édition

Disponibilité et prix mis à jour pour la famille Gemini

En plus de l'arrivée de Flash-Lite, Gemini 2.5 Pro et Flash sont désormais disponibles, après avoir passé la phase de test. Google a profité de l'occasion pour simplifier le système de tarification, en éliminant la distinction précédente entre les tarifs réfléchis et non réfléchis, ce qui a semé la confusion parmi les développeurs. Maintenant, Le modèle Flash facture 0,30 $ par million de jetons d'entrée pour le texte, les images et la vidéo, et 2,50 $ par million de jetons de sortie., avec des prix séparés pour l'audio.

Dans le cas de Flash-Lite, les prix sont encore plus ajustés, se consolidant comme le modèle d'entrée de gamme pour ceux qui manipulent de gros volumes de données mais n'ont pas besoin d'une sophistication maximale en matière de raisonnement automatique.

Contenu exclusif - Cliquez ici  Comment se désinscrire d'un cours dans Google Classroom

Cas d'utilisation et accès au modèle Flash-Lite

Gemini 2.5 Flash-Lite Google AI Studio

Google cible les développeurs et les entreprises ayant des besoins Traduction de masse, classification des données et analyse à grande échelle comme principaux bénéficiaires de Flash-Lite. Ce modèle est également utile pour l'organisation automatisée de l'information, le traitement de contenu multimédia et les opérations où chaque milliseconde compte, comme la réponse instantanée dans les outils de service client ou les systèmes d'alerte et de surveillance.

Gemini 2.5 Flash-Lite est maintenant disponible disponible en mode aperçu à travers Google AI Studio et Vertex AILes modèles Flash et Pro, quant à eux, sont compatibles avec ces services et l'application Gemini. Toutes ces options permettent d'ajuster le budget et de s'adapter au profil de chaque projet ou besoin.

Google cherche à offrir des solutions pour tous les publics et tous les budgets, intégrant ces modèles à son moteur de recherche AI ​​Overviews et à ses produits de productivité comme Meet, Docs et Sheets. Avec l'introduction de Flash Lite, Google élargit la gamme d'options disponibles, rendant l'IA générative encore plus accessible pour les tâches où le volume, la rapidité et le prix sont des facteurs déterminants.

Article connexe:
Gemini Flash 2.0 vous permettra de voir à quoi ressemblerait un vêtement sur n'importe qui.