Google revela Gemini 2.5 Flash-Lite: o modelo mais rápido e eficiente da família de IA

Última atualização: 24/06/2025

  • Gemini 2.5 Flash-Lite se destaca pela velocidade e baixo custo
  • O modelo é ideal para tarefas de larga escala e baixa latência, como tradução e classificação.
  • Está em fase de pré-visualização, enquanto o Flash e o Pro se tornam disponíveis para o público em geral.
  • Oferece integração multimodal e preços significativamente mais baixos que os modelos anteriores.
Gemini 2.5 Flash-Lite

Google continua a expandir sua gama de modelos de inteligência artificial com a chegada do Gemini 2.5 Flash-Lite, um modelo que foca na máxima eficiência de custos e velocidade. Nos últimos dias, a empresa anunciou a disponibilidade geral dos modelos 2.5 Pro e Flash, enquanto o Flash-Lite está sendo lançado em formato de pré-lançamento para desenvolvedores e empresas interessadas em soluções ágeis e econômicas.

Este movimento responde à crescente procura por modelos que combinem alto volume de processamento e baixa latência, facilitando tarefas como tradução, classificação de dados ou qualquer operação que exija rapidez sem comprometer o orçamento. O Flash-Lite chega como a opção preferida para quem busca processar grandes quantidades de informação de forma rápida e a preços competitivos, sem precisar sempre recorrer à máxima capacidade de raciocínio da família de Gêmeos.

Flash-Lite: o modelo mais rápido e acessível da Gemini

Gemini 2.5

A nova versão Gemini 2.5 Flash-Lite supera claramente seu antecessor (2.0 Flash-Lite) em programação, matemática, ciências, raciocínio lógico e benchmarks de tarefas multimodais. De acordo com o Google, este modelo é especialmente eficaz em cenários de entrada massiva de dados, como tradução de textos longos ou classificação em larga escala, com resultados superior em velocidade e qualidade em comparação com outras propostas da série.

Conteúdo exclusivo - Clique aqui  Como sair de uma aula no Google Classroom

A latência, outro dos parâmetros decisivos em aplicações em tempo real, também é mínimo em Flash-Lite, superando as versões anteriores em velocidade e se posicionando como a opção preferida para quem prioriza a imediatez.

Características técnicas e melhorias em comparação com versões anteriores

Gemini 2.5 Flash Lite 0

O Gemini 2.5 Flash-Lite mantém muitos dos recursos avançados da família: suporte multimodal (texto, imagem, vídeo e até áudio), integração com ferramentas essenciais como a Pesquisa Google, execução de código ou contextos de até um milhão de tokens. Além disso, a arquitetura de mixagem especializada empregada pelo Gemini 2.5 maximiza a eficiência ao ativar apenas a rede neural essencial para cada consulta, reduzindo o consumo de recursos.

Outra vantagem distintiva é a controle do 'orçamento pensante' Por meio de um parâmetro de API, que permite aos desenvolvedores decidir até que ponto o modelo deve usar seus recursos de raciocínio para cada tarefa. Por padrão, no Flash-Lite, esse recurso está desabilitado, buscando o equilíbrio ideal entre velocidade e custo, mas pode ser habilitado sempre que a precisão for uma prioridade.

Conteúdo exclusivo - Clique aqui  Um casal dirigiu mais de três horas para conhecer um lugar que não existia: a IA já está gerando destinos turísticos falsos.

Os últimos benchmarks internos Pontuações excepcionais do Flash-Lite: 86,8% em FACTS Grounding, 84,5% em Multilingual MMLU e números igualmente competitivos em compreensão visualEssas métricas confirmam sua adequação para aplicações onde precisão e velocidade fazem a diferença.

editar fotos gemini flash-4
Artigo relacionado:
Como editar fotos com Gemini Flash 2.0 sem nenhum conhecimento de edição

Disponibilidade e preços atualizados para a família Gemini

Além da chegada do Flash-Lite, Gemini 2.5 Pro e Flash já estão disponíveis para o público em geral, após passar pela fase de testes. O Google aproveitou a oportunidade para simplificar o sistema de preços, eliminando a distinção anterior entre tarifas pensantes e não pensantes, o que causou confusão entre os desenvolvedores. Agora, O modelo Flash cobra US$ 0,30 por milhão de tokens de entrada para texto, imagens e vídeo, e US$ 2,50 por milhão de tokens de saída., com preços separados para áudio.

No caso do Flash-Lite, os preços são ainda mais ajustados, consolidando-se como o modelo de entrada para quem lida com grandes volumes de dados, mas não necessita de máxima sofisticação em raciocínio automático.

Conteúdo exclusivo - Clique aqui  Como alterar a senha no Google Pixel 4a

Casos de uso e acesso ao modelo Flash-Lite

Gemini 2.5 Flash-Lite Google AI Studio

O Google tem como alvo desenvolvedores e empresas com necessidades Tradução em massa, classificação de dados e análise em larga escala como os principais beneficiários do Flash-Lite. O modelo também é útil para organização automatizada de informações, processamento de conteúdo multimídia e operações onde cada milissegundo conta, como resposta instantânea em ferramentas de atendimento ao cliente ou sistemas de alerta e monitoramento.

Gemini 2.5 Flash-Lite já está disponível disponível no modo de visualização através de Google AI Studio e Vertex AIJá os modelos Flash e Pro podem ser usados ​​nesses serviços e no app Gemini. Todas essas opções permitem ajustar o orçamento e se adaptar ao perfil de cada projeto ou necessidade.

O Google busca oferecer soluções para todos os públicos e orçamentos, integrando esses modelos tanto ao seu mecanismo de busca AI Overviews quanto a produtos de produtividade como Meet, Docs e Sheets. Com a introdução do Flash Lite, o Google está expandindo a gama de opções disponíveis, tornando a IA generativa ainda mais fácil de acessar para tarefas em que volume, velocidade e preço são fatores decisivos.

Artigo relacionado:
O Gemini Flash 2.0 permite que você veja como uma peça de roupa ficaria em qualquer pessoa.