Google melhora Gemini 2.5 Flash e Flash Lite com mais raciocínio e menos custo

Última atualização: 26/09/2025

  • O Gemini 2.5 Flash orienta você passo a passo e organiza as respostas com títulos, listas e tabelas.
  • Grande salto em eficiência: menos tokens e menor latência (Flash -24%, Flash Lite -50%).
  • Capacidades multimodais aprimoradas: análise de imagens, transcrição e tradução; organização de notas e criação de flashcards.
  • Disponível no Google AI Studio e no Vertex AI; use o alias -latest para acessar a versão mais recente e recomendamos usar ramificações estáveis ​​em produção.

Atualização Gemini 2.5

Madrid — O Google anunciou uma atualização para Gemini 2.5 Flash e sua variante Flash Lite focado em elevar o pensamento, apresentar respostas mais claras e reduzir custos operacionais para desenvolvedores e empresas. A atualização Ele vem com melhorias projetadas para resolver tarefas complexas com mais ordem e menos atrito..

La compañía explica que O modelo agora estrutura melhor a saída com formatos como cabeçalhos, listas e tabelas, ajudando a compreender as conclusões num relance. Além disso, O uso de tokens foi otimizado para reduzir latência e custos, e o guia passo a passo foi reforçado. sobre questões espinhosas para que o usuário possa seguir em frente com mais confiança.

O que está mudando no Gemini 2.5 Flash

Gemini 2.5 Flash

Na versão Flash, o Google coloca o foco no raciocínio e o guia interativoO sistema pode guiar o usuário por processos de várias etapas, detalhando cada decisão e mostrando a lógica por trás dela. Esta apresentação mais didática é complementada por respostas com títulos, marcadores e tabelas, quando apropriado, para facilitar a leitura.

Conteúdo exclusivo - Clique aqui  Como voltar ao Google Pixel 7

As capacidades agênticas também progridem: o modelo gere melhor o uso de ferramentas externas e fluxos de trabalho encadeados, com um aumento de 5% no benchmark SWE-Bench Verified em comparação com a iteração anterior. Trata-se de uma melhoria modesta, mas consistente, em tarefas que exigem coordenação em fases.

Na seção multimodal, o Gemini 2.5 Flash pode analisar imagens, diagramas e material de estudo com maior confiabilidade. A partir das notas enviadas pelo usuário, o assistente consegue organizá-los, resumi-los e até mesmo gerar flashcards, o que abre portas para usos em educação e documentação interna.

A eficiência é outro dos pilares: o Google aponta um Redução de 24% no consumo de tokens de saída para Flash, o que se traduz em respostas mais rápidas e faturas mais concisas. Combinado com uma organização de texto aprimorada, o modelo mantém a qualidade com menos recursos.

Para desenvolvedores, há atualizações operacionais: versões atualizadas estão disponíveis em Google AI Studio y Vertex AI, e a família incorpora um alias -latest que permite obter a versão mais recente sem alterar os identificadores. No entanto, a empresa recomenda continuar a usar ramificações estáveis ​​em projetos que exigem precisão máxima, mantendo essas compilações como iterações experimentais.

Conteúdo exclusivo - Clique aqui  Como importar um tema para o Apresentações Google

Flash Lite: velocidade e baixo custo

Gemini 2.5 Flash-Lite

O Flash Lite, o modelo mais acessível e rápido da família, foi treinado com três objetivos: siga melhor instruções complexas, oferecem respostas mais concisas e reforçam a multimodalidade (transcripción de audio, compreensão de imagens e tradução automática). O resultado é voltado para aplicações de alto desempenho que exigem latência mínima.

Em eficiência, a versão Lite dá um salto notável com um Corte de 50% nos tokens de saída, essencial para reduzir custos e suportar volumes de tráfego maiores. Cortar texto desnecessário ajuda você a ir direto ao ponto sem perder o contexto, algo muito valorizado em integrações onde cada milissegundo conta.

Essas melhorias também alcançam o uso diário: O Gemini Flash agora está integrado ao aplicativo Google Assistente., enquanto as compilações em Flash e Flash Lite podem ser testadas no AI Studio e no Vertex AI. O Google enfatiza que estas não se destinam a ser versões estáveis ​​finais, mas sim a iterações para ajudar a moldar futuras ramificações de produção.

Conteúdo exclusivo - Clique aqui  Como inserir marcadores no Planilhas Google

Além do desempenho, a experiência do usuário se beneficia da apresentação mais ordenada das informações e a capacidade de decompor problemas complexos em etapas concretas. Em ambientes de estudo e trabalho, carregar um diagrama ou algumas anotações pode ser suficiente para criar um plano de ação numerado e pronto para execução.

O que há de novo em resumo

Gemini 2.5 Flash Lite

  • Guia passo a passo aprimorado e respostas com títulos, listas e tabelas para maior clareza.
  • Otimização de Tokens: menor latência e custos (Flash -24%, Flash Lite -50%).
  • Multimodalidade mais forte: Analisar imagens/diagramas, transcrever áudio, traduzir e criar flashcards.
  • Melhor utilização de ferramentas e fluxos encadeados; +5% em SWE-Bench Verificado.
  • Disponibilidade no Google AI Studio e Vertex AI, com alias -latest e recomendação de modelos estáveis ​​para produção.

A atualização Gemini 2.5 se concentra em tornar a IA mais útil e sustentável em custos sem sacrificar a qualidade: menos tokens, respostas mais precisas e comportamento mais confiável ao coordenar múltiplas ferramentas. Para equipes técnicas e desenvolvedores de produtos, fornece uma base mais eficiente para iteração e escalonamento.

Gemini 2.5 Flash-Lite
Artigo relacionado:
Google revela Gemini 2.5 Flash-Lite: o modelo mais rápido e eficiente da família de IA