DeepSeek acelera: menor custo, mais contexto e um rival desajeitado para OpenAI

Última atualização: 02/10/2025

  • DeepSeek-V3.2-Exp lançado, um passo intermediário em direção à sua próxima arquitetura
  • Novo mecanismo DeepSeek Sparse Attention para contextos longos e menor computação
  • Disponível no aplicativo, web e API com redução de preço de mais de 50%.
  • Pressão competitiva e adaptação aos chips chineses, com suporte ao FP8 e trabalho no BF16
DeepSeek V3.2-Exp

Construído em V3.1-Terminus, o novo modelo DeepSeek V3.2-Exp introduz uma abordagem de atenção dispersa que busca reduzir a carga computacional sem sacrificar a qualidade. Segundo a empresa, Preços de API caem mais de 50% com efeito imediato, e acesso Agora está disponível em seu aplicativo, na web e via API, além de ser oferecido no formato de de código aberto em plataformas de desenvolvimento como Abraçando o rosto.

Inovações técnicas: atenção dispersa e contexto longo

Tecnologia de atenção esparsa em modelos de IA

O cerne desta atualização é Atenção Esparsa DeepSeek (DSA), um mecanismo que prioriza partes relevantes do contexto para processá-las com mais precisão. A empresa detalha o uso de um Indexador de relâmpagos que seleciona fragmentos-chave e um processo de “seleção de tokens de granulação fina”, com o objetivo de cobrir grandes janelas de contexto e lidar com múltiplas linhas de pensamento ao mesmo tempo com menos sobrecarga de informações.

Conteúdo exclusivo - Clique aqui  Meta impulsiona a corrida pela superinteligência com a criação do Superintelligence Labs

Esta abordagem persegue melhorias tanto no treinamento quanto na inferência, acelerando os tempos e reduzindo o consumo de memória. O DeepSeek indica que suas versões mais recentes já apoiar o FP8 e estão trabalhando na compatibilidade com BF16, formatos numéricos que ajudam a equilibrar velocidade e precisão, e que facilitam execução em hardware local.

A empresa ressalta que se trata de um lançamento, ou seja, uma campo de testes que antecipa sua arquitetura de próxima geração. Ainda assim, sua testes internos Eles ressaltam que o V3.2-Exp (a versão experimental) tem desempenho no nível do V3.1-Terminus em tarefas como agentes de busca, codificação ou matemática, com o benefício adicional de eficiência em cenários de longo contexto.

Além da parte técnica, a disponibilidade é ampla: o modelo pode ser testado no app, a web e a API da empresa. O redução de preço (mais de 50%) visa acelerar a adoção por equipes de produtos e departamentos de engenharia que buscam reduzir custos operacionais.

Conteúdo exclusivo - Clique aqui  DeepSeek R2 pode ser lançado em abril e marcar um novo marco na IA

Na frente comunitária, a abertura em Abraçando o rosto e o GitHub Ele permite que pesquisadores e desenvolvedores auditem, reutilizem e proponham melhorias, fortalecendo o perfil do DeepSeek no ecossistema. IA de código aberto.

Impacto de mercado e pulso geopolítico

Ecossistema de IA e competição de modelos

Embora não se espere que esta medida abale os mercados como aconteceu R1 e V3 no início do ano, O V3.2-Exp pode pressionar rivais nacionais como Qwen (Alibaba) e concorrentes americanos como OpenAI, Antrópico ou xAI. A chave será demonstrar alto desempenho a menor custo, um fator particularmente sensível para grandes implantações de IA.

O lançamento ocorre em um ambiente complexo: vários países limitaram o uso de DeepSeek em agências governamentais (incluindo Itália, Estados Unidos e Coréia do Sul), citando preocupações de segurança. Essas restrições forçam a empresa a fortalecer sua governança e garantias se você deseja ganhar presença institucional.

No setor industrial, a China está pressionando suas empresas de tecnologia a reduzir sua dependência de semicondutores estrangeiros. Controles de exportação dos EUA para chips Nvidia (como Blackwell) e restrições adicionais - por exemplo, em RTX Pro 6000—, a DeepSeek afirma colaborar com fabricantes de chips chineses para otimizar seu execução em hardware local. Nesta linha, o setor tem manifestado o apoio de Huawei para a atualização mais recente do modelo.

Conteúdo exclusivo - Clique aqui  Astronautas presos na Estação Espacial Internacional retornam à Terra após nove meses

Se o modelo conseguir manter seu desempenho com metade do custo operacional, casos de uso com documentos longos, conversas longas ou tarefas analíticas exigentes podem ser especialmente benéficas. Para muitas empresas, a combinação eficiência + preço É tão decisivo quanto alguns pontos extras nos benchmarks.

A abordagem da DeepSeek combina abertura, eficiência e disponibilidade imediata com um roteiro que promete uma arquitetura mais capaz. Se a empresa consolidar as reduções de custos, mantendo o nível demonstrado pela V3.1-Terminus, O novo modelo pode se tornar uma referência prática para implantação de IA generativa em escala sem custos exorbitantes.Veremos se o DeepSeek pode fazer com que a eficiência deixe de ser uma aspiração técnica e passe a ser uma verdadeira vantagem competitiva para empresas e desenvolvedores.

Deepseek no VS Code
Artigo relacionado:
Como usar o DeepSeek no Visual Studio Code