- Nemotron 3 é uma família aberta de modelos, dados e bibliotecas focada em IA agentiva e sistemas multiagentes.
- Inclui três tamanhos de MoE (Nano, Super e Ultra) com arquitetura híbrida e treinamento eficiente de 4 bits no NVIDIA Blackwell.
- O Nemotron 3 Nano já está disponível na Europa através da Hugging Face, nuvens públicas e como um microsserviço NIM, com um limite de 1 milhão de tokens.
- O ecossistema é complementado por conjuntos de dados massivos, NeMo Gym, NeMo RL e Evaluator para treinar, ajustar e auditar agentes de IA soberanos.
A corrida pela inteligência artificial está migrando de chatbots simples e isolados para sistemas de agentes que colaboram entre si, gerenciam fluxos de trabalho extensos e precisam ser auditáveis. Nesse novo cenário, A NVIDIA decidiu dar um passo bastante claro: abrir não apenas os modelos, mas também os dados e as ferramentas.para que empresas, administrações públicas e centros de pesquisa possam construir suas próprias plataformas de IA com mais controle.
Esse movimento se materializa em Nemotron 3, uma família de modelos abertos voltados para IA multiagente. O objetivo é combinar alto desempenho, baixo custo de inferência e transparência. A proposta não se destina a ser apenas mais um chatbot de uso geral, mas sim como... uma base para implantar agentes que raciocinam, planejam e executam tarefas complexas em setores regulamentadosIsto é especialmente relevante na Europa e em Espanha, onde a soberania dos dados e o cumprimento das normas regulamentares são importantes.
Uma família aberta de modelos para IA agente e soberana.
Nemotron 3 é apresentado como Um ecossistema completo: modelos, conjuntos de dados, bibliotecas e receitas de treinamento. sob licenças abertas. A ideia da NVIDIA é que as organizações não apenas consumam IA como um serviço opaco, mas também possam inspecionar seu conteúdo, adaptar os modelos aos seus domínios e implantá-los em sua própria infraestrutura, seja na nuvem ou em data centers locais.
A empresa enquadra essa estratégia em seu compromisso com IA soberanaGovernos e empresas na Europa, Coreia do Sul e outras regiões estão buscando alternativas abertas a sistemas fechados ou estrangeiros, que muitas vezes não se alinham bem com suas leis de proteção de dados ou requisitos de auditoria. O Nemotron 3 visa ser a base técnica sobre a qual construir modelos nacionais, setoriais ou corporativos com maior visibilidade e controle.
Em paralelo, NVIDIA fortalece sua posição além do hardwareAté agora, era principalmente um fornecedor de GPUs de referência; com o Nemotron 3, também se posiciona na camada de ferramentas de modelagem e treinamento, competindo mais diretamente com empresas como OpenAI, Google, Anthropic ou até mesmo Meta, e contra modelos premium como SuperGrok PesadoA Meta tem reduzido seu compromisso com o código aberto nas últimas gerações do Llama.
Para o ecossistema europeu de pesquisa e startups — fortemente dependente de modelos abertos hospedados em plataformas como o Hugging Face — a disponibilidade de pesos, dados sintéticos e bibliotecas sob licenças abertas representa uma alternativa poderosa ao modelos chineses e os americanos, que dominam os rankings de popularidade e de referência.
Arquitetura híbrida MoE: eficiência para agentes de grande escala
A principal característica técnica do Nemotron 3 é um Arquitetura híbrida de mistura latente de especialistas (MoE)Em vez de ativar todos os parâmetros do modelo em cada inferência, apenas uma fração deles é ativada, o subconjunto de especialistas mais relevantes para a tarefa ou token em questão.
Esta abordagem permite reduzir drasticamente o custo computacional e o consumo de memóriaIsso também aumenta a taxa de transferência de tokens. Para arquiteturas multiagentes, onde dezenas ou centenas de agentes trocam mensagens continuamente, essa eficiência é fundamental para evitar que o sistema se torne insustentável em termos de custos de GPU e nuvem.
De acordo com dados divulgados pela NVIDIA e benchmarks independentes, o Nemotron 3 Nano atinge até quatro vezes mais tokens por segundo Em comparação com seu antecessor, o Nemotron 2 Nano, ele reduz a geração de tokens de raciocínio desnecessários em cerca de 60%. Na prática, isso significa respostas igualmente ou até mais precisas, mas com menos "verborragia" e um custo menor por consulta.
A arquitetura híbrida MoE, combinada com técnicas de treinamento específicas, levou a Muitos dos modelos abertos mais avançados adotam esquemas de especialistas.Nemotron 3 acompanha essa tendência, mas se concentra especificamente em IA agética: rotas internas projetadas para coordenação entre agentes, uso de ferramentas, gerenciamento de estados longos e planejamento passo a passo.
Três tamanhos: Nano, Super e Ultra para diferentes cargas de trabalho.

A família Nemotron 3 está organizada em três tamanhos principais do modelo MoETodas elas abertas e com parâmetros ativos reduzidos graças à arquitetura especializada:
- Nemotron 3 Nano: cerca de 30.000 bilhões de parâmetros no total, com aproximadamente 3.000 bilhões de ativos por tokenEle foi projetado para tarefas específicas onde a eficiência é importante: depuração de software, sumarização de documentos, recuperação de informações, monitoramento de sistemas ou assistentes de IA especializados.
- Nemotron 3 Superaproximadamente 100.000 bilhões de parâmetros, com 10.000 bilhões em ativos em cada etapa. É voltado para Raciocínio avançado em arquiteturas multiagentesCom baixa latência, mesmo quando vários agentes cooperam para resolver fluxos complexos.
- Nemotron 3 Ultra: o nível superior, com aproximadamente 500.000 bilhões de parâmetros e até 50.000 bilhões de ativos por tokenFunciona como um poderoso mecanismo de raciocínio para pesquisa, planejamento estratégico, suporte à decisão de alto nível e sistemas de IA particularmente exigentes.
Na prática, isso permite que as organizações Escolha o tamanho do modelo de acordo com seu orçamento e suas necessidades.Nano para cargas de trabalho massivas e intensivas com custos controlados; Super quando é necessário um raciocínio mais profundo com muitos agentes colaborando; e Ultra para casos em que a qualidade e o contexto extenso superam o custo da GPU.
No momento, Apenas o Nemotron 3 Nano está disponível para uso imediato.As variantes Super e Ultra estão previstas para o primeiro semestre de 2026, dando às empresas e laboratórios europeus tempo para experimentar primeiro com a Nano, estabelecer linhas de produção e, posteriormente, migrar os casos que exigem maior capacidade.
Nemotron 3 Nano: janela de 1 milhão de tokens e custo contido

O Nemotron 3 Nano é, até o momento, a ponta de lança prática da famíliaA NVIDIA descreve-o como o modelo mais eficiente em termos de custos computacionais da gama, otimizado para oferecer o máximo desempenho em fluxos de trabalho multiagentes e tarefas intensivas, mas repetitivas.
Dentre suas características técnicas, destacam-se as seguintes: janela de contexto de até um milhão de tokensIsso permite a retenção de memória para documentos extensos, repositórios de código inteiros ou processos de negócios com várias etapas. Para aplicações europeias nos setores bancário, de saúde ou de administração pública, onde os registros podem ser volumosos, essa capacidade de contexto de longo prazo é particularmente valiosa.
Os parâmetros de referência da organização independente A análise artificial coloca o Nemotron 3 Nano como um dos modelos de código aberto mais equilibrados. Ela combina inteligência, precisão e velocidade, com taxas de processamento na casa das centenas de tokens por segundo. Essa combinação a torna atraente para integradores de IA e provedores de serviços na Espanha que precisam de uma boa experiência do usuário sem custos exorbitantes de infraestrutura.
Em termos de casos de uso, a NVIDIA está direcionando a Nano para Resumo de conteúdo, depuração de software, recuperação de informações e assistentes de IA empresariais.Graças à redução de tokens de raciocínio redundantes, é possível executar agentes que mantêm longas conversas com usuários ou sistemas sem que a conta de inferência dispare.
Dados e bibliotecas abertas: NeMo Gym, NeMo RL e Evaluator.

Uma das características mais marcantes do Nemotron 3 é que Não se limita à divulgação dos pesos dos modelos.A NVIDIA acompanha a família de agentes com um conjunto abrangente de recursos abertos para treinamento, ajuste e avaliação.
Por um lado, disponibiliza um corpus sintético de vários trilhões de tokens de dados de pré-treinamento, pós-treinamento e reforçoEsses conjuntos de dados, focados em raciocínio, codificação e fluxos de trabalho de várias etapas, permitem que empresas e centros de pesquisa gerem suas próprias variantes específicas de domínio do Nemotron (por exemplo, jurídica, de saúde ou industrial) sem precisar começar do zero.
Dentre esses recursos, destacam-se os seguintes: Conjunto de dados de segurança do agente NemotronEle coleta dados de telemetria sobre o comportamento de agentes em cenários do mundo real. Seu objetivo é ajudar as equipes a medir e fortalecer a segurança de sistemas autônomos complexos: desde as ações que um agente toma ao encontrar dados sensíveis até como ele reage a comandos ambíguos ou potencialmente prejudiciais.
Com relação à seção de ferramentas, a NVIDIA está lançando NeMo Gym e NeMo RL como bibliotecas de código aberto para treinamento de reforço e pós-treinamento, juntamente com o NeMo Evaluator para avaliação de segurança e desempenho. Essas bibliotecas fornecem ambientes e fluxos de trabalho de simulação prontos para uso com a família Nemotron, mas podem ser estendidas a outros modelos.
Todo esse material — pesos, conjuntos de dados e código — é distribuído através de O GitHub e o Hugging Face são licenciados sob a Licença de Modelo Aberto da NVIDIA.para que as equipes europeias possam integrá-lo perfeitamente em suas próprias operações de MLOps. Empresas como a Prime Intellect e a Unsloth já estão incorporando o NeMo Gym diretamente em seus fluxos de trabalho para simplificar o aprendizado por reforço no Nemotron.
Disponibilidade em nuvens públicas e no ecossistema europeu

Nemotron 3 Nano já está disponível em Abraçando o rosto y GitHubbem como por meio de provedores de inferência como Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter e Together AI. Isso abre caminho para que equipes de desenvolvimento na Espanha testem o modelo via API ou o implementem em suas próprias infraestruturas sem complexidade excessiva.
No que diz respeito à computação em nuvem, Nemotron 3 Nano se junta à AWS via Amazon Bedrock. para inferência sem servidor, e anunciou suporte para Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale e Yotta. Para organizações europeias que já trabalham com essas plataformas, isso facilita a adoção do Nemotron sem mudanças drásticas em sua arquitetura.
Além da nuvem pública, a NVIDIA está promovendo o uso do Nemotron 3 Nano como Microsserviço NIM implantável em qualquer infraestrutura acelerada pela NVIDIAIsso permite cenários híbridos: parte da carga em nuvens internacionais e parte em centros de dados locais ou em nuvens europeias que priorizam a residência de dados na UE.
Versões Nemotron 3 Super e Ultra, voltadas para cargas de trabalho de raciocínio extremo e sistemas multiagentes de grande escala, são planejado para o primeiro semestre de 2026Este cronograma permite que o ecossistema europeu de pesquisa e negócios tenha tempo para experimentar o Nano, validar casos de uso e projetar estratégias de migração para modelos maiores, quando necessário.
O Nemotron 3 posiciona a NVIDIA como uma das principais fornecedoras de Modelos abertos de alta qualidade voltados para IA agente.Com uma proposta que combina eficiência técnica (MoE híbrido, NVFP4, contexto massivo), abertura (pesos, conjuntos de dados e bibliotecas disponíveis) e um foco claro na soberania e transparência dos dados, aspectos que são especialmente sensíveis na Espanha e no resto da Europa, onde a regulamentação e a pressão para auditar a IA são cada vez maiores.
Sou um entusiasta da tecnologia que transformou seus interesses “geek” em profissão. Passei mais de 10 anos da minha vida usando tecnologia de ponta e mexendo em todos os tipos de programas por pura curiosidade. Agora me especializei em informática e videogames. Isto porque há mais de 5 anos escrevo para diversos sites sobre tecnologia e videojogos, criando artigos que procuram dar-lhe a informação que necessita numa linguagem compreensível para todos.
Se você tiver alguma dúvida, meu conhecimento vai desde tudo relacionado ao sistema operacional Windows até Android para celulares. E meu compromisso é com você, estou sempre disposto a dedicar alguns minutos e te ajudar a resolver qualquer dúvida que você possa ter nesse mundo da internet.
