- Nemotron 3는 에이전트형 AI 및 다중 에이전트 시스템에 초점을 맞춘 모델, 데이터 및 라이브러리의 오픈 소스 제품군입니다.
- 이 제품에는 하이브리드 아키텍처와 NVIDIA Blackwell 기반의 효율적인 4비트 학습을 지원하는 세 가지 MoE 크기(Nano, Super, Ultra)가 포함되어 있습니다.
- Nemotron 3 Nano는 이제 Hugging Face, 퍼블릭 클라우드 및 NIM 마이크로서비스를 통해 유럽에서 이용 가능하며, 1만 토큰의 공급량이 설정되어 있습니다.
- 이 생태계는 방대한 데이터 세트, NeMo Gym, NeMo RL 및 Evaluator를 통해 독립적인 AI 에이전트를 훈련, 조정 및 검증할 수 있도록 완성됩니다.
인공지능 경쟁은 단순하고 독립적인 챗봇에서 서로 협력하고, 복잡한 워크플로우를 관리하며, 감사가 가능한 에이전트 시스템으로 진화하고 있습니다. 이러한 새로운 환경에서, NVIDIA는 상당히 명확한 행보를 보이기로 결정했습니다. 모델뿐만 아니라 데이터와 도구까지 개방하겠다는 것입니다.이를 통해 기업, 공공기관 및 연구센터는 더욱 강력한 통제력을 가지고 자체적인 AI 플랫폼을 구축할 수 있습니다.
그 운동은 다음과 같이 구체화됩니다. Nemotron 3는 다중 에이전트 AI를 위한 개방형 모델 제품군입니다. 이 제안은 고성능, 낮은 추론 비용 및 투명성을 결합하는 것을 목표로 합니다. 이 제안은 단순한 범용 챗봇이 아니라, 다음과 같은 목적을 가지고 있습니다. 규제 대상 분야에서 복잡한 작업을 추론하고 계획하며 실행하는 에이전트를 배치하기 위한 기반이는 데이터 주권과 규제 준수가 중요한 유럽과 스페인에서 특히 중요한 의미를 갖습니다.
에이전트형 및 주권형 AI를 위한 개방형 모델군
네모트론 3는 다음과 같이 제시됩니다. 완벽한 생태계: 모델, 데이터셋, 라이브러리 및 학습 레시피 개방형 라이선스 하에 제공됩니다. NVIDIA의 아이디어는 기업들이 AI를 불투명한 서비스로만 소비하는 것이 아니라, 내부를 살펴보고, 모델을 자사 영역에 맞게 조정하고, 클라우드 또는 로컬 데이터 센터 등 자체 인프라에 배포할 수 있도록 하는 것입니다.
회사는 이러한 전략을 다음과 같은 약속의 틀 안에서 설명합니다. 소버린 AI유럽, 한국 및 기타 지역의 정부와 기업들은 폐쇄형 시스템이나 해외 시스템 대신 개방형 시스템을 모색하고 있습니다. 이러한 시스템은 종종 자국의 데이터 보호법이나 감사 요건과 잘 부합하지 않기 때문입니다. 네모트론 3는 이러한 대안을 통해 국가, 산업 또는 기업 차원에서 더욱 투명하고 효과적으로 관리할 수 있는 모델을 구축할 수 있는 기술적 기반을 제공하고자 합니다.
병행하여, NVIDIA는 하드웨어 외 분야에서의 입지를 강화합니다.지금까지는 주로 레퍼런스 GPU 공급업체였지만, Nemotron 3를 통해 모델링 및 학습 도구 분야에도 진출하여 OpenAI, Google, Anthropic, Meta와 같은 업체 및 프리미엄 모델들과 더욱 직접적으로 경쟁하게 되었습니다. 슈퍼그록 헤비Meta는 최근 Llama 버전에서 오픈 소스에 대한 지원을 줄여왔습니다.
Hugging Face와 같은 플랫폼에서 호스팅되는 오픈 모델에 크게 의존하는 유럽의 연구 및 스타트업 생태계에 있어, 오픈 라이선스 하에 제공되는 가중치, 합성 데이터 및 라이브러리는 강력한 대안을 제시합니다. 중국 모델 그리고 미국인들은 인기와 벤치마크 순위에서 압도적인 우위를 차지하고 있습니다.
하이브리드 MoE 아키텍처: 대규모 에이전트를 위한 효율성
네모트론 3의 핵심 기술적 특징은 다음과 같습니다. 잠재적 전문가 혼합 모델(MoE)의 하이브리드 아키텍처각 추론에서 모델의 모든 매개변수를 활성화하는 대신, 해당 작업이나 토큰에 가장 관련성이 높은 전문가 하위 집합인 일부 매개변수만 활성화합니다.
이 접근 방식은 다음을 허용합니다. 계산 비용과 메모리 사용량을 획기적으로 줄입니다.이는 토큰 처리량도 증가시킵니다. 수십 또는 수백 개의 에이전트가 지속적으로 메시지를 교환하는 다중 에이전트 아키텍처의 경우, 이러한 효율성은 GPU 및 클라우드 비용 측면에서 시스템이 지속 불가능해지는 것을 방지하는 데 핵심적인 요소입니다.
NVIDIA가 공개한 데이터와 독립적인 벤치마크 결과에 따르면, Nemotron 3 Nano는 다음과 같은 성능을 달성합니다. 초당 최대 4배 더 많은 토큰 이전 모델인 네모트론 2 나노와 비교했을 때, 불필요한 추론 토큰 생성을 약 60% 줄였습니다. 실제로 이는 정확도는 동일하거나 더 높으면서도 "장황함"은 줄어들고 쿼리당 비용은 낮아진다는 것을 의미합니다.
특정 훈련 기법과 결합된 하이브리드 MoE 아키텍처는 다음과 같은 결과를 가져왔습니다. 가장 발전된 개방형 모델 중 상당수는 전문가 체계를 채택하고 있습니다.Nemotron 3도 이러한 추세에 동참하지만, 특히 에이전트 기반 AI에 초점을 맞춥니다. 즉, 에이전트 간의 조정을 위해 설계된 내부 경로, 도구 사용, 장기 상태 처리 및 단계별 계획 수립에 중점을 둡니다.
작업 부하에 따라 나노, 슈퍼, 울트라의 세 가지 크기로 제공됩니다.

네모트론 3 제품군은 다음과 같이 구성됩니다. MoE 모델의 세 가지 주요 크기이 모든 기능은 전문가 수준의 아키텍처 덕분에 개방형이며 활성 매개변수가 축소되었습니다.
- 네모트론 3 나노총 약 30.000억 개의 매개변수 중 약 토큰당 3.000억 달러 자산이 소프트웨어는 소프트웨어 디버깅, 문서 요약, 정보 검색, 시스템 모니터링 또는 특수 AI 비서와 같이 효율성이 중요한 특정 작업을 위해 설계되었습니다.
- 네모트론 3 슈퍼약 100.000억 개의 매개변수를 포함합니다. 10.000억 달러 자산 모든 단계에서. 그것은 ~을 목표로 합니다. 다중 에이전트 아키텍처에서의 고급 추론여러 에이전트가 복잡한 흐름을 해결하기 위해 협력하는 경우에도 지연 시간이 낮습니다.
- 네모트론 3 울트라상위 레벨은 약 500.000천억 개의 매개변수와 최대... 토큰당 50.000억 달러 자산이 시스템은 연구, 전략 기획, 고위급 의사 결정 지원, 특히 까다로운 AI 시스템을 위한 강력한 추론 엔진으로 작동합니다.
실제로 이는 조직에게 다음과 같은 이점을 제공합니다. 예산과 필요에 따라 모델 크기를 선택하세요.Nano는 대규모의 집중적인 작업 부하와 비용 효율성이 중요한 경우에 적합하고, Super는 여러 협력 에이전트를 통해 더 심층적인 추론이 필요한 경우에 적합하며, Ultra는 GPU 비용보다 품질과 장기적인 컨텍스트 처리가 더 중요한 경우에 적합합니다.
지금은 현재 네모트론 3 나노만 즉시 사용 가능합니다.슈퍼 및 울트라 버전은 2026년 상반기에 출시될 예정이며, 이를 통해 유럽 기업과 연구소는 나노 기술을 먼저 실험하고, 파이프라인을 구축한 후, 더 큰 용량이 필요한 사례를 이전할 시간을 확보할 수 있습니다.
네모트론 3 나노: 1만 토큰 창 및 비용 포함

네모트론 3 나노는 오늘 기준으로 다음과 같습니다. 가족의 실질적인 선봉장NVIDIA는 이 모델을 해당 제품군에서 계산 비용 효율성이 가장 뛰어난 모델로 설명하며, 다중 에이전트 워크플로우와 집중적이지만 반복적인 작업에서 최대 성능을 제공하도록 최적화되었다고 밝혔습니다.
기술적 특징 중 다음과 같은 점들이 두드러집니다. 최대 백만 토큰의 컨텍스트 윈도우이를 통해 방대한 문서, 전체 코드 저장소 또는 여러 단계로 이루어진 비즈니스 프로세스에 대한 메모리를 보존할 수 있습니다. 은행, 의료 또는 공공 행정과 같이 기록량이 방대할 수 있는 유럽의 애플리케이션에서 이러한 장기적인 컨텍스트 보존 기능은 특히 유용합니다.
독립 기관의 기준 인공지능 분석 결과, 네모트론 3 나노는 가장 균형 잡힌 오픈소스 모델 중 하나로 평가되었습니다. 이 시스템은 지능, 정확성 및 속도를 결합하여 초당 수백 개의 토큰을 처리하는 처리량을 제공합니다. 이러한 조합 덕분에 스페인의 AI 통합업체 및 서비스 제공업체는 인프라 비용을 크게 늘리지 않고도 우수한 사용자 경험을 필요로 하므로 이 시스템을 매력적으로 여깁니다.
사용 사례 측면에서 NVIDIA는 Nano를 다음과 같은 대상으로 삼고 있습니다. 콘텐츠 요약, 소프트웨어 디버깅, 정보 검색 및 기업용 AI 비서중복 추론 토큰이 감소함에 따라 추론 비용이 급증하지 않고도 사용자 또는 시스템과 장시간 대화를 유지하는 에이전트를 실행할 수 있습니다.
오픈 데이터 및 라이브러리: NeMo Gym, NeMo RL 및 Evaluator

네모트론 3의 가장 두드러진 특징 중 하나는 바로 이것입니다. 모델 가중치 공개에만 국한되지 않습니다.NVIDIA는 에이전트 학습, 튜닝 및 평가를 위한 포괄적인 오픈 소스 리소스 제품군을 제공합니다.
한편으로는, 이는 합성 코퍼스를 제공합니다. 수조 개의 토큰으로 이루어진 사전 학습, 사후 학습 및 강화 데이터추론, 코딩 및 다단계 워크플로에 초점을 맞춘 이러한 데이터 세트를 통해 기업과 연구 센터는 처음부터 시작하지 않고도 네모트론의 도메인별 변형(예: 법률, 의료 또는 산업)을 자체적으로 생성할 수 있습니다.
이러한 자료들 중에서 다음이 특히 눈에 띕니다. 네모트론 에이전트 안전 데이터 세트이 도구는 실제 시나리오에서 에이전트의 행동에 대한 원격 측정 데이터를 수집합니다. 목표는 에이전트가 민감한 데이터를 만났을 때 취하는 행동부터 모호하거나 잠재적으로 유해한 명령에 대한 반응까지, 복잡한 자율 시스템의 보안을 측정하고 강화하는 데 도움을 주는 것입니다.
도구 섹션과 관련하여 NVIDIA는 다음을 출시합니다. NeMo Gym과 NeMo RL은 오픈 소스 라이브러리입니다. 강화 훈련 및 훈련 후 학습을 위한 라이브러리와 안전성 및 성능 평가를 위한 NeMo Evaluator가 포함되어 있습니다. 이러한 라이브러리는 Nemotron 제품군을 위한 즉시 사용 가능한 시뮬레이션 환경 및 파이프라인을 제공하며, 다른 모델로 확장할 수도 있습니다.
가중치, 데이터 세트 및 코드와 같은 모든 자료는 다음을 통해 배포됩니다. GitHub와 Hugging Face는 NVIDIA 오픈 모델 라이선스에 따라 사용이 허가되었습니다.이를 통해 유럽 팀들이 자체 MLOps에 원활하게 통합할 수 있습니다. Prime Intellect 및 Unsloth와 같은 회사들은 이미 Nemo Gym을 워크플로우에 직접 통합하여 Nemotron에서의 강화 학습을 간소화하고 있습니다.
퍼블릭 클라우드 및 유럽 생태계에서의 가용성

Nemotron 3 Nano를 지금 구매하실 수 있습니다. 포옹하는 얼굴 y GitHub의Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter, Together AI와 같은 추론 제공업체를 통해서도 모델을 사용할 수 있습니다. 이를 통해 스페인의 개발팀은 복잡한 과정 없이 API를 통해 모델을 테스트하거나 자체 인프라에 배포할 수 있습니다.
구름 문제에 관해서는, Nemotron 3 Nano가 Amazon Bedrock을 통해 AWS에 합류합니다. 네모트론은 서버리스 추론을 지원하며, 구글 클라우드, 코어위브, 크루소, 마이크로소프트 파운드리, 네비우스, 엔스케일, 요타에 대한 지원을 발표했습니다. 이미 이러한 플랫폼을 사용하고 있는 유럽 기업들은 아키텍처를 크게 변경하지 않고도 네모트론을 쉽게 도입할 수 있게 되었습니다.
NVIDIA는 퍼블릭 클라우드 외에도 Nemotron 3 Nano의 사용을 장려하고 있습니다. NVIDIA 가속 인프라에 배포 가능한 NIM 마이크로서비스이를 통해 하이브리드 시나리오가 가능해집니다. 즉, 부하의 일부는 해외 클라우드에, 일부는 지역 데이터 센터 또는 EU 내 데이터 상주를 우선시하는 유럽 클라우드에 분산시킬 수 있습니다.
버전 네모트론 3 슈퍼와 울트라, 극한의 추론 작업 부하와 대규모 다중 에이전트 시스템에 맞춰 설계되었습니다. 2026년 상반기에 계획됨이러한 일정은 유럽의 연구 및 비즈니스 생태계가 나노 기술을 실험하고, 사용 사례를 검증하며, 필요에 따라 더 큰 모델로의 마이그레이션 전략을 설계할 시간을 제공합니다.
Nemotron 3는 NVIDIA를 선도적인 공급업체 중 하나로 자리매김하게 합니다. 에이전트형 AI에 최적화된 고급 개방형 모델이 제안은 기술적 효율성(하이브리드 MoE, NVFP4, 대규모 컨텍스트), 개방성(가중치, 데이터 세트 및 사용 가능한 라이브러리)과 데이터 주권 및 투명성에 대한 명확한 초점을 결합한 것으로, 이는 인공지능에 대한 규제와 감사 압력이 점점 더 커지고 있는 스페인과 유럽 전역에서 특히 민감한 측면입니다.
나는 그의 "괴짜" 관심을 직업으로 바꾼 기술 열광자입니다. 나는 10년 넘게 최첨단 기술을 사용하고 순수한 호기심으로 온갖 프로그램을 만지작거리며 살아왔습니다. 이제 저는 컴퓨터 기술과 비디오 게임을 전공했습니다. 왜냐하면 저는 5년 넘게 기술 및 비디오 게임에 관한 다양한 웹사이트에 글을 쓰고 모든 사람이 이해할 수 있는 언어로 필요한 정보를 제공하려는 기사를 작성해 왔기 때문입니다.
질문이 있으시면 제가 알고 있는 지식은 Windows 운영 체제는 물론 휴대폰용 Android까지 다양합니다. 그리고 저는 여러분을 위한 헌신을 하고 있습니다. 저는 항상 몇 분씩만 시간을 내어 이 인터넷 세계에서 여러분이 가질 수 있는 모든 질문을 해결하도록 도와드릴 의향이 있습니다.
