- Nemotron 3 adalah keluarga model, data, dan pustaka terbuka yang berfokus pada AI berbasis agen dan sistem multi-agen.
- Produk ini mencakup tiga ukuran MoE (Nano, Super, dan Ultra) dengan arsitektur hibrida dan pelatihan 4-bit yang efisien pada NVIDIA Blackwell.
- Nemotron 3 Nano kini tersedia di Eropa melalui Hugging Face, cloud publik, dan sebagai layanan mikro NIM, dengan jendela 1 juta token.
- Ekosistem ini dilengkapi dengan kumpulan data besar, NeMo Gym, NeMo RL, dan Evaluator untuk melatih, menyempurnakan, dan mengaudit agen AI yang mandiri.
Persaingan dalam bidang kecerdasan buatan bergeser dari chatbot sederhana dan terisolasi ke sistem agen yang berkolaborasi satu sama lain, mengelola alur kerja yang panjang, dan perlu diaudit. Dalam skenario baru ini, NVIDIA telah memutuskan untuk mengambil langkah yang cukup jelas: membuka tidak hanya model, tetapi juga data dan alat.sehingga perusahaan, administrasi publik, dan pusat penelitian dapat membangun platform AI mereka sendiri dengan kontrol yang lebih besar.
Pergerakan itu terwujud dalam Nemotron 3, sebuah keluarga model terbuka yang ditujukan untuk AI multi-agen. Proposal ini berupaya menggabungkan kinerja tinggi, biaya inferensi rendah, dan transparansi. Proposal ini tidak dimaksudkan hanya sebagai chatbot serbaguna biasa, tetapi sebagai... sebuah landasan untuk mengerahkan agen-agen yang berpikir, merencanakan, dan melaksanakan tugas-tugas kompleks di sektor-sektor yang diatur.Hal ini sangat relevan di Eropa dan Spanyol, di mana kedaulatan data dan kepatuhan terhadap peraturan sangatlah penting.
Sekumpulan model terbuka untuk AI yang memiliki peran agen dan kedaulatan.
Nemotron 3 disajikan sebagai Ekosistem lengkap: model, kumpulan data, pustaka, dan resep pelatihan. di bawah lisensi terbuka. Gagasan NVIDIA adalah agar organisasi tidak hanya mengonsumsi AI sebagai layanan yang tidak transparan, tetapi juga dapat memeriksa isinya, menyesuaikan model dengan domain mereka, dan menerapkannya pada infrastruktur mereka sendiri, baik di cloud maupun di pusat data lokal.
Perusahaan merumuskan strategi ini dalam kerangka komitmennya terhadap AI yang BerdaulatPemerintah dan perusahaan di Eropa, Korea Selatan, dan wilayah lain mencari alternatif terbuka untuk sistem tertutup atau asing, yang seringkali tidak selaras dengan undang-undang perlindungan data atau persyaratan audit mereka. Nemotron 3 bertujuan untuk menjadi fondasi teknis yang dapat digunakan untuk membangun model nasional, sektoral, atau korporat dengan visibilitas dan kontrol yang lebih besar.
Secara paralel, NVIDIA memperkuat posisinya di luar perangkat keras.Sampai sekarang, Nemotron terutama merupakan penyedia GPU referensi; dengan Nemotron 3, ia juga memposisikan diri di lapisan alat pemodelan dan pelatihan, bersaing lebih langsung dengan pemain seperti OpenAI, Google, Anthropic, atau bahkan Meta, dan melawan model premium seperti SuperGrok BeratMeta telah mengurangi komitmennya terhadap open source dalam beberapa generasi Llama terakhir.
Bagi ekosistem riset dan startup Eropa—yang sangat bergantung pada model terbuka yang dihosting di platform seperti Hugging Face—ketersediaan bobot, data sintetis, dan pustaka di bawah lisensi terbuka merupakan alternatif yang ampuh bagi Model-model Tiongkok dan warga Amerika yang mendominasi peringkat popularitas dan tolok ukur.
Arsitektur MoE hibrida: efisiensi untuk agen skala besar
Fitur teknis utama dari Nemotron 3 adalah sebuah Arsitektur hibrida campuran laten para ahli (MoE)Alih-alih mengaktifkan semua parameter model dalam setiap inferensi, hanya sebagian kecil yang diaktifkan, yaitu subset pakar yang paling relevan dengan tugas atau token yang bersangkutan.
Pendekatan ini memungkinkan Mengurangi biaya komputasi dan konsumsi memori secara drastis.Hal ini juga meningkatkan throughput token. Untuk arsitektur multi-agen, di mana puluhan atau ratusan agen terus menerus bertukar pesan, efisiensi ini sangat penting untuk mencegah sistem menjadi tidak berkelanjutan dalam hal biaya GPU dan cloud.
Menurut data yang dibagikan oleh NVIDIA dan tolok ukur independen, Nemotron 3 Nano mencapai hingga empat kali lebih banyak token per detik Dibandingkan dengan pendahulunya, Nemotron 2 Nano, perangkat ini mengurangi pembuatan token penalaran yang tidak perlu sekitar 60%. Dalam praktiknya, ini berarti jawaban yang sama akuratnya atau bahkan lebih akurat, tetapi dengan lebih sedikit "kata-kata yang bertele-tele" dan biaya per kueri yang lebih rendah.
Arsitektur MoE hibrida, dikombinasikan dengan teknik pelatihan spesifik, telah menghasilkan Banyak model terbuka paling canggih mengadopsi skema pakar.Nemotron 3 mengikuti tren ini, tetapi secara khusus berfokus pada AI berbasis agen: rute internal yang dirancang untuk koordinasi antar agen, penggunaan alat, penanganan status yang panjang, dan perencanaan langkah demi langkah.
Tersedia tiga ukuran: Nano, Super, dan Ultra untuk beban kerja yang berbeda.

Keluarga Nemotron 3 diorganisasikan menjadi tiga ukuran utama model MoE, semuanya terbuka dan dengan parameter aktif yang dikurangi berkat arsitektur ahli:
- Nemotron 3 Nano: sekitar 30.000 miliar parameter total, dengan sekitar 3.000 miliar aset per tokenPerangkat lunak ini dirancang untuk tugas-tugas spesifik di mana efisiensi menjadi penting: debugging perangkat lunak, peringkasan dokumen, pengambilan informasi, pemantauan sistem, atau asisten AI khusus.
- Nemotron 3 Super: sekitar 100.000 miliar parameter, dengan Aset senilai 10.000 miliar di setiap langkah. Ini diarahkan untuk Penalaran tingkat lanjut dalam arsitektur multi-agendengan latensi rendah bahkan ketika beberapa agen bekerja sama untuk menyelesaikan alur yang kompleks.
- Nemotron 3 Ultra: tingkat atas, dengan sekitar 500.000 miliar parameter dan hingga 50.000 miliar aset per tokenIa berfungsi sebagai mesin penalaran yang ampuh untuk penelitian, perencanaan strategis, dukungan pengambilan keputusan tingkat tinggi, dan sistem AI yang sangat menuntut.
Dalam praktiknya, hal ini memungkinkan organisasi Pilih ukuran model sesuai dengan anggaran dan kebutuhan Anda.Nano untuk beban kerja yang masif dan intensif serta biaya yang ketat; Super ketika dibutuhkan penalaran yang lebih mendalam dengan banyak agen yang berkolaborasi; dan Ultra untuk kasus di mana kualitas dan konteks jangka panjang lebih penting daripada biaya GPU.
Untuk sekarang Hanya Nemotron 3 Nano yang tersedia untuk penggunaan segera.Varian Super dan Ultra direncanakan untuk paruh pertama tahun 2026, memberikan waktu bagi perusahaan dan laboratorium Eropa untuk bereksperimen terlebih dahulu dengan Nano, membangun alur kerja, dan kemudian memindahkan kasus-kasus yang membutuhkan kapasitas lebih besar.
Nemotron 3 Nano: Jendela 1 juta token dan biaya terkendali

Nemotron 3 Nano, hingga hari ini, ujung tombak praktis keluargaNVIDIA menggambarkannya sebagai model yang paling hemat biaya komputasi dalam jajaran produknya, dioptimalkan untuk memberikan kinerja maksimal dalam alur kerja multi-agen dan tugas-tugas intensif namun berulang.
Di antara fitur-fitur teknisnya, berikut ini yang menonjol: jendela konteks hingga satu juta tokenHal ini memungkinkan penyimpanan memori untuk dokumen yang ekstensif, seluruh repositori kode, atau proses bisnis multi-tahap. Untuk aplikasi di Eropa di bidang perbankan, perawatan kesehatan, atau administrasi publik, di mana catatan dapat sangat banyak, kemampuan konteks jangka panjang ini sangat berharga.
Tolok ukur organisasi independen Analisis buatan menempatkan Nemotron 3 Nano sebagai salah satu model sumber terbuka yang paling seimbang. Sistem ini menggabungkan kecerdasan, akurasi, dan kecepatan, dengan tingkat pemrosesan data hingga ratusan token per detik. Kombinasi ini menjadikannya menarik bagi integrator AI dan penyedia layanan di Spanyol yang membutuhkan pengalaman pengguna yang baik tanpa biaya infrastruktur yang melambung tinggi.
Dari segi kasus penggunaan, NVIDIA menargetkan Nano untuk Ringkasan konten, debugging perangkat lunak, pengambilan informasi, dan asisten AI perusahaan.Berkat pengurangan token penalaran yang berlebihan, dimungkinkan untuk menjalankan agen yang mempertahankan percakapan panjang dengan pengguna atau sistem tanpa biaya inferensi yang melonjak.
Data dan pustaka terbuka: NeMo Gym, NeMo RL, dan Evaluator

Salah satu fitur paling khas dari Nemotron 3 adalah bahwa Hal ini tidak terbatas pada merilis bobot model.NVIDIA melengkapi jajaran produk ini dengan serangkaian sumber daya terbuka yang komprehensif untuk pelatihan, penyetelan, dan evaluasi agen.
Di satu sisi, hal ini menyediakan korpus sintetis dari beberapa triliun token data pra-pelatihan, pasca-pelatihan, dan penguatan.Kumpulan data ini, yang berfokus pada penalaran, pengkodean, dan alur kerja multi-langkah, memungkinkan perusahaan dan pusat penelitian untuk menghasilkan varian Nemotron khusus domain mereka sendiri (misalnya, hukum, perawatan kesehatan, atau industri) tanpa harus memulai dari awal.
Di antara sumber daya tersebut, berikut ini yang paling menonjol: Kumpulan data Keamanan Agen NemotronSistem ini mengumpulkan data telemetri tentang perilaku agen dalam skenario dunia nyata. Tujuannya adalah untuk membantu tim mengukur dan memperkuat keamanan sistem otonom yang kompleks: mulai dari tindakan apa yang diambil agen ketika menemukan data sensitif, hingga bagaimana reaksinya terhadap perintah yang ambigu atau berpotensi berbahaya.
Terkait bagian perangkat, NVIDIA meluncurkan... NeMo Gym dan NeMo RL sebagai pustaka sumber terbuka. untuk pelatihan penguatan dan pasca-pelatihan, bersama dengan NeMo Evaluator untuk menilai keselamatan dan kinerja. Pustaka-pustaka ini menyediakan lingkungan simulasi dan alur kerja yang siap pakai dengan keluarga Nemotron, tetapi dapat diperluas ke model lain.
Semua materi ini—bobot, kumpulan data, dan kode—didistribusikan melalui GitHub dan Hugging Face dilisensikan di bawah Lisensi Model Terbuka NVIDIA.sehingga tim-tim Eropa dapat mengintegrasikannya dengan mudah ke dalam MLOps mereka sendiri. Perusahaan seperti Prime Intellect dan Unsloth sudah memasukkan NeMo Gym langsung ke dalam alur kerja mereka untuk menyederhanakan pembelajaran penguatan (reinforcement learning) di Nemotron.
Ketersediaan di cloud publik dan ekosistem Eropa

Nemotron 3 Nano kini tersedia di Wajah Memeluk y GitHubserta melalui penyedia inferensi seperti Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter, dan Together AI. Hal ini membuka pintu bagi tim pengembang di Spanyol untuk menguji model melalui API atau menerapkannya pada infrastruktur mereka sendiri tanpa kerumitan yang berlebihan.
Dari segi komputasi awan, Nemotron 3 Nano bergabung dengan AWS melalui Amazon Bedrock. untuk inferensi tanpa server, dan telah mengumumkan dukungan untuk Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale, dan Yotta. Bagi organisasi Eropa yang sudah bekerja di platform ini, hal ini mempermudah adopsi Nemotron tanpa perubahan drastis pada arsitektur mereka.
Selain cloud publik, NVIDIA juga mempromosikan penggunaan Nemotron 3 Nano sebagai Layanan mikro NIM dapat diimplementasikan pada infrastruktur apa pun yang dipercepat NVIDIA.Hal ini memungkinkan skenario hibrida: sebagian beban berada di cloud internasional dan sebagian lagi di pusat data lokal atau di cloud Eropa yang memprioritaskan residensi data di Uni Eropa.
Versi Nemotron 3 Super dan Ultra, Dirancang untuk beban kerja penalaran ekstrem dan sistem multi-agen skala besar, direncanakan untuk paruh pertama tahun 2026Jangka waktu ini memberi ekosistem penelitian dan bisnis Eropa waktu untuk bereksperimen dengan Nano, memvalidasi kasus penggunaan, dan merancang strategi migrasi ke model yang lebih besar bila diperlukan.
Nemotron 3 memposisikan NVIDIA sebagai salah satu penyedia terkemuka dalam bidang ini. model terbuka kelas atas yang ditujukan untuk AI agenikDengan proposal yang memadukan efisiensi teknis (MoE hibrida, NVFP4, konteks masif), keterbukaan (bobot, kumpulan data, dan pustaka yang tersedia) serta fokus yang jelas pada kedaulatan data dan transparansi, aspek-aspek yang sangat sensitif di Spanyol dan seluruh Eropa, di mana regulasi dan tekanan untuk mengaudit AI semakin besar.
Saya seorang penggila teknologi yang telah mengubah minat "geek"-nya menjadi sebuah profesi. Saya telah menghabiskan lebih dari 10 tahun hidup saya menggunakan teknologi mutakhir dan mengutak-atik semua jenis program hanya karena rasa ingin tahu. Sekarang saya memiliki spesialisasi dalam teknologi komputer dan video game. Hal ini karena selama lebih dari 5 tahun saya telah menulis untuk berbagai website tentang teknologi dan video game, membuat artikel yang berupaya memberikan informasi yang Anda butuhkan dalam bahasa yang dapat dimengerti oleh semua orang.
Jika Anda memiliki pertanyaan, pengetahuan saya berkisar dari segala sesuatu yang berhubungan dengan sistem operasi Windows serta Android untuk ponsel. Dan komitmen saya adalah kepada Anda, saya selalu bersedia meluangkan beberapa menit dan membantu Anda menyelesaikan pertanyaan apa pun yang mungkin Anda miliki di dunia internet ini.
