Nemotron 3: Model terbuka NVIDIA untuk AI berbilang ejen

Nemotron 3 ialah keluarga terbuka model, data dan perpustakaan yang tertumpu pada AI agentik dan sistem berbilang agen.
Ia merangkumi tiga saiz MoE (Nano, Super dan Ultra) dengan seni bina hibrid dan latihan 4-bit yang cekap pada NVIDIA Blackwell.
Nemotron 3 Nano kini tersedia di Eropah melalui Hugging Face, awan awam dan sebagai perkhidmatan mikro NIM, dengan tempoh 1 juta token.
Ekosistem ini dilengkapi dengan set data yang besar, NeMo Gym, NeMo RL dan Evaluator untuk melatih, menyelaras dan mengaudit ejen AI berdaulat.

Model Kecerdasan Buatan Nemotron 3

Perlumbaan untuk kecerdasan buatan sedang beralih daripada chatbot yang mudah dan terpencil kepada sistem ejen yang bekerjasama antara satu sama lain, mengurus aliran kerja yang panjang dan perlu diaudit. Dalam senario baharu ini, NVIDIA telah memutuskan untuk mengambil langkah yang agak jelas: untuk membuka bukan sahaja model, tetapi juga data dan alatsupaya syarikat, pentadbiran awam dan pusat penyelidikan boleh membina platform AI mereka sendiri dengan lebih kawalan.

Gerakan itu terwujud dalam Nemotron 3, sebuah keluarga model terbuka yang ditujukan kepada AI berbilang ejen Ia bertujuan untuk menggabungkan prestasi tinggi, kos inferens yang rendah dan ketelusan. Cadangan ini bukan sekadar chatbot tujuan umum, tetapi sebagai asas untuk menggunakan ejen yang menaakul, merancang dan melaksanakan tugas kompleks dalam sektor yang dikawal seliaIni amat relevan di Eropah dan Sepanyol, di mana kedaulatan data dan pematuhan peraturan adalah penting.

Sebuah keluarga model terbuka untuk AI ejen dan berdaulat

Nemotron 3 dibentangkan sebagai ekosistem yang lengkap: model, set data, perpustakaan dan resipi latihan di bawah lesen terbuka. Idea NVIDIA adalah bahawa organisasi bukan sahaja menggunakan AI sebagai perkhidmatan legap, tetapi juga boleh memeriksa apa yang ada di dalamnya, menyesuaikan model dengan domain mereka dan menggunakannya pada infrastruktur mereka sendiri, sama ada di awan atau di pusat data tempatan.

Syarikat ini merangka strategi ini dalam komitmennya untuk AI BerdaulatKerajaan dan syarikat di Eropah, Korea Selatan dan rantau lain sedang mencari alternatif terbuka kepada sistem tertutup atau asing, yang selalunya tidak selaras dengan undang-undang perlindungan data atau keperluan audit mereka. Nemotron 3 bertujuan untuk menjadi asas teknikal untuk membina model kebangsaan, sektor atau korporat dengan keterlihatan dan kawalan yang lebih besar.

Secara selari, NVIDIA mengukuhkan kedudukannya melangkaui perkakasanSehingga kini, ia terutamanya merupakan penyedia GPU rujukan; dengan Nemotron 3, ia juga meletakkan dirinya dalam lapisan alat pemodelan dan latihan, bersaing secara lebih langsung dengan pemain seperti OpenAI, Google, Anthropic atau Meta, dan menentang model premium seperti SuperGrok HeavyMeta telah mengurangkan komitmennya terhadap sumber terbuka dalam generasi Llama baru-baru ini.

Bagi ekosistem penyelidikan dan permulaan Eropah—yang sangat bergantung pada model terbuka yang dihoskan pada platform seperti Hugging Face—ketersediaan pemberat, data sintetik dan perpustakaan di bawah lesen terbuka mewakili alternatif yang hebat kepada Model Cina dan rakyat Amerika yang mendominasi populariti dan kedudukan penanda aras.

Kandungan eksklusif - Klik Di Sini Meta meningkatkan pengambilan bakat AI untuk menerajui superintelligence

Seni bina MoE hibrid: kecekapan untuk ejen berskala besar

Ciri teknikal utama Nemotron 3 ialah Seni bina hibrid campuran pakar terpendam (MoE)Daripada mengaktifkan semua parameter model dalam setiap inferens, hanya sebahagian kecil daripadanya yang dihidupkan, iaitu subset pakar yang paling relevan dengan tugasan atau token yang dimaksudkan.

Pendekatan ini membolehkan mengurangkan kos pengiraan dan penggunaan memori secara drastikIni juga meningkatkan daya pemprosesan token. Bagi seni bina berbilang ejen, yang mana berpuluh-puluh atau beratus-ratus ejen bertukar mesej secara berterusan, kecekapan ini adalah kunci untuk mencegah sistem daripada menjadi tidak mampan dari segi kos GPU dan awan.

Menurut data yang dikongsi oleh NVIDIA dan penanda aras bebas, Nemotron 3 Nano mencapai sehingga empat kali ganda lebih banyak token sesaat Berbanding dengan pendahulunya, Nemotron 2 Nano, ia mengurangkan penjanaan token penaakulan yang tidak perlu sebanyak sekitar 60%. Dalam praktiknya, ini bermakna jawapan yang sama atau lebih tepat, tetapi dengan kurang "kepelbagaian perkataan" dan kos setiap pertanyaan yang lebih rendah.

Seni bina MoE hibrid, digabungkan dengan teknik latihan khusus, telah membawa kepada Kebanyakan model terbuka yang paling canggih menggunakan skim pakarNemotron 3 menyertai trend ini, tetapi memberi tumpuan khusus pada AI agentik: laluan dalaman yang direka untuk penyelarasan antara ejen, penggunaan alatan, pengendalian keadaan panjang dan perancangan langkah demi langkah.

Tiga saiz: Nano, Super dan Ultra untuk beban kerja yang berbeza

Seni bina model Nemotron 3

Keluarga Nemotron 3 disusun menjadi tiga saiz utama model MoE, kesemuanya terbuka dan dengan parameter aktif yang dikurangkan hasil daripada seni bina pakar:

Nemotron 3 Nano: sekitar 30.000 bilion jumlah parameter, dengan kira-kira 3.000 bilion aset setiap tokenIa direka bentuk untuk tugasan yang disasarkan di mana kecekapan penting: penyahpepijatan perisian, ringkasan dokumen, pencarian maklumat, pemantauan sistem atau pembantu AI khusus.
Nemotron 3 Super: kira-kira 100.000 bilion parameter, dengan 10.000 bilion aset pada setiap langkah. Ia ditujukan ke arah Penaakulan lanjutan dalam seni bina berbilang ejendengan kependaman rendah walaupun berbilang ejen bekerjasama untuk menyelesaikan aliran kompleks.
Nemotron 3 Ultra: peringkat atas, dengan kira-kira 500.000 bilion parameter dan sehingga 50.000 bilion aset setiap tokenIa beroperasi sebagai enjin penaakulan yang berkuasa untuk penyelidikan, perancangan strategik, sokongan keputusan peringkat tinggi dan sistem AI yang sangat mencabar.

Dalam praktiknya, ini membolehkan organisasi Pilih saiz model mengikut bajet dan keperluan andaNano untuk beban kerja yang besar dan intensif serta kos yang ketat; Super apabila penaakulan yang lebih mendalam diperlukan dengan banyak ejen yang bekerjasama; dan Ultra untuk kes di mana kualiti dan konteks yang panjang melebihi kos GPU.

Kandungan eksklusif - Klik Di Sini Alternatif WinRAR Terbaik: Panduan Lengkap dan Perbandingan 2024

Buat masa ini, Hanya Nemotron 3 Nano sahaja yang tersedia untuk kegunaan serta-merta.Varian Super dan Ultra dirancang untuk separuh pertama tahun 2026, memberikan masa kepada syarikat dan makmal Eropah untuk bereksperimen terlebih dahulu dengan Nano, mewujudkan saluran paip dan, kemudian, memindahkan kes yang memerlukan kapasiti yang lebih besar.

Nemotron 3 Nano: tetingkap token 1 juta dan kos terkawal

Nemotron 3 Nano, setakat hari ini, peneraju praktikal keluargaNVIDIA menggambarkannya sebagai model yang paling cekap kos pengiraan dalam rangkaian tersebut, dioptimumkan untuk memberikan prestasi maksimum dalam aliran kerja berbilang ejen dan tugasan intensif tetapi berulang.

Antara ciri teknikalnya, yang berikut menonjol: tetingkap konteks sehingga satu juta tokenIni membolehkan pengekalan memori untuk dokumen yang luas, keseluruhan repositori kod atau proses perniagaan berbilang langkah. Bagi aplikasi Eropah dalam perbankan, penjagaan kesihatan atau pentadbiran awam, yang mana rekod boleh menjadi banyak, keupayaan konteks jangka panjang ini amat berharga.

Penanda aras organisasi bebas Analisis buatan meletakkan Nemotron 3 Nano sebagai salah satu model sumber terbuka yang paling seimbang Ia menggabungkan kecerdasan, ketepatan dan kelajuan, dengan kadar daya pemprosesan dalam ratusan token sesaat. Gabungan ini menjadikannya menarik bagi penyepadu AI dan penyedia perkhidmatan di Sepanyol yang memerlukan pengalaman pengguna yang baik tanpa kos infrastruktur yang melambung tinggi.

Dari segi kes penggunaan, NVIDIA menyasarkan Nano pada Ringkasan kandungan, penyahpepijatan perisian, pencarian maklumat dan pembantu AI perusahaanHasil daripada pengurangan token penaakulan yang berlebihan, adalah mungkin untuk menjalankan ejen yang mengekalkan perbualan panjang dengan pengguna atau sistem tanpa bil inferens yang melambung tinggi.

Data dan perpustakaan terbuka: NeMo Gym, NeMo RL dan Evaluator

Perpustakaan NeMo

Salah satu ciri paling tersendiri bagi Nemotron 3 ialah Ia tidak terhad kepada melepaskan pemberat modelNVIDIA menemani keluarga ini dengan rangkaian sumber terbuka yang komprehensif untuk latihan, penalaan dan penilaian ejen.

Di satu pihak, ia menyediakan korpus sintetik beberapa trilion token data pra-latihan, pasca-latihan dan pengukuhanSet data ini, yang tertumpu pada penaakulan, pengekodan dan aliran kerja berbilang langkah, membolehkan syarikat dan pusat penyelidikan menghasilkan varian khusus domain Nemotron mereka sendiri (contohnya, perundangan, penjagaan kesihatan atau perindustrian) tanpa bermula dari awal.

Antara sumber-sumber ini, yang berikut menonjol: Set data Keselamatan Agentik NemotronIa mengumpul data telemetri tentang tingkah laku ejen dalam senario dunia sebenar. Matlamatnya adalah untuk membantu pasukan mengukur dan mengukuhkan keselamatan sistem autonomi yang kompleks: daripada tindakan yang diambil oleh ejen apabila ia menemui data sensitif, kepada cara ia bertindak balas terhadap arahan yang samar-samar atau berpotensi berbahaya.

Kandungan eksklusif - Klik Di Sini F Lite: Model AI generatif baharu Freepik berdasarkan hanya pada imej berlesen

Berkenaan bahagian alatan, NVIDIA melancarkan NeMo Gym dan NeMo RL sebagai perpustakaan sumber terbuka untuk latihan pengukuhan dan pasca latihan, bersama-sama dengan NeMo Evaluator untuk menilai keselamatan dan prestasi. Pustaka ini menyediakan persekitaran simulasi dan saluran paip sedia untuk digunakan dengan keluarga Nemotron, tetapi boleh diperluaskan kepada model lain.

Semua bahan ini—pemberat, set data dan kod—diagihkan melalui GitHub dan Hugging Face dilesenkan di bawah Lesen Model Terbuka NVIDIA.supaya pasukan Eropah boleh mengintegrasikannya dengan lancar ke dalam MLOp mereka sendiri. Syarikat seperti Prime Intellect dan Unsloth sudah pun menggabungkan NeMo Gym terus ke dalam aliran kerja mereka untuk memudahkan pembelajaran peneguhan pada Nemotron.

Ketersediaan dalam awan awam dan ekosistem Eropah

Muka Pelukan Nemotron 3 Nano

Nemotron 3 Nano kini boleh didapati di Muka Memeluk y GitHubserta melalui penyedia inferens seperti Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter dan Together AI. Ini membuka peluang untuk pasukan pembangunan di Sepanyol menguji model melalui API atau menggunakannya pada infrastruktur mereka sendiri tanpa kerumitan yang berlebihan.

Di hadapan awan, Nemotron 3 Nano menyertai AWS melalui Amazon Bedrock untuk inferens tanpa pelayan, dan telah mengumumkan sokongan untuk Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale dan Yotta. Bagi organisasi Eropah yang sudah pun mengusahakan platform ini, ini memudahkan penggunaan Nemotron tanpa perubahan drastik pada seni bina mereka.

Selain awan awam, NVIDIA mempromosikan penggunaan Nemotron 3 Nano sebagai Perkhidmatan mikro NIM boleh digunakan pada mana-mana infrastruktur dipercepatkan NVIDIAIni membolehkan senario hibrid: sebahagian daripada beban dalam awan antarabangsa dan sebahagian lagi dalam pusat data tempatan atau dalam awan Eropah yang mengutamakan residensi data di EU.

Versi ini Nemotron 3 Super dan Ultra, ditujukan kepada beban kerja penaakulan yang ekstrem dan sistem berbilang ejen berskala besar, adalah dirancang untuk separuh pertama tahun 2026Garis masa ini membolehkan ekosistem penyelidikan dan perniagaan Eropah bereksperimen dengan Nano, mengesahkan kes penggunaan dan mereka bentuk strategi migrasi kepada model yang lebih besar apabila perlu.

Nemotron 3 meletakkan NVIDIA sebagai salah satu penyedia terkemuka model terbuka mewah yang ditujukan kepada AI ejenDengan cadangan yang menggabungkan kecekapan teknikal (MoE hibrid, NVFP4, konteks besar-besaran), keterbukaan (pemberat, set data dan perpustakaan yang tersedia) dan tumpuan yang jelas terhadap kedaulatan dan ketelusan data, aspek yang amat sensitif di Sepanyol dan seluruh Eropah, di mana peraturan dan tekanan untuk mengaudit AI semakin meningkat.

Artikel berkaitan:

Microsoft Discovery AI memacu penemuan saintifik dan pendidikan dengan kecerdasan buatan yang diperibadikan

Alberto Navarro

Saya seorang peminat teknologi yang telah menjadikan minat "geek"nya sebagai satu profesion. Saya telah menghabiskan lebih daripada 10 tahun hidup saya menggunakan teknologi canggih dan bermain-main dengan semua jenis program kerana rasa ingin tahu yang tulen. Sekarang saya mempunyai pakar dalam teknologi komputer dan permainan video. Ini kerana selama lebih daripada 5 tahun saya telah menulis untuk pelbagai laman web mengenai teknologi dan permainan video, mencipta artikel yang bertujuan untuk memberi anda maklumat yang anda perlukan dalam bahasa yang boleh difahami oleh semua orang.

Jika anda mempunyai sebarang soalan, pengetahuan saya merangkumi semua perkara yang berkaitan dengan sistem pengendalian Windows serta Android untuk telefon mudah alih. Dan komitmen saya adalah kepada anda, saya sentiasa bersedia untuk meluangkan masa beberapa minit dan membantu anda menyelesaikan sebarang soalan yang mungkin anda ada dalam dunia internet ini.