Nemotron 3: Taruhan kabuka ageung NVIDIA pikeun AI multi-agén

Update terakhir: 17/12/2025

  • Nemotron 3 nyaéta kulawarga modél, data, sareng pustaka anu kabuka anu museur kana AI agéntik sareng sistem multi-agén.
  • Ieu ngawengku tilu ukuran MoE (Nano, Super sareng Ultra) kalayan arsitéktur hibrida sareng latihan 4-bit anu efisien dina NVIDIA Blackwell.
  • Nemotron 3 Nano ayeuna sayogi di Éropa via Hugging Face, awan umum sareng salaku layanan mikro NIM, kalayan jandela 1 juta token.
  • Ékosistem ieu dilengkepan ku kumpulan data anu masif, NeMo Gym, NeMo RL, sareng Evaluator pikeun ngalatih, nyaluyukeun, sareng ngaudit agén AI berdaulat.

Modél Kecerdasan Buatan Nemotron 3

Balapan pikeun kecerdasan jieunan nuju pindah ti chatbot anu saderhana sareng terasing ka sistem agén anu silih kolaborasi, ngatur alur kerja anu panjang, sareng kedah tiasa diaudit. Dina skénario énggal ieu, NVIDIA parantos mutuskeun pikeun ngalakukeun léngkah anu cukup jelas: pikeun muka henteu ngan ukur modél, tapi ogé data sareng alatsupados perusahaan, administrasi publik, sareng pusat panalungtikan tiasa ngawangun platform AI nyalira kalayan langkung seueur kontrol.

Gerakan éta ngawujud dina Nemotron 3, kulawarga modél kabuka anu ditujukeun pikeun AI multi-agén Ieu narékahan pikeun ngagabungkeun kinerja anu luhur, biaya inferensi anu handap, sareng transparansi. Proposal ieu henteu dimaksudkeun salaku chatbot tujuan umum anu sanés, tapi salaku dasar pikeun ngagunakeun agén anu mikir, ngarencanakeun, sareng ngalaksanakeun tugas anu rumit dina séktor anu diaturIeu hususna relevan di Éropa sareng Spanyol, dimana kadaulatan data sareng patuh kana peraturan penting.

Kulawarga modél kabuka pikeun AI agéntik sareng daulat

Nemotron 3 dipidangkeun salaku ékosistem anu lengkep: modél, kumpulan data, perpustakaan, sareng resep pelatihan dina lisénsi kabuka. Ideu NVIDIA nyaéta organisasi henteu ngan ukur nganggo AI salaku layanan anu teu jelas, tapi ogé tiasa mariksa naon anu aya di jerona, nyaluyukeun modél kana domainna, sareng nyebarkeunana dina infrastrukturna nyalira, boh di awan atanapi di pusat data lokal.

Perusahaan ngawangun strategi ieu dina komitmenna pikeun Daulat AIPamaréntah sareng perusahaan di Éropa, Koréa Kidul, sareng daérah sanésna milarian alternatif kabuka pikeun sistem anu ditutup atanapi asing, anu sering henteu saluyu sareng undang-undang panyalindungan data atanapi sarat auditna. Nemotron 3 ngagaduhan tujuan pikeun janten pondasi téknis pikeun ngawangun modél nasional, séktoral, atanapi perusahaan kalayan pisibilitas sareng kontrol anu langkung ageung.

Sajajar, NVIDIA nguatkeun posisina saluareun perangkat kerasNepi ka ayeuna, éta utamina mangrupikeun panyadia GPU rujukan; sareng Nemotron 3, éta ogé nempatkeun dirina dina lapisan alat modél sareng latihan, bersaing langkung langsung sareng pamaén sapertos OpenAI, Google, Anthropic, atanapi bahkan Meta, sareng ngalawan modél premium sapertos SuperGrok beuratMeta parantos ngirangan komitmenna kana sumber terbuka dina generasi Llama anyar.

Pikeun ékosistem panalungtikan sareng startup Éropa—anu gumantung pisan kana modél kabuka anu diayakeun dina platform sapertos Hugging Face—kasadiaan beurat, data sintétis, sareng perpustakaan dina lisénsi kabuka ngagambarkeun alternatif anu kuat pikeun Modél Cina sareng urang Amérika anu ngadominasi popularitas sareng peringkat patokan.

Eusi ekslusif - Klik Ieuh  Microsoft Store moal muka atanapi tetep nutup: solusi lengkep

Arsitektur MoE hibrida: efisiensi pikeun agén skala ageung

Fitur téknis utama Nemotron 3 nyaéta Arsitektur hibrida campuran-ahli laten (MoE)Gantina ngaktipkeun sadaya parameter modél dina unggal inferensi, ngan ukur sabagian leutik anu diaktipkeun, nyaéta himpunan bagian ahli anu paling relevan sareng tugas atanapi token anu dimaksud.

pendekatan ieu ngamungkinkeun sacara drastis ngirangan biaya komputasi sareng konsumsi mémoriIeu ogé ningkatkeun throughput token. Pikeun arsitéktur multi-agén, dimana puluhan atanapi ratusan agén terus-terusan silih tukeur pesen, efisiensi ieu mangrupikeun konci pikeun nyegah sistem janten teu lestari dina hal biaya GPU sareng awan.

Numutkeun data anu dibagikeun ku NVIDIA sareng patokan mandiri, Nemotron 3 Nano ngahontal nepi ka opat kali leuwih loba token per detik Dibandingkeun sareng miheulaanna, Nemotron 2 Nano, éta ngirangan generasi token penalaran anu teu perlu sakitar 60%. Dina praktékna, ieu hartosna jawaban anu sami atanapi bahkan langkung akurat, tapi kalayan "kecap anu kirang" sareng biaya per pamundut anu langkung handap.

Arsitektur MoE hibrida, digabungkeun sareng téknik latihan khusus, parantos ngarah kana Seueur modél kabuka anu paling canggih nganut skéma ahliNemotron 3 ngagabung kana tren ieu, tapi museur sacara khusus kana AI agéntik: rute internal anu dirancang pikeun koordinasi antara agén, panggunaan alat, penanganan kaayaan anu panjang, sareng perencanaan léngkah-léngkah.

Tilu ukuran: Nano, Super, sareng Ultra pikeun beban kerja anu béda-béda

Arsitektur modél Nemotron 3

Kulawarga Nemotron 3 diwangun ku tilu ukuran utama modél MoE, sadayana kabuka sareng nganggo parameter aktif anu dikirangan hatur nuhun kana arsitéktur ahli:

  • Nemotron 3 Nano: sakitar 30.000 milyar parameter total, kalayan sakitar 3.000 milyar aset per tokenIeu dirancang pikeun tugas-tugas anu ditujukeun dimana efisiensi penting: debugging perangkat lunak, ringkesan dokumén, pamilarian inpormasi, pangawasan sistem, atanapi asistén AI khusus.
  • Nemotron 3 Super: kira-kira 100.000 milyar parameter, kalayan 10.000 milyar aset dina unggal léngkah. Éta ditujukeun pikeun Penalaran canggih dina arsitéktur multi-agénkalayan latency anu handap sanajan sababaraha agén gawé bareng pikeun ngarengsekeun aliran anu rumit.
  • Nemotron 3 Ultra: tingkat luhur, kalayan sakitar 500.000 milyar parameter sareng dugi ka 50.000 milyar aset per tokenÉta beroperasi salaku mesin penalaran anu kuat pikeun panalungtikan, perencanaan strategis, dukungan kaputusan tingkat luhur, sareng sistem AI anu nungtut pisan.

Dina praktékna, ieu ngamungkinkeun organisasi Pilih ukuran modél numutkeun anggaran sareng kabutuhan anjeunNano pikeun beban kerja anu masif sareng intensif sareng biaya anu ketat; Super nalika peryogi penalaran anu langkung jero sareng seueur agén anu kolaborasi; sareng Ultra pikeun kasus dimana kualitas sareng kontéks anu panjang langkung ageung tibatan biaya GPU.

Eusi ekslusif - Klik Ieuh  TAG Heuer Connected Kaliber E5: kabisat kana software proprietary sareng édisi New Balance

Kanggo ayeuna Ngan Nemotron 3 Nano anu sayogi kanggo dianggo langsung.Varian Super sareng Ultra direncanakeun pikeun satengah taun mimiti 2026, masihan waktos ka perusahaan sareng laboratorium Éropa pikeun ékspérimén heula sareng Nano, ngadegkeun jalur pipa sareng, engkéna, mindahkeun kasus anu meryogikeun kapasitas anu langkung ageung.

Nemotron 3 Nano: jandela token 1 juta sareng biaya anu dikandung

Nemotron 3 Nano

Nemotron 3 Nano nyaéta, dugi ka ayeuna, ujung tombak praktis kulawargaNVIDIA ngagambarkeun éta salaku modél anu paling hemat biaya sacara komputasi dina jajaran éta, dioptimalkeun pikeun nganteurkeun kinerja maksimal dina alur kerja multi-agén sareng tugas anu intensif tapi repetitif.

Di antara fitur téknisna, ieu di handap ieu menonjol: jandela kontéks nepi ka hiji juta tokenIeu ngamungkinkeun panyimpenan mémori pikeun dokumén anu éksténsif, sadaya gudang kode, atanapi prosés bisnis multi-léngkah. Pikeun aplikasi Éropa dina perbankan, kasehatan, atanapi administrasi publik, dimana rékaman tiasa seueur pisan, kamampuan kontéks jangka panjang ieu penting pisan.

Tolok ukur organisasi mandiri Analisis jieunan nempatkeun Nemotron 3 Nano salaku salah sahiji modél sumber terbuka anu paling saimbang Ieu ngagabungkeun intelegensi, akurasi, sareng kecepatan, kalayan laju throughput dina ratusan token per detik. Kombinasi ieu ngajantenkeun pikaresepeun pikeun integrator AI sareng panyadia jasa di Spanyol anu peryogi pangalaman pangguna anu saé tanpa biaya infrastruktur anu ningkat pisan.

Dina hal kasus panggunaan, NVIDIA ngincer Nano di Ringkesan eusi, debugging perangkat lunak, pamilarian inpormasi, sareng asistén AI perusahaanHatur nuhun kana pangurangan token penalaran anu teu perlu, dimungkinkeun pikeun ngajalankeun agén anu ngajaga paguneman panjang sareng pangguna atanapi sistem tanpa tagihan inferensi anu naék.

Data sareng perpustakaan kabuka: NeMo Gym, NeMo RL sareng Evaluator

Perpustakaan NeMo

Salah sahiji ciri anu paling khas tina Nemotron 3 nyaéta Éta henteu diwatesan ku ngaleupaskeun beurat modélNVIDIA ngiringan kulawargana ku sakumpulan sumber daya kabuka anu lengkep pikeun latihan, nyetel, sareng meunteun agén.

Di hiji sisi, éta nyayogikeun korpus sintétis tina sababaraha triliun token data pra-latihan, pasca-latihan, sareng pangrojongKumpulan data ieu, anu museur kana penalaran, coding, sareng alur kerja multi-léngkah, ngamungkinkeun perusahaan sareng pusat panalungtikan pikeun ngahasilkeun varian Nemotron anu khusus pikeun domain sorangan (contona, hukum, kasehatan, atanapi industri) tanpa kedah ngamimitian ti mimiti.

Di antara sumber daya ieu, anu paling menonjol nyaéta: Kumpulan data Kasalametan Agentik NemotronIeu ngumpulkeun data telemetri ngeunaan paripolah agén dina skénario dunya nyata. Tujuanana nyaéta pikeun ngabantosan tim ngukur sareng nguatkeun kaamanan sistem otonom anu rumit: ti tindakan naon anu dilakukeun ku agén nalika mendakan data sénsitip, dugi ka kumaha réaksina kana paréntah anu ambigu atanapi berpotensi ngabahayakeun.

Eusi ekslusif - Klik Ieuh  Fitur panganyarna anu datang ka Windows 11: intelijen buatan sareng cara anyar pikeun ngatur PC anjeun

Ngeunaan bagian parabot, NVIDIA ngaluncurkeun NeMo Gym sareng NeMo RL salaku perpustakaan sumber terbuka pikeun latihan panguatan sareng pasca-latihan, sareng NeMo Evaluator pikeun meunteun kasalametan sareng kinerja. Pustaka ieu nyayogikeun lingkungan simulasi sareng pipa anu siap dianggo sareng kulawarga Nemotron, tapi tiasa diperpanjang ka modél sanés.

Sadaya bahan ieu—beurat, kumpulan data, sareng kode—disebarkeun ngalangkungan GitHub sareng Hugging Face dilisensikeun dina Lisénsi Modél Terbuka NVIDIA.supados tim Éropa tiasa ngahijikeunana kalayan lancar kana MLOp sorangan. Perusahaan sapertos Prime Intellect sareng Unsloth parantos ngagabungkeun NeMo Gym langsung kana alur kerja na pikeun ngagampangkeun pembelajaran penguatan dina Nemotron.

Kasadiaan dina awan umum sareng ékosistem Éropa

Beungeut Ngarangkul Nemotron 3 Nano

Nemotron 3 Nano ayeuna sayogi di Nangkeup Beureum y GitHubkitu ogé ngaliwatan panyadia inferensi sapertos Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter, sareng Together AI. Ieu muka panto pikeun tim pamekaran di Spanyol pikeun nguji modél ngalangkungan API atanapi nerapkeunana dina infrastruktur sorangan tanpa kompleksitas anu kaleuleuwihi.

Di payuneun méga, Nemotron 3 Nano ngagabung ka AWS via Amazon Bedrock pikeun inferensi tanpa server, sareng parantos ngumumkeun dukungan pikeun Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale, sareng Yotta. Pikeun organisasi Éropa anu parantos damel dina platform ieu, ieu ngajantenkeun langkung gampang pikeun ngadopsi Nemotron tanpa parobihan drastis kana arsitékturna.

Salian ti awan publik, NVIDIA ngamajukeun panggunaan Nemotron 3 Nano salaku Layanan mikro NIM tiasa dianggo dina infrastruktur anu diakselerasi ku NVIDIAIeu ngamungkinkeun pikeun skenario hibrida: sabagian tina beban dina awan internasional sareng sabagian dina pusat data lokal atanapi dina awan Éropa anu ngutamakeun padumukan data di EU.

Versi-versina Nemotron 3 Super sareng Ultra, diarahkeun kana beban kerja penalaran anu ekstrim sareng sistem multi-agén skala ageung, nyaéta direncanakeun pikeun satengah taun kahiji 2026Garis waktu ieu masihan waktos ka ékosistem panalungtikan sareng bisnis Éropa pikeun ékspérimén sareng Nano, ngavalidasi kasus panggunaan, sareng ngarancang strategi migrasi ka modél anu langkung ageung nalika diperyogikeun.

Nemotron 3 nempatkeun NVIDIA salaku salah sahiji panyadia anu unggul Modél kabuka kelas luhur anu ditujukeun pikeun AI agénKalayan proposal anu ngagabungkeun efisiensi téknis (MoE hibrida, NVFP4, kontéks masif), kabukaan (bobot, sét data sareng perpustakaan anu sayogi) sareng fokus anu jelas kana kadaulatan data sareng transparansi, aspék anu khususna sénsitip di Spanyol sareng sésana Éropa, dimana peraturan sareng tekanan pikeun ngaudit AI beuki ageung.

Microsoft Discovery IA-2
Tulisan anu aya hubunganana:
Microsoft Discovery AI ngajalankeun terobosan ilmiah sareng atikan ku intelijen buatan pribadi