- A Nemotron 3 egy nyitott modellekből, adatokból és könyvtárakból álló család, amely az ágentikus mesterséges intelligenciára és a többágenses rendszerekre összpontosít.
- Három MoE méretet (Nano, Super és Ultra) tartalmaz hibrid architektúrával és hatékony 4 bites betanítással NVIDIA Blackwellen.
- A Nemotron 3 Nano már elérhető Európában a Hugging Face-en, nyilvános felhőn és NIM mikroszolgáltatásként, 1 millió token eléréséig.
- Az ökoszisztémát hatalmas adathalmazok, a NeMo Gym, a NeMo RL és az Evaluator teszik teljessé, amelyek segítségével szuverén MI-ügynökök képezhetők, hangolhatók és auditálhatók.
A mesterséges intelligencia versenye az egyszerű, elszigetelt chatbotoktól az egymással együttműködő, hosszú munkafolyamatokat kezelő és auditálható ágensrendszerek felé halad. Ebben az új forgatókönyvben, Az NVIDIA egy meglehetősen egyértelmű lépés mellett döntött: nemcsak a modelleket, hanem az adatokat és az eszközöket is megnyitja.hogy a vállalatok, a közigazgatási szervek és a kutatóközpontok nagyobb kontrollal építhessék ki saját MI-platformjaikat.
Ez a mozgalom abban testesül meg, Nemotron 3, egy nyílt modellekből álló család, amely a többágenses mesterséges intelligenciára irányul A javaslat a nagy teljesítmény, az alacsony következtetési költségek és az átláthatóság ötvözésére törekszik. A javaslat nem csupán egy újabb általános célú chatbotként kíván működni, hanem… egy olyan bázis, amelyre olyan ügynököket lehet telepíteni, akik szabályozott szektorokban gondolkodnak, terveznek és hajtanak végre összetett feladatokatEz különösen fontos Európában és Spanyolországban, ahol az adatszuverenitás és a szabályozási megfelelés fontos.
Nyílt modellek családja az ágensi és szuverén mesterséges intelligenciához
A Nemotron 3-at a következőképpen mutatják be egy teljes ökoszisztéma: modellek, adatkészletek, könyvtárak és betanítási receptek nyílt licencek alatt. Az NVIDIA ötlete az, hogy a szervezetek ne csak átlátszatlan szolgáltatásként használják a mesterséges intelligenciát, hanem megvizsgálhassák annak tartalmát, adaptálhassák a modelleket a saját területeikhez, és telepíthessék azokat saját infrastruktúrájukon, akár a felhőben, akár helyi adatközpontokban.
A vállalat ezt a stratégiát a következő elkötelezettségébe foglalja: Szuverén AIAz európai, dél-koreai és más régiók kormányai és vállalatai nyílt alternatívákat keresnek a zárt vagy külföldi rendszerekkel szemben, amelyek gyakran nem illeszkednek jól az adatvédelmi törvényeikhez vagy az auditkövetelményeikhez. A Nemotron 3 célja, hogy technikai alapot teremtsen, amelyre nagyobb láthatósággal és kontrollal rendelkező nemzeti, ágazati vagy vállalati modelleket lehet építeni.
Párhuzamosan, Az NVIDIA a hardvereken túl is erősíti pozíciójátEddig elsősorban referencia GPU-szolgáltató volt; a Nemotron 3-mal a modellező és oktatóeszközök rétegében is pozicionálja magát, közvetlenebb versenyben olyan szereplőkkel, mint az OpenAI, a Google, az Anthropic vagy akár a Meta, valamint prémium modellekkel, mint például a SuperGrok HeavyA Meta a Llama legutóbbi generációiban csökkentette a nyílt forráskódú szoftverek iránti elkötelezettségét.
Az európai kutatási és startup ökoszisztéma számára – amely nagymértékben támaszkodik a Hugging Face-hez hasonló platformokon üzemeltetett nyílt modellekre – a súlyok, szintetikus adatok és könyvtárak nyílt licencek alatti elérhetősége hatékony alternatívát jelent a... kínai modellek és az amerikaiak, akik uralják a népszerűségi és benchmark rangsorokat.
Hibrid MoE architektúra: hatékonyság nagyméretű ágensek számára
A Nemotron 3 központi műszaki jellemzője a Látens szakértői keverék hibrid architektúrája (MoE)Ahelyett, hogy a modell összes paraméterét aktiválnánk minden egyes következtetésben, csak egy töredéküket kapcsoljuk be, a szóban forgó feladathoz vagy tokenhez leginkább kapcsolódó szakértők részhalmazát.
Ez a megközelítés lehetővé teszi drasztikusan csökkenti a számítási költségeket és a memóriafogyasztástEz a token átviteli sebességét is növeli. Többügynökös architektúrák esetén, ahol több tucat vagy több száz ügynök folyamatosan üzeneteket vált, ez a hatékonyság kulcsfontosságú annak megakadályozásához, hogy a rendszer fenntarthatatlanná váljon a GPU és a felhőköltségek tekintetében.
Az NVIDIA és független benchmarkok által megosztott adatok szerint a Nemotron 3 Nano a következőket éri el: akár négyszer több token másodpercenként Elődjéhez, a Nemotron 2 Nano-hoz képest körülbelül 60%-kal csökkenti a felesleges érvelési tokenek generálását. A gyakorlatban ez ugyanolyan vagy akár pontosabb válaszokat jelent, de kevesebb „bőbeszédűséggel” és alacsonyabb lekérdezésenkénti költséggel.
A hibrid MoE architektúra, specifikus betanítási technikákkal kombinálva, a következőkhöz vezetett: A legfejlettebb nyílt modellek közül sok szakértői sémákat alkalmazA Nemotron 3 csatlakozik ehhez a trendhez, de kifejezetten az ágentikus mesterséges intelligenciára összpontosít: belső útvonalak, amelyeket az ágensek közötti koordinációra, eszközök használatára, hosszú állapotok kezelésére és lépésről lépésre történő tervezésre terveztek.
Három méret: Nano, Super és Ultra a különböző munkaterhelésekhez

A Nemotron 3 család a következőképpen szerveződik: az MoE modell három fő mérete, mindegyik nyitott és csökkentett aktív paraméterekkel rendelkezik a szakértői architektúrának köszönhetően:
- Nemotron 3 Nanokörülbelül 30.000 milliárd paraméter összesen, kb. 3.000 milliárd eszköz tokenenkéntCélzott feladatokra tervezték, ahol a hatékonyság számít: szoftverhiba-keresés, dokumentum-összefoglaló, információ-visszakeresés, rendszerfelügyelet vagy speciális MI-asszisztensek.
- Nemotron 3 Superkörülbelül 100.000 milliárd paraméter, 10.000 milliárdnyi vagyon minden lépésnél. Arra irányul, hogy Fejlett érvelés többágenses architektúrákbanalacsony késleltetéssel, még akkor is, ha több ágens működik együtt összetett folyamatok megoldása érdekében.
- Nemotron 3 Ultra: a felső szint, körülbelül 500.000 milliárd paraméterrel és akár 50.000 milliárd eszköz tokenenkéntHatékony érvelési motorként működik a kutatás, a stratégiai tervezés, a magas szintű döntéstámogatás és a különösen igényes mesterséges intelligencia rendszerek számára.
A gyakorlatban ez lehetővé teszi a szervezetek számára, hogy Válassza ki a modell méretét a költségvetése és az igényei szerintA Nano hatalmas, intenzív munkaterhelésekhez és szűkös költségekhez használható; a Super, ha sok együttműködő ügynökkel mélyebb gondolkodásra van szükség; és az Ultra azokhoz az esetekhez, amikor a minőség és a hosszú kontextus meghaladja a GPU költségeit.
Átmenetileg Csak a Nemotron 3 Nano érhető el azonnali használatra.A Super és Ultra változatok várhatóan 2026 első felére kerülnek forgalomba, így az európai vállalatoknak és laboratóriumoknak elegendő idejük lesz először a Nano technológiával kísérletezni, termékpalettát létrehozni, majd később a nagyobb kapacitást igénylő eseteket migrálni.
Nemotron 3 Nano: 1 millió tokenes ablak és korlátozott költségek

A Nemotron 3 Nano a mai naptól kezdve... a család gyakorlati élharcosaAz NVIDIA a kínálat legköltséghatékonyabb számítási modelljeként írja le, amelyet a többügynökös munkafolyamatokban és az intenzív, de ismétlődő feladatokban való maximális teljesítmény biztosítására optimalizáltak.
Műszaki jellemzői közül a következők emelkednek ki: akár egymillió token kontextus ablakaEz lehetővé teszi terjedelmes dokumentumok, teljes kódtárak vagy többlépéses üzleti folyamatok memóriájának megőrzését. Az európai banki, egészségügyi vagy közigazgatási alkalmazások esetében, ahol a rekordok nagy mennyiségben lehetnek jelen, ez a hosszú távú kontextusképesség különösen értékes.
A független szervezet mércéi A mesterséges elemzés a Nemotron 3 Nanót az egyik legkiegyensúlyozottabb nyílt forráskódú modellként tartja számon. Az intelligenciát, a pontosságot és a sebességet ötvözi, másodpercenként több száz token átviteli sebességgel. Ez a kombináció vonzóvá teszi a spanyolországi mesterséges intelligencia integrátorok és szolgáltatók számára, akiknek jó felhasználói élményre van szükségük az egekbe szökő infrastrukturális költségek nélkül.
Felhasználási esetek tekintetében az NVIDIA a Nanót célozza meg Tartalomösszefoglaló, szoftverhiba-keresés, információ-visszakeresés és vállalati MI-asszisztensekA redundáns érvelési tokenek csökkentésének köszönhetően olyan ügynököket lehet futtatni, amelyek hosszú beszélgetéseket folytatnak a felhasználókkal vagy a rendszerekkel anélkül, hogy a következtetési számla az egekbe szökne.
Nyílt adatok és könyvtárak: NeMo Gym, NeMo RL és Evaluator

A Nemotron 3 egyik legkülönlegesebb tulajdonsága, hogy Nem korlátozódik a modellsúlyok kiadásáraAz NVIDIA a családot átfogó, nyílt forráskódú készlettel kíséri az ügynökök képzéséhez, hangolásához és értékeléséhez.
Egyrészt elérhetővé tesz egy szintetikus korpuszt több billió tokennyi betanítás előtti, utáni és megerősítési adatEzek az érvelésre, kódolásra és többlépéses munkafolyamatokra összpontosító adatkészletek lehetővé teszik a vállalatok és kutatóközpontok számára, hogy saját, területspecifikus Nemotron-variánsokat (pl. jogi, egészségügyi vagy ipari) hozzanak létre anélkül, hogy a nulláról kellene kezdeniük a munkát.
Ezen erőforrások közül a következők emelkednek ki: Nemotron Agentic Safety adatkészletTelemetriai adatokat gyűjt az ügynökök viselkedéséről valós helyzetekben. Célja, hogy segítsen a csapatoknak mérni és megerősíteni az összetett autonóm rendszerek biztonságát: attól kezdve, hogy egy ügynök milyen műveleteket tesz, amikor érzékeny adatokkal találkozik, egészen addig, hogy hogyan reagál a kétértelmű vagy potenciálisan káros parancsokra.
Az eszközök szekciót illetően az NVIDIA elindítja NeMo Gym és NeMo RL nyílt forráskódú könyvtárakként megerősítő képzéshez és utóképzéshez, valamint a NeMo Evaluatorhoz a biztonság és a teljesítmény értékeléséhez. Ezek a könyvtárak használatra kész szimulációs környezeteket és folyamatokat biztosítanak a Nemotron családdal, de más modellekre is kiterjeszthetők.
Mindez az anyag – súlyok, adathalmazok és kód – a következő csatornákon keresztül kerül terjesztésre: A GitHub és a Hugging Face az NVIDIA Open Model License licenc alatt használható....hogy az európai csapatok zökkenőmentesen integrálhassák saját MLOp-jaikba. Olyan cégek, mint a Prime Intellect és az Unsloth, már közvetlenül beépítik a NeMo Gym-et a munkafolyamataikba, hogy egyszerűsítsék a megerősítéses tanulást a Nemotronon.
Elérhetőség nyilvános felhőkben és az európai ökoszisztémában

A Nemotron 3 Nano már elérhető a következő címen: Átölelő arc y GitHubvalamint következtetési szolgáltatókon, mint például a Baseten, a DeepInfra, a Fireworks, a FriendliAI, az OpenRouter és a Together AI. Ez megnyitja az utat a spanyol fejlesztőcsapatok előtt, hogy API-n keresztül teszteljék a modellt, vagy túlzott bonyolultság nélkül telepítsék saját infrastruktúrájukon.
A felhők frontján, A Nemotron 3 Nano az Amazon Bedrock-on keresztül csatlakozik az AWS-hez a szerver nélküli következtetéshez, és bejelentette a Google Cloud, a CoreWeave, a Crusoe, a Microsoft Foundry, a Nebius, az Nscale és a Yotta támogatását. Az ezeken a platformokon már dolgozó európai szervezetek számára ez megkönnyíti a Nemotron bevezetését az architektúrájuk drasztikus megváltoztatása nélkül.
A nyilvános felhő mellett az NVIDIA a Nemotron 3 Nano használatát is népszerűsíti. NIM mikroszolgáltatás, amely bármely NVIDIA-gyorsítású infrastruktúrán telepíthetőEz hibrid forgatókönyveket tesz lehetővé: a terhelés egy része nemzetközi felhőkben, egy része pedig helyi adatközpontokban vagy európai felhőkben történik, amelyek az EU-ban lévő adatok tárolását helyezik előtérbe.
Verziók Nemotron 3 Super és Ultra, extrém logikai terhelésekre és nagyméretű, többágenses rendszerekre vannak felkészítve, 2026 első felére tervezveEz az ütemterv időt ad az európai kutatási és üzleti ökoszisztéma számára a nanotechnológiával való kísérletezésre, a használati esetek validálására és szükség esetén a nagyobb modellekre való migrációs stratégiák kidolgozására.
A Nemotron 3 az NVIDIA-t az egyik vezető szolgáltatóvá teszi ágentikus mesterséges intelligenciára épülő, csúcskategóriás, nyílt modellekEgy olyan javaslattal, amely ötvözi a technikai hatékonyságot (hibrid MoE, NVFP4, masszív kontextus), a nyitottságot (súlyok, adatkészletek és elérhető könyvtárak), valamint az adatszuverenitásra és átláthatóságra való egyértelmű összpontosítást, amelyek különösen érzékeny szempontok Spanyolországban és Európa többi részén, ahol a mesterséges intelligencia szabályozása és az auditálására irányuló nyomás egyre nagyobb.
Technológia-rajongó vagyok, aki "geek" érdeklődését szakmává változtatta. Életemből több mint 10 évet töltöttem a legmodernebb technológiával, és pusztán kíváncsiságból mindenféle programmal bütykölgettem. Most a számítástechnikára és a videojátékokra szakosodtam. Ennek az az oka, hogy több mint 5 éve írok különféle technológiával és videojátékokkal foglalkozó weboldalakra, olyan cikkeket készítve, amelyek mindenki számára érthető nyelven igyekeznek megadni a szükséges információkat.
Ha bármilyen kérdése van, tudásom a Windows operációs rendszerrel, valamint a mobiltelefonokhoz készült Androiddal kapcsolatos mindenre kiterjed. És az én elkötelezettségem az Ön iránti elkötelezettségem, mindig készen állok néhány percet rászánni arra, hogy segítsek megoldani minden kérdését ebben az internetes világban.
