- नेमोट्रॉन 3, एजेंटिक एआई और मल्टी-एजेंट सिस्टम पर केंद्रित मॉडल, डेटा और लाइब्रेरी का एक ओपन फैमिली है।
- इसमें हाइब्रिड आर्किटेक्चर और एनवीडिया ब्लैकवेल पर कुशल 4-बिट ट्रेनिंग के साथ तीन MoE आकार (नैनो, सुपर और अल्ट्रा) शामिल हैं।
- नेमोट्रॉन 3 नैनो अब यूरोप में हगिंग फेस, पब्लिक क्लाउड और एनआईएम माइक्रोसर्विस के माध्यम से 1 मिलियन टोकन की सीमा के साथ उपलब्ध है।
- इस इकोसिस्टम में विशाल डेटासेट, नेमो जिम, नेमो आरएल और इवैल्यूएटर जैसी सुविधाएं मौजूद हैं, जिनका उपयोग संप्रभु एआई एजेंटों को प्रशिक्षित करने, उन्हें बेहतर बनाने और उनका ऑडिट करने के लिए किया जाता है।
कृत्रिम बुद्धिमत्ता की दौड़ सरल, पृथक चैटबॉट से हटकर ऐसे एजेंट सिस्टम की ओर बढ़ रही है जो एक-दूसरे के साथ सहयोग करते हैं, लंबे वर्कफ़्लो का प्रबंधन करते हैं और ऑडिट करने योग्य होने चाहिए। इस नए परिदृश्य में, एनवीडिया ने एक स्पष्ट कदम उठाने का फैसला किया है: न केवल मॉडल, बल्कि डेटा और टूल्स को भी सार्वजनिक करना।ताकि कंपनियां, सार्वजनिक प्रशासन और अनुसंधान केंद्र अधिक नियंत्रण के साथ अपने स्वयं के एआई प्लेटफॉर्म का निर्माण कर सकें।
वह आंदोलन साकार होता है नेमोट्रॉन 3, मल्टी-एजेंट एआई के लिए तैयार किए गए ओपन मॉडल का एक समूह है। इसका उद्देश्य उच्च प्रदर्शन, कम अनुमान लागत और पारदर्शिता को संयोजित करना है। यह प्रस्ताव केवल एक सामान्य-उद्देश्यीय चैटबॉट के रूप में नहीं, बल्कि एक विशिष्ट उद्देश्य के रूप में है। एक ऐसा आधार जिस पर विनियमित क्षेत्रों में तर्क करने, योजना बनाने और जटिल कार्यों को निष्पादित करने वाले एजेंटों को तैनात किया जा सके।यह विशेष रूप से यूरोप और स्पेन में प्रासंगिक है, जहां डेटा संप्रभुता और नियामक अनुपालन महत्वपूर्ण हैं।
एजेंटिक और संप्रभु एआई के लिए मॉडलों का एक खुला परिवार
नेमोट्रॉन 3 को इस प्रकार प्रस्तुत किया गया है एक संपूर्ण पारिस्थितिकी तंत्र: मॉडल, डेटासेट, लाइब्रेरी और प्रशिक्षण विधियाँ ओपन लाइसेंस के तहत। एनवीडिया का विचार है कि संगठन न केवल एआई को एक अपारदर्शी सेवा के रूप में उपयोग करें, बल्कि इसके भीतर की जानकारी का निरीक्षण भी कर सकें, मॉडलों को अपने डोमेन के अनुसार अनुकूलित कर सकें और उन्हें अपने स्वयं के बुनियादी ढांचे पर तैनात कर सकें, चाहे वह क्लाउड में हो या स्थानीय डेटा केंद्रों में।
कंपनी इस रणनीति को अपनी प्रतिबद्धता के दायरे में रखती है। संप्रभु ए.आईयूरोप, दक्षिण कोरिया और अन्य क्षेत्रों की सरकारें और कंपनियां बंद या विदेशी प्रणालियों के खुले विकल्पों की तलाश कर रही हैं, जो अक्सर उनके डेटा सुरक्षा कानूनों या ऑडिट आवश्यकताओं के अनुरूप नहीं होती हैं। नेमोट्रॉन 3 का उद्देश्य एक ऐसा तकनीकी आधार प्रदान करना है जिस पर अधिक पारदर्शिता और नियंत्रण के साथ राष्ट्रीय, क्षेत्रीय या कॉर्पोरेट मॉडल विकसित किए जा सकें।
समान्तर में, एनवीडिया हार्डवेयर से परे अपनी स्थिति को मजबूत कर रही हैअब तक, यह मुख्य रूप से एक रेफरेंस जीपीयू प्रदाता था; नेमोट्रॉन 3 के साथ, यह मॉडलिंग और ट्रेनिंग टूल्स श्रेणी में भी अपनी जगह बना लेता है, और ओपनएआई, गूगल, एंथ्रोपिक, या यहां तक कि मेटा जैसे खिलाड़ियों के साथ-साथ प्रीमियम मॉडलों के खिलाफ सीधे प्रतिस्पर्धा करता है। सुपरग्रोक हेवीलामा के हाल के संस्करणों में मेटा ने ओपन सोर्स के प्रति अपनी प्रतिबद्धता को कम कर दिया है।
यूरोपीय अनुसंधान और स्टार्टअप इकोसिस्टम के लिए—जो हगिंग फेस जैसे प्लेटफार्मों पर होस्ट किए गए ओपन मॉडल पर अत्यधिक निर्भर है—ओपन लाइसेंस के तहत वेट्स, सिंथेटिक डेटा और लाइब्रेरी की उपलब्धता एक शक्तिशाली विकल्प प्रस्तुत करती है। चीनी मॉडल और लोकप्रियता और मानक रैंकिंग में अमेरिकी ही शीर्ष पर हैं।
हाइब्रिड MoE आर्किटेक्चर: बड़े पैमाने के एजेंटों के लिए दक्षता
नेमोट्रॉन 3 की केंद्रीय तकनीकी विशेषता यह है कि... विशेषज्ञों के अव्यक्त मिश्रण (MoE) की संकर वास्तुकलाप्रत्येक अनुमान में मॉडल के सभी मापदंडों को सक्रिय करने के बजाय, उनमें से केवल कुछ ही सक्रिय किए जाते हैं, जो कि संबंधित कार्य या टोकन के लिए सबसे अधिक प्रासंगिक विशेषज्ञों का उपसमूह होता है।
यह दृष्टिकोण अनुमति देता है गणना लागत और मेमोरी खपत में भारी कमी आती है।इससे टोकन थ्रूपुट भी बढ़ता है। मल्टी-एजेंट आर्किटेक्चर के लिए, जहां दर्जनों या सैकड़ों एजेंट लगातार संदेशों का आदान-प्रदान करते हैं, यह दक्षता GPU और क्लाउड लागत के मामले में सिस्टम को अस्थिर होने से बचाने के लिए महत्वपूर्ण है।
एनवीडिया द्वारा साझा किए गए आंकड़ों और स्वतंत्र बेंचमार्क के अनुसार, नेमोट्रॉन 3 नैनो निम्नलिखित उपलब्धि हासिल करता है। प्रति सेकंड चार गुना अधिक टोकन अपने पूर्ववर्ती, नेमोट्रॉन 2 नैनो की तुलना में, यह अनावश्यक तर्क टोकन के निर्माण को लगभग 60% तक कम कर देता है। व्यवहार में, इसका अर्थ है समान रूप से या उससे भी अधिक सटीक उत्तर, लेकिन कम शब्दों के साथ और प्रति प्रश्न कम लागत के साथ।
शिक्षा मंत्रालय की संकर संरचना, विशिष्ट प्रशिक्षण तकनीकों के संयोजन से, निम्नलिखित परिणाम प्राप्त हुए हैं: कई सबसे उन्नत ओपन मॉडल विशेषज्ञ योजनाओं को अपनाते हैं।नेमोट्रॉन 3 भी इसी प्रवृत्ति को आगे बढ़ाता है, लेकिन विशेष रूप से एजेंटिक एआई पर केंद्रित है: एजेंटों के बीच समन्वय, उपकरणों के उपयोग, लंबी स्थितियों को संभालने और चरण-दर-चरण योजना बनाने के लिए डिज़ाइन किए गए आंतरिक मार्ग।
तीन आकार: नैनो, सुपर और अल्ट्रा, विभिन्न कार्यभारों के लिए।

नेमोट्रॉन 3 परिवार को निम्नलिखित प्रकार से व्यवस्थित किया गया है: MoE मॉडल के तीन मुख्य आकारये सभी खुले हैं और विशेषज्ञ आर्किटेक्चर की बदौलत सक्रिय पैरामीटर कम हो गए हैं:
- नेमोट्रॉन 3 नैनोलगभग 30.000 अरब कुल पैरामीटर, लगभग प्रति टोकन 3.000 बिलियन संपत्तिइसे उन विशिष्ट कार्यों के लिए डिज़ाइन किया गया है जहां दक्षता मायने रखती है: सॉफ्टवेयर डिबगिंग, दस्तावेज़ सारांश, सूचना पुनर्प्राप्ति, सिस्टम निगरानी, या विशेषीकृत एआई सहायक।
- नेमोट्रॉन 3 सुपरलगभग 100.000 अरब पैरामीटर, साथ में 10.000 अरब की संपत्ति हर कदम पर। यह इस ओर लक्षित है मल्टी-एजेंट आर्किटेक्चर में उन्नत तर्क क्षमताजटिल प्रवाहों को हल करने के लिए कई एजेंटों के सहयोग करने पर भी कम विलंबता के साथ।
- नेमोट्रॉन 3 अल्ट्राऊपरी स्तर, जिसमें लगभग 500.000 अरब पैरामीटर हैं और अधिकतम सीमा तक... प्रति टोकन 50.000 बिलियन संपत्तियह अनुसंधान, रणनीतिक योजना, उच्च-स्तरीय निर्णय समर्थन और विशेष रूप से मांग वाली एआई प्रणालियों के लिए एक शक्तिशाली तर्क इंजन के रूप में कार्य करता है।
व्यवहार में, यह संगठनों को अनुमति देता है अपने बजट और आवश्यकताओं के अनुसार मॉडल का आकार चुनें।नैनो का उपयोग भारी, गहन कार्यभार और सीमित लागत के लिए किया जाता है; सुपर का उपयोग तब किया जाता है जब कई सहयोगी एजेंटों के साथ अधिक गहन तर्क की आवश्यकता होती है; और अल्ट्रा का उपयोग उन मामलों के लिए किया जाता है जहां गुणवत्ता और लंबा संदर्भ जीपीयू की लागत से अधिक महत्वपूर्ण होते हैं।
अभी के लिए फिलहाल केवल नेमोट्रॉन 3 नैनो ही तत्काल उपयोग के लिए उपलब्ध है।सुपर और अल्ट्रा वेरिएंट को 2026 की पहली छमाही में लॉन्च करने की योजना है, जिससे यूरोपीय कंपनियों और प्रयोगशालाओं को पहले नैनो के साथ प्रयोग करने, पाइपलाइन स्थापित करने और बाद में अधिक क्षमता की आवश्यकता वाले मामलों को स्थानांतरित करने का समय मिलेगा।
नेमोट्रॉन 3 नैनो: 1 मिलियन टोकन विंडो और निहित लागत

आज की तारीख में, नेमोट्रॉन 3 नैनो परिवार का व्यावहारिक अगुआएनवीडिया इसे इस श्रेणी का सबसे अधिक गणनात्मक रूप से लागत-कुशल मॉडल बताती है, जिसे मल्टी-एजेंट वर्कफ़्लो और गहन लेकिन दोहराव वाले कार्यों में अधिकतम प्रदर्शन प्रदान करने के लिए अनुकूलित किया गया है।
इसकी तकनीकी विशेषताओं में से निम्नलिखित प्रमुख हैं: एक मिलियन टोकन तक की संदर्भ विंडोइससे व्यापक दस्तावेज़ों, संपूर्ण कोड संग्रहों या बहु-चरणीय व्यावसायिक प्रक्रियाओं के लिए मेमोरी को सुरक्षित रखना संभव हो जाता है। बैंकिंग, स्वास्थ्य सेवा या सार्वजनिक प्रशासन जैसे यूरोपीय अनुप्रयोगों में, जहाँ रिकॉर्ड बहुत अधिक मात्रा में होते हैं, यह दीर्घकालिक संदर्भ क्षमता विशेष रूप से मूल्यवान है।
स्वतंत्र संगठन के मानदंड कृत्रिम विश्लेषण से पता चलता है कि नेमोट्रॉन 3 नैनो सबसे संतुलित ओपन-सोर्स मॉडलों में से एक है। यह बुद्धिमत्ता, सटीकता और गति का संयोजन है, जिसकी थ्रूपुट दर प्रति सेकंड सैकड़ों टोकन है। यह संयोजन इसे स्पेन में एआई इंटीग्रेटर्स और सेवा प्रदाताओं के लिए आकर्षक बनाता है, जिन्हें बुनियादी ढांचे की लागत में भारी वृद्धि किए बिना बेहतर उपयोगकर्ता अनुभव की आवश्यकता होती है।
उपयोग के मामलों के संदर्भ में, NVIDIA नैनो को निम्नलिखित लक्ष्यों की ओर लक्षित कर रही है: सामग्री सारांश, सॉफ्टवेयर डिबगिंग, सूचना पुनर्प्राप्ति और उद्यम एआई सहायकअनावश्यक तर्क टोकनों में कमी के कारण, ऐसे एजेंटों को चलाना संभव है जो उपयोगकर्ताओं या प्रणालियों के साथ लंबी बातचीत बनाए रखते हैं, बिना अनुमान लागत में अत्यधिक वृद्धि किए।
ओपन डेटा और लाइब्रेरीज़: NeMo Gym, NeMo RL और Evaluator

नेमोट्रॉन 3 की सबसे विशिष्ट विशेषताओं में से एक यह है कि यह केवल मॉडल के वज़न जारी करने तक सीमित नहीं हैएनवीडिया एजेंटों के प्रशिक्षण, ट्यूनिंग और मूल्यांकन के लिए खुले संसाधनों का एक व्यापक सूट प्रदान करके इस परिवार का समर्थन करता है।
एक ओर, यह एक कृत्रिम संग्रह उपलब्ध कराता है प्रशिक्षण-पूर्व, प्रशिक्षण-पश्चात और सुदृढ़ीकरण डेटा के कई खरब टोकनतर्क, कोडिंग और बहु-चरणीय कार्यप्रवाह पर केंद्रित ये डेटासेट कंपनियों और अनुसंधान केंद्रों को शुरू से शुरुआत किए बिना नेमोट्रॉन के अपने स्वयं के डोमेन-विशिष्ट संस्करण (जैसे, कानूनी, स्वास्थ्य सेवा या औद्योगिक) उत्पन्न करने की अनुमति देते हैं।
इन संसाधनों में से निम्नलिखित संसाधन विशेष रूप से महत्वपूर्ण हैं: नेमोट्रॉन एजेंटिक सुरक्षा डेटासेटयह वास्तविक परिस्थितियों में एजेंट के व्यवहार से संबंधित टेलीमेट्री डेटा एकत्र करता है। इसका उद्देश्य टीमों को जटिल स्वायत्त प्रणालियों की सुरक्षा को मापने और मजबूत करने में मदद करना है: संवेदनशील डेटा का सामना करने पर एजेंट द्वारा की जाने वाली कार्रवाइयों से लेकर अस्पष्ट या संभावित रूप से हानिकारक आदेशों पर उसकी प्रतिक्रिया तक।
टूल्स सेक्शन के संबंध में, एनवीडिया लॉन्च कर रहा है। NeMo Gym और NeMo RL ओपन सोर्स लाइब्रेरी के रूप में उपलब्ध हैं। सुदृढ़ीकरण प्रशिक्षण और प्रशिक्षणोत्तर के लिए, साथ ही सुरक्षा और प्रदर्शन का आकलन करने के लिए नेमो इवैल्यूएटर का उपयोग किया जाता है। ये लाइब्रेरी नेमोट्रॉन परिवार के साथ उपयोग के लिए तैयार सिमुलेशन वातावरण और पाइपलाइन प्रदान करती हैं, लेकिन इन्हें अन्य मॉडलों तक भी बढ़ाया जा सकता है।
यह सभी सामग्री—वजन, डेटासेट और कोड—के माध्यम से वितरित की जाती है। GitHub और Hugging Face, NVIDIA ओपन मॉडल लाइसेंस के अंतर्गत लाइसेंस प्राप्त हैं।ताकि यूरोपीय टीमें इसे अपने MLOps में आसानी से एकीकृत कर सकें। प्राइम इंटेलेक्ट और अनस्लोथ जैसी कंपनियां पहले से ही नेमोट्रॉन पर रीइन्फोर्समेंट लर्निंग को सरल बनाने के लिए नेमो जिम को सीधे अपने वर्कफ़्लो में शामिल कर रही हैं।
पब्लिक क्लाउड और यूरोपीय इकोसिस्टम में उपलब्धता

नेमोट्रॉन 3 नैनो अब उपलब्ध है गले लगना y GitHubसाथ ही Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter और Together AI जैसे इन्फरेंस प्रोवाइडर्स के माध्यम से भी। इससे स्पेन में विकास टीमों के लिए API के माध्यम से मॉडल का परीक्षण करने या इसे बिना किसी अतिरिक्त जटिलता के अपने स्वयं के इंफ्रास्ट्रक्चर पर तैनात करने का रास्ता खुल जाता है।
क्लाउड के मोर्चे पर, नेमोट्रॉन 3 नैनो अमेज़न बेडरॉक के माध्यम से AWS से जुड़ गया है। सर्वरलेस इन्फरेंस के लिए Nemotron का उपयोग किया जाता है, और कंपनी ने Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale और Yotta के लिए समर्थन की घोषणा की है। इन प्लेटफॉर्मों पर पहले से काम कर रहे यूरोपीय संगठनों के लिए, इससे उनकी वास्तुकला में बड़े बदलाव किए बिना Nemotron को अपनाना आसान हो जाता है।
पब्लिक क्लाउड के अलावा, एनवीडिया नेमोट्रॉन 3 नैनो के उपयोग को भी बढ़ावा दे रही है। NIM माइक्रोसेवा किसी भी NVIDIA-एक्सेलरेटेड इंफ्रास्ट्रक्चर पर डिप्लॉय की जा सकती है।इससे हाइब्रिड परिदृश्य संभव हो पाते हैं: लोड का एक हिस्सा अंतरराष्ट्रीय क्लाउड में और दूसरा हिस्सा स्थानीय डेटा केंद्रों में या यूरोपीय क्लाउड में, जो यूरोपीय संघ में डेटा निवास को प्राथमिकता देते हैं।
संस्करणों नेमोट्रॉन 3 सुपर और अल्ट्रा, अत्यधिक तर्क क्षमता वाले कार्यभार और बड़े पैमाने पर बहु-एजेंट प्रणालियों के लिए तैयार किए गए उपकरण हैं। 2026 के पहले छमाही के लिए योजनाबद्धयह समयसीमा यूरोपीय अनुसंधान और व्यावसायिक पारिस्थितिकी तंत्र को नैनो के साथ प्रयोग करने, उपयोग के मामलों को मान्य करने और आवश्यकता पड़ने पर बड़े मॉडलों में माइग्रेशन रणनीतियों को डिजाइन करने के लिए समय प्रदान करती है।
नेमोट्रॉन 3 ने एनवीडिया को अग्रणी प्रदाताओं में से एक के रूप में स्थापित किया है। एजेंटिक एआई की ओर लक्षित उच्च-स्तरीय ओपन मॉडलएक ऐसे प्रस्ताव के साथ जो तकनीकी दक्षता (हाइब्रिड MoE, NVFP4, विशाल संदर्भ), खुलापन (वजन, डेटासेट और उपलब्ध लाइब्रेरी) और डेटा संप्रभुता और पारदर्शिता पर स्पष्ट ध्यान केंद्रित करता है, ऐसे पहलू जो स्पेन और शेष यूरोप में विशेष रूप से संवेदनशील हैं, जहां AI के ऑडिट के लिए विनियमन और दबाव तेजी से बढ़ रहा है।
मैं एक प्रौद्योगिकी उत्साही हूं जिसने अपनी "गीक" रुचियों को एक पेशे में बदल दिया है। मैंने अपने जीवन के 10 से अधिक वर्ष अत्याधुनिक तकनीक का उपयोग करने और शुद्ध जिज्ञासा से सभी प्रकार के कार्यक्रमों के साथ छेड़छाड़ करने में बिताए हैं। अब मैंने कंप्यूटर प्रौद्योगिकी और वीडियो गेम में विशेषज्ञता हासिल कर ली है। ऐसा इसलिए है क्योंकि 5 वर्षों से अधिक समय से मैं प्रौद्योगिकी और वीडियो गेम पर विभिन्न वेबसाइटों के लिए लिख रहा हूं, ऐसे लेख बना रहा हूं जो आपको ऐसी भाषा में आवश्यक जानकारी देने का प्रयास करते हैं जो हर किसी के लिए समझ में आती है।
यदि आपके कोई प्रश्न हैं, तो मेरी जानकारी विंडोज ऑपरेटिंग सिस्टम के साथ-साथ मोबाइल फोन के लिए एंड्रॉइड से संबंधित हर चीज तक है। और मेरी प्रतिबद्धता आपके प्रति है, मैं हमेशा कुछ मिनट बिताने और इस इंटरनेट की दुनिया में आपके किसी भी प्रश्न को हल करने में आपकी मदद करने को तैयार हूं।
