Nemotron 3: ملٹی ایجنٹ AI کے لیے NVIDIA کی بڑی کھلی شرط

آخری تازہ کاری: 17/12/2025

  • Nemotron 3 ماڈلز، ڈیٹا اور لائبریریوں کا ایک کھلا خاندان ہے جو ایجنٹ AI اور ملٹی ایجنٹ سسٹمز پر مرکوز ہے۔
  • اس میں ہائبرڈ فن تعمیر کے ساتھ تین MoE سائز (نینو، سپر اور الٹرا) اور NVIDIA بلیک ویل پر 4 بٹ کی موثر تربیت شامل ہے۔
  • Nemotron 3 Nano اب یورپ میں ہگنگ فیس، پبلک کلاؤڈز اور NIM مائیکرو سروس کے طور پر 1 ملین ٹوکنز کی ونڈو کے ساتھ دستیاب ہے۔
  • ایکو سسٹم کو بڑے پیمانے پر ڈیٹا سیٹس، NeMo جم، NeMo RL اور Evaluator کے ساتھ مکمل کیا گیا ہے تاکہ وہ خودمختار AI ایجنٹوں کی تربیت، ٹیون اور آڈٹ کرے۔

نیموٹرون 3 مصنوعی ذہانت کا ماڈل

مصنوعی ذہانت کی دوڑ سادہ، الگ تھلگ چیٹ بوٹس سے ایسے ایجنٹ سسٹمز کی طرف بڑھ رہی ہے جو ایک دوسرے کے ساتھ تعاون کرتے ہیں، طویل ورک فلو کا انتظام کرتے ہیں، اور قابل سماعت ہونے کی ضرورت ہے۔ اس نئے منظر نامے میں، NVIDIA نے کافی واضح قدم اٹھانے کا فیصلہ کیا ہے: نہ صرف ماڈل بلکہ ڈیٹا اور ٹولز کو بھی کھولناتاکہ کمپنیاں، عوامی انتظامیہ اور تحقیقی مراکز زیادہ کنٹرول کے ساتھ اپنا AI پلیٹ فارم بنا سکیں۔

وہ تحریک عمل میں آتی ہے۔ Nemotron 3، کھلے ماڈلز کا ایک خاندان جو ملٹی ایجنٹ AI کی طرف تیار ہے۔ یہ اعلی کارکردگی، کم تخمینہ لاگت، اور شفافیت کو یکجا کرنے کی کوشش کرتا ہے۔ تجویز کا مقصد صرف ایک اور عام مقصد والے چیٹ بوٹ کے طور پر نہیں ہے، بلکہ جیسا کہ ایک بنیاد جس پر ایجنٹوں کو تعینات کرنا ہے جس کی وجہ سے ریگولیٹڈ سیکٹرز میں پیچیدہ کاموں کی منصوبہ بندی کرنا اور ان پر عمل کرنایہ خاص طور پر یورپ اور اسپین میں متعلقہ ہے، جہاں ڈیٹا کی خودمختاری اور ریگولیٹری تعمیل اہم ہے۔

ایجنٹ اور خودمختار AI کے لیے ماڈلز کا ایک کھلا خاندان

Nemotron 3 کے طور پر پیش کیا گیا ہے۔ ایک مکمل ماحولیاتی نظام: ماڈل، ڈیٹاسیٹس، لائبریریاں، اور تربیتی ترکیبیں۔ کھلے لائسنس کے تحت. NVIDIA کا خیال یہ ہے کہ تنظیمیں نہ صرف AI کو ایک مبہم سروس کے طور پر استعمال کرتی ہیں، بلکہ اندر کی چیزوں کا معائنہ کر سکتی ہیں، ماڈلز کو اپنے ڈومینز کے مطابق ڈھال سکتی ہیں، اور انہیں اپنے انفراسٹرکچر پر تعینات کر سکتی ہیں، چاہے وہ کلاؤڈ میں ہوں یا مقامی ڈیٹا سینٹرز میں۔

کمپنی اس حکمت عملی کو اپنی وابستگی کے اندر بناتی ہے۔ خودمختار AIیورپ، جنوبی کوریا اور دیگر خطوں میں حکومتیں اور کمپنیاں بند یا غیر ملکی نظاموں کے لیے کھلے متبادل تلاش کر رہی ہیں، جو اکثر ان کے ڈیٹا کے تحفظ کے قوانین یا آڈٹ کی ضروریات کے ساتھ موافق نہیں ہوتے ہیں۔ Nemotron 3 کا مقصد ایک تکنیکی بنیاد بننا ہے جس پر زیادہ سے زیادہ مرئیت اور کنٹرول کے ساتھ قومی، سیکٹرل، یا کارپوریٹ ماڈلز بنانا ہے۔

متوازی میں، NVIDIA ہارڈ ویئر سے آگے اپنی پوزیشن کو مضبوط کرتا ہے۔اب تک، یہ بنیادی طور پر ایک حوالہ GPU فراہم کنندہ تھا۔ Nemotron 3 کے ساتھ، یہ اپنے آپ کو ماڈلنگ اور ٹریننگ ٹولز کی پرت میں بھی پوزیشن میں رکھتا ہے، جو OpenAI، Google، Anthropic، یا یہاں تک کہ Meta جیسے کھلاڑیوں سے براہ راست مقابلہ کرتا ہے، اور جیسے پریمیم ماڈلز کے خلاف۔ سپر گروک ہیویمیٹا لاما کی حالیہ نسلوں میں اوپن سورس کے لیے اپنی وابستگی کو کم کر رہا ہے۔

یورپی تحقیق اور سٹارٹ اپ ایکو سسٹم کے لیے - جو کہ کھلے ماڈلز پر بہت زیادہ انحصار کرتا ہے جیسے کہ پلیٹ فارم پر ہوسٹ کیا جاتا ہے جیسے ہیگنگ فیس - وزن، مصنوعی ڈیٹا، اور کھلے لائسنس کے تحت لائبریریوں کی دستیابی ایک طاقتور متبادل کی نمائندگی کرتی ہے۔ چینی ماڈلز اور امریکی جو مقبولیت اور بینچ مارک کی درجہ بندی پر حاوی ہیں۔

خصوصی مواد - یہاں کلک کریں۔  ٹیلیگرام پر مائیکروسافٹ کوپائلٹ کا استعمال کیسے کریں: مکمل گائیڈ

ہائبرڈ MoE فن تعمیر: بڑے پیمانے پر ایجنٹوں کے لئے کارکردگی

Nemotron 3 کی مرکزی تکنیکی خصوصیت a ہے۔ لیٹنٹ مکسچر آف ایکسپرٹس (MoE) کا ہائبرڈ فن تعمیرہر ایک اندازہ میں ماڈل کے تمام پیرامیٹرز کو چالو کرنے کے بجائے، ان میں سے صرف ایک حصہ آن کیا جاتا ہے، ماہرین کا سب سیٹ جو کام سے سب سے زیادہ متعلقہ ہے یا سوال میں ٹوکن۔

یہ نقطہ نظر کی اجازت دیتا ہے کمپیوٹیشنل لاگت اور میموری کی کھپت کو تیزی سے کم کریں۔اس سے ٹوکن تھرو پٹ میں بھی اضافہ ہوتا ہے۔ ملٹی ایجنٹ آرکیٹیکچرز کے لیے، جہاں درجنوں یا سینکڑوں ایجنٹس مسلسل پیغامات کا تبادلہ کرتے ہیں، یہ کارکردگی نظام کو GPU اور کلاؤڈ لاگت کے لحاظ سے غیر مستحکم ہونے سے روکنے کے لیے کلیدی حیثیت رکھتی ہے۔

NVIDIA اور آزاد بینچ مارکس کے اشتراک کردہ اعداد و شمار کے مطابق، Nemotron 3 Nano حاصل کرتا ہے۔ فی سیکنڈ چار گنا زیادہ ٹوکن تک اپنے پیشرو، Nemotron 2 Nano کے مقابلے میں، یہ غیر ضروری استدلال کے ٹوکن کی پیداوار کو تقریباً 60 فیصد تک کم کرتا ہے۔ عملی طور پر، اس کا مطلب ہے مساوی یا اس سے بھی زیادہ درست جوابات، لیکن کم "لفظی پن" اور کم قیمت فی سوال کے ساتھ۔

ہائبرڈ MoE فن تعمیر، مخصوص تربیتی تکنیکوں کے ساتھ مل کر، اس کا باعث بنا ہے۔ بہت سے جدید ترین اوپن ماڈلز ماہر اسکیموں کو اپناتے ہیں۔Nemotron 3 اس رجحان میں شامل ہوتا ہے، لیکن خاص طور پر ایجنٹ AI پر توجہ مرکوز کرتا ہے: ایجنٹوں کے درمیان ہم آہنگی، آلات کے استعمال، طویل ریاستوں کو سنبھالنے، اور قدم بہ قدم منصوبہ بندی کے لیے ڈیزائن کیے گئے اندرونی راستے۔

تین سائز: نینو، سپر، اور الٹرا مختلف کام کے بوجھ کے لیے

نیموٹرون 3 ماڈل فن تعمیر

Nemotron 3 فیملی کو منظم کیا گیا ہے۔ MoE ماڈل کے تین اہم سائز, یہ سب کھلے ہیں اور کم فعال پیرامیٹرز کے ساتھ ماہر فن تعمیر کی بدولت:

  • نیموٹرون 3 نینو: تقریباً 30.000 بلین کل پیرامیٹرز، کے ساتھ 3.000 بلین اثاثے فی ٹوکناسے ہدف بنائے گئے کاموں کے لیے ڈیزائن کیا گیا ہے جہاں کارکردگی اہمیت رکھتی ہے: سافٹ ویئر ڈیبگنگ، دستاویز کا خلاصہ، معلومات کی بازیافت، نظام کی نگرانی، یا خصوصی AI معاونین۔
  • نیموٹرون 3 سپر: تقریباً 100.000 بلین پیرامیٹرز، کے ساتھ 10.000 ارب کے اثاثے ہر قدم پر. کی طرف تیار ہے۔ ملٹی ایجنٹ فن تعمیر میں جدید استدلالکم تاخیر کے ساتھ یہاں تک کہ جب متعدد ایجنٹ پیچیدہ بہاؤ کو حل کرنے میں تعاون کرتے ہیں۔
  • نیموٹرون 3 الٹرا: بالائی سطح، تقریباً 500.000 بلین پیرامیٹرز کے ساتھ اور اس تک 50.000 بلین اثاثے فی ٹوکنیہ تحقیق، اسٹریٹجک منصوبہ بندی، اعلیٰ سطحی فیصلے کی حمایت، اور خاص طور پر AI نظاموں کے لیے ایک طاقتور استدلال کے انجن کے طور پر کام کرتا ہے۔

عملی طور پر، یہ تنظیموں کی اجازت دیتا ہے اپنے بجٹ اور ضروریات کے مطابق ماڈل کا سائز منتخب کریں۔بڑے پیمانے پر کام کے بوجھ اور سخت اخراجات کے لیے نینو؛ جب بہت سے تعاون کرنے والے ایجنٹوں کے ساتھ استدلال کی زیادہ گہرائی کی ضرورت ہو تو بہت اچھا ہے۔ اور الٹرا ان معاملات کے لیے جہاں معیار اور طویل سیاق و سباق GPU کی لاگت سے کہیں زیادہ ہے۔

خصوصی مواد - یہاں کلک کریں۔  اجازت کے بغیر خودکار طور پر شروع ہونے والے پروگراموں کو ہٹانے کے لیے Autoruns کا استعمال کیسے کریں۔

اب تک صرف Nemotron 3 Nano فوری استعمال کے لیے دستیاب ہے۔سپر اور الٹرا ویریئنٹس کا منصوبہ 2026 کی پہلی ششماہی کے لیے بنایا گیا ہے، جس سے یورپی کمپنیوں اور لیبارٹریوں کو پہلے نینو کے ساتھ تجربہ کرنے، پائپ لائنیں قائم کرنے اور، بعد میں، ایسے معاملات کو منتقل کرنے کا وقت دیا گیا ہے جن میں زیادہ صلاحیت کی ضرورت ہوتی ہے۔

Nemotron 3 Nano: 1 ملین ٹوکن ونڈو اور لاگت پر مشتمل ہے۔

نیموٹرون 3 نینو

Nemotron 3 نینو، آج تک، خاندان کا عملی سربراہNVIDIA اسے رینج میں سب سے زیادہ کمپیوٹیشنل لاگت سے موثر ماڈل کے طور پر بیان کرتا ہے، جو ملٹی ایجنٹ ورک فلو اور گہرے لیکن دہرائے جانے والے کاموں میں زیادہ سے زیادہ کارکردگی فراہم کرنے کے لیے موزوں ہے۔

اس کی تکنیکی خصوصیات میں سے، مندرجہ ذیل نمایاں ہیں: ایک ملین ٹوکن تک کی سیاق و سباق کی ونڈویہ وسیع دستاویزات، پورے کوڈ ریپوزٹریز، یا کثیر قدمی کاروباری عمل کے لیے میموری کو برقرار رکھنے کی اجازت دیتا ہے۔ بینکنگ، ہیلتھ کیئر، یا پبلک ایڈمنسٹریشن میں یورپی ایپلی کیشنز کے لیے، جہاں ریکارڈز بہت زیادہ ہو سکتے ہیں، یہ طویل مدتی سیاق و سباق کی صلاحیت خاص طور پر قابل قدر ہے۔

آزاد تنظیم کے معیارات مصنوعی تجزیہ نیموٹرون 3 نینو کو سب سے متوازن اوپن سورس ماڈلز میں سے ایک کے طور پر رکھتا ہے۔ یہ ذہانت، درستگی اور رفتار کو یکجا کرتا ہے، سینکڑوں ٹوکن فی سیکنڈ میں تھرو پٹ ریٹ کے ساتھ۔ یہ مجموعہ اسپین میں AI انٹیگریٹرز اور سروس فراہم کنندگان کے لیے پرکشش بناتا ہے جنہیں بنیادی ڈھانچے کی لاگت میں اضافہ کیے بغیر صارف کے اچھے تجربے کی ضرورت ہوتی ہے۔

استعمال کے معاملات کے لحاظ سے، NVIDIA نینو کو نشانہ بنا رہا ہے۔ مواد کا خلاصہ، سافٹ ویئر ڈیبگنگ، معلومات کی بازیافت، اور انٹرپرائز AI معاونینبے کار استدلال کے ٹوکنز کی کمی کی بدولت، ایسے ایجنٹوں کو چلانا ممکن ہے جو صارفین یا سسٹمز کے ساتھ طویل گفتگو کو بغیر کسی قیاس آرائی کے بغیر برقرار رکھتے ہیں۔

ڈیٹا اور لائبریریاں کھولیں: NeMo جم، NeMo RL اور Evaluator

NeMo لائبریریاں

Nemotron 3 کی سب سے مخصوص خصوصیات میں سے ایک یہ ہے۔ یہ ماڈل وزن جاری کرنے تک محدود نہیں ہے۔NVIDIA خاندان کے ساتھ تربیت، ٹیوننگ، اور جانچ کرنے والے ایجنٹوں کے لیے کھلے وسائل کے ایک جامع سوٹ کے ساتھ ہے۔

ایک طرف، یہ ایک مصنوعی کارپس دستیاب کرتا ہے۔ پری ٹریننگ، پوسٹ ٹریننگ، اور کمک ڈیٹا کے کئی ٹریلین ٹوکنیہ ڈیٹاسیٹس، استدلال، کوڈنگ، اور ملٹی سٹیپ ورک فلوز پر مرکوز، کمپنیوں اور تحقیقی مراکز کو اجازت دیتے ہیں کہ وہ شروع سے شروع کیے بغیر اپنے ڈومین کے لیے مخصوص مختلف قسمیں (جیسے قانونی، صحت کی دیکھ بھال، یا صنعتی) تیار کریں۔

ان وسائل میں سے، درج ذیل ہیں: نیموٹرون ایجنٹ سیفٹی ڈیٹاسیٹیہ حقیقی دنیا کے منظرناموں میں ایجنٹ کے رویے پر ٹیلی میٹری ڈیٹا اکٹھا کرتا ہے۔ اس کا مقصد ٹیموں کو پیچیدہ خود مختار نظاموں کی حفاظت کی پیمائش اور اسے مضبوط بنانے میں مدد کرنا ہے: جب کوئی ایجنٹ حساس ڈیٹا کا سامنا کرتا ہے تو وہ کیا اقدامات کرتا ہے، یہ مبہم یا ممکنہ طور پر نقصان دہ کمانڈز پر کیسے رد عمل ظاہر کرتا ہے۔

خصوصی مواد - یہاں کلک کریں۔  اسپیچ ریکگنیشن کو آٹومیشن کے میدان میں کیسے استعمال کیا جاتا ہے؟

ٹولز سیکشن کے حوالے سے، NVIDIA لانچ کر رہا ہے۔ NeMo جم اور NeMo RL بطور اوپن سورس لائبریری حفاظت اور کارکردگی کا اندازہ لگانے کے لیے NeMo Evaluator کے ساتھ، کمک کی تربیت اور پوسٹ ٹریننگ کے لیے۔ یہ لائبریریاں نیموٹرون فیملی کے ساتھ استعمال کے لیے تیار نقلی ماحول اور پائپ لائن فراہم کرتی ہیں، لیکن ان کو دوسرے ماڈلز تک بڑھایا جا سکتا ہے۔

یہ تمام مواد — وزن، ڈیٹا سیٹس، اور کوڈ — کے ذریعے تقسیم کیا جاتا ہے۔ GitHub اور Hugging Face NVIDIA اوپن ماڈل لائسنس کے تحت لائسنس یافتہ ہیں۔تاکہ یورپی ٹیمیں اسے بغیر کسی رکاوٹ کے اپنے MLOps میں ضم کر سکیں۔ پرائم انٹیلیکٹ اور انسلتھ جیسی کمپنیاں پہلے ہی نیمو جم کو براہ راست اپنے ورک فلو میں شامل کر رہی ہیں تاکہ Nemotron پر کمک سیکھنے کو آسان بنایا جا سکے۔

عوامی بادلوں اور یورپی ماحولیاتی نظام میں دستیابی۔

Nemotron 3 نینو گلے لگانے والا چہرہ

Nemotron 3 Nano اب دستیاب ہے۔ گلے لگانے والا چہرہ y GitHub کےنیز انفرنس فراہم کنندگان جیسے کہ Baseten، DeepInfra، Fireworks، FriendliAI، OpenRouter، اور Together AI کے ذریعے۔ اس سے اسپین میں ترقیاتی ٹیموں کے لیے API کے ذریعے ماڈل کی جانچ کرنے یا ضرورت سے زیادہ پیچیدگی کے بغیر اسے اپنے بنیادی ڈھانچے پر تعینات کرنے کا دروازہ کھل جاتا ہے۔

بادل کے سامنے، Nemotron 3 Nano Amazon Bedrock کے ذریعے AWS میں شامل ہوتا ہے۔ سرور لیس انفرنس کے لیے، اور گوگل کلاؤڈ، کور ویو، کروسو، مائیکروسافٹ فاؤنڈری، نیبیئس، این اسکیل، اور یوٹا کے لیے تعاون کا اعلان کیا ہے۔ ان پلیٹ فارمز پر پہلے سے کام کرنے والی یورپی تنظیموں کے لیے، یہ ان کے فن تعمیر میں زبردست تبدیلیوں کے بغیر نموٹرون کو اپنانا آسان بناتا ہے۔

عوامی بادل کے علاوہ، NVIDIA Nemotron 3 Nano کے استعمال کو فروغ دے رہا ہے۔ NIM مائیکرو سروس کسی بھی NVIDIA-تیز انفراسٹرکچر پر قابل تعینات ہے۔یہ ہائبرڈ منظرناموں کی اجازت دیتا ہے: بین الاقوامی بادلوں میں بوجھ کا کچھ حصہ اور مقامی ڈیٹا سینٹرز یا یورپی کلاؤڈز میں جو EU میں ڈیٹا کی رہائش کو ترجیح دیتے ہیں۔

ورژنز نیموٹرون 3 سپر اور الٹرا، انتہائی استدلال کے کام کے بوجھ اور بڑے پیمانے پر ملٹی ایجنٹ سسٹم کی طرف تیار ہیں، ہیں۔ 2026 کی پہلی ششماہی کے لیے منصوبہ بنایا گیا ہے۔یہ ٹائم لائن یورپی تحقیق اور کاروباری ماحولیاتی نظام کو نینو کے ساتھ تجربہ کرنے، استعمال کے معاملات کی توثیق کرنے، اور ضرورت پڑنے پر بڑے ماڈلز میں منتقلی کی حکمت عملیوں کو ڈیزائن کرنے کی اجازت دیتی ہے۔

Nemotron 3 NVIDIA کے سرکردہ فراہم کنندگان میں سے ایک ہے۔ اعلی درجے کے کھلے ماڈلز ایجنٹی AI کی طرف تیار ہیں۔ایک تجویز کے ساتھ جو تکنیکی کارکردگی (ہائبرڈ MoE، NVFP4، بڑے پیمانے پر سیاق و سباق)، کھلے پن (وزن، ڈیٹا سیٹس اور دستیاب لائبریریوں) اور ڈیٹا کی خودمختاری اور شفافیت پر واضح توجہ مرکوز کرتی ہے، وہ پہلو جو سپین اور باقی یورپ میں خاص طور پر حساس ہیں، جہاں AI کو آڈٹ کرنے کے لیے ضابطے اور دباؤ بہت زیادہ بڑھ رہا ہے۔

Microsoft Discovery IA-2
متعلقہ آرٹیکل:
مائیکروسافٹ ڈسکوری AI ذاتی مصنوعی ذہانت کے ساتھ سائنسی اور تعلیمی کامیابیاں حاصل کرتا ہے