Nemotron 3: NVIDIA-ს დიდი ღია ფსონი მრავალაგენტიანი ხელოვნური ინტელექტისთვის

Ბოლო განახლება: 17/12/2025

  • Nemotron 3 არის მოდელების, მონაცემებისა და ბიბლიოთეკების ღია ოჯახი, რომელიც ორიენტირებულია აგენტურ ხელოვნურ ინტელექტსა და მრავალაგენტიან სისტემებზე.
  • ის მოიცავს სამ MoE ზომას (Nano, Super და Ultra) ჰიბრიდული არქიტექტურით და NVIDIA Blackwell-ზე ეფექტური 4-ბიტიანი ტრენინგით.
  • Nemotron 3 Nano ამჟამად ხელმისაწვდომია ევროპაში Hugging Face-ის, საჯარო ღრუბლების და NIM მიკროსერვისის საშუალებით, 1 მილიონი ტოკენის ფანჯრით.
  • ეკოსისტემა აღჭურვილია უზარმაზარი მონაცემთა ნაკრებებით, NeMo Gym-ით, NeMo RL-ით და Evaluator-ით, რათა მომზადდეს, დაკონფიგურირდეს და აუდიტი ჩაუტარდეს სუვერენულ ხელოვნურ ინტელექტზე მომუშავე აგენტებს.

Nemotron 3 ხელოვნური ინტელექტის მოდელი

ხელოვნური ინტელექტის რბოლა მარტივი, იზოლირებული ჩატბოტებიდან აგენტურ სისტემებზე გადადის, რომლებიც ერთმანეთთან თანამშრომლობენ, მართავენ ხანგრძლივ სამუშაო პროცესებს და აუდიტის უნარი უნდა ჰქონდეთ. ამ ახალ სცენარში, NVIDIA-მ გადაწყვიტა საკმაოდ მკაფიო ნაბიჯის გადადგმა: გახსნას არა მხოლოდ მოდელები, არამედ მონაცემები და ინსტრუმენტებიც.რათა კომპანიებმა, საჯარო ადმინისტრაციებმა და კვლევითმა ცენტრებმა შეძლონ საკუთარი ხელოვნური ინტელექტის პლატფორმების შექმნა მეტი კონტროლის მქონე.

ეს მოძრაობა მატერიალიზებულია Nemotron 3, ღია მოდელების ოჯახი, რომელიც ორიენტირებულია მრავალაგენტიან ხელოვნურ ინტელექტზე. ის ცდილობს გააერთიანოს მაღალი შესრულება, დაბალი დასკვნის ხარჯები და გამჭვირვალობა. წინადადება არ არის განკუთვნილი, როგორც კიდევ ერთი ზოგადი დანიშნულების ჩატბოტი, არამედ როგორც ბაზა, რომელზეც განლაგდება აგენტები, რომლებიც მსჯელობენ, გეგმავენ და ასრულებენ რთულ ამოცანებს რეგულირებად სექტორებში.ეს განსაკუთრებით აქტუალურია ევროპასა და ესპანეთში, სადაც მონაცემთა სუვერენიტეტი და მარეგულირებელი ნორმების დაცვა მნიშვნელოვანია.

აგენტისა და სუვერენული ხელოვნური ინტელექტის მოდელების ღია ოჯახი

ნემოტრონი 3 წარმოდგენილია როგორც სრული ეკოსისტემა: მოდელები, მონაცემთა ნაკრებები, ბიბლიოთეკები და სასწავლო რეცეპტები ღია ლიცენზიებით. NVIDIA-ს იდეა იმაში მდგომარეობს, რომ ორგანიზაციებმა არა მხოლოდ ხელოვნური ინტელექტი მოიხმარონ, როგორც გაუმჭვირვალე სერვისი, არამედ შეძლონ შიგნით არსებულის შემოწმება, მოდელების ადაპტირება საკუთარ დომენებთან და მათი საკუთარ ინფრასტრუქტურაზე განთავსება, ღრუბელში თუ ადგილობრივ მონაცემთა ცენტრებში.

კომპანია ამ სტრატეგიას თავისი ვალდებულების ფარგლებში აყალიბებს: სუვერენული ხელოვნური ინტელექტიევროპის, სამხრეთ კორეისა და სხვა რეგიონების მთავრობები და კომპანიები ეძებენ ღია ალტერნატივებს დახურული ან უცხოური სისტემებისთვის, რომლებიც ხშირად არ შეესაბამება მათ მონაცემთა დაცვის კანონმდებლობას ან აუდიტის მოთხოვნებს. Nemotron 3-ის მიზანია იყოს ტექნიკური საფუძველი, რომელზეც აშენდება ეროვნული, სექტორული ან კორპორატიული მოდელები უფრო დიდი ხილვადობითა და კონტროლით.

Პარალელურად, NVIDIA აძლიერებს თავის პოზიციას აპარატურის მიღმააქამდე ის ძირითადად საცნობარო გრაფიკული პროვაიდერს წარმოადგენდა; Nemotron 3-ით ის ასევე პოზიციონირებს მოდელირებისა და ტრენინგის ინსტრუმენტების დონეზე, უფრო პირდაპირ კონკურენციას უწევს ისეთ მოთამაშეებს, როგორიცაა OpenAI, Google, Anthropic ან თუნდაც Meta, და პრემიუმ მოდელებს, როგორიცაა სუპერგროკ ჰევიLlama-ს ბოლო თაობებში Meta ამცირებს ღია კოდისადმი ერთგულებას.

ევროპული კვლევითი და სტარტაპების ეკოსისტემისთვის, რომელიც დიდად არის დამოკიდებული Hugging Face-ის მსგავს პლატფორმებზე განთავსებულ ღია მოდელებზე, ღია ლიცენზიებით წონების, სინთეზური მონაცემებისა და ბიბლიოთეკების ხელმისაწვდომობა წარმოადგენს ძლიერ ალტერნატივას... ჩინური მოდელები და ამერიკელები, რომლებიც დომინირებენ პოპულარობისა და საორიენტაციო რეიტინგებში.

ექსკლუზიური შინაარსი - დააწკაპუნეთ აქ  Microsoft Store არ იხსნება ან გამუდმებით იხურება: დეტალური გადაწყვეტილებები

ჰიბრიდული MoE არქიტექტურა: ეფექტურობა მასშტაბური აგენტებისთვის

Nemotron 3-ის მთავარი ტექნიკური მახასიათებელია ექსპერტების ლატენტური ნარევის (MoE) ჰიბრიდული არქიტექტურათითოეულ დასკვნაში მოდელის ყველა პარამეტრის გააქტიურების ნაცვლად, მათი მხოლოდ მცირე ნაწილია ჩართული, ექსპერტების ქვეჯგუფი, რომლებიც ყველაზე მეტად შეეფერებიან მოცემულ ამოცანას ან ტოკენს.

ეს მიდგომა საშუალებას იძლევა მკვეთრად შეამცირებს გამოთვლით ხარჯებს და მეხსიერების მოხმარებასეს ასევე ზრდის ტოკენების გამტარუნარიანობას. მრავალაგენტიანი არქიტექტურისთვის, სადაც ათობით ან ასობით აგენტი განუწყვეტლივ ცვლის შეტყობინებებს, ეს ეფექტურობა გადამწყვეტია სისტემის GPU-სა და ღრუბლოვანი ხარჯების თვალსაზრისით არამდგრადობის თავიდან ასაცილებლად.

NVIDIA-სა და დამოუკიდებელი საორიენტაციო ტესტების მიერ გაზიარებული მონაცემების თანახმად, Nemotron 3 Nano აღწევს... წამში ოთხჯერ მეტი ტოკენი თავის წინამორბედ Nemotron 2 Nano-სთან შედარებით, ის დაახლოებით 60%-ით ამცირებს არასაჭირო მსჯელობის ტოკენების გენერირებას. პრაქტიკაში ეს ნიშნავს თანაბრად ან თუნდაც უფრო ზუსტ პასუხებს, მაგრამ ნაკლები „სიტყვიერებით“ და თითო მოთხოვნაზე უფრო დაბალი ღირებულებით.

ჰიბრიდული MoE არქიტექტურა, სპეციფიკურ სასწავლო ტექნიკასთან ერთად, განაპირობებს ყველაზე მოწინავე ღია მოდელების უმეტესობა ექსპერტულ სქემებს იყენებს.Nemotron 3 ამ ტენდენციას უერთდება, მაგრამ კონკრეტულად აგენტურ ხელოვნურ ინტელექტზეა ფოკუსირებული: შიდა მარშრუტები, რომლებიც შექმნილია აგენტებს შორის კოორდინაციისთვის, ინსტრუმენტების გამოყენებისთვის, გრძელი მდგომარეობების მართვისა და ეტაპობრივი დაგეგმვისთვის.

სამი ზომა: Nano, Super და Ultra სხვადასხვა სამუშაო დატვირთვებისთვის

Nemotron 3 მოდელის არქიტექტურა

Nemotron 3 ოჯახი ორგანიზებულია MoE მოდელის სამი ძირითადი ზომა, ყველა მათგანი ღიაა და შემცირებული აქტიური პარამეტრებით ექსპერტის არქიტექტურის წყალობით:

  • ნემოტრონ 3 ნანო: დაახლოებით 30.000 მილიარდი პარამეტრი სულ, დაახლოებით 3.000 მილიარდი აქტივი თითო ტოკენზეის შექმნილია მიზნობრივი ამოცანებისთვის, სადაც ეფექტურობა მნიშვნელოვანია: პროგრამული უზრუნველყოფის გამართვა, დოკუმენტების შეჯამება, ინფორმაციის მოძიება, სისტემის მონიტორინგი ან სპეციალიზებული ხელოვნური ინტელექტის ასისტენტები.
  • ნემოტრონ 3 სუპერდაახლოებით 100.000 მილიარდი პარამეტრით, 10.000 მილიარდი აქტივი ყოველ ნაბიჯზე. ის მიმართულია მოწინავე მსჯელობა მრავალაგენტიან არქიტექტურებშიდაბალი ლატენტობით, მაშინაც კი, როდესაც მრავალი აგენტი თანამშრომლობს რთული ნაკადების გადასაჭრელად.
  • ნემოტრონ 3 ულტრა: ზედა დონე, დაახლოებით 500.000 მილიარდი პარამეტრით და მაქსიმუმ 50.000 მილიარდი აქტივი თითო ტოკენზეის მოქმედებს როგორც ძლიერი მსჯელობის ძრავა კვლევის, სტრატეგიული დაგეგმვის, მაღალი დონის გადაწყვეტილებების მხარდაჭერისა და განსაკუთრებით მომთხოვნი ხელოვნური ინტელექტის სისტემებისთვის.

პრაქტიკაში, ეს ორგანიზაციებს საშუალებას აძლევს მოდელის ზომა შეარჩიეთ თქვენი ბიუჯეტისა და მოთხოვნების შესაბამისადNano მასიური, ინტენსიური სამუშაო დატვირთვებისა და შეზღუდული ხარჯებისთვის; Super, როდესაც ბევრი თანამშრომლობითი აგენტის შემთხვევაში საჭიროა უფრო ღრმა მსჯელობა; და Ultra იმ შემთხვევებისთვის, როდესაც ხარისხი და ხანგრძლივი კონტექსტი აჭარბებს GPU-ს ღირებულებას.

ექსკლუზიური შინაარსი - დააწკაპუნეთ აქ  TAG Heuer Connected Calibre E5: ნახტომი საკუთრების პროგრამულ უზრუნველყოფასა და New Balance-ის გამოცემაზე

Ახლა მხოლოდ Nemotron 3 Nano არის ხელმისაწვდომი დაუყოვნებლივი გამოყენებისთვის.Super და Ultra ვარიანტების გამოშვება 2026 წლის პირველი ნახევრისთვის იგეგმება, რაც ევროპულ კომპანიებსა და ლაბორატორიებს საშუალებას მისცემს, ჯერ Nano-თი ექსპერიმენტები ჩაატარონ, მილსადენები შექმნან და მოგვიანებით, უფრო დიდი სიმძლავრის მომთხოვნი შემთხვევების მიგრაცია განახორციელონ.

Nemotron 3 Nano: 1 მილიონი ტოკენის ფანჯარა და შეფარდებული ღირებულება

ნემოტრონ 3 ნანო

Nemotron 3 Nano, დღეის მდგომარეობით, ოჯახის პრაქტიკული ლიდერიNVIDIA მას აღწერს, როგორც ყველაზე გამოთვლითი ხარჯების თვალსაზრისით ეფექტურ მოდელს თავის ასორტიმენტში, ოპტიმიზირებულია მაქსიმალური შესრულების უზრუნველსაყოფად მრავალაგენტიან სამუშაო პროცესებსა და ინტენსიურ, მაგრამ განმეორებად ამოცანებში.

მის ტექნიკურ მახასიათებლებს შორის გამოირჩევა შემდეგი: ერთ მილიონამდე ტოკენის კონტექსტური ფანჯარაეს საშუალებას იძლევა შეინახოს მეხსიერება ვრცელი დოკუმენტებისთვის, მთელი კოდის საცავების ან მრავალსაფეხურიანი ბიზნეს პროცესებისთვის. საბანკო, ჯანდაცვის ან საჯარო ადმინისტრირების ევროპული აპლიკაციებისთვის, სადაც ჩანაწერები შეიძლება იყოს მოცულობითი, ეს გრძელვადიანი კონტექსტის შესაძლებლობა განსაკუთრებით ფასეულია.

დამოუკიდებელი ორგანიზაციის სტანდარტები ხელოვნური ანალიზი Nemotron 3 Nano-ს ერთ-ერთ ყველაზე დაბალანსებულ ღია კოდის მოდელად ასახელებს. ის აერთიანებს ინტელექტს, სიზუსტესა და სიჩქარეს, წამში ასობით ტოკენის გამტარუნარიანობით. ეს კომბინაცია მას მიმზიდველს ხდის ესპანეთში ხელოვნური ინტელექტის ინტეგრატორებისა და მომსახურების მიმწოდებლებისთვის, რომლებსაც სჭირდებათ კარგი მომხმარებლის გამოცდილება ინფრასტრუქტურული ხარჯების მკვეთრი ზრდის გარეშე.

გამოყენების შემთხვევების თვალსაზრისით, NVIDIA Nano-ს სამიზნედ მიიჩნევს კონტენტის შეჯამება, პროგრამული უზრუნველყოფის გამართვა, ინფორმაციის მოძიება და საწარმოს ხელოვნური ინტელექტის ასისტენტებიზედმეტი მსჯელობის ტოკენების შემცირების წყალობით, შესაძლებელია ისეთი აგენტების გაშვება, რომლებიც მომხმარებლებთან ან სისტემებთან ხანგრძლივ საუბრებს ინარჩუნებენ დასკვნების ხარჯების მკვეთრი ზრდის გარეშე.

ღია მონაცემები და ბიბლიოთეკები: NeMo Gym, NeMo RL და Evaluator

NeMo-ს ბიბლიოთეკები

Nemotron 3-ის ერთ-ერთი ყველაზე გამორჩეული თვისება ის არის, რომ ეს არ შემოიფარგლება მხოლოდ მოდელის წონის გამოქვეყნებითNVIDIA ოჯახს თან ახლავს ღია რესურსების ყოვლისმომცველი ნაკრები აგენტების ტრენინგის, რეგულირებისა და შეფასებისთვის.

ერთი მხრივ, ის ხელმისაწვდომს ხდის სინთეზურ კორპუსს რამდენიმე ტრილიონი ტოკენი წინასწარი ტრენინგის, ტრენინგის შემდგომი და გაძლიერების მონაცემებითეს მონაცემთა ნაკრებები, რომლებიც ორიენტირებულია მსჯელობაზე, კოდირებასა და მრავალსაფეხურიან სამუშაო პროცესებზე, საშუალებას აძლევს კომპანიებსა და კვლევით ცენტრებს შექმნან Nemotron-ის საკუთარი, დომენ-სპეციფიკური ვარიანტები (მაგ., იურიდიული, ჯანდაცვის ან სამრეწველო) ნულიდან დაწყების გარეშე.

ამ რესურსებს შორის გამოირჩევა შემდეგი: Nemotron-ის აგენტის უსაფრთხოების მონაცემთა ნაკრებიის აგროვებს ტელემეტრიულ მონაცემებს აგენტის ქცევის შესახებ რეალურ სცენარებში. მისი მიზანია დაეხმაროს გუნდებს რთული ავტონომიური სისტემების უსაფრთხოების გაზომვასა და გაძლიერებაში: დაწყებული იმ ქმედებებიდან, რომლებიც აგენტის მიერ ხორციელდება მგრძნობიარე მონაცემებთან შეხვედრისას, და დამთავრებული იმით, თუ როგორ რეაგირებს ის ორაზროვან ან პოტენციურად მავნე ბრძანებებზე.

ექსკლუზიური შინაარსი - დააწკაპუნეთ აქ  Windows 11-ისთვის გამოსული უახლესი ფუნქციები: ხელოვნური ინტელექტი და თქვენი კომპიუტერის მართვის ახალი გზები

რაც შეეხება ხელსაწყოების განყოფილებას, NVIDIA იწყებს NeMo Gym და NeMo RL, როგორც ღია კოდის ბიბლიოთეკები გაძლიერების ტრენინგისა და შემდგომი ტრენინგისთვის, NeMo Evaluator-თან ერთად უსაფრთხოებისა და მუშაობის შესაფასებლად. ეს ბიბლიოთეკები Nemotron-ის ოჯახით მზა სიმულაციურ გარემოსა და მილსადენებს გვთავაზობენ, მაგრამ შეიძლება სხვა მოდელებზეც გაფართოვდეს.

მთელი ეს მასალა - წონები, მონაცემთა ნაკრებები და კოდი - ნაწილდება GitHub და Hugging Face ლიცენზირებულია NVIDIA Open Model License-ის ფარგლებში.რათა ევროპულმა გუნდებმა შეძლონ მისი შეუფერხებლად ინტეგრირება საკუთარ MLOps-ებში. ისეთი კომპანიები, როგორიცაა Prime Intellect და Unsloth, უკვე იყენებენ NeMo Gym-ს პირდაპირ თავიანთ სამუშაო პროცესებში, რათა გაამარტივონ გაძლიერებული სწავლება Nemotron-ზე.

ხელმისაწვდომობა საზოგადოებრივ ღრუბლებსა და ევროპულ ეკოსისტემაში

Nemotron 3 Nano-ს მომხიბვლელი სახე

Nemotron 3 Nano ახლა უკვე ხელმისაწვდომია სახეზე ჩახუტება y GitHubასევე ისეთი ინფერენციის პროვაიდერების მეშვეობით, როგორიცაა Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter და Together AI. ეს ესპანეთში განვითარების გუნდებს საშუალებას აძლევს, გამოსცადონ მოდელი API-ის საშუალებით ან განათავსონ ის საკუთარ ინფრასტრუქტურაზე ზედმეტი სირთულის გარეშე.

ღრუბლის ფრონტზე, Nemotron 3 Nano შეუერთდა AWS-ს Amazon Bedrock-ის მეშვეობით სერვერის გარეშე ინფერენციისთვის და გამოაცხადა Google Cloud-ის, CoreWeave-ის, Crusoe-ს, Microsoft Foundry-ის, Nebius-ის, Nscale-ის და Yotta-ს მხარდაჭერა. ევროპული ორგანიზაციებისთვის, რომლებიც უკვე მუშაობენ ამ პლატფორმებზე, ეს აადვილებს Nemotron-ის დანერგვას მათ არქიტექტურაში მკვეთრი ცვლილებების გარეშე.

საჯარო ღრუბლის გარდა, NVIDIA ხელს უწყობს Nemotron 3 Nano-ს გამოყენებას, როგორც NIM მიკროსერვისის განთავსება შესაძლებელია ნებისმიერ NVIDIA-ს მიერ დაჩქარებულ ინფრასტრუქტურაზეეს ჰიბრიდული სცენარების საშუალებას იძლევა: დატვირთვის ნაწილი საერთაშორისო ღრუბლებშია, ნაწილი კი ადგილობრივ მონაცემთა ცენტრებში ან ევროპულ ღრუბლებში, რომლებიც მონაცემთა ევროკავშირში რეზიდენტობას ანიჭებენ უპირატესობას.

ვერსიები ნემოტრონ 3 სუპერ და ულტრა, ექსტრემალური მსჯელობის სამუშაო დატვირთვებისა და მასშტაბური მრავალაგენტიანი სისტემებისთვისაა განკუთვნილი, დაგეგმილია 2026 წლის პირველი ნახევრისთვისეს ვადები ევროპულ კვლევით და ბიზნეს ეკოსისტემას საშუალებას აძლევს, ექსპერიმენტები ჩაატაროს ნანოსთან, დაადასტუროს გამოყენების შემთხვევები და საჭიროების შემთხვევაში შეიმუშაოს მიგრაციის სტრატეგიები უფრო დიდ მოდელებზე.

Nemotron 3 NVIDIA-ს ერთ-ერთ წამყვან პროვაიდერად ასახელებს. მაღალი კლასის ღია მოდელები, რომლებიც აგენტურ ხელოვნურ ინტელექტზეა ორიენტირებულიწინადადებით, რომელიც აერთიანებს ტექნიკურ ეფექტურობას (ჰიბრიდული განათლების სამინისტრო, NVFP4, მასიური კონტექსტი), ღიაობას (წონები, მონაცემთა ნაკრებები და ხელმისაწვდომი ბიბლიოთეკები) და მონაცემთა სუვერენიტეტსა და გამჭვირვალობაზე მკაფიო ფოკუსირებას, ასპექტებს, რომლებიც განსაკუთრებით მგრძნობიარეა ესპანეთსა და ევროპის დანარჩენ ნაწილში, სადაც ხელოვნური ინტელექტის აუდიტის რეგულირება და ზეწოლა სულ უფრო იზრდება.

Microsoft Discovery IA-2
დაკავშირებული სტატია:
Microsoft Discovery AI პერსონალიზებული ხელოვნური ინტელექტის გამოყენებით სამეცნიერო და საგანმანათლებლო მიღწევებს უწყობს ხელს