- Nemotron 3 เป็นตระกูลโมเดล ข้อมูล และไลบรารีแบบเปิดที่มุ่งเน้นไปที่ปัญญาประดิษฐ์แบบเอเจนต์และระบบหลายเอเจนต์
- ประกอบด้วยหน่วยประมวลผล MoE สามขนาด (Nano, Super และ Ultra) พร้อมสถาปัตยกรรมแบบไฮบริดและการประมวลผล 4 บิตที่มีประสิทธิภาพบน NVIDIA Blackwell
- ขณะนี้ Nemotron 3 Nano พร้อมใช้งานในยุโรปแล้วผ่านทาง Hugging Face, ระบบคลาวด์สาธารณะ และในรูปแบบไมโครเซอร์วิสของ NIM โดยมีจำนวนโทเค็นเริ่มต้นที่ 1 ล้านโทเค็น
- ระบบนิเวศนี้สมบูรณ์ด้วยชุดข้อมูลขนาดใหญ่ NeMo Gym, NeMo RL และ Evaluator เพื่อฝึกฝน ปรับแต่ง และตรวจสอบตัวแทน AI ที่เป็นอิสระ
การแข่งขันด้านปัญญาประดิษฐ์กำลังเปลี่ยนจากแชทบอทแบบง่ายๆ ที่ทำงานแยกกัน ไปสู่ระบบเอเจนต์ที่ทำงานร่วมกัน จัดการเวิร์กโฟลว์ที่ยาวนาน และต้องตรวจสอบได้ ในสถานการณ์ใหม่นี้ NVIDIA ได้ตัดสินใจที่จะดำเนินการอย่างชัดเจน นั่นคือ การเปิดเผยไม่เพียงแต่โมเดลเท่านั้น แต่ยังรวมถึงข้อมูลและเครื่องมือต่างๆ ด้วยเพื่อให้บริษัท หน่วยงานภาครัฐ และศูนย์วิจัย สามารถสร้างแพลตฟอร์ม AI ของตนเองได้อย่างมีประสิทธิภาพมากขึ้น
การเคลื่อนไหวดังกล่าวปรากฏเป็นรูปธรรมใน Nemotron 3 คือตระกูลโมเดลแบบเปิดที่มุ่งเน้นไปที่ปัญญาประดิษฐ์แบบหลายเอเจนต์ แนวคิดนี้มุ่งหวังที่จะผสานประสิทธิภาพสูง ต้นทุนการประมวลผลต่ำ และความโปร่งใส ข้อเสนอนี้ไม่ได้มีจุดประสงค์เพียงแค่เป็นแชทบอททั่วไปอีกตัวหนึ่ง แต่เป็น... เป็นฐานในการวางกำลังเจ้าหน้าที่ที่สามารถใช้เหตุผล วางแผน และดำเนินการงานที่ซับซ้อนในภาคส่วนที่มีการกำกับดูแลเรื่องนี้มีความสำคัญอย่างยิ่งในยุโรปและสเปน ซึ่งการรักษาอธิปไตยทางข้อมูลและการปฏิบัติตามกฎระเบียบเป็นสิ่งสำคัญ
กลุ่มโมเดลแบบเปิดสำหรับปัญญาประดิษฐ์ที่มีความสามารถในการกระทำและมีอำนาจอธิปไตย
Nemotron 3 นำเสนอในรูปแบบ ระบบนิเวศที่สมบูรณ์แบบ: โมเดล ชุดข้อมูล ไลบรารี และสูตรการฝึกฝน ภายใต้ใบอนุญาตแบบเปิด แนวคิดของ NVIDIA คือองค์กรต่างๆ ไม่เพียงแต่ใช้ AI ในฐานะบริการที่ไม่เปิดเผยข้อมูลเท่านั้น แต่ยังสามารถตรวจสอบสิ่งที่อยู่ภายใน ปรับแต่งโมเดลให้เข้ากับโดเมนของตน และใช้งานบนโครงสร้างพื้นฐานของตนเอง ไม่ว่าจะเป็นในระบบคลาวด์หรือในศูนย์ข้อมูลท้องถิ่น
บริษัทวางกรอบกลยุทธ์นี้ภายใต้พันธสัญญาของตนที่มีต่อ เอไออธิปไตยรัฐบาลและบริษัทต่างๆ ในยุโรป เกาหลีใต้ และภูมิภาคอื่นๆ กำลังมองหาทางเลือกแบบเปิดเพื่อทดแทนระบบปิดหรือระบบจากต่างประเทศ ซึ่งมักไม่สอดคล้องกับกฎหมายคุ้มครองข้อมูลหรือข้อกำหนดด้านการตรวจสอบของตน Nemotron 3 มีเป้าหมายที่จะเป็นรากฐานทางเทคนิคในการสร้างแบบจำลองระดับชาติ ระดับภาค หรือระดับองค์กร ด้วยความโปร่งใสและการควบคุมที่มากขึ้น
ในแบบคู่ขนาน, NVIDIA เสริมสร้างความแข็งแกร่งให้กับตำแหน่งของตนนอกเหนือจากด้านฮาร์ดแวร์ก่อนหน้านี้ Nemotron เป็นผู้ให้บริการ GPU สำหรับการอ้างอิงเป็นหลัก แต่ด้วย Nemotron 3 บริษัทได้วางตำแหน่งตัวเองในกลุ่มเครื่องมือสร้างแบบจำลองและฝึกฝนข้อมูล โดยแข่งขันโดยตรงกับผู้เล่นอย่าง OpenAI, Google, Anthropic หรือแม้แต่ Meta และแข่งขันกับโมเดลระดับพรีเมียมอย่างเช่น ซุปเปอร์กร็อก เฮฟวี่ในรุ่นล่าสุดของ Llama บริษัท Meta ได้ลดความมุ่งมั่นในการพัฒนาซอฟต์แวร์โอเพนซอร์สลง
สำหรับระบบนิเวศการวิจัยและสตาร์ทอัพในยุโรป ซึ่งพึ่งพาโมเดลแบบเปิดที่โฮสต์อยู่บนแพลตฟอร์มต่างๆ เช่น Hugging Face เป็นอย่างมาก การเข้าถึงน้ำหนักโมเดล ข้อมูลสังเคราะห์ และไลบรารีภายใต้ใบอนุญาตแบบเปิด ถือเป็นทางเลือกที่มีประสิทธิภาพอย่างยิ่ง นางแบบชาวจีน และชาวอเมริกันที่ครองอันดับความนิยมและมาตรฐานสูงสุด
สถาปัตยกรรม MoE แบบไฮบริด: ประสิทธิภาพสำหรับเอเจนต์ขนาดใหญ่
คุณลักษณะทางเทคนิคที่สำคัญของ Nemotron 3 คือ สถาปัตยกรรมแบบผสมผสานของผู้เชี่ยวชาญแฝง (MoE)แทนที่จะเปิดใช้งานพารามิเตอร์ทั้งหมดของโมเดลในการอนุมานแต่ละครั้ง จะมีการเปิดใช้งานเพียงส่วนน้อยเท่านั้น ซึ่งเป็นกลุ่มย่อยของผู้เชี่ยวชาญที่เกี่ยวข้องกับงานหรือโทเค็นที่เกี่ยวข้องมากที่สุด
แนวทางนี้ช่วยให้ ลดต้นทุนการคำนวณและการใช้หน่วยความจำลงอย่างมากนอกจากนี้ยังช่วยเพิ่มปริมาณการรับส่งโทเค็นด้วย สำหรับสถาปัตยกรรมแบบหลายเอเจนต์ ซึ่งมีเอเจนต์หลายสิบหรือหลายร้อยตัวแลกเปลี่ยนข้อความกันอย่างต่อเนื่อง ประสิทธิภาพนี้ถือเป็นกุญแจสำคัญในการป้องกันไม่ให้ระบบไม่ยั่งยืนในแง่ของต้นทุน GPU และคลาวด์
จากข้อมูลที่ NVIDIA เปิดเผยและผลการทดสอบอิสระ พบว่า Nemotron 3 Nano ทำได้ดังนี้ โทเค็นต่อวินาทีมากกว่าเดิมถึงสี่เท่า เมื่อเทียบกับรุ่นก่อนหน้าอย่าง Nemotron 2 Nano แล้ว รุ่นนี้ช่วยลดการสร้างโทเค็นการให้เหตุผลที่ไม่จำเป็นลงได้ประมาณ 60% ในทางปฏิบัติ หมายความว่าคำตอบที่ได้จะมีความแม่นยำเท่าเดิมหรือแม่นยำยิ่งขึ้น แต่มี "คำพูด" น้อยกว่าและต้นทุนต่อคำถามต่ำกว่า
สถาปัตยกรรม MoE แบบผสมผสาน ผนวกกับเทคนิคการฝึกอบรมเฉพาะ ได้นำไปสู่ผลลัพธ์ดังนี้ โมเดลแบบเปิดที่ทันสมัยที่สุดหลายโมเดลใช้รูปแบบที่ผู้เชี่ยวชาญกำหนดNemotron 3 เข้าร่วมกระแสนี้ แต่เน้นไปที่ AI แบบเอเจนต์โดยเฉพาะ ได้แก่ เส้นทางภายในที่ออกแบบมาเพื่อการประสานงานระหว่างเอเจนต์ การใช้เครื่องมือ การจัดการสถานะที่ยาวนาน และการวางแผนทีละขั้นตอน
มีให้เลือก 3 ขนาด: Nano, Super และ Ultra เพื่อรองรับปริมาณงานที่แตกต่างกัน

ผลิตภัณฑ์ในตระกูล Nemotron 3 แบ่งออกเป็น แบบจำลอง MoE มีสามขนาดหลักโดยทั้งหมดเป็นแบบเปิดและมีพารามิเตอร์การทำงานที่ลดลง berkat สถาปัตยกรรมที่ออกแบบโดยผู้เชี่ยวชาญ:
- เนโมตรอน 3 นาโน: มีพารามิเตอร์ทั้งหมดประมาณ 30.000 พันล้านรายการ โดยมีประมาณ สินทรัพย์ 3.000 พันล้านเหรียญต่อโทเค็นได้รับการออกแบบมาเพื่อใช้งานเฉพาะด้านที่ต้องการประสิทธิภาพสูง เช่น การแก้ไขข้อผิดพลาดของซอฟต์แวร์ การสรุปเอกสาร การค้นหาข้อมูล การตรวจสอบระบบ หรือผู้ช่วย AI เฉพาะทาง
- เนโมตรอน 3 ซูเปอร์: ประมาณ 100.000 พันล้านพารามิเตอร์ พร้อมด้วย สินทรัพย์ 10.000 พันล้าน ในทุกขั้นตอน มันถูกออกแบบมาเพื่อ... การให้เหตุผลขั้นสูงในสถาปัตยกรรมหลายเอเจนต์ด้วยความหน่วงต่ำ แม้ว่าจะมีเอเจนต์หลายตัวทำงานร่วมกันเพื่อแก้ไขปัญหาที่ซับซ้อนก็ตาม
- เนโมตรอน 3 อัลตร้า: ระดับบนสุด ซึ่งมีพารามิเตอร์ประมาณ 500.000 พันล้านตัว และมากถึง สินทรัพย์ 50.000 พันล้านเหรียญต่อโทเค็นมันทำหน้าที่เป็นเครื่องมือให้เหตุผลที่มีประสิทธิภาพสูงสำหรับการวิจัย การวางแผนเชิงกลยุทธ์ การสนับสนุนการตัดสินใจระดับสูง และโดยเฉพาะอย่างยิ่งระบบ AI ที่ต้องการประสิทธิภาพสูง
ในทางปฏิบัติ สิ่งนี้ช่วยให้องค์กรต่างๆ สามารถดำเนินการได้ เลือกขนาดรุ่นที่เหมาะสมกับงบประมาณและความต้องการของคุณNano เหมาะสำหรับงานประมวลผลขนาดใหญ่และหนักหน่วง รวมถึงงบประมาณที่จำกัด Super เมื่อต้องการความสามารถในการให้เหตุผลเชิงลึกมากขึ้น โดยมีตัวแทนที่ทำงานร่วมกันจำนวนมาก และ Ultra สำหรับกรณีที่คุณภาพและบริบทที่ยาวนานมีความสำคัญมากกว่าต้นทุนของ GPU
สำหรับตอนนี้ มีเพียง Nemotron 3 Nano เท่านั้นที่พร้อมใช้งานได้ทันทีรุ่น Super และ Ultra มีกำหนดวางจำหน่ายในช่วงครึ่งแรกของปี 2026 เพื่อให้บริษัทและห้องปฏิบัติการในยุโรปมีเวลาในการทดลองใช้ Nano ก่อน สร้างระบบการทำงาน และในภายหลังจึงค่อยย้ายกรณีที่ต้องการกำลังการผลิตที่สูงกว่าไปยังรุ่นที่มี Nano
Nemotron 3 Nano: จำนวนโทเค็นสูงสุด 1 ล้านโทเค็น และต้นทุนที่ควบคุมได้

ณ วันนี้ Nemotron 3 Nano คือ... หัวหอกปฏิบัติของครอบครัวNVIDIA อธิบายว่านี่คือรุ่นที่มีประสิทธิภาพด้านต้นทุนการคำนวณสูงสุดในกลุ่มผลิตภัณฑ์ โดยได้รับการปรับแต่งให้มอบประสิทธิภาพสูงสุดในเวิร์กโฟลว์แบบหลายเอเจนต์ และงานที่ต้องใช้ทรัพยากรมากแต่ทำซ้ำๆ
ในบรรดาคุณสมบัติทางเทคนิคต่างๆ นั้น มีคุณสมบัติที่โดดเด่นดังต่อไปนี้: หน้าต่างบริบทที่รองรับโทเค็นได้สูงสุดถึงหนึ่งล้านโทเค็นสิ่งนี้ช่วยให้สามารถเก็บรักษาความทรงจำสำหรับเอกสารขนาดใหญ่ คลังรหัสทั้งหมด หรือกระบวนการทางธุรกิจหลายขั้นตอนได้ สำหรับแอปพลิเคชันในยุโรปในด้านการธนาคาร การดูแลสุขภาพ หรือการบริหารราชการแผ่นดิน ซึ่งอาจมีบันทึกจำนวนมาก ความสามารถในการรักษาบริบทในระยะยาวนี้จึงมีคุณค่าอย่างยิ่ง
เกณฑ์มาตรฐานขององค์กรอิสระ จากการวิเคราะห์เชิงปัญญาประดิษฐ์ พบว่า Nemotron 3 Nano เป็นหนึ่งในโมเดลโอเพนซอร์สที่มีความสมดุลมากที่สุด ระบบนี้ผสานรวมความชาญฉลาด ความแม่นยำ และความเร็วเข้าด้วยกัน โดยมีอัตราการประมวลผลสูงถึงหลายร้อยโทเค็นต่อวินาที การผสมผสานนี้ทำให้ระบบนี้เป็นที่น่าสนใจสำหรับผู้บูรณาการ AI และผู้ให้บริการในสเปนที่ต้องการประสบการณ์การใช้งานที่ดีโดยไม่ต้องเสียค่าใช้จ่ายด้านโครงสร้างพื้นฐานที่สูงเกินไป
ในแง่ของกรณีการใช้งาน NVIDIA ตั้งเป้าหมายให้ Nano อยู่ที่... สรุปเนื้อหา, การแก้ไขข้อผิดพลาดของซอฟต์แวร์, การค้นหาข้อมูล และผู้ช่วย AI สำหรับองค์กรด้วยการลดจำนวนโทเค็นการให้เหตุผลที่ซ้ำซ้อน ทำให้สามารถใช้งานเอเจนต์ที่สนทนากับผู้ใช้หรือระบบได้เป็นเวลานานโดยที่ค่าใช้จ่ายในการอนุมานไม่พุ่งสูงขึ้น
ข้อมูลและไลบรารีแบบเปิด: NeMo Gym, NeMo RL และ Evaluator

หนึ่งในคุณสมบัติที่โดดเด่นที่สุดของ Nemotron 3 คือ ไม่ได้จำกัดแค่เพียงการลดน้ำหนักของโมเดลเท่านั้นNVIDIA ได้จัดเตรียมชุดทรัพยากรแบบเปิดที่ครอบคลุมสำหรับใช้ในการฝึกอบรม ปรับแต่ง และประเมินเอเจนต์ไว้ในตระกูลนี้ด้วย
ในอีกด้านหนึ่ง มันทำให้มีคลังข้อมูลสังเคราะห์ของ ข้อมูลก่อนการฝึกฝน หลังการฝึกฝน และการเสริมแรงจำนวนหลายล้านล้านโทเค็นชุดข้อมูลเหล่านี้ ซึ่งมุ่งเน้นไปที่การให้เหตุผล การเขียนโค้ด และเวิร์กโฟลว์หลายขั้นตอน ช่วยให้บริษัทและศูนย์วิจัยสามารถสร้าง Nemotron เวอร์ชันเฉพาะด้านของตนเอง (เช่น ด้านกฎหมาย ด้านการดูแลสุขภาพ หรือด้านอุตสาหกรรม) โดยไม่ต้องเริ่มต้นจากศูนย์
ในบรรดาแหล่งข้อมูลเหล่านี้ มีแหล่งข้อมูลต่อไปนี้ที่โดดเด่น: ชุดข้อมูลความปลอดภัยจากสารก่อภูมิแพ้ของเนโมตรอนระบบนี้รวบรวมข้อมูลการวัดระยะทางเกี่ยวกับพฤติกรรมของเอージェนต์ในสถานการณ์จริง เป้าหมายคือการช่วยให้ทีมวัดและเสริมสร้างความปลอดภัยของระบบอัตโนมัติที่ซับซ้อน ตั้งแต่การกระทำของเอージェนต์เมื่อพบข้อมูลที่ละเอียดอ่อน ไปจนถึงวิธีการตอบสนองต่อคำสั่งที่ไม่ชัดเจนหรืออาจเป็นอันตราย
ในส่วนของเครื่องมือนั้น NVIDIA กำลังเปิดตัว... NeMo Gym และ NeMo RL เป็นไลบรารีโอเพนซอร์ส สำหรับการฝึกอบรมเสริมและการฝึกอบรมหลังการฝึกอบรม พร้อมด้วย NeMo Evaluator สำหรับการประเมินความปลอดภัยและประสิทธิภาพ ไลบรารีเหล่านี้มีสภาพแวดล้อมการจำลองและกระบวนการทำงานที่พร้อมใช้งานสำหรับตระกูล Nemotron แต่สามารถขยายไปยังรุ่นอื่นๆ ได้
วัสดุทั้งหมดนี้—น้ำหนัก ชุดข้อมูล และรหัส—ถูกแจกจ่ายผ่าน GitHub และ Hugging Face ได้รับอนุญาตภายใต้ NVIDIA Open Model Licenseเพื่อให้ทีมงานในยุโรปสามารถผสานรวมเข้ากับ MLOps ของตนเองได้อย่างราบรื่น บริษัทต่างๆ เช่น Prime Intellect และ Unsloth ได้นำ NeMo Gym มาใช้ในขั้นตอนการทำงานของตนโดยตรงแล้ว เพื่อลดความซับซ้อนของการเรียนรู้แบบเสริมแรงบน Nemotron
มีให้บริการในระบบคลาวด์สาธารณะและระบบนิเวศของยุโรป

Nemotron 3 Nano พร้อมจำหน่ายแล้วที่ กอดหน้า y GitHubรวมถึงการใช้งานผ่านผู้ให้บริการการอนุมาน เช่น Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter และ Together AI ซึ่งเปิดโอกาสให้ทีมพัฒนาในสเปนสามารถทดสอบโมเดลผ่าน API หรือปรับใช้บนโครงสร้างพื้นฐานของตนเองได้โดยไม่ยุ่งยากซับซ้อนเกินไป
ในส่วนของระบบคลาวด์นั้น Nemotron 3 Nano เข้าร่วม AWS ผ่าน Amazon Bedrock สำหรับการประมวลผลแบบไร้เซิร์ฟเวอร์ (serverless inference) และได้ประกาศรองรับ Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale และ Yotta สำหรับองค์กรในยุโรปที่ใช้งานแพลตฟอร์มเหล่านี้อยู่แล้ว จะทำให้การนำ Nemotron มาใช้ทำได้ง่ายขึ้นโดยไม่ต้องเปลี่ยนแปลงสถาปัตยกรรมอย่างมาก
นอกเหนือจากระบบคลาวด์สาธารณะแล้ว NVIDIA ยังส่งเสริมการใช้งาน Nemotron 3 Nano อีกด้วย ไมโครเซอร์วิส NIM สามารถใช้งานได้บนโครงสร้างพื้นฐานที่เร่งความเร็วด้วย NVIDIA ทุกประเภทสิ่งนี้ช่วยให้สามารถใช้งานในรูปแบบไฮบริดได้ กล่าวคือ กระจายภาระงานบางส่วนไปยังคลาวด์ระหว่างประเทศ และอีกส่วนหนึ่งไปยังศูนย์ข้อมูลในท้องถิ่น หรือไปยังคลาวด์ในยุโรปที่ให้ความสำคัญกับการจัดเก็บข้อมูลในสหภาพยุโรปเป็นอันดับแรก
รุ่นต่างๆ เนโมตรอน 3 ซูเปอร์ และ อัลตร้า ออกแบบมาเพื่อรองรับภาระงานการให้เหตุผลขั้นสูงและระบบหลายเอเจนต์ขนาดใหญ่ วางแผนไว้สำหรับครึ่งแรกของปี 2026ไทม์ไลน์นี้เปิดโอกาสให้ระบบนิเวศการวิจัยและธุรกิจของยุโรปมีเวลาในการทดลองใช้ Nano ตรวจสอบความถูกต้องของกรณีการใช้งาน และออกแบบกลยุทธ์การย้ายไปสู่โมเดลขนาดใหญ่ขึ้นเมื่อจำเป็น
Nemotron 3 ทำให้ NVIDIA ก้าวขึ้นเป็นหนึ่งในผู้ให้บริการชั้นนำด้าน... โมเดลเปิดระดับสูงที่มุ่งเน้นปัญญาประดิษฐ์เชิงตัวแทนด้วยข้อเสนอที่ผสมผสานประสิทธิภาพทางเทคนิค (Hybrid MoE, NVFP4, บริบทขนาดใหญ่) ความเปิดกว้าง (น้ำหนัก ข้อมูลชุด และไลบรารีที่มีอยู่) และการให้ความสำคัญอย่างชัดเจนต่ออธิปไตยของข้อมูลและความโปร่งใส ซึ่งเป็นประเด็นที่อ่อนไหวเป็นพิเศษในสเปนและประเทศอื่นๆ ในยุโรป ที่ซึ่งกฎระเบียบและความกดดันในการตรวจสอบ AI มีมากขึ้นเรื่อยๆ
ฉันเป็นผู้ชื่นชอบเทคโนโลยีที่เปลี่ยนความสนใจ "เกินบรรยาย" ของเขาให้กลายเป็นอาชีพ ฉันใช้เวลามากกว่า 10 ปีในชีวิตไปกับเทคโนโลยีล้ำสมัยและปรับแต่งโปรแกรมทุกประเภทด้วยความอยากรู้อยากเห็น ตอนนี้ฉันมีความเชี่ยวชาญในด้านเทคโนโลยีคอมพิวเตอร์และวิดีโอเกม เนื่องจากเป็นเวลากว่า 5 ปีแล้วที่ฉันเขียนให้กับเว็บไซต์ต่างๆ เกี่ยวกับเทคโนโลยีและวิดีโอเกม โดยสร้างบทความที่พยายามให้ข้อมูลที่คุณต้องการในภาษาที่ทุกคนเข้าใจได้
หากคุณมีคำถามใดๆ ความรู้ของฉันมีตั้งแต่ทุกอย่างที่เกี่ยวข้องกับระบบปฏิบัติการ Windows รวมถึง Android สำหรับโทรศัพท์มือถือ และความมุ่งมั่นของฉันคือคุณ ฉันยินดีสละเวลาสักครู่เสมอและช่วยคุณแก้ไขคำถามใดๆ ที่คุณอาจมีในโลกอินเทอร์เน็ตนี้
