Nemotron 3: Canh bạc lớn của NVIDIA cho trí tuệ nhân tạo đa tác nhân

Cập nhật lần cuối: 17/12/2025
tác giả: Alberto navarro

  • Nemotron 3 là một hệ thống mở gồm các mô hình, dữ liệu và thư viện tập trung vào trí tuệ nhân tạo tác nhân và hệ thống đa tác nhân.
  • Nó bao gồm ba kích thước MoE (Nano, Super và Ultra) với kiến ​​trúc lai và khả năng xử lý 4-bit hiệu quả trên NVIDIA Blackwell.
  • Nemotron 3 Nano hiện đã có mặt tại châu Âu thông qua Hugging Face, các nền tảng điện toán đám mây công cộng và dưới dạng dịch vụ vi mô NIM, với số lượng giới hạn 1 triệu token.
  • Hệ sinh thái được hoàn thiện với các tập dữ liệu khổng lồ, NeMo Gym, NeMo RL và Evaluator để huấn luyện, tinh chỉnh và kiểm tra các tác nhân AI độc lập.

Mô hình trí tuệ nhân tạo Nemotron 3

Cuộc đua về trí tuệ nhân tạo đang chuyển từ những chatbot đơn giản, hoạt động độc lập sang các hệ thống tác nhân cộng tác với nhau, quản lý các quy trình làm việc dài và cần có khả năng kiểm toán. Trong bối cảnh mới này, NVIDIA đã quyết định thực hiện một bước đi khá rõ ràng: không chỉ mở các mô hình mà còn cả dữ liệu và công cụ.để các công ty, cơ quan hành chính nhà nước và trung tâm nghiên cứu có thể xây dựng nền tảng AI của riêng mình với khả năng kiểm soát tốt hơn.

Phong trào đó được hiện thực hóa ở Nemotron 3, một họ các mô hình mở hướng tới trí tuệ nhân tạo đa tác nhân. Nó hướng đến sự kết hợp giữa hiệu năng cao, chi phí suy luận thấp và tính minh bạch. Đề xuất này không chỉ nhằm mục đích tạo ra một chatbot đa năng thông thường, mà còn hướng đến mục tiêu trở thành một chatbot mạnh mẽ hơn. một nền tảng để triển khai các tác nhân có khả năng suy luận, lập kế hoạch và thực hiện các nhiệm vụ phức tạp trong các lĩnh vực được quản lý.Điều này đặc biệt quan trọng ở châu Âu và Tây Ban Nha, nơi chủ quyền dữ liệu và tuân thủ quy định là những vấn đề trọng yếu.

Một tập hợp các mô hình mở cho trí tuệ nhân tạo có khả năng tự chủ và độc lập.

Nemotron 3 được giới thiệu như sau: Một hệ sinh thái hoàn chỉnh: mô hình, tập dữ liệu, thư viện và công thức huấn luyện theo giấy phép mở. Ý tưởng của NVIDIA là các tổ chức không chỉ sử dụng AI như một dịch vụ không minh bạch, mà còn có thể kiểm tra những gì bên trong, điều chỉnh các mô hình cho lĩnh vực của họ và triển khai chúng trên cơ sở hạ tầng của riêng họ, cho dù là trên đám mây hay trong các trung tâm dữ liệu cục bộ.

Công ty xây dựng chiến lược này trong khuôn khổ cam kết của mình đối với AI có chủ quyềnCác chính phủ và công ty ở châu Âu, Hàn Quốc và các khu vực khác đang tìm kiếm các giải pháp thay thế mở cho các hệ thống đóng hoặc nước ngoài, vốn thường không phù hợp với luật bảo vệ dữ liệu hoặc yêu cầu kiểm toán của họ. Nemotron 3 hướng đến mục tiêu trở thành nền tảng kỹ thuật để xây dựng các mô hình quốc gia, ngành hoặc doanh nghiệp với khả năng giám sát và kiểm soát tốt hơn.

Song song, NVIDIA củng cố vị thế của mình ngoài lĩnh vực phần cứng.Cho đến nay, nó chủ yếu là nhà cung cấp GPU tham chiếu; với Nemotron 3, nó cũng định vị mình ở phân khúc công cụ mô hình hóa và huấn luyện, cạnh tranh trực tiếp hơn với các đối thủ như OpenAI, Google, Anthropic, hay thậm chí cả Meta, và với các mô hình cao cấp như... SuperGrok HeavyMeta đã giảm bớt cam kết của mình đối với mã nguồn mở trong các thế hệ Llama gần đây.

Đối với hệ sinh thái nghiên cứu và khởi nghiệp châu Âu—vốn phụ thuộc rất nhiều vào các mô hình mở được lưu trữ trên các nền tảng như Hugging Face—việc cung cấp các trọng số, dữ liệu tổng hợp và thư viện theo giấy phép mở представляет một giải pháp thay thế mạnh mẽ cho các mô hình cũ. Người mẫu Trung Quốc và những người Mỹ thống trị các bảng xếp hạng về mức độ phổ biến và tiêu chuẩn.

Nội dung độc quyền - Bấm vào đây  Microsoft Store không mở hoặc liên tục đóng: giải pháp chi tiết

Kiến trúc MoE lai: hiệu quả cho các tác nhân quy mô lớn

Tính năng kỹ thuật trung tâm của Nemotron 3 là... Kiến trúc lai của hỗn hợp chuyên gia tiềm ẩn (MoE)Thay vì kích hoạt tất cả các tham số của mô hình trong mỗi lần suy luận, chỉ một phần nhỏ trong số chúng được bật lên, đó là tập hợp con các chuyên gia phù hợp nhất với nhiệm vụ hoặc đối tượng được đề cập.

Cách tiếp cận này cho phép giảm đáng kể chi phí tính toán và mức tiêu thụ bộ nhớ.Điều này cũng làm tăng thông lượng token. Đối với các kiến ​​trúc đa tác nhân, nơi hàng chục hoặc hàng trăm tác nhân liên tục trao đổi tin nhắn, hiệu quả này là chìa khóa để ngăn hệ thống trở nên không bền vững về chi phí GPU và điện toán đám mây.

Theo dữ liệu được NVIDIA chia sẻ và các bài kiểm tra hiệu năng độc lập, Nemotron 3 Nano đạt được... nhiều hơn tới bốn lần số token mỗi giây So với phiên bản tiền nhiệm, Nemotron 2 Nano, nó giảm việc tạo ra các mã thông báo suy luận không cần thiết khoảng 60%. Trên thực tế, điều này có nghĩa là câu trả lời chính xác tương đương hoặc thậm chí chính xác hơn, nhưng ngắn gọn hơn và chi phí cho mỗi truy vấn thấp hơn.

Kiến trúc MoE lai, kết hợp với các kỹ thuật đào tạo chuyên biệt, đã dẫn đến Nhiều mô hình mở tiên tiến nhất áp dụng các phương pháp dựa trên chuyên gia.Nemotron 3 cũng theo xu hướng này, nhưng tập trung cụ thể vào trí tuệ nhân tạo dựa trên tác nhân: các lộ trình nội bộ được thiết kế để phối hợp giữa các tác nhân, sử dụng công cụ, xử lý các trạng thái dài và lập kế hoạch từng bước.

Ba kích cỡ: Nano, Super và Ultra dành cho các khối lượng công việc khác nhau.

Kiến trúc mô hình Nemotron 3

Dòng sản phẩm Nemotron 3 được tổ chức thành các loại sau: ba kích thước chính của mô hình MoETất cả đều mở và có các thông số hoạt động được giảm thiểu nhờ kiến ​​trúc chuyên gia:

  • Nemotron 3 Nano: khoảng 30.000 tỷ tham số tổng cộng, với khoảng 3.000 tỷ tài sản trên mỗi tokenNó được thiết kế cho các tác vụ cụ thể mà hiệu quả là yếu tố quan trọng: gỡ lỗi phần mềm, tóm tắt tài liệu, truy xuất thông tin, giám sát hệ thống hoặc trợ lý AI chuyên dụng.
  • Nemotron 3 Super: khoảng 100.000 tỷ tham số, với 10.000 tỷ đô la tài sản ở mọi bước. Nó hướng tới Suy luận nâng cao trong kiến ​​trúc đa tác tửVới độ trễ thấp ngay cả khi nhiều tác nhân hợp tác để giải quyết các luồng dữ liệu phức tạp.
  • Nemotron 3 Ultra: cấp độ cao nhất, với khoảng 500.000 tỷ tham số và lên đến 50.000 tỷ tài sản trên mỗi tokenNó hoạt động như một công cụ suy luận mạnh mẽ cho nghiên cứu, lập kế hoạch chiến lược, hỗ trợ ra quyết định cấp cao và đặc biệt là các hệ thống AI đòi hỏi khắt khe.

Trên thực tế, điều này cho phép các tổ chức Hãy chọn kích thước mẫu phù hợp với ngân sách và nhu cầu của bạn.Nano dành cho các khối lượng công việc khổng lồ, chuyên sâu và chi phí eo hẹp; Super khi cần độ sâu suy luận cao hơn với nhiều tác nhân cộng tác; và Ultra cho các trường hợp mà chất lượng và ngữ cảnh dài hơn quan trọng hơn chi phí GPU.

Nội dung độc quyền - Bấm vào đây  TAG Heuer Connected Calibre E5: bước nhảy vọt đến phần mềm độc quyền và phiên bản New Balance

Cho bây giờ Chỉ có Nemotron 3 Nano là có sẵn để sử dụng ngay lập tức.Các phiên bản Super và Ultra dự kiến ​​sẽ ra mắt vào nửa đầu năm 2026, tạo điều kiện cho các công ty và phòng thí nghiệm châu Âu có thời gian thử nghiệm trước với công nghệ Nano, thiết lập quy trình sản xuất và sau đó chuyển sang các trường hợp cần dung lượng lớn hơn.

Nemotron 3 Nano: Cửa sổ 1 triệu token và chi phí được kiểm soát

Nemotron 3 Nano

Tính đến thời điểm hiện tại, Nemotron 3 Nano là... người tiên phong thực tế của gia đìnhNVIDIA mô tả đây là mẫu card đồ họa tiết kiệm chi phí tính toán nhất trong dòng sản phẩm, được tối ưu hóa để mang lại hiệu suất tối đa trong các quy trình làm việc đa tác nhân và các tác vụ chuyên sâu nhưng lặp đi lặp lại.

Trong số các tính năng kỹ thuật, những điểm sau đây nổi bật: cửa sổ ngữ cảnh chứa tối đa một triệu tokenĐiều này cho phép lưu giữ bộ nhớ cho các tài liệu đồ sộ, toàn bộ kho mã nguồn hoặc các quy trình kinh doanh nhiều bước. Đối với các ứng dụng ở châu Âu trong lĩnh vực ngân hàng, chăm sóc sức khỏe hoặc hành chính công, nơi mà hồ sơ có thể rất lớn, khả năng lưu trữ ngữ cảnh dài hạn này đặc biệt có giá trị.

Các tiêu chí đánh giá của tổ chức độc lập Phân tích nhân tạo cho thấy Nemotron 3 Nano là một trong những mô hình mã nguồn mở cân bằng nhất. Nó kết hợp trí thông minh, độ chính xác và tốc độ, với tốc độ xử lý hàng trăm token mỗi giây. Sự kết hợp này khiến nó trở nên hấp dẫn đối với các nhà tích hợp AI và các nhà cung cấp dịch vụ tại Tây Ban Nha, những người cần trải nghiệm người dùng tốt mà không phải chịu chi phí cơ sở hạ tầng quá cao.

Về các trường hợp sử dụng, NVIDIA đang nhắm đến Nano ở các mục tiêu sau: Tóm tắt nội dung, gỡ lỗi phần mềm, truy xuất thông tin và trợ lý AI doanh nghiệp.Nhờ việc giảm thiểu các token suy luận dư thừa, giờ đây có thể vận hành các tác nhân duy trì các cuộc hội thoại dài với người dùng hoặc hệ thống mà không làm tăng vọt chi phí suy luận.

Dữ liệu và thư viện mở: NeMo Gym, NeMo RL và Evaluator

Thư viện NeMo

Một trong những đặc điểm nổi bật nhất của Nemotron 3 là... Nó không chỉ giới hạn ở việc công bố trọng lượng mô hình.NVIDIA cung cấp cho dòng sản phẩm này một bộ tài nguyên mở toàn diện để huấn luyện, tinh chỉnh và đánh giá các tác nhân.

Một mặt, nó cung cấp một kho ngữ liệu tổng hợp về vài nghìn tỷ token dữ liệu huấn luyện trước, huấn luyện sau và củng cốCác bộ dữ liệu này, tập trung vào suy luận, lập trình và quy trình làm việc nhiều bước, cho phép các công ty và trung tâm nghiên cứu tạo ra các biến thể Nemotron chuyên biệt theo lĩnh vực của riêng họ (ví dụ: pháp lý, chăm sóc sức khỏe hoặc công nghiệp) mà không cần phải bắt đầu từ đầu.

Trong số các nguồn tài liệu này, những nguồn sau đây nổi bật: Bộ dữ liệu an toàn tác nhân NemotronNó thu thập dữ liệu đo từ xa về hành vi của tác nhân trong các tình huống thực tế. Mục tiêu của nó là giúp các nhóm đo lường và tăng cường bảo mật cho các hệ thống tự động phức tạp: từ những hành động mà tác nhân thực hiện khi gặp dữ liệu nhạy cảm, đến cách nó phản ứng với các lệnh mơ hồ hoặc có khả năng gây hại.

Nội dung độc quyền - Bấm vào đây  Các tính năng mới nhất có trên Windows 11: trí tuệ nhân tạo và cách mới để quản lý PC của bạn

Về phần công cụ, NVIDIA đang ra mắt... NeMo Gym và NeMo RL là các thư viện mã nguồn mở. Dùng cho huấn luyện củng cố và sau huấn luyện, cùng với NeMo Evaluator để đánh giá an toàn và hiệu suất. Các thư viện này cung cấp môi trường mô phỏng và quy trình sẵn sàng sử dụng với dòng sản phẩm Nemotron, nhưng có thể mở rộng sang các mô hình khác.

Tất cả tài liệu này—trọng số, tập dữ liệu và mã nguồn—được phân phối thông qua GitHub và Hugging Face được cấp phép theo Giấy phép Mô hình Mở NVIDIA.Nhờ đó, các đội châu Âu có thể tích hợp nó một cách liền mạch vào hệ thống MLOps của riêng họ. Các công ty như Prime Intellect và Unsloth đã và đang tích hợp trực tiếp NeMo Gym vào quy trình làm việc của họ để đơn giản hóa việc học tăng cường trên Nemotron.

Khả năng truy cập trên các nền tảng điện toán đám mây công cộng và hệ sinh thái châu Âu

Nemotron 3 Nano Hugging Face

Nemotron 3 Nano hiện đã có bán tại Ôm mặt y GitHubCũng như thông qua các nhà cung cấp suy luận như Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter và Together AI. Điều này mở ra cơ hội cho các nhóm phát triển tại Tây Ban Nha thử nghiệm mô hình thông qua API hoặc triển khai trên cơ sở hạ tầng của riêng họ mà không gặp quá nhiều phức tạp.

Về tình hình mây, Nemotron 3 Nano gia nhập AWS thông qua Amazon Bedrock. Nemotron hướng đến suy luận phi máy chủ, và đã công bố hỗ trợ cho Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale và Yotta. Đối với các tổ chức châu Âu hiện đang sử dụng các nền tảng này, điều này giúp việc áp dụng Nemotron dễ dàng hơn mà không cần thay đổi đáng kể kiến ​​trúc của họ.

Ngoài điện toán đám mây công cộng, NVIDIA đang thúc đẩy việc sử dụng Nemotron 3 Nano như một phần của hệ thống. Dịch vụ vi mô NIM có thể triển khai trên bất kỳ cơ sở hạ tầng nào được tăng tốc bởi NVIDIA.Điều này cho phép các kịch bản kết hợp: một phần tải nằm trên các đám mây quốc tế và một phần nằm trên các trung tâm dữ liệu địa phương hoặc trên các đám mây châu Âu ưu tiên lưu trữ dữ liệu tại EU.

Các phiên bản Nemotron 3 Super và Ultra, Được thiết kế để đáp ứng khối lượng công việc suy luận cực lớn và các hệ thống đa tác tử quy mô lớn, dự kiến ​​thực hiện trong nửa đầu năm 2026Khung thời gian này cho phép hệ sinh thái nghiên cứu và kinh doanh châu Âu có thời gian để thử nghiệm Nano, xác thực các trường hợp sử dụng và thiết kế các chiến lược chuyển đổi sang các mô hình lớn hơn khi cần thiết.

Nemotron 3 đưa NVIDIA trở thành một trong những nhà cung cấp hàng đầu về... Các mô hình mở cao cấp hướng tới trí tuệ nhân tạo tác nhân (agentic AI).Đề xuất này kết hợp hiệu quả kỹ thuật (MoE lai, NVFP4, bối cảnh quy mô lớn), tính mở (trọng số, tập dữ liệu và thư viện có sẵn) và tập trung rõ ràng vào chủ quyền dữ liệu và tính minh bạch, những khía cạnh đặc biệt nhạy cảm ở Tây Ban Nha và phần còn lại của châu Âu, nơi quy định và áp lực kiểm toán AI ngày càng gia tăng.

Microsoft Khám phá IA-2
Bài viết liên quan:
Microsoft Discovery AI thúc đẩy những đột phá về khoa học và giáo dục với trí tuệ nhân tạo được cá nhân hóa