Nemotron 3: ההימור הפתוח הגדול של NVIDIA עבור בינה מלאכותית מרובת סוכנים

העדכון אחרון: 17/12/2025

  • Nemotron 3 היא משפחה פתוחה של מודלים, נתונים וספריות המתמקדת בבינה מלאכותית סוכנית ובמערכות מרובות סוכנים.
  • הוא כולל שלושה גדלי MoE (Nano, Super ו-Ultra) עם ארכיטקטורה היברידית ואימון יעיל של 4 סיביות על NVIDIA Blackwell.
  • Nemotron 3 Nano זמין כעת באירופה דרך Hugging Face, עננים ציבוריים וכמיקרו-שירות NIM, עם חלון של מיליון טוקנים.
  • המערכת האקולוגית משלימה עם מערכי נתונים עצומים, NeMo Gym, NeMo RL ו-Evaluator כדי להכשיר, לכוונן ולבקר סוכני בינה מלאכותית ריבוניים.

מודל בינה מלאכותית נמוטרון 3

המירוץ לבינה מלאכותית עובר מצ'אטבוטים פשוטים ומבודדים למערכות סוכנים שמשתפות פעולה זו עם זו, מנהלות זרימות עבודה ארוכות וצריכות להיות ניתנות לביקורת. בתרחיש חדש זה, NVIDIA החליטה לנקוט בצעד ברור למדי: לפתוח לא רק מודלים, אלא גם נתונים וכלים.כך שחברות, מנהלים ציבוריים ומרכזי מחקר יוכלו לבנות פלטפורמות בינה מלאכותית משלהם עם יותר שליטה.

תנועה זו מתממשת ב נמוטרון 3, משפחת מודלים פתוחים המיועדים לבינה מלאכותית מרובת סוכנים היא שואפת לשלב ביצועים גבוהים, עלויות הסקה נמוכות ושקיפות. ההצעה אינה מיועדת להיות עוד צ'אטבוט כללי, אלא כ... בסיס עליו ניתן לפרוס סוכנים המסבירים, מתכננים ומבצעים משימות מורכבות במגזרים מוסדריםזה רלוונטי במיוחד באירופה ובספרד, שם ריבונות נתונים ועמידה בתקנות חשובות.

משפחה פתוחה של מודלים עבור בינה מלאכותית סוכנתית וריבונית

נמוטרון 3 מוצג כ מערכת אקולוגית שלמה: מודלים, מערכי נתונים, ספריות ומתכוני אימון תחת רישיונות פתוחים. הרעיון של NVIDIA הוא שארגונים לא רק צורכים בינה מלאכותית כשירות אטום, אלא גם יכולים לבדוק את מה שבפנים, להתאים את המודלים לתחומים שלהם ולפרוס אותם בתשתית שלהם, בין אם בענן או במרכזי נתונים מקומיים.

החברה מגבשת אסטרטגיה זו במסגרת מחויבותה ל בינה מלאכותית ריבוניתממשלות וחברות באירופה, דרום קוריאה ואזורים אחרים מחפשות חלופות פתוחות למערכות סגורות או זרות, שלעתים קרובות אינן תואמות היטב את חוקי הגנת המידע או את דרישות הביקורת שלהן. Nemotron 3 שואפת להיות הבסיס הטכני עליו ניתן לבנות מודלים לאומיים, מגזריים או תאגידיים עם נראות ובקרה גדולים יותר.

במקביל, NVIDIA מחזקת את מעמדה מעבר לחומרהעד כה, היא הייתה בעיקר ספקית GPU ייחוס; עם Nemotron 3, היא גם ממקמת את עצמה בשכבת כלי המידול והאימון, ומתחרה באופן ישיר יותר מול שחקנים כמו OpenAI, גוגל, Anthropic או אפילו Meta, ומול דגמים פרימיום כמו סופרגרוק כבדמטא צמצמה את מחויבותה לקוד פתוח בדורות האחרונים של Llama.

עבור המערכת האקולוגית האירופית של מחקר וסטארט-אפים - התלויה במידה רבה במודלים פתוחים המאוחסנים בפלטפורמות כמו Hugging Face - הזמינות של משקלים, נתונים סינתטיים וספריות תחת רישיונות פתוחים מייצגת אלטרנטיבה רבת עוצמה ל... מודלים סיניים ואמריקאים ששולטים בפופולריות ובדירוגי המדד.

תוכן בלעדי - לחץ כאן  כיצד להשתמש ב-Microsoft Copilot בטלגרם: מדריך מלא

ארכיטקטורת משרד החינוך ההיברידית: יעילות עבור סוכנים בקנה מידה גדול

המאפיין הטכני המרכזי של נמוטרון 3 הוא ארכיטקטורה היברידית של תערובת מומחים סמוי (MoE)במקום להפעיל את כל פרמטרי המודל בכל הסקה, רק חלק קטן מהם מופעלים, תת-קבוצה של מומחים הרלוונטיים ביותר למשימה או לאסימון המדובר.

גישה זו מאפשרת להפחית באופן דרסטי את עלויות החישוב ואת צריכת הזיכרוןזה גם מגדיל את תפוקת האסימונים. עבור ארכיטקטורות מרובות סוכנים, שבהן עשרות או מאות סוכנים מחליפים הודעות ברציפות, יעילות זו היא המפתח למניעת הפיכת המערכת לבלתי בת קיימא מבחינת עלויות GPU וענן.

לפי נתונים ששותפו על ידי NVIDIA ומבחני ביצועים עצמאיים, ה-Nemotron 3 Nano משיג עד פי ארבעה יותר אסימונים לשנייה בהשוואה לקודמו, ה-Nemotron 2 Nano, הוא מפחית את יצירת אסימוני ההיגיון המיותרים בכ-60%. בפועל, משמעות הדבר היא תשובות מדויקות באותה מידה או אפילו יותר, אך עם פחות "מילים" ועלות נמוכה יותר לשאילתה.

הארכיטקטורה ההיברידית של משרד החינוך, בשילוב עם טכניקות אימון ספציפיות, הובילה ל רבים מהמודלים הפתוחים המתקדמים ביותר מאמצים סכמות מומחיםנמוטרון 3 מצטרף למגמה זו, אך מתמקד ספציפית בבינה מלאכותית סוכנית: מסלולים פנימיים שנועדו לתיאום בין סוכנים, שימוש בכלים, טיפול במצבים ארוכים ותכנון שלב אחר שלב.

שלושה גדלים: ננו, סופר ואולטרה לעומסי עבודה שונים

ארכיטקטורת מודל נמוטרון 3

משפחת נמוטרון 3 מאורגנת כך: שלושה גדלים עיקריים של מודל משרד החינוך, כולם פתוחים ועם פרמטרים פעילים מופחתים הודות לארכיטקטורה המומחית:

  • נמוטרון 3 ננוכ-30.000 מיליארד פרמטרים בסך הכל, עם כ- 3.000 מיליארד נכסים לכל אסימוןהוא מיועד למשימות ממוקדות שבהן יעילות חשובה: ניפוי שגיאות בתוכנה, סיכום מסמכים, אחזור מידע, ניטור מערכת או עוזרי בינה מלאכותית ייעודיים.
  • נמוטרון 3 סופרכ-100.000 מיליארד פרמטרים, עם 10.000 מיליארד בנכסים בכל צעד ושעל. זה מכוון ל חשיבה מתקדמת בארכיטקטורות מרובות סוכניםעם השהייה נמוכה גם כאשר מספר סוכנים משתפים פעולה כדי לפתור זרימות מורכבות.
  • נמוטרון 3 אולטרההרמה העליונה, עם כ-500.000 מיליארד פרמטרים ועד 50.000 מיליארד נכסים לכל אסימוןהוא פועל כמנוע חשיבה רב עוצמה למחקר, תכנון אסטרטגי, תמיכה בקבלת החלטות ברמה גבוהה, ומערכות בינה מלאכותית תובעניות במיוחד.

בפועל, זה מאפשר לארגונים בחרו את גודל הדגם בהתאם לתקציב ולדרישות שלכםננו לעומסי עבודה עצומים ואינטנסיביים ועלויות צפופות; סופר כאשר נדרש חשיבה מעמיקה יותר עם סוכנים רבים המשתפים פעולה; ואולטרה למקרים בהם איכות והקשר ארוך עולים על עלות המעבד הגרפי.

תוכן בלעדי - לחץ כאן  כיצד להשתמש בהפעלה אוטומטית כדי להסיר תוכניות שמופעלות אוטומטית ללא אישור

לעת עתה רק ה-Nemotron 3 Nano זמין לשימוש מיידי.גרסאות הסופר והאולטרה מתוכננות למחצית הראשונה של 2026, מה שנותן לחברות ומעבדות אירופאיות זמן להתנסות תחילה עם ננו, להקים צינורות ייצור, ובהמשך, להעביר מקרים הדורשים קיבולת גדולה יותר.

נמוטרון 3 ננו: חלון של מיליון אסימונים ועלות מבוקרת

נמוטרון 3 ננו

נמוטרון 3 ננו הוא, נכון להיום, חוד החנית המעשי של המשפחהNVIDIA מתארת ​​אותו כמודל היעיל ביותר מבחינת עלות חישובית בסדרה, המותאם לספק ביצועים מקסימליים בזרימות עבודה מרובות סוכנים ובמשימות אינטנסיביות אך חוזרות על עצמן.

בין המאפיינים הטכניים שלה, בולטים הדברים הבאים: חלון הקשר של עד מיליון טוקניםזה מאפשר שמירה על זיכרון עבור מסמכים נרחבים, מאגרי קוד שלמים או תהליכים עסקיים מרובי שלבים. עבור יישומים אירופאיים בתחומי הבנקאות, הבריאות או המנהל הציבורי, שבהם רשומות יכולות להיות גדולות, יכולת הקשר ארוכת טווח זו בעלת ערך רב במיוחד.

אמות המידה של הארגון העצמאי ניתוח מלאכותי מציב את Nemotron 3 Nano כאחד ממודלי הקוד הפתוח המאוזנים ביותר היא משלבת אינטליגנציה, דיוק ומהירות, עם קצבי תפוקה של מאות טוקנים לשנייה. שילוב זה הופך אותה לאטרקטיבית עבור אינטגרטורים של בינה מלאכותית וספקי שירותים בספרד הזקוקים לחוויית משתמש טובה מבלי להרקיע שחקים בעלויות התשתית.

מבחינת מקרי שימוש, NVIDIA מכוונת ל-Nano ב סיכום תוכן, ניפוי שגיאות בתוכנה, אחזור מידע ועוזרי בינה מלאכותית ארגוניתהודות לצמצום אסימוני ההיגיון המיותרים, ניתן להפעיל סוכנים שמקיימים שיחות ארוכות עם משתמשים או מערכות מבלי שחשבון ההסקה יעלה שחקים.

נתונים פתוחים וספריות: NeMo Gym, NeMo RL ו-Evaluator

ספריות NeMo

אחד המאפיינים הייחודיים ביותר של נמוטרון 3 הוא ש זה לא מוגבל לשחרור משקלי מודלNVIDIA מלווה את המשפחה עם חבילה מקיפה של משאבים פתוחים להכשרה, כוונון והערכת סוכנים.

מצד אחד, זה מעמיד לרשותנו קורפוס סינתטי של כמה טריליוני אסימונים של נתוני טרום אימון, אחרי אימון וחיזוקמערכי נתונים אלה, המתמקדים בהיגיון, קידוד וזרימות עבודה מרובות שלבים, מאפשרים לחברות ולמרכזי מחקר לייצר גרסאות משלהם של נמוטרון ספציפיות לתחום (למשל, משפטיות, בריאותיות או תעשייתיות) מבלי להתחיל מאפס.

בין המשאבים הללו, בולטים הדברים הבאים: מערך נתונים של Nemotron Agenty Safetyהיא אוספת נתוני טלמטריה על התנהגות סוכנים בתרחישים אמיתיים. מטרתה היא לעזור לצוותים למדוד ולחזק את האבטחה של מערכות אוטונומיות מורכבות: החל מהפעולות שסוכן מבצע כאשר הוא נתקל בנתונים רגישים, ועד לאופן שבו הוא מגיב לפקודות מעורפלות או שעלולות להיות מזיקות.

תוכן בלעדי - לחץ כאן  כיצד נעשה שימוש בזיהוי דיבור בתחום האוטומציה?

בנוגע לסעיף הכלים, NVIDIA משיקה את NeMo Gym ו-NeMo RL כספריות קוד פתוח לאימון חיזוקים ולאימון לאחר מכן, יחד עם NeMo Evaluator להערכת בטיחות וביצועים. ספריות אלו מספקות סביבות סימולציה וצנרת מוכנות לשימוש עם משפחת Nemotron, אך ניתן להרחיב אותן למודלים אחרים.

כל החומר הזה - משקלים, מערכי נתונים וקוד - מופץ דרך GitHub ו-Hugging Face מורשים תחת רישיון NVIDIA Open Model License.כך שצוותים אירופאים יוכלו לשלב אותו בצורה חלקה ב-MLOps שלהם. חברות כמו Prime Intellect ו-Unsloth כבר משלבות את NeMo Gym ישירות בזרימות העבודה שלהן כדי לפשט את למידת החיזוקים ב-Nemotron.

זמינות בעננים ציבוריים ובמערכת האקולוגית האירופית

נמוטרון 3 ננו חיבוק פנים

נמוטרון 3 ננו זמין כעת ב פנים מחבקות y GitHubוכן באמצעות ספקי הסקה כגון Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter ו-Together AI. זה פותח את הדלת לצוותי פיתוח בספרד לבדוק את המודל באמצעות API או לפרוס אותו על התשתיות שלהם ללא מורכבות יתר.

בחזית הענן, Nemotron 3 Nano מצטרפת ל-AWS דרך Amazon Bedrock עבור הסקה ללא שרת, והכריזה על תמיכה ב-Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale ו-Yotta. עבור ארגונים אירופאים שכבר עובדים על פלטפורמות אלו, הדבר מקל על אימוץ Nemotron ללא שינויים דרסטיים בארכיטקטורה שלהם.

בנוסף לענן הציבורי, NVIDIA מקדמת את השימוש ב-Nemotron 3 Nano כ- ניתן לפריסה של מיקרו-שירותי NIM בכל תשתית המואצת על ידי NVIDIAזה מאפשר תרחישים היברידיים: חלק מהעומס בעננים בינלאומיים וחלק במרכזי נתונים מקומיים או בעננים אירופיים שנותנים עדיפות לשמירת הנתונים באיחוד האירופי.

הגרסאות נמוטרון 3 סופר ואולטרה, מכוונים לעומסי עבודה קיצוניים של חשיבה ומערכות מרובות סוכנים בקנה מידה גדול, הם מתוכנן למחצית הראשונה של 2026ציר זמן זה מאפשר למערכת האקולוגית האירופית למחקר ולעסקים זמן להתנסות עם ננו, לאמת מקרי שימוש ולתכנן אסטרטגיות הגירה למודלים גדולים יותר בעת הצורך.

Nemotron 3 ממצבת את NVIDIA כאחת הספקיות המובילות של מודלים פתוחים מתקדמים המכוונים לבינה מלאכותית סוכניתעם הצעה המשלבת יעילות טכנית (משרד החינוך היברידי, NVFP4, הקשר מסיבי), פתיחות (משקלים, מערכי נתונים וספריות זמינות) ומיקוד ברור בריבונות נתונים ושקיפות, היבטים רגישים במיוחד בספרד ובשאר אירופה, שם הרגולציה והלחץ לבקרת בינה מלאכותית הולכים וגדלים.

מיקרוסופט דיסקברי IA-2
Artaculo relacionado:
מיקרוסופט דיסקברי בינה מלאכותית מניעה פריצות דרך מדעיות וחינוכיות בעזרת בינה מלאכותית מותאמת אישית