- DeepSeek-V3.2-Exp שוחרר, צעד ביניים לקראת הארכיטקטורה הבאה שלו
- מנגנון חדש של DeepSeek Sparse Attention עבור הקשרים ארוכים וחישוב נמוך יותר
- זמין באפליקציה, באינטרנט וב-API עם הנחה של יותר מ-50%.
- לחץ תחרותי והתאמה לשבבים סיניים, עם תמיכה ב-FP8 ועבודה על BF16
בנוי על V3.1-טרמינל, הדגם החדש DeepSeek גרסה 3.2-Ex מציג גישת קשב מפוזרת אשר שואפת להפחית את עומס המחשוב מבלי להתפשר על האיכות. לדברי החברה, מחירי ה-API ירדו ביותר מ-50% עם תוקף מיידי, וגישה זה זמין כעת באפליקציה שלך, באינטרנט ובאמצעות API, בנוסף להיותו מוצע בפורמט של קוד פתוח בפלטפורמות פיתוח כגון פנים מחבקות.
חידושים טכניים: תשומת לב מפוזרת והקשר ארוך

לב ליבו של עדכון זה הוא תשומת לב דלילה של DeepSeek (DSA), מנגנון שנותן עדיפות לחלקים רלוונטיים מההקשר כדי לעבד אותם בצורה מדויקת יותר. החברה מפרטת את השימוש ב- אינדקסר ברק שבוחר קטעי מפתח ותהליך של "בחירת אסימונים מדויקת", במטרה לכסות חלונות הקשר גדולים ולטפל במספר קווי מחשבה בו זמנית עם פחות תקורה של מידע.
גישה זו שואפת שיפורים הן באימון והן בהסקה, מה שמאיץ את הזמנים ומפחית את צריכת הזיכרון. DeepSeek מציין שהגרסאות האחרונות שלו כבר תמיכה ב-FP8 ועובדים על תאימות עם BF16, פורמטים של מספרים המסייעים לאזן בין מהירות לדיוק, ומקלים על ביצוע על חומרה מקומית.
החברה מדגישה שמדובר בהשקה, כלומר, מגרש בדיקה אשר צופה את הארכיטקטורה של הדור הבא שלה. ובכל זאת, שלה בדיקות פנימיות הם מציינים שגרסה 3.2-Exp (הגרסה הניסיונית) מתפקדת ברמה של גרסה 3.1-Terminus במשימות כמו סוכני חיפוש, קידוד או מתמטיקה, עם יתרון נוסף של יעילות בתרחישים ארוכי הקשר.
בנוסף לחלק הטכני, הזמינות רחבה: ניתן לבדוק את המודל ב האפליקציה, האינטרנט ו-API של החברה. ה הפחתת מחיר (יותר מ-50%) שואפת להאיץ את האימוץ על ידי צוותי מוצר ומחלקות הנדסה המעוניינים להפחית את עלויות התפעול.
בחזית הקהילתית, הפתיחה ב פנים מחבקות וגיטהאב זה מאפשר לחוקרים ולמפתחים לבצע ביקורת, לעשות שימוש חוזר ולהציע שיפורים, ובכך לחזק את הפרופיל של DeepSeek במערכת האקולוגית. בינה מלאכותית בקוד פתוח.
השפעה על השוק ודופק גיאופוליטי

למרות שצעד זה לא צפוי לזעזע את השווקים כפי שעשה R1 ו-V3 בתחילת השנה, V3.2-Exp יכול להפעיל לחץ על יריבים מקומיים כמו קוון (עליבאבא) ומתחרים אמריקאים כמו OpenAI, אנתרופי או xAI. המפתח יהיה להדגים ביצועים גבוהים בעלות נמוכה יותר, גורם רגיש במיוחד עבור פריסות גדולות של בינה מלאכותית.
ההשקה מגיעה על רקע סביבה מורכבת: מספר מדינות הגבילו את השימוש ב DeepSeek בסוכנויות ממשלתיות (כולל איטליה, ארצות הברית ו דרום קוריאה), תוך ציון חששות ביטחוניים. הגבלות אלו מאלצות את החברה לחזק את ממשל וערבויות אם אתם רוצים להשיג נוכחות מוסדית.
במגזר התעשייתי, סין דוחפת את חברות הטכנולוגיה שלה להפחית את תלותן במוליכים למחצה זרים. פיקוח אמריקאי על יצוא שבבי Nvidia (כגון בלקוול) ומגבלות נוספות - לדוגמה, על RTX Pro 6000—, DeepSeek טוענת כי היא משתפת פעולה עם יצרניות שבבים סיניות כדי לייעל את ביצוע על חומרה מקומיתבקו זה, המגזר הביע את תמיכתו של Huawei לעדכון הדגם האחרון.
אם המודל יצליח לשמור על ביצועיו במחצית מעלות התפעול, מקרי שימוש עם מסמכים ארוכים, שיחות ארוכות או משימות אנליטיות תובעניות יכולות להועיל במיוחד. עבור חברות רבות, השילוב יעילות + מחיר זה מכריע כמו כמה נקודות נוספות במבחני ביצועים.
הגישה של DeepSeek משלבת פתיחות, יעילות וזמינות מיידית עם מפת דרכים המבטיחה ארכיטקטורה יעילה יותר. אם החברה תאחד את הפחתות העלויות תוך שמירה על הרמה שהודגמה על ידי V3.1-Terminus, המודל החדש יכול להפוך לנקודת ייחוס מעשית לפריסת בינה מלאכותית גנרטיבית בקנה מידה גדול מבלי להרקיע שחקים את העלויות.נראה אם DeepSeek תוכל להפוך את היעילות לא עוד לשאיפה טכנית, אלא ליתרון תחרותי אמיתי עבור חברות ומפתחים.
אני חובב טכנולוגיה שהפך את תחומי העניין ה"חנון" שלו למקצוע. ביליתי יותר מ-10 שנים מחיי בטכנולוגיה מתקדמת והתעסקות עם כל מיני תוכניות מתוך סקרנות טהורה. עכשיו התמחיתי בטכנולוגיית מחשבים ומשחקי וידאו. הסיבה לכך היא שכבר יותר מ-5 שנים אני כותב לאתרים שונים בנושאי טכנולוגיה ומשחקי וידאו, ויוצר מאמרים המבקשים לתת לכם את המידע הדרוש לכם בשפה מובנת לכולם.
אם יש לך שאלות, הידע שלי נע מכל מה שקשור למערכת ההפעלה Windows וכן אנדרואיד לטלפונים ניידים. והמחויבות שלי היא אליך, אני תמיד מוכן להקדיש כמה דקות ולעזור לך לפתור כל שאלה שיש לך בעולם האינטרנט הזה.