DeepSeek מגזימה: עלות נמוכה יותר, יותר הקשר ויריב מביך ל-OpenAI

העדכון אחרון: 02/10/2025

  • DeepSeek-V3.2-Exp שוחרר, צעד ביניים לקראת הארכיטקטורה הבאה שלו
  • מנגנון חדש של DeepSeek Sparse Attention עבור הקשרים ארוכים וחישוב נמוך יותר
  • זמין באפליקציה, באינטרנט וב-API עם הנחה של יותר מ-50%.
  • לחץ תחרותי והתאמה לשבבים סיניים, עם תמיכה ב-FP8 ועבודה על BF16
DeepSeek גרסה 3.2-Ex

בנוי על V3.1-טרמינל, הדגם החדש DeepSeek גרסה 3.2-Ex מציג גישת קשב מפוזרת אשר שואפת להפחית את עומס המחשוב מבלי להתפשר על האיכות. לדברי החברה, מחירי ה-API ירדו ביותר מ-50% עם תוקף מיידי, וגישה זה זמין כעת באפליקציה שלך, באינטרנט ובאמצעות API, בנוסף להיותו מוצע בפורמט של קוד פתוח בפלטפורמות פיתוח כגון פנים מחבקות.

חידושים טכניים: תשומת לב מפוזרת והקשר ארוך

טכנולוגיית קשב דלילה במודלים של בינה מלאכותית

לב ליבו של עדכון זה הוא תשומת לב דלילה של DeepSeek (DSA), מנגנון שנותן עדיפות לחלקים רלוונטיים מההקשר כדי לעבד אותם בצורה מדויקת יותר. החברה מפרטת את השימוש ב- אינדקסר ברק שבוחר קטעי מפתח ותהליך של "בחירת אסימונים מדויקת", במטרה לכסות חלונות הקשר גדולים ולטפל במספר קווי מחשבה בו זמנית עם פחות תקורה של מידע.

תוכן בלעדי - לחץ כאן  NotebookLM זמין כעת באנדרואיד: הכל על אפליקציית הבינה המלאכותית של גוגל ליצירה, סיכום והאזנה להערות שלכם.

גישה זו שואפת שיפורים הן באימון והן בהסקה, מה שמאיץ את הזמנים ומפחית את צריכת הזיכרון. DeepSeek מציין שהגרסאות האחרונות שלו כבר תמיכה ב-FP8 ועובדים על תאימות עם BF16, פורמטים של מספרים המסייעים לאזן בין מהירות לדיוק, ומקלים על ביצוע על חומרה מקומית.

החברה מדגישה שמדובר בהשקה, כלומר, מגרש בדיקה אשר צופה את הארכיטקטורה של הדור הבא שלה. ובכל זאת, שלה בדיקות פנימיות הם מציינים שגרסה 3.2-Exp (הגרסה הניסיונית) מתפקדת ברמה של גרסה 3.1-Terminus במשימות כמו סוכני חיפוש, קידוד או מתמטיקה, עם יתרון נוסף של יעילות בתרחישים ארוכי הקשר.

בנוסף לחלק הטכני, הזמינות רחבה: ניתן לבדוק את המודל ב האפליקציה, האינטרנט ו-API של החברה. ה הפחתת מחיר (יותר מ-50%) שואפת להאיץ את האימוץ על ידי צוותי מוצר ומחלקות הנדסה המעוניינים להפחית את עלויות התפעול.

תוכן בלעדי - לחץ כאן  אפל בוחנת את Veritas, סירי החדשה עם צ'אטבוט פנימי בסגנון ChatGPT.

בחזית הקהילתית, הפתיחה ב פנים מחבקות וגיטהאב זה מאפשר לחוקרים ולמפתחים לבצע ביקורת, לעשות שימוש חוזר ולהציע שיפורים, ובכך לחזק את הפרופיל של DeepSeek במערכת האקולוגית. בינה מלאכותית בקוד פתוח.

השפעה על השוק ודופק גיאופוליטי

מערכת אקולוגית של בינה מלאכותית ותחרות מודלים

למרות שצעד זה לא צפוי לזעזע את השווקים כפי שעשה R1 ו-V3 בתחילת השנה, V3.2-Exp יכול להפעיל לחץ על יריבים מקומיים כמו קוון (עליבאבא) ומתחרים אמריקאים כמו OpenAI, אנתרופי או xAI. המפתח יהיה להדגים ביצועים גבוהים בעלות נמוכה יותר, גורם רגיש במיוחד עבור פריסות גדולות של בינה מלאכותית.

ההשקה מגיעה על רקע סביבה מורכבת: מספר מדינות הגבילו את השימוש ב DeepSeek בסוכנויות ממשלתיות (כולל איטליה, ארצות הברית ו דרום קוריאה), תוך ציון חששות ביטחוניים. הגבלות אלו מאלצות את החברה לחזק את ממשל וערבויות אם אתם רוצים להשיג נוכחות מוסדית.

במגזר התעשייתי, סין דוחפת את חברות הטכנולוגיה שלה להפחית את תלותן במוליכים למחצה זרים. פיקוח אמריקאי על יצוא שבבי Nvidia (כגון בלקוול) ומגבלות נוספות - לדוגמה, על RTX Pro 6000—, DeepSeek טוענת כי היא משתפת פעולה עם יצרניות שבבים סיניות כדי לייעל את ביצוע על חומרה מקומיתבקו זה, המגזר הביע את תמיכתו של Huawei לעדכון הדגם האחרון.

תוכן בלעדי - לחץ כאן  ChatGPT Atlas: דפדפן OpenAI המשלב צ'אט, חיפוש ומשימות אוטומטיות

אם המודל יצליח לשמור על ביצועיו במחצית מעלות התפעול, מקרי שימוש עם מסמכים ארוכים, שיחות ארוכות או משימות אנליטיות תובעניות יכולות להועיל במיוחד. עבור חברות רבות, השילוב יעילות + מחיר זה מכריע כמו כמה נקודות נוספות במבחני ביצועים.

הגישה של DeepSeek משלבת פתיחות, יעילות וזמינות מיידית עם מפת דרכים המבטיחה ארכיטקטורה יעילה יותר. אם החברה תאחד את הפחתות העלויות תוך שמירה על הרמה שהודגמה על ידי V3.1-Terminus, המודל החדש יכול להפוך לנקודת ייחוס מעשית לפריסת בינה מלאכותית גנרטיבית בקנה מידה גדול מבלי להרקיע שחקים את העלויות.נראה אם ​​DeepSeek תוכל להפוך את היעילות לא עוד לשאיפה טכנית, אלא ליתרון תחרותי אמיתי עבור חברות ומפתחים.

Deepseek בקוד VS
Artaculo relacionado:
כיצד להשתמש ב-DeepSeek בקוד Visual Studio