- DeepSeek-V3.2-Exp veröffentlicht, ein Zwischenschritt in Richtung der nächsten Architektur
- Neuer DeepSeek Sparse Attention-Mechanismus für lange Kontexte und weniger Rechenleistung
- Verfügbar in der App, im Web und über die API mit einer Preisreduzierung von über 50 %.
- Wettbewerbsdruck und Anpassung an chinesische Chips, mit FP8-Unterstützung und Arbeit an BF16
Gebaut auf V3.1-Terminus, das neue Modell DeepSeek V3.2-Exp führt einen Ansatz der verteilten Aufmerksamkeit ein die darauf abzielt, die Rechenlast zu reduzieren, ohne die Qualität zu beeinträchtigen. Nach Angaben des Unternehmens API-Preise fallen um mehr als 50 % mit sofortiger Wirkungund Zugriff Es ist jetzt in Ihrer App, im Web und über die API verfügbar, zusätzlich zum Angebot im Format von Open-Source- auf Entwicklungsplattformen wie Gesicht umarmen.
Technische Innovationen: Zerstreute Aufmerksamkeit und langer Kontext

Das Herzstück dieses Updates ist DeepSeek Sparse Attention (DSA), ein Mechanismus, der relevante Teile des Kontexts priorisiert, um sie genauer zu verarbeiten. Das Unternehmen beschreibt die Verwendung eines Blitzindexer das Schlüsselfragmente auswählt und einen Prozess der „feinkörnige Token-Auswahl“, mit dem Ziel, große Kontextfenster abzudecken und mehrere Gedankengänge gleichzeitig mit weniger Informationsaufwand zu verarbeiten.
Dieser Ansatz verfolgt Verbesserungen sowohl beim Training als auch bei der Inferenz, wodurch die Zeiten beschleunigt und der Speicherverbrauch reduziert wird. DeepSeek gibt an, dass seine neuesten Versionen bereits Unterstützung des RP8 und arbeiten an der Kompatibilität mit BF16, Zahlenformate, die Geschwindigkeit und Genauigkeit in Einklang bringen und die es einfacher machen, Ausführung auf lokaler Hardware.
Das Unternehmen betont, dass es sich um eine Markteinführung handelt, also um eine Testgelände die die Architektur der nächsten Generation vorwegnimmt. Dennoch ist seine interne Prüfungen Sie weisen darauf hin, dass V3.2-Exp (die experimentelle Version) bei Aufgaben wie Suchagenten, Codierung oder Mathematik auf dem Niveau von V3.1-Terminus arbeitet und zusätzlich den Vorteil der Effizienz in Szenarien mit langem Kontext bietet.
Neben dem technischen Teil ist die Verfügbarkeit groß: Das Modell kann in der App, das Web und die API des Unternehmens. Die Preisnachlass (mehr als 50 %) zielt darauf ab, die Einführung durch Produktteams und Entwicklungsabteilungen zu beschleunigen, die ihre Betriebskosten senken möchten.
Auf Gemeinschaftsebene ist die Öffnung in Hugging Face und GitHub Es ermöglicht Forschern und Entwicklern, Verbesserungen zu prüfen, wiederzuverwenden und vorzuschlagen, wodurch das Profil von DeepSeek im Ökosystem gestärkt wird. Open-Source-KI.
Markteinfluss und geopolitischer Puls

Obwohl dieser Schritt voraussichtlich nicht zu einer Erschütterung der Märkte führen wird, wie er es tat R1 und V3 zu Beginn des Jahres, V3.2-Exp kann Druck auf inländische Konkurrenten ausüben, wie Qwen (Alibaba) und amerikanischen Konkurrenten wie OpenAI, Anthropisch oder xAI. Der Schlüssel wird darin liegen, zu zeigen, hohe Leistung zu geringeren Kosten, ein besonders sensibler Faktor bei großen KI-Bereitstellungen.
Die Markteinführung erfolgt in einem komplexen Umfeld: Mehrere Länder haben die Nutzung von DeepSeek in Behörden (einschließlich Italien, den Vereinigten Staaten und Südkorea), unter Berufung auf Sicherheitsbedenken. Diese Einschränkungen zwingen das Unternehmen, seine Governance und Garantien wenn Sie institutionelle Präsenz gewinnen möchten.
Im Industriesektor drängt China seine Technologieunternehmen dazu, ihre Abhängigkeit von ausländischen Halbleitern zu verringern. US-Exportkontrollen für Nvidia-Chips (wie Blackwell) und zusätzliche Einschränkungen – zum Beispiel auf RTX Pro 6000—, DeepSeek behauptet, mit chinesischen Chipherstellern zusammenzuarbeiten, um seine Ausführung auf lokaler Hardware. In diesem Zusammenhang hat der Sektor die Unterstützung von Huawei auf das neuste Modell-Update.
Wenn es dem Modell gelingt, seine Leistung mit der Hälfte der Betriebskosten aufrechtzuerhalten, Anwendungsfälle mit langen Dokumenten, lange Gespräche oder anspruchsvolle analytische Aufgaben könnten besonders davon profitieren. Für viele Unternehmen ist die Kombination Effizienz + Preis Es ist genauso entscheidend wie ein paar Extrapunkte bei Benchmarks.
Der Ansatz von DeepSeek kombiniert Offenheit, Effizienz und sofortige Verfügbarkeit mit einer Roadmap, die eine leistungsfähigere Architektur verspricht. Wenn das Unternehmen die Kostensenkungen konsolidiert und gleichzeitig das von V3.1-Terminus demonstrierte Niveau beibehält, Das neue Modell könnte zu einem praktischen Maßstab für die Bereitstellung generativer KI im großen Maßstab werden, ohne dass die Kosten in die Höhe schnellen.Wir werden sehen, ob DeepSeek Effizienz nicht länger zu einem technischen Ziel machen kann, sondern zu einem echten Wettbewerbsvorteil für Unternehmen und Entwickler.
Ich bin ein Technik-Enthusiast, der seine „Geek“-Interessen zum Beruf gemacht hat. Ich habe mehr als 10 Jahre meines Lebens damit verbracht, modernste Technologie zu nutzen und aus purer Neugier an allen möglichen Programmen herumzubasteln. Mittlerweile habe ich mich auf Computertechnik und Videospiele spezialisiert. Das liegt daran, dass ich seit mehr als fünf Jahren für verschiedene Websites zum Thema Technologie und Videospiele schreibe und Artikel erstelle, die Ihnen die Informationen, die Sie benötigen, in einer für jeden verständlichen Sprache vermitteln möchten.
Bei Fragen reicht mein Wissen von allem rund um das Windows-Betriebssystem bis hin zu Android für Mobiltelefone. Und mein Engagement gilt Ihnen, ich bin immer bereit, ein paar Minuten zu investieren und Ihnen bei der Lösung aller Fragen in dieser Internetwelt zu helfen.