DeepSeek gaza basıyor: daha düşük maliyet, daha fazla bağlam ve OpenAI için zor bir rakip

Son Güncelleme: 02/10/2025

  • DeepSeek-V3.2-Exp, bir sonraki mimarisine doğru atılan ara bir adım olarak yayımlandı
  • Uzun bağlamlar ve daha düşük hesaplama için yeni DeepSeek Seyrek Dikkat mekanizması
  • Uygulama, web ve API'de %50'den fazla fiyat indirimiyle mevcuttur.
  • Rekabet baskısı ve Çin çiplerine uyum, FP8 desteği ve BF16 üzerindeki çalışmalar
DeepSeek V3.2-Exp

Üzerine inşa edilmiş V3.1-Terminus, yeni model DeepSeek V3.2-Exp dağınık dikkat yaklaşımını tanıtır Kaliteyi feda etmeden bilgi işlem yükünü azaltmayı hedefleyen şirkete göre, API fiyatları %50'den fazla düştü derhal yürürlüğe girecekve erişim Artık uygulamanızda, web'de ve API aracılığıyla kullanılabilir, formatında sunulmasının yanı sıra açık kaynak gibi geliştirme platformlarında Sarılma Yüz.

Teknik yenilikler: dağınık dikkat ve uzun bağlam

Yapay zeka modellerinde seyrek dikkat teknolojisi

Bu güncellemenin özü şudur: DeepSeek Seyrek Dikkat (DSA), bağlamın ilgili kısımlarını daha doğru bir şekilde işlemek için öncelik sırasına koyan bir mekanizmadır. Şirket, bir Lightning indeksleyici anahtar parçaları ve bir süreci seçen "ince ayrıntılı token seçimi", geniş bağlam pencerelerini kapsamak ve daha az bilgi yüküyle aynı anda birden fazla düşünce satırını ele almak amacıyla.

Özel içerik - Buraya Tıklayın  NotebookLM artık Android'de: Notlarınızı oluşturma, özetleme ve dinleme konusunda Google'ın yapay zeka uygulaması hakkında her şey.

Bu yaklaşım, hem eğitimde hem de çıkarımda iyileştirmeler, süreleri hızlandırır ve bellek tüketimini azaltır. DeepSeek, en son sürümlerinin zaten FP8'i destekle ve uyumluluk üzerinde çalışıyoruz BF16, hız ve doğruluğu dengelemeye yardımcı olan ve hesaplamayı kolaylaştıran sayı biçimleri yerel donanımda yürütme.

Şirket bunun bir lansman olduğunu, yani bir test Alanı yeni nesil mimarisini öngören bir şirket. Yine de, dahili testler V3.2-Exp'in (deneysel versiyon) arama aracıları, kodlama veya matematik gibi görevlerde V3.1-Terminus seviyesinde performans gösterdiğini, ayrıca uzun bağlamlı senaryolarda verimlilik sağladığını belirtiyorlar.

Teknik kısmın yanı sıra, kullanılabilirlik de geniştir: model, uygulamayı yükleyeceğiz, web ve API Şirketin fiyat düşüşü (%50'den fazla) işletme maliyetlerini düşürmek isteyen ürün ekipleri ve mühendislik departmanları tarafından benimsenmeyi hızlandırmayı hedefliyor.

Özel içerik - Buraya Tıklayın  Edge'deki Copilot'un yeni AI modunda gizliliğinizi nasıl koruyabilirsiniz?

Topluluk cephesinde, açılış Sarılma Yüzü ve GitHub Araştırmacıların ve geliştiricilerin denetleme yapmasına, yeniden kullanmasına ve iyileştirmeler önermesine olanak sağlayarak DeepSeek'in ekosistemdeki profilini güçlendiriyor. açık kaynak yapay zeka.

Piyasa etkisi ve jeopolitik nabız

Yapay zeka ekosistemi ve model yarışması

Bu adımın piyasaları sarsması beklenmese de R1 ve V3 yılın başında V3.2-Exp, aşağıdaki gibi yerel rakiplere baskı yapabilir: Qwen (Alibaba) ve Amerikan rakipleri gibi OpenAI, Antropik veya xAI. Anahtar, göstermek olacak daha düşük maliyetle yüksek performans, büyük yapay zeka dağıtımları için özellikle hassas bir faktördür.

Lansman karmaşık bir ortamda gerçekleşti: Birçok ülke kullanımını sınırlandırdı Devlet kurumlarında DeepSeek (İtalya, Amerika Birleşik Devletleri ve Kore Sur), güvenlik endişelerini gerekçe göstererek, şirketin faaliyetlerini güçlendirmesini zorunlu kılıyor. yönetişim ve garantiler Kurumsal varlık kazanmak istiyorsanız.

Çin, sanayi sektöründe teknoloji şirketlerini yabancı yarı iletkenlere olan bağımlılıklarını azaltmaya zorluyor. ABD'nin Nvidia yongalarına yönelik ihracat kontrolleri (Blackwell gibi) ve ek kısıtlamalar—örneğin, RTX Pro 6000—, DeepSeek, Çinli çip üreticileriyle iş birliği yaparak kendi çözümlerini optimize ettiğini iddia ediyor yerel donanımda yürütmeBu doğrultuda sektör, desteğini dile getirdi. Huawei son model güncellemesine.

Özel içerik - Buraya Tıklayın  DeepSeek API hatası 422 nasıl düzeltilir

Model, işletme maliyetinin yarısıyla performansını sürdürmeyi başarırsa, uzun belgelerle kullanım durumları, uzun sohbetler veya zorlu analitik görevler özellikle faydalı olabilir. Birçok şirket için bu kombinasyon verimlilik + fiyat Kriterlerde birkaç ekstra puan kadar belirleyicidir.

DeepSeek'in yaklaşımı, açıklık, verimlilik ve anında erişilebilirliği, daha yetenekli bir mimari vaat eden bir yol haritasıyla birleştiriyor. Şirket, V3.1-Terminus ile gösterilen seviyeyi korurken maliyet düşüşlerini pekiştirirse, Yeni model, maliyetleri çok artırmadan üretken yapay zekanın büyük ölçekte dağıtımı için pratik bir ölçüt haline gelebilir.DeepSeek'in verimliliği artık teknik bir hedef olmaktan çıkarıp şirketler ve geliştiriciler için gerçek bir rekabet avantajı haline getirip getiremeyeceğini göreceğiz.

VS Code'da Deepseek
İlgili makale:
Visual Studio Code'da DeepSeek nasıl kullanılır