- DeepSeek-V3.2-Exp, bir sonraki mimarisine doğru atılan ara bir adım olarak yayımlandı
- Uzun bağlamlar ve daha düşük hesaplama için yeni DeepSeek Seyrek Dikkat mekanizması
- Uygulama, web ve API'de %50'den fazla fiyat indirimiyle mevcuttur.
- Rekabet baskısı ve Çin çiplerine uyum, FP8 desteği ve BF16 üzerindeki çalışmalar
Üzerine inşa edilmiş V3.1-Terminus, yeni model DeepSeek V3.2-Exp dağınık dikkat yaklaşımını tanıtır Kaliteyi feda etmeden bilgi işlem yükünü azaltmayı hedefleyen şirkete göre, API fiyatları %50'den fazla düştü derhal yürürlüğe girecekve erişim Artık uygulamanızda, web'de ve API aracılığıyla kullanılabilir, formatında sunulmasının yanı sıra açık kaynak gibi geliştirme platformlarında Sarılma Yüz.
Teknik yenilikler: dağınık dikkat ve uzun bağlam

Bu güncellemenin özü şudur: DeepSeek Seyrek Dikkat (DSA), bağlamın ilgili kısımlarını daha doğru bir şekilde işlemek için öncelik sırasına koyan bir mekanizmadır. Şirket, bir Lightning indeksleyici anahtar parçaları ve bir süreci seçen "ince ayrıntılı token seçimi", geniş bağlam pencerelerini kapsamak ve daha az bilgi yüküyle aynı anda birden fazla düşünce satırını ele almak amacıyla.
Bu yaklaşım, hem eğitimde hem de çıkarımda iyileştirmeler, süreleri hızlandırır ve bellek tüketimini azaltır. DeepSeek, en son sürümlerinin zaten FP8'i destekle ve uyumluluk üzerinde çalışıyoruz BF16, hız ve doğruluğu dengelemeye yardımcı olan ve hesaplamayı kolaylaştıran sayı biçimleri yerel donanımda yürütme.
Şirket bunun bir lansman olduğunu, yani bir test Alanı yeni nesil mimarisini öngören bir şirket. Yine de, dahili testler V3.2-Exp'in (deneysel versiyon) arama aracıları, kodlama veya matematik gibi görevlerde V3.1-Terminus seviyesinde performans gösterdiğini, ayrıca uzun bağlamlı senaryolarda verimlilik sağladığını belirtiyorlar.
Teknik kısmın yanı sıra, kullanılabilirlik de geniştir: model, uygulamayı yükleyeceğiz, web ve API Şirketin fiyat düşüşü (%50'den fazla) işletme maliyetlerini düşürmek isteyen ürün ekipleri ve mühendislik departmanları tarafından benimsenmeyi hızlandırmayı hedefliyor.
Topluluk cephesinde, açılış Sarılma Yüzü ve GitHub Araştırmacıların ve geliştiricilerin denetleme yapmasına, yeniden kullanmasına ve iyileştirmeler önermesine olanak sağlayarak DeepSeek'in ekosistemdeki profilini güçlendiriyor. açık kaynak yapay zeka.
Piyasa etkisi ve jeopolitik nabız

Bu adımın piyasaları sarsması beklenmese de R1 ve V3 yılın başında V3.2-Exp, aşağıdaki gibi yerel rakiplere baskı yapabilir: Qwen (Alibaba) ve Amerikan rakipleri gibi OpenAI, Antropik veya xAI. Anahtar, göstermek olacak daha düşük maliyetle yüksek performans, büyük yapay zeka dağıtımları için özellikle hassas bir faktördür.
Lansman karmaşık bir ortamda gerçekleşti: Birçok ülke kullanımını sınırlandırdı Devlet kurumlarında DeepSeek (İtalya, Amerika Birleşik Devletleri ve Kore Sur), güvenlik endişelerini gerekçe göstererek, şirketin faaliyetlerini güçlendirmesini zorunlu kılıyor. yönetişim ve garantiler Kurumsal varlık kazanmak istiyorsanız.
Çin, sanayi sektöründe teknoloji şirketlerini yabancı yarı iletkenlere olan bağımlılıklarını azaltmaya zorluyor. ABD'nin Nvidia yongalarına yönelik ihracat kontrolleri (Blackwell gibi) ve ek kısıtlamalar—örneğin, RTX Pro 6000—, DeepSeek, Çinli çip üreticileriyle iş birliği yaparak kendi çözümlerini optimize ettiğini iddia ediyor yerel donanımda yürütmeBu doğrultuda sektör, desteğini dile getirdi. Huawei son model güncellemesine.
Model, işletme maliyetinin yarısıyla performansını sürdürmeyi başarırsa, uzun belgelerle kullanım durumları, uzun sohbetler veya zorlu analitik görevler özellikle faydalı olabilir. Birçok şirket için bu kombinasyon verimlilik + fiyat Kriterlerde birkaç ekstra puan kadar belirleyicidir.
DeepSeek'in yaklaşımı, açıklık, verimlilik ve anında erişilebilirliği, daha yetenekli bir mimari vaat eden bir yol haritasıyla birleştiriyor. Şirket, V3.1-Terminus ile gösterilen seviyeyi korurken maliyet düşüşlerini pekiştirirse, Yeni model, maliyetleri çok artırmadan üretken yapay zekanın büyük ölçekte dağıtımı için pratik bir ölçüt haline gelebilir.DeepSeek'in verimliliği artık teknik bir hedef olmaktan çıkarıp şirketler ve geliştiriciler için gerçek bir rekabet avantajı haline getirip getiremeyeceğini göreceğiz.
Ben "inek" merakını mesleğe dönüştürmüş bir teknoloji tutkunuyum. Hayatımın 10 yıldan fazlasını en son teknolojiyi kullanarak ve sırf merakımdan dolayı her türlü programı kurcalayarak geçirdim. Artık bilgisayar teknolojisi ve video oyunları konusunda uzmanlaştım. Bunun nedeni, 5 yılı aşkın bir süredir teknoloji ve video oyunlarıyla ilgili çeşitli web sitelerinde yazılar yazıyor olmam ve ihtiyacınız olan bilgileri herkesin anlayabileceği bir dilde size vermeye çalışan makaleler oluşturmamdır.
Sorularınız varsa bilgim Windows işletim sistemi ve cep telefonları için Android ile ilgili her şeyi kapsar. Ve size olan bağlılığımdır, her zaman birkaç dakikamı ayırmaya ve bu internet dünyasında aklınıza gelebilecek her türlü soruyu çözmenize yardımcı olmaya hazırım.