डीपसिकले सफलता हासिल गर्‍यो: कम लागत, बढी सन्दर्भ, र ओपनएआईको लागि एक अजीब प्रतिद्वन्द्वी

अन्तिम अपडेट: 02/10/2025

  • DeepSeek-V3.2-Exp जारी गरियो, यसको अर्को वास्तुकला तर्फ एक मध्यवर्ती कदम
  • लामो सन्दर्भ र कम गणनाको लागि नयाँ डीपसिक स्पार्स एटेन्सन संयन्त्र
  • ५०% भन्दा बढीको मूल्य कटौतीको साथ एप, वेब र API मा उपलब्ध छ।
  • प्रतिस्पर्धात्मक दबाब र चिनियाँ चिप्समा अनुकूलन, FP8 समर्थन र BF16 मा कामको साथ
डीपसिक V3.2-एक्सप

निर्मित V3.1-टर्मिनस, नयाँ मोडेल डीपसिक V3.2-एक्सप छरिएको ध्यान दृष्टिकोण प्रस्तुत गर्दछ जसले गुणस्तरमा कुनै कमी नल्याएर कम्प्युटिङ भार कम गर्न खोज्छ। कम्पनीका अनुसार, एपीआईको मूल्य ५०% भन्दा बढीले घट्यो तत्काल प्रभावबाट, र पहुँच यो अब तपाईंको एप, वेब र API मार्फत उपलब्ध छ।, को ढाँचामा प्रस्ताव गरिनुको अतिरिक्त खुला स्रोत जस्ता विकास प्लेटफर्महरूमा अनुहार अँध्यारो अनुहार.

प्राविधिक नवप्रवर्तन: छरिएको ध्यान र लामो सन्दर्भ

एआई मोडेलहरूमा कम ध्यान प्रविधि

यस अपडेटको मुटु हो डीपसिक स्पार्स अटेन्सन (DSA), एउटा संयन्त्र जसले सन्दर्भका सान्दर्भिक भागहरूलाई अझ सही रूपमा प्रशोधन गर्न प्राथमिकता दिन्छ। कम्पनीले a को प्रयोगको विवरण दिन्छ लाइटनिङ इन्डेक्सर जसले मुख्य टुक्राहरू र प्रक्रिया चयन गर्दछ "सुक्ष्म टोकन चयन", ठूला सन्दर्भ विन्डोहरू समेट्ने र कम जानकारी ओभरहेडको साथ एकैचोटि धेरै विचारधाराहरू ह्यान्डल गर्ने लक्ष्यका साथ।

विशेष सामग्री - यहाँ क्लिक गर्नुहोस्  मेटाले सुपरइन्टेलिजेन्स ल्याबहरूको सिर्जनासँगै सुपरइन्टेलिजेन्सको दौडलाई बढावा दिन्छ

यो दृष्टिकोणले पछ्याउँछ प्रशिक्षण र अनुमान दुवैमा सुधार, समयको गति बढाउँदै र मेमोरी खपत घटाउँदै। DeepSeek ले संकेत गर्दछ कि यसको सबैभन्दा भर्खरका संस्करणहरू पहिले नै FP8 लाई समर्थन गर्नुहोस् र सँग अनुकूलतामा काम गरिरहेका छन् BF16, संख्या ढाँचाहरू जसले गति र शुद्धता सन्तुलनमा मद्दत गर्दछ, र यसलाई सजिलो बनाउँछ स्थानीय हार्डवेयरमा कार्यान्वयन.

कम्पनीले जोड दिन्छ कि यो एउटा सुरुवात हो, अर्थात्, एक परीक्षण स्थल जसले यसको अर्को पुस्ताको वास्तुकलाको पूर्वानुमान गर्दछ। तैपनि, यसको आन्तरिक परीक्षणहरू उनीहरूले औंल्याए कि V3.2-Exp (प्रयोगात्मक संस्करण) ले खोज एजेन्ट, कोडिङ वा गणित जस्ता कार्यहरूमा V3.1-टर्मिनसको स्तरमा कार्य गर्दछ, लामो-सन्दर्भ परिदृश्यहरूमा दक्षताको थप लाभको साथ।

प्राविधिक भागको अतिरिक्त, उपलब्धता फराकिलो छ: मोडेललाई मा परीक्षण गर्न सकिन्छ अनुप्रयोग, वेब र API कम्पनीको। मूल्य कटौती (५०% भन्दा बढी) ले सञ्चालन लागत घटाउन खोजिरहेका उत्पादन टोलीहरू र इन्जिनियरिङ विभागहरूद्वारा अपनाउने कार्यलाई तीव्र पार्ने लक्ष्य राखेको छ।

विशेष सामग्री - यहाँ क्लिक गर्नुहोस्  DeepSeek R2 अप्रिलमा रिलिज हुन सक्छ र AI मा नयाँ कोसेढुङ्गा चिन्ह लगाउन सक्छ

सामुदायिक मोर्चामा, उद्घाटन अँगालो हाल्ने अनुहार र GitHub यसले अनुसन्धानकर्ताहरू र विकासकर्ताहरूलाई इकोसिस्टममा DeepSeek को प्रोफाइललाई सुदृढ पार्दै, लेखा परीक्षण गर्न, पुन: प्रयोग गर्न र सुधारहरू प्रस्ताव गर्न सक्षम बनाउँछ। खुला स्रोत एआई.

बजार प्रभाव र भूराजनीतिक पल्स

एआई इकोसिस्टम र मोडेल प्रतिस्पर्धा

यद्यपि यो कदमले बजारलाई हल्लाउने अपेक्षा गरिएको छैन जस्तो R1 र V3 वर्षको सुरुमा, V3.2-Exp ले घरेलु प्रतिद्वन्द्वीहरू जस्तै दबाब दिन सक्छ क्वेन (अलिबाबा) र अमेरिकी प्रतिस्पर्धीहरू जस्तै OpenAI, मानवशास्त्रीय वा xAI। मुख्य कुरा प्रदर्शन गर्नु हुनेछ कम लागतमा उच्च प्रदर्शन, ठूला एआई तैनाथीहरूको लागि विशेष गरी संवेदनशील कारक।

यो प्रक्षेपण जटिल वातावरणको बीचमा भएको हो: धेरै देशहरूले यसको प्रयोग सीमित गरेका छन् सरकारी निकायहरूमा डीपसिक (इटाली, संयुक्त राज्य अमेरिका र सहित) दक्षिण कोरिया), सुरक्षा चिन्ताहरू उद्धृत गर्दै। यी प्रतिबन्धहरूले कम्पनीलाई आफ्नो शासन र ग्यारेन्टीहरू यदि तपाईं संस्थागत उपस्थिति प्राप्त गर्न चाहनुहुन्छ भने।

औद्योगिक क्षेत्रमा, चीनले आफ्ना प्रविधि कम्पनीहरूलाई विदेशी अर्धचालकहरूमा निर्भरता कम गर्न दबाब दिइरहेको छ। एनभिडिया चिप्समा अमेरिकी निर्यात नियन्त्रण (जस्तै ब्ल्याकवेल) र थप प्रतिबन्धहरू - उदाहरणका लागि, मा RTX प्रो ६०००—, DeepSeek ले यसको अनुकूलन गर्न चिनियाँ चिप निर्माताहरूसँग सहकार्य गर्ने दाबी गर्छ स्थानीय हार्डवेयरमा कार्यान्वयनयस लाइनमा, क्षेत्रले समर्थन संकेत गरेको छ Huawei पछिल्लो मोडेल अपडेटमा।

विशेष सामग्री - यहाँ क्लिक गर्नुहोस्  अन्तर्राष्ट्रिय अन्तरिक्ष स्टेशनमा फसेका अन्तरिक्ष यात्रीहरू नौ महिनापछि पृथ्वीमा फर्किए

यदि मोडेलले सञ्चालन लागतको आधा हिस्सामा आफ्नो कार्यसम्पादन कायम राख्न सफल भयो भने, लामो कागजात भएका केसहरू प्रयोग गर्नुहोस्, लामो कुराकानी, वा माग गर्ने विश्लेषणात्मक कार्यहरूले विशेष गरी फाइदा पुर्‍याउन सक्छ। धेरै कम्पनीहरूको लागि, संयोजन दक्षता + मूल्य यो बेन्चमार्कमा केही अतिरिक्त अंकहरू जत्तिकै निर्णायक छ।

डीपसिकको दृष्टिकोणले खुलापन, दक्षता र तत्काल उपलब्धतालाई अझ सक्षम वास्तुकलाको प्रतिज्ञा गर्ने रोडम्यापसँग जोड्दछ। यदि कम्पनीले V3.1-टर्मिनस द्वारा प्रदर्शन गरिएको स्तर कायम राख्दै लागत कटौतीलाई समेकित गर्छ भने, नयाँ मोडेल लागत बढाए बिना नै जेनेरेटिभ एआईलाई व्यापक रूपमा तैनाथ गर्नको लागि व्यावहारिक बेन्चमार्क बन्न सक्छ।हामी हेर्नेछौं कि DeepSeek ले अब दक्षतालाई प्राविधिक आकांक्षा नभई कम्पनीहरू र विकासकर्ताहरूको लागि वास्तविक प्रतिस्पर्धात्मक लाभ बनाउन सक्छ कि सक्दैन।

VS कोडमा Deepseek
सम्बन्धित लेख:
भिजुअल स्टुडियो कोडमा डीपसिक कसरी प्रयोग गर्ने