क्लाउड सॉनेट 4.5: कोडिंग, एजेंट और कंप्यूटर उपयोग में छलांग

आखिरी अपडेट: 02/10/2025

  • यह OSWorld में 61,4% प्रदर्शन करता है और SWE-बेंच में अग्रणी है। सत्यापित
  • 30 घंटे से अधिक समय तक जटिल कार्यों को संभालता है और 64.000 टोकन तक उत्पन्न करता है
  • क्लाउड कोड और एजेंटों के लिए नए क्लाउड एजेंट SDK के अपडेट
  • उन्नत सुरक्षा (ASL-3) और समान मूल्य: $3/$15 प्रति मिलियन टोकन

क्लाउड सॉनेट 4.5 मॉडल की छवि

एंथ्रोपिक ने क्लाउड सॉनेट 4.5 जारी किया है, जो प्रोग्रामिंग, एजेंट्स और कंप्यूटर कंट्रोल पर केंद्रित एक नया संस्करण है जो पेशेवर परिवेश में प्लेटफ़ॉर्म को मज़बूत करने का प्रयास करता है। उच्च-स्तरीय प्रतिद्वंद्वियों के बीच, कंपनी इस रिलीज़ को अपनी सर्वश्रेष्ठ रिलीज़ बताती है। इंजीनियरिंग कार्यों के लिए अधिक परिष्कृत और उपयोगी मॉडल आज तक

नया संस्करण सॉनेट परिवार के पिछले संस्करणों के ट्रैक रिकॉर्ड पर आधारित है, जिसने पहले ही तर्क और कोडिंग में सुधार किया था। इसी आधार पर, 4.5 का लक्ष्य उन्नतियों के साथ व्यावहारिक दायरे का विस्तार करना है। ध्यान की दृढ़ता, उपकरण का उपयोग और उत्पादकतासुरक्षा और संरेखण में विवेकपूर्ण रणनीति बनाए रखना।

प्रमुख क्षमताएँ और प्रदर्शन सुधार

क्लाउड सॉनेट 4.5 की सामान्य छवि

एन्थ्रोपिक के अनुसार, क्लाउड सॉनेट 4.5 जटिल कार्यों पर 30 घंटे से अधिक समय तक ध्यान केंद्रित रखने में सक्षम है। और बहु-चरणीय, जो लंबी परियोजनाओं के लिए अनुकूल है जहाँ संदर्भ की निरंतरता आवश्यक है। यह अधिकतम आउटपुट का भी समर्थन करता है एक ही प्रतिक्रिया में 64.000 टोकन, और प्रतिक्रिया देने से पहले "सोचने के समय" को समायोजित करने के लिए नियंत्रण प्रदान करता है, आवश्यकतानुसार गति और विवरण को संतुलित करता है।

विशेष सामग्री - यहां क्लिक करें  मेटा वाइब्स: मेटा एआई पर नया एआई वीडियो फ़ीड

कंप्यूटर के सामने वास्तविक कार्यों में, कंपनी ने ओएसवर्ल्ड में 61,4% अंक प्राप्त किए हैं, जो कि इसी परीक्षण में इसके पूर्ववर्ती के 42,2% से उल्लेखनीय वृद्धि है।व्यावहारिक परिदृश्यों में, मॉडल वेब ब्राउज़ करें, स्प्रेडशीट पूरी करें, और कार्य करें डेस्कटॉप अनुप्रयोगों में क्रोम एक्सटेंशन से, उपयोगकर्ता की निरंतर निगरानी कम हो जाती है।

की भूमि प्रोग्रामिंग में अधिकांश सुधार केंद्रित हैंएसडब्ल्यूई-बेंच सत्यापित मूल्यांकन में, जो वास्तविक दुनिया की परियोजनाओं पर लागू कोडिंग पर केंद्रित था, सॉनेट 4.5 77,2% के साथ सबसे आगे (ऐसे विन्यासों के साथ जो समानांतर कंप्यूटिंग के अंतर्गत संख्या बढ़ाते हैं)। एंथ्रोपिक का प्रस्ताव है कि यह मॉडल संपूर्ण विकास चक्र को कवर करता है: बड़े कोड बेस की योजना, कार्यान्वयन, रिफैक्टरिंग और रखरखाव.

विशुद्ध विकास से परे, एन्थ्रोपिक उन उपयोगों की पहचान करता है जिनके लिए लम्बे समय तक प्रवाह और चरणों के समन्वय की आवश्यकता होती है।साइबर सुरक्षा और वित्त से लेकर कार्यालय उत्पादकता और अनुसंधान तक, आंतरिक और बाह्य डेटा का उपयोग करते हुए। इन संदर्भों में, अधिक स्थिर एजेंटों में ही संभावना निहित है जो बिना निरंतरता खोए दीर्घकालिक कार्य को बनाए रखने में सक्षम हों।

डेवलपर उपकरण और पारिस्थितिकी तंत्र

क्लाउड कोड

इस लॉन्च के साथ-साथ क्लाउड कोड में नया क्या है?: चौकियों प्रगति को सहेजने और पिछली स्थिति में लौटने के लिए, जैसे संस्करण इतिहासएक, नया टर्मिनल इंटरफ़ेस, विज़ुअल स्टूडियो कोड के लिए मूल एक्सटेंशन और लंबे कार्यों को चलाने के लिए एपीआई के माध्यम से संदर्भ और मेमोरी संपादन में सुधार।

विशेष सामग्री - यहां क्लिक करें  ओपनएआई एक 'ओपन-वेट' मॉडल पर दांव लगा रहा है: उन्नत तर्क के साथ इसका नया एआई कुछ ऐसा ही दिखेगा।

एंथ्रोपिक का प्रीमियर भी हुआ क्लाउड एजेंट SDK, जो उस बुनियादी ढांचे की नकल करता है जिसका उपयोग कंपनी अपने एजेंटों के निर्माण के लिए करती हैयह किट दीर्घकालिक स्मृति, अनुमति प्रणालियों और उप-एजेंट समन्वय के लिए उपकरण प्रदान करती है, जो स्वचालित समाधानों के निर्माण की सुविधा प्रदान करती है जो सामान्य लक्ष्यों की दिशा में सहयोग करते हैं और जैसे उपकरणों के साथ सुरक्षित कनेक्टिविटी प्रदान करते हैं WireGuard.

एक पूरक के रूप में, फर्म अस्थायी रूप से "क्लाउड के साथ कल्पना करें" को सक्षम बनाती है, एक प्रदर्शन जो हमें यह देखने की अनुमति देता है कि मॉडल कैसे वास्तविक समय में सॉफ्टवेयर उत्पन्न करता है कोई पूर्वनिर्धारित कोड नहीं। यह पूर्वावलोकन, जो मैक्स उपयोगकर्ताओं के लिए सीमित समय के लिए उपलब्ध है, मॉडल की इंटरैक्टिव निर्माण क्षमता को दर्शाता है।

सुरक्षा, संरेखण और लचीलापन

एंथ्रोपिक ने अपने संरक्षण स्तर में सॉनेट 4.5 को शामिल किया है AI सुरक्षा स्तर 3 (ASL-3), खतरनाक सामग्री, खासकर सीबीआरएन जोखिमों से संबंधित सामग्री का पता लगाने के लिए प्रशिक्षित फ़िल्टर के साथ। कंपनी का दावा है कि उसने दस गुना अधिक गलत सकारात्मक परिणाम इन क्लासिफायर के प्रारंभिक संस्करण की तुलना में, और प्रदान करता है सुरक्षा लॉकआउट होने पर सॉनेट 4 के साथ बातचीत जारी रखना.

इसके समानांतर, कंपनी यह सुनिश्चित करती है कि यह मॉडल चापलूसी या भ्रामक प्रतिक्रियाओं जैसे अवांछित व्यवहारों को कम करता है और धोखाधड़ी के प्रयासों के खिलाफ सुरक्षा को मजबूत करता है। शीघ्र इंजेक्शनये उपाय एक उपयोग की ओर इशारा करते हैं कॉर्पोरेट वातावरण में अधिक विश्वसनीय, जहां स्वचालित कार्यों के निष्पादन के लिए नियंत्रण और पता लगाने की क्षमता की आवश्यकता होती है।

विशेष सामग्री - यहां क्लिक करें  कोपायलट क्या है और इसके लिए क्या है? जानें कि यह आपकी उत्पादकता और कोड को कैसे बढ़ाता है

उपलब्धता, प्लेटफ़ॉर्म और कीमतें

क्लाउड सॉनेट 4.5 द्वारा चित्र

क्लाउड सॉनेट 4.5 क्लाउड.ai पर उपलब्ध है (वेब, आईओएस और एंड्रॉइड) और क्लाउड डेवलपर प्लेटफ़ॉर्म के माध्यम से डेवलपर्स के लिएअमेज़न बेडरॉक और गूगल क्लाउड वर्टेक्स एआई जैसी सेवाओं के साथ एकीकरण के साथ। मुफ़्त योजना एक सत्र सीमा के साथ काम करती है जो हर पाँच घंटे में रीसेट हो जाती है और माँग पर संदेशों की संख्या बदलती रहती है। कीमतें वही रहती हैं।: $3 प्रति मिलियन इनपुट टोकन और $15 प्रति मिलियन आउटपुट टोकन.

नई पहुँच सुविधाओं में, क्लाउड का क्रोम एक्सटेंशन मैक्स उपयोगकर्ताओं के लिए उपलब्ध हो रहा है। पहले प्रतीक्षा सूची में पंजीकृत। हालाँकि बेंचमार्क पिछले संस्करणों की तुलना में काफ़ी सुधार दर्शाते हैं, एंथ्रोपिक का कहना है कि वास्तविक प्रदर्शन उपयोग के मामले और प्रत्येक कार्य के लिए निर्धारित तर्क बजट पर निर्भर करता है।

कोडिंग में प्रगति, एजेंटों के लिए अधिक स्वायत्तता और सुरक्षा पर सख्त ध्यान के संयोजन के साथ, क्लाउड सॉनेट 4.5 को एक ठोस विकल्प के रूप में स्थापित किया गया है तकनीकी टीमों के लिए जिन्हें लंबी प्रक्रियाओं में निरंतरता और नियंत्रण की आवश्यकता होती है, स्थिर लागत और एंथ्रोपिक के पहले से ही स्थापित पारिस्थितिकी तंत्र के साथ संगतता बनाए रखना.

लिंक्डइन समायोजन एआई
संबंधित लेख:
लिंक्डइन अपने AI को समायोजित करता है: गोपनीयता परिवर्तन, क्षेत्र और इसे अक्षम कैसे करें