- यह OSWorld में 61,4% प्रदर्शन करता है और SWE-बेंच में अग्रणी है। सत्यापित
- 30 घंटे से अधिक समय तक जटिल कार्यों को संभालता है और 64.000 टोकन तक उत्पन्न करता है
- क्लाउड कोड और एजेंटों के लिए नए क्लाउड एजेंट SDK के अपडेट
- उन्नत सुरक्षा (ASL-3) और समान मूल्य: $3/$15 प्रति मिलियन टोकन

एंथ्रोपिक ने क्लाउड सॉनेट 4.5 जारी किया है, जो प्रोग्रामिंग, एजेंट्स और कंप्यूटर कंट्रोल पर केंद्रित एक नया संस्करण है जो पेशेवर परिवेश में प्लेटफ़ॉर्म को मज़बूत करने का प्रयास करता है। उच्च-स्तरीय प्रतिद्वंद्वियों के बीच, कंपनी इस रिलीज़ को अपनी सर्वश्रेष्ठ रिलीज़ बताती है। इंजीनियरिंग कार्यों के लिए अधिक परिष्कृत और उपयोगी मॉडल आज तक
नया संस्करण सॉनेट परिवार के पिछले संस्करणों के ट्रैक रिकॉर्ड पर आधारित है, जिसने पहले ही तर्क और कोडिंग में सुधार किया था। इसी आधार पर, 4.5 का लक्ष्य उन्नतियों के साथ व्यावहारिक दायरे का विस्तार करना है। ध्यान की दृढ़ता, उपकरण का उपयोग और उत्पादकतासुरक्षा और संरेखण में विवेकपूर्ण रणनीति बनाए रखना।
प्रमुख क्षमताएँ और प्रदर्शन सुधार

एन्थ्रोपिक के अनुसार, क्लाउड सॉनेट 4.5 जटिल कार्यों पर 30 घंटे से अधिक समय तक ध्यान केंद्रित रखने में सक्षम है। और बहु-चरणीय, जो लंबी परियोजनाओं के लिए अनुकूल है जहाँ संदर्भ की निरंतरता आवश्यक है। यह अधिकतम आउटपुट का भी समर्थन करता है एक ही प्रतिक्रिया में 64.000 टोकन, और प्रतिक्रिया देने से पहले "सोचने के समय" को समायोजित करने के लिए नियंत्रण प्रदान करता है, आवश्यकतानुसार गति और विवरण को संतुलित करता है।
कंप्यूटर के सामने वास्तविक कार्यों में, कंपनी ने ओएसवर्ल्ड में 61,4% अंक प्राप्त किए हैं, जो कि इसी परीक्षण में इसके पूर्ववर्ती के 42,2% से उल्लेखनीय वृद्धि है।व्यावहारिक परिदृश्यों में, मॉडल वेब ब्राउज़ करें, स्प्रेडशीट पूरी करें, और कार्य करें डेस्कटॉप अनुप्रयोगों में क्रोम एक्सटेंशन से, उपयोगकर्ता की निरंतर निगरानी कम हो जाती है।
की भूमि प्रोग्रामिंग में अधिकांश सुधार केंद्रित हैंएसडब्ल्यूई-बेंच सत्यापित मूल्यांकन में, जो वास्तविक दुनिया की परियोजनाओं पर लागू कोडिंग पर केंद्रित था, सॉनेट 4.5 77,2% के साथ सबसे आगे (ऐसे विन्यासों के साथ जो समानांतर कंप्यूटिंग के अंतर्गत संख्या बढ़ाते हैं)। एंथ्रोपिक का प्रस्ताव है कि यह मॉडल संपूर्ण विकास चक्र को कवर करता है: बड़े कोड बेस की योजना, कार्यान्वयन, रिफैक्टरिंग और रखरखाव.
विशुद्ध विकास से परे, एन्थ्रोपिक उन उपयोगों की पहचान करता है जिनके लिए लम्बे समय तक प्रवाह और चरणों के समन्वय की आवश्यकता होती है।साइबर सुरक्षा और वित्त से लेकर कार्यालय उत्पादकता और अनुसंधान तक, आंतरिक और बाह्य डेटा का उपयोग करते हुए। इन संदर्भों में, अधिक स्थिर एजेंटों में ही संभावना निहित है जो बिना निरंतरता खोए दीर्घकालिक कार्य को बनाए रखने में सक्षम हों।
डेवलपर उपकरण और पारिस्थितिकी तंत्र

इस लॉन्च के साथ-साथ क्लाउड कोड में नया क्या है?: चौकियों प्रगति को सहेजने और पिछली स्थिति में लौटने के लिए, जैसे संस्करण इतिहासएक, नया टर्मिनल इंटरफ़ेस, विज़ुअल स्टूडियो कोड के लिए मूल एक्सटेंशन और लंबे कार्यों को चलाने के लिए एपीआई के माध्यम से संदर्भ और मेमोरी संपादन में सुधार।
एंथ्रोपिक का प्रीमियर भी हुआ क्लाउड एजेंट SDK, जो उस बुनियादी ढांचे की नकल करता है जिसका उपयोग कंपनी अपने एजेंटों के निर्माण के लिए करती हैयह किट दीर्घकालिक स्मृति, अनुमति प्रणालियों और उप-एजेंट समन्वय के लिए उपकरण प्रदान करती है, जो स्वचालित समाधानों के निर्माण की सुविधा प्रदान करती है जो सामान्य लक्ष्यों की दिशा में सहयोग करते हैं और जैसे उपकरणों के साथ सुरक्षित कनेक्टिविटी प्रदान करते हैं WireGuard.
एक पूरक के रूप में, फर्म अस्थायी रूप से "क्लाउड के साथ कल्पना करें" को सक्षम बनाती है, एक प्रदर्शन जो हमें यह देखने की अनुमति देता है कि मॉडल कैसे वास्तविक समय में सॉफ्टवेयर उत्पन्न करता है कोई पूर्वनिर्धारित कोड नहीं। यह पूर्वावलोकन, जो मैक्स उपयोगकर्ताओं के लिए सीमित समय के लिए उपलब्ध है, मॉडल की इंटरैक्टिव निर्माण क्षमता को दर्शाता है।
सुरक्षा, संरेखण और लचीलापन
एंथ्रोपिक ने अपने संरक्षण स्तर में सॉनेट 4.5 को शामिल किया है AI सुरक्षा स्तर 3 (ASL-3), खतरनाक सामग्री, खासकर सीबीआरएन जोखिमों से संबंधित सामग्री का पता लगाने के लिए प्रशिक्षित फ़िल्टर के साथ। कंपनी का दावा है कि उसने दस गुना अधिक गलत सकारात्मक परिणाम इन क्लासिफायर के प्रारंभिक संस्करण की तुलना में, और प्रदान करता है सुरक्षा लॉकआउट होने पर सॉनेट 4 के साथ बातचीत जारी रखना.
इसके समानांतर, कंपनी यह सुनिश्चित करती है कि यह मॉडल चापलूसी या भ्रामक प्रतिक्रियाओं जैसे अवांछित व्यवहारों को कम करता है और धोखाधड़ी के प्रयासों के खिलाफ सुरक्षा को मजबूत करता है। शीघ्र इंजेक्शनये उपाय एक उपयोग की ओर इशारा करते हैं कॉर्पोरेट वातावरण में अधिक विश्वसनीय, जहां स्वचालित कार्यों के निष्पादन के लिए नियंत्रण और पता लगाने की क्षमता की आवश्यकता होती है।
उपलब्धता, प्लेटफ़ॉर्म और कीमतें

क्लाउड सॉनेट 4.5 क्लाउड.ai पर उपलब्ध है (वेब, आईओएस और एंड्रॉइड) और क्लाउड डेवलपर प्लेटफ़ॉर्म के माध्यम से डेवलपर्स के लिएअमेज़न बेडरॉक और गूगल क्लाउड वर्टेक्स एआई जैसी सेवाओं के साथ एकीकरण के साथ। मुफ़्त योजना एक सत्र सीमा के साथ काम करती है जो हर पाँच घंटे में रीसेट हो जाती है और माँग पर संदेशों की संख्या बदलती रहती है। कीमतें वही रहती हैं।: $3 प्रति मिलियन इनपुट टोकन और $15 प्रति मिलियन आउटपुट टोकन.
नई पहुँच सुविधाओं में, क्लाउड का क्रोम एक्सटेंशन मैक्स उपयोगकर्ताओं के लिए उपलब्ध हो रहा है। पहले प्रतीक्षा सूची में पंजीकृत। हालाँकि बेंचमार्क पिछले संस्करणों की तुलना में काफ़ी सुधार दर्शाते हैं, एंथ्रोपिक का कहना है कि वास्तविक प्रदर्शन उपयोग के मामले और प्रत्येक कार्य के लिए निर्धारित तर्क बजट पर निर्भर करता है।
कोडिंग में प्रगति, एजेंटों के लिए अधिक स्वायत्तता और सुरक्षा पर सख्त ध्यान के संयोजन के साथ, क्लाउड सॉनेट 4.5 को एक ठोस विकल्प के रूप में स्थापित किया गया है तकनीकी टीमों के लिए जिन्हें लंबी प्रक्रियाओं में निरंतरता और नियंत्रण की आवश्यकता होती है, स्थिर लागत और एंथ्रोपिक के पहले से ही स्थापित पारिस्थितिकी तंत्र के साथ संगतता बनाए रखना.
मैं एक प्रौद्योगिकी उत्साही हूं जिसने अपनी "गीक" रुचियों को एक पेशे में बदल दिया है। मैंने अपने जीवन के 10 से अधिक वर्ष अत्याधुनिक तकनीक का उपयोग करने और शुद्ध जिज्ञासा से सभी प्रकार के कार्यक्रमों के साथ छेड़छाड़ करने में बिताए हैं। अब मैंने कंप्यूटर प्रौद्योगिकी और वीडियो गेम में विशेषज्ञता हासिल कर ली है। ऐसा इसलिए है क्योंकि 5 वर्षों से अधिक समय से मैं प्रौद्योगिकी और वीडियो गेम पर विभिन्न वेबसाइटों के लिए लिख रहा हूं, ऐसे लेख बना रहा हूं जो आपको ऐसी भाषा में आवश्यक जानकारी देने का प्रयास करते हैं जो हर किसी के लिए समझ में आती है।
यदि आपके कोई प्रश्न हैं, तो मेरी जानकारी विंडोज ऑपरेटिंग सिस्टम के साथ-साथ मोबाइल फोन के लिए एंड्रॉइड से संबंधित हर चीज तक है। और मेरी प्रतिबद्धता आपके प्रति है, मैं हमेशा कुछ मिनट बिताने और इस इंटरनेट की दुनिया में आपके किसी भी प्रश्न को हल करने में आपकी मदद करने को तैयार हूं।