- يحقق أداءً بنسبة 61,4% في OSWorld ويتصدر في SWE-bench Verified
- يتعامل مع المهام المعقدة لأكثر من 30 ساعة ويولد ما يصل إلى 64.000 رمز
- تحديثات لبرنامج Claude Code ومجموعة أدوات تطوير البرامج الجديدة Claude Agent للوكلاء
- الأمان المعزز (ASL-3) والسعر نفسه: 3 دولارات/15 دولارًا لكل مليون رمز

أصدرت أنثروبيك الإصدار 4.5 من Claude Sonnet، وهو تطور يُركز على البرمجة والوكلاء والتحكم الحاسوبي، ويهدف إلى تعزيز المنصة في البيئات المهنية. في ظل وجود منافسين كبار، تصف الشركة هذا الإصدار بأنه نموذج أكثر دقة وفائدة للمهام الهندسية حتى تاريخ.
يعتمد الإصدار الجديد على سجل عائلة سونيت، التي حسّنت بالفعل التفكير والترميز في الإصدارات السابقة. بناءً على هذا الأساس، يهدف الإصدار 4.5 إلى توسيع النطاق العملي من خلال التطورات في استمرار الاهتمام واستخدام الأدوات والإنتاجية، مع الحفاظ على استراتيجية حكيمة في الأمن والمحاذاة.
القدرات الرئيسية وتحسينات الأداء

وفقا لـ Anthropic، يتمتع Claude Sonnet 4.5 بالقدرة على الحفاظ على التركيز لمدة تزيد عن 30 ساعة في المهام المعقدة. ومتعدد الخطوات، مما يُفضّل المشاريع الطويلة التي تتطلب استمرارية السياق. كما يدعم مخرجات تصل إلى 64.000 رمزًا في استجابة واحدةويقدم عناصر تحكم لضبط "وقت التفكير" قبل الاستجابة، وموازنة السرعة والتفاصيل حسب الحاجة.
في المهام الحقيقية أمام الكمبيوتر، وتفيد الشركة بتحقيق نسبة 61,4% في OSWorld، وهي قفزة ملحوظة من نسبة 42,2% التي حققتها سابقتها في نفس الاختبار.في السيناريوهات العملية، يمكن للنموذج تصفح الويب، واستكمال جداول البيانات، وتنفيذ الإجراءات في تطبيقات سطح المكتب من ملحق Chrome، مما يقلل من مراقبة المستخدم المستمرة.
أرض تركز البرمجة على معظم التحسيناتفي تقييم SWE-bench Verified، الذي ركز على الترميز المطبق على المشاريع الواقعية، سونيت 4.5 تقود الطريق بنسبة 77,2٪ (مع تكوينات تزيد العدد في ظل الحوسبة المتوازية). يقترح أنثروبيك أن يغطي النموذج دورة التطوير بأكملها: التخطيط والتنفيذ وإعادة الهيكلة وصيانة قواعد التعليمات البرمجية الكبيرة.
ما وراء التنمية الخالصة، يحدد Anthropic الاستخدامات التي تتطلب تدفقات مطولة وتنسيق الخطوات.من الأمن السيبراني والتمويل إلى إنتاجية المكاتب والبحث باستخدام البيانات الداخلية والخارجية. في هذه السياقات، يكمن الوعد في وكلاء أكثر استقرارًا قادرين على استدامة العمل على المدى الطويل دون فقدان الاتساق.
أدوات المطور والنظام البيئي

ويأتي الإطلاق مصحوبًا بـ ما الجديد في Claude Code: نقاط تفتيش لحفظ التقدم والعودة إلى الحالات السابقة، مثل تاريخ النسخة، واحد واجهة طرفية مُجددة, ملحق أصلي لبرنامج Visual Studio Code وتحسينات في تحرير السياق والذاكرة عبر واجهة برمجة التطبيقات لتشغيل المهام الأطول.
يعرض أنثروبيك أيضًا لأول مرة مجموعة أدوات تطوير البرامج الخاصة بوكيل كلود, الذي يكرر البنية التحتية التي تستخدمها الشركة لبناء وكلائها الخاصينتقدم المجموعة أدوات للذاكرة طويلة المدى وأنظمة الأذونات وتنسيق الوكلاء الفرعيين، مما يسهل إنشاء حلول آلية تتعاون نحو تحقيق أهداف مشتركة وتأمين الاتصال بأدوات مثل WireGuard.
كمكمل ، تقوم الشركة بتمكين "تخيل مع كلود" مؤقتًا، وهو عرض توضيحي يسمح لنا بمراقبة كيفية عمل النموذج يُنشئ برامج في الوقت الفعلي لا يوجد كود مُعَدَّ مُسبقًا. هذه المعاينة، المُتاحة لفترة محدودة لمستخدمي Max، تُوضِّح إمكانات النموذج في الإنشاء التفاعلي.
الأمن والمحاذاة والمرونة
يتضمن Anthropic Sonnet 4.5 في مستوى الحماية الخاص به مستوى سلامة الذكاء الاصطناعي 3 (ASL-3), مع فلاتر مُدرَّبة على اكتشاف المحتوى الخطير، وخاصةً تلك المتعلقة بمخاطر المواد الكيميائية والبيولوجية والإشعاعية والنووية. وتزعم الشركة أنها قلَّلت نتائج إيجابية خاطئة بمقدار عشرة أضعاف مقارنة بالإصدار الأولي لهذه المصنفات، ويقدم استمرارية المحادثة مع Sonnet 4 في حالة حدوث قفل أمني.
وبالتوازي مع ذلك، تعمل الشركة على ضمان أن يقلل النموذج من السلوكيات غير المرغوب فيها مثل الإطراء أو الاستجابات الخادعة ويعزز الدفاعات ضد محاولات الحقن الفوريتشير هذه التدابير إلى الاستخدام أكثر موثوقية في البيئات المؤسسيةحيث يتطلب تنفيذ الإجراءات الآلية ضوابط وإمكانية تتبع.
التوفر والمنصات والأسعار

Claude Sonnet 4.5 متاح على Claude.ai (الويب، iOS و Android) وللمطورين عبر منصة Claude Developerمع التكامل مع خدمات مثل Amazon Bedrock وGoogle Cloud Vertex AI. تعمل الباقة المجانية بحد جلسة يُعاد ضبطه كل خمس ساعات، مع عدد متغير من الرسائل عند الطلب. الأسعار ثابتة.: 3 دولارات لكل مليون رمز إدخال و15 دولارًا لكل مليون رمز إخراج.
ومن بين ميزات الوصول الجديدة، تم طرح إضافة Claude's Chrome لمستخدمي Max. مُسجَّل سابقًا في قائمة الانتظار. على الرغم من أن المعايير تُشير إلى تحسينات جوهرية مُقارنةً بالإصدارات السابقة، تُشير أنثروبيك إلى أن الأداء الفعلي يعتمد على حالة الاستخدام وميزانية الاستدلال المُخصَّصة لكل مهمة.
بفضل مجموعة من التطورات في الترميز، واستقلالية أكبر للوكلاء، والتركيز الأكثر صرامة على الأمان، يعتبر Claude Sonnet 4.5 خيارًا قويًا للفرق الفنية التي تحتاج إلى الاستمرارية والتحكم في العمليات الطويلة، الحفاظ على تكاليف مستقرة والتوافق مع النظام البيئي المنتشر بالفعل في Anthropic.
أنا من عشاق التكنولوجيا وقد حول اهتماماته "المهووسة" إلى مهنة. لقد أمضيت أكثر من 10 سنوات من حياتي في استخدام التكنولوجيا المتطورة والتعديل على جميع أنواع البرامج بدافع الفضول الخالص. الآن تخصصت في تكنولوجيا الكمبيوتر وألعاب الفيديو. وذلك لأنني منذ أكثر من 5 سنوات أكتب لمواقع مختلفة حول التكنولوجيا وألعاب الفيديو، وأقوم بإنشاء مقالات تسعى إلى تزويدك بالمعلومات التي تحتاجها بلغة مفهومة للجميع.
إذا كان لديك أي أسئلة، فإن معرفتي تتراوح بين كل ما يتعلق بنظام التشغيل Windows وكذلك Android للهواتف المحمولة. والتزامي تجاهك هو أنني على استعداد دائمًا لقضاء بضع دقائق ومساعدتك في حل أي أسئلة قد تكون لديكم في عالم الإنترنت هذا.