كلود سونيت 4.5: قفزة في البرمجة والوكلاء واستخدام الكمبيوتر

آخر تحديث: 02/10/2025
نبذة عن الكاتب: ألبرتو نافارو

  • يحقق أداءً بنسبة 61,4% في OSWorld ويتصدر في SWE-bench Verified
  • يتعامل مع المهام المعقدة لأكثر من 30 ساعة ويولد ما يصل إلى 64.000 رمز
  • تحديثات لبرنامج Claude Code ومجموعة أدوات تطوير البرامج الجديدة Claude Agent للوكلاء
  • الأمان المعزز (ASL-3) والسعر نفسه: 3 دولارات/15 دولارًا لكل مليون رمز

صورة لنموذج كلود سونيت 4.5

أصدرت أنثروبيك الإصدار 4.5 من Claude Sonnet، وهو تطور يُركز على البرمجة والوكلاء والتحكم الحاسوبي، ويهدف إلى تعزيز المنصة في البيئات المهنية. في ظل وجود منافسين كبار، تصف الشركة هذا الإصدار بأنه نموذج أكثر دقة وفائدة للمهام الهندسية حتى تاريخ.

يعتمد الإصدار الجديد على سجل عائلة سونيت، التي حسّنت بالفعل التفكير والترميز في الإصدارات السابقة. بناءً على هذا الأساس، يهدف الإصدار 4.5 إلى توسيع النطاق العملي من خلال التطورات في استمرار الاهتمام واستخدام الأدوات والإنتاجية، مع الحفاظ على استراتيجية حكيمة في الأمن والمحاذاة.

القدرات الرئيسية وتحسينات الأداء

صورة عامة لسونيت كلود 4.5

وفقا لـ Anthropic، يتمتع Claude Sonnet 4.5 بالقدرة على الحفاظ على التركيز لمدة تزيد عن 30 ساعة في المهام المعقدة. ومتعدد الخطوات، مما يُفضّل المشاريع الطويلة التي تتطلب استمرارية السياق. كما يدعم مخرجات تصل إلى 64.000 رمزًا في استجابة واحدةويقدم عناصر تحكم لضبط "وقت التفكير" قبل الاستجابة، وموازنة السرعة والتفاصيل حسب الحاجة.

محتوى حصري - اضغط هنا  يعاني ChatGPT من انقطاع عالمي: ما الذي يحدث وماذا تفعل

في المهام الحقيقية أمام الكمبيوتر، وتفيد الشركة بتحقيق نسبة 61,4% في OSWorld، وهي قفزة ملحوظة من نسبة 42,2% التي حققتها سابقتها في نفس الاختبار.في السيناريوهات العملية، يمكن للنموذج تصفح الويب، واستكمال جداول البيانات، وتنفيذ الإجراءات في تطبيقات سطح المكتب من ملحق Chrome، مما يقلل من مراقبة المستخدم المستمرة.

أرض تركز البرمجة على معظم التحسيناتفي تقييم SWE-bench Verified، الذي ركز على الترميز المطبق على المشاريع الواقعية، سونيت 4.5 تقود الطريق بنسبة 77,2٪ (مع تكوينات تزيد العدد في ظل الحوسبة المتوازية). يقترح أنثروبيك أن يغطي النموذج دورة التطوير بأكملها: التخطيط والتنفيذ وإعادة الهيكلة وصيانة قواعد التعليمات البرمجية الكبيرة.

ما وراء التنمية الخالصة، يحدد Anthropic الاستخدامات التي تتطلب تدفقات مطولة وتنسيق الخطوات.من الأمن السيبراني والتمويل إلى إنتاجية المكاتب والبحث باستخدام البيانات الداخلية والخارجية. في هذه السياقات، يكمن الوعد في وكلاء أكثر استقرارًا قادرين على استدامة العمل على المدى الطويل دون فقدان الاتساق.

أدوات المطور والنظام البيئي

كلود كود

ويأتي الإطلاق مصحوبًا بـ ما الجديد في Claude Code: نقاط تفتيش لحفظ التقدم والعودة إلى الحالات السابقة، مثل تاريخ النسخة، واحد واجهة طرفية مُجددة, ملحق أصلي لبرنامج Visual Studio Code وتحسينات في تحرير السياق والذاكرة عبر واجهة برمجة التطبيقات لتشغيل المهام الأطول.

محتوى حصري - اضغط هنا  Nano Banana Pro: قفزة جديدة من Google في مجال التصوير المدعوم بالذكاء الاصطناعي

يعرض أنثروبيك أيضًا لأول مرة مجموعة أدوات تطوير البرامج الخاصة بوكيل كلود, الذي يكرر البنية التحتية التي تستخدمها الشركة لبناء وكلائها الخاصينتقدم المجموعة أدوات للذاكرة طويلة المدى وأنظمة الأذونات وتنسيق الوكلاء الفرعيين، مما يسهل إنشاء حلول آلية تتعاون نحو تحقيق أهداف مشتركة وتأمين الاتصال بأدوات مثل WireGuard.

كمكمل ، تقوم الشركة بتمكين "تخيل مع كلود" مؤقتًا، وهو عرض توضيحي يسمح لنا بمراقبة كيفية عمل النموذج يُنشئ برامج في الوقت الفعلي لا يوجد كود مُعَدَّ مُسبقًا. هذه المعاينة، المُتاحة لفترة محدودة لمستخدمي Max، تُوضِّح إمكانات النموذج في الإنشاء التفاعلي.

الأمن والمحاذاة والمرونة

يتضمن Anthropic Sonnet 4.5 في مستوى الحماية الخاص به مستوى سلامة الذكاء الاصطناعي 3 (ASL-3), مع فلاتر مُدرَّبة على اكتشاف المحتوى الخطير، وخاصةً تلك المتعلقة بمخاطر المواد الكيميائية والبيولوجية والإشعاعية والنووية. وتزعم الشركة أنها قلَّلت نتائج إيجابية خاطئة بمقدار عشرة أضعاف مقارنة بالإصدار الأولي لهذه المصنفات، ويقدم استمرارية المحادثة مع Sonnet 4 في حالة حدوث قفل أمني.

وبالتوازي مع ذلك، تعمل الشركة على ضمان أن يقلل النموذج من السلوكيات غير المرغوب فيها مثل الإطراء أو الاستجابات الخادعة ويعزز الدفاعات ضد محاولات الحقن الفوريتشير هذه التدابير إلى الاستخدام أكثر موثوقية في البيئات المؤسسيةحيث يتطلب تنفيذ الإجراءات الآلية ضوابط وإمكانية تتبع.

محتوى حصري - اضغط هنا  أمازون تراهن على الذكاء الاصطناعي الشخصي باستحواذها على Bee

التوفر والمنصات والأسعار

صورة بواسطة كلود سونيت 4.5

Claude Sonnet 4.5 متاح على Claude.ai (الويب، iOS و Android) وللمطورين عبر منصة Claude Developerمع التكامل مع خدمات مثل Amazon Bedrock وGoogle Cloud Vertex AI. تعمل الباقة المجانية بحد جلسة يُعاد ضبطه كل خمس ساعات، مع عدد متغير من الرسائل عند الطلب. الأسعار ثابتة.: 3 دولارات لكل مليون رمز إدخال و15 دولارًا لكل مليون رمز إخراج.

ومن بين ميزات الوصول الجديدة، تم طرح إضافة Claude's Chrome لمستخدمي Max. مُسجَّل سابقًا في قائمة الانتظار. على الرغم من أن المعايير تُشير إلى تحسينات جوهرية مُقارنةً بالإصدارات السابقة، تُشير أنثروبيك إلى أن الأداء الفعلي يعتمد على حالة الاستخدام وميزانية الاستدلال المُخصَّصة لكل مهمة.

بفضل مجموعة من التطورات في الترميز، واستقلالية أكبر للوكلاء، والتركيز الأكثر صرامة على الأمان، يعتبر Claude Sonnet 4.5 خيارًا قويًا للفرق الفنية التي تحتاج إلى الاستمرارية والتحكم في العمليات الطويلة، الحفاظ على تكاليف مستقرة والتوافق مع النظام البيئي المنتشر بالفعل في Anthropic.

تعديل لينكدإن الذكاء الاصطناعي
المادة ذات الصلة:
LinkedIn يضبط الذكاء الاصطناعي الخاص به: تغييرات الخصوصية والمناطق وكيفية تعطيله