کلود سونت ۴.۵: جهشی در کدنویسی، عامل‌ها و استفاده از کامپیوتر

اخرین بروزرسانی: 02/10/2025

  • این دستگاه در OSWorld 61,4٪ عملکرد دارد و در SWE-bench Verified پیشتاز است.
  • وظایف پیچیده را بیش از 30 ساعت انجام می‌دهد و تا 64.000 توکن تولید می‌کند
  • به‌روزرسانی‌های Claude Code و SDK جدید Claude Agent برای Agentها
  • امنیت پیشرفته (ASL-3) و قیمت مشابه: ۳/۱۵ دلار به ازای هر میلیون توکن

تصویر مدل کلود سونت ۴.۵

شرکت آنتروپیک (Anthropic) نرم‌افزار Claude Sonnet 4.5 را منتشر کرده است، انقلابی که بر برنامه‌نویسی، عامل‌ها (Agents) و کنترل کامپیوتر تمرکز دارد و به دنبال تثبیت پلتفرم در محیط‌های حرفه‌ای است. در چشم‌اندازی با رقبای سطح بالا، این شرکت این نسخه را به عنوان ... توصیف می‌کند. مدلی اصلاح‌شده‌تر و مفیدتر برای کارهای مهندسی تا به امروز

نسخه جدید بر اساس سابقه خانواده Sonnet ساخته شده است که در نسخه‌های قبلی استدلال و کدنویسی را بهبود بخشیده بودند. با تکیه بر این پایه، نسخه ۴.۵ قصد دارد دامنه عملی را با پیشرفت‌هایی در ... گسترش دهد. تداوم توجه، استفاده از ابزار و بهره‌وری، حفظ یک استراتژی محتاطانه در امنیت و هماهنگی.

قابلیت‌های کلیدی و بهبود عملکرد

تصویر عمومی کلود سونت ۴.۵

به گفته آنتروپیک، کلود سونت ۴.۵ قادر است بیش از ۳۰ ساعت روی کارهای پیچیده تمرکز خود را حفظ کند. و چند مرحله‌ای، که برای پروژه‌های طولانی که در آن‌ها پیوستگی زمینه مورد نیاز است، مناسب است. همچنین از خروجی‌هایی تا ... پشتیبانی می‌کند. ۶۴۰۰۰ توکن در یک پاسخ واحدو کنترل‌هایی را برای تنظیم «زمان تفکر» قبل از پاسخ دادن ارائه می‌دهد و در صورت نیاز، سرعت و جزئیات را متعادل می‌کند.

محتوای اختصاصی - اینجا را کلیک کنید  نحوه استفاده از Riffusion: هوش مصنوعی که متن را به صورت بلادرنگ به موسیقی تبدیل می‌کند

در کارهای واقعی جلوی کامپیوتر، این شرکت در OSWorld امتیاز ۶۱.۴٪ را گزارش می‌دهد که جهشی قابل توجه نسبت به امتیاز ۴۲.۲٪ مدل قبلی خود در همین آزمون است.در سناریوهای عملی، مدل می‌تواند وب را مرور کنید، صفحات گسترده را تکمیل کنید و اقدامات لازم را انجام دهید در برنامه‌های دسکتاپ از افزونه کروم، که باعث کاهش نظارت مداوم کاربر می‌شود.

سرزمینِ برنامه‌نویسی بیشترین پیشرفت‌ها را متمرکز می‌کنددر ارزیابی SWE-bench Verified، که بر کدنویسی اعمال شده در پروژه‌های دنیای واقعی تمرکز داشت، Sonnet 4.5 با 77,2٪ پیشتاز است (با پیکربندی‌هایی که تعداد را تحت محاسبات موازی افزایش می‌دهند). آنتروپیک پیشنهاد می‌کند که این مدل کل چرخه توسعه را پوشش دهد: برنامه‌ریزی، پیاده‌سازی، ریفکتورینگ و نگهداری پایگاه‌های کد بزرگ.

فراتر از توسعه‌ی محض، آنتروپیک کاربردهایی را شناسایی می‌کند که نیاز به جریان‌های طولانی و هماهنگی مراحل دارند.از امنیت سایبری و امور مالی گرفته تا بهره‌وری اداری و تحقیقات با استفاده از داده‌های داخلی و خارجی. در این زمینه‌ها، نویدبخش، وجود عوامل پایدارتری است که قادر به حفظ کار بلندمدت بدون از دست دادن ثبات باشند.

ابزارها و اکوسیستم توسعه‌دهندگان

کلود کد

این پرتاب همراه با چه خبر از کلود کد: ایست بازرسی برای ذخیره پیشرفت و بازگشت به حالت‌های قبلی، مانند تاریخچه نسخه، یکی از رابط ترمینال اصلاح‌شده, افزونه بومی برای ویژوال استودیو کد و بهبودهایی در ویرایش متن و حافظه از طریق API برای اجرای وظایف طولانی‌تر.

محتوای اختصاصی - اینجا را کلیک کنید  هوش مصنوعی پالانتیر: هوش مصنوعی سازمانی که در مقابل مایکروسافت می‌ایستد

آنتروپیک همچنین اولین نمایش را ارائه می‌دهد کلود ایجنت SDK, که زیرساختی را که شرکت برای ساخت نمایندگان خود استفاده می‌کند، شبیه‌سازی می‌کند.این کیت ابزارهایی برای حافظه بلندمدت، سیستم‌های مجوز و هماهنگی زیرعامل ارائه می‌دهد و ایجاد راه‌حل‌های خودکار را که برای دستیابی به اهداف مشترک و اتصال امن با ابزارهایی مانند ... همکاری می‌کنند، تسهیل می‌کند. WireGuard.

به عنوان مکمل، این شرکت به طور موقت «با کلود تصور کنید» را فعال می‌کند.، نمایشی که به ما امکان می‌دهد مشاهده کنیم که مدل چگونه تولید نرم‌افزار به صورت بلادرنگ بدون کد از پیش تعریف شده. این پیش‌نمایش که برای مدت محدودی برای کاربران مکس در دسترس است، پتانسیل مدل را برای ایجاد تعاملی نشان می‌دهد.

امنیت، هماهنگی و انعطاف‌پذیری

آنتروپیک، Sonnet 4.5 را در سطح حفاظت خود قرار می‌دهد. سطح ایمنی هوش مصنوعی ۳ (ASL-3), با فیلترهایی که برای تشخیص محتوای خطرناک، به ویژه موارد مرتبط با خطرات CBRN، آموزش دیده‌اند. این شرکت ادعا می‌کند که کاهش یافته است مثبت‌های کاذب با ضریب ده در مقایسه با نسخه اولیه این طبقه‌بندی‌کننده‌ها، و ارائه می‌دهد تداوم مکالمه با Sonnet 4 در صورت وقوع قفل امنیتی.

به طور موازی، شرکت تضمین می‌کند که این مدل رفتارهای ناخواسته مانند چاپلوسی یا پاسخ‌های فریبنده را کاهش می‌دهد و دفاع در برابر تلاش‌ها برای ... را تقویت می‌کند. تزریق سریعاین اقدامات به استفاده اشاره دارد در محیط‌های شرکتی قابل اعتمادتر است، جایی که اجرای اقدامات خودکار نیاز به کنترل و قابلیت ردیابی دارد.

محتوای اختصاصی - اینجا را کلیک کنید  یادگیری تقویتی چیست؟

در دسترس بودن، پلتفرم‌ها و قیمت‌ها

تصویر از کلود سونت ۴.۵

Claude Sonnet 4.5 در Claude.ai موجود است. (وب، iOS و اندروید) و برای توسعه‌دهندگان از طریق پلتفرم توسعه‌دهندگان کلودبا ادغام در سرویس‌هایی مانند Amazon Bedrock و Google Cloud Vertex AI. طرح رایگان با محدودیت تعداد جلسات که هر پنج ساعت یکبار ریست می‌شود و تعداد متغیری پیام بنا به تقاضا کار می‌کند. قیمت‌ها ثابت می‌مانند.: ۳ دلار به ازای هر میلیون توکن ورودی و ۱۵ دلار به ازای هر میلیون توکن خروجی.

از جمله ویژگی‌های دسترسی جدید، افزونه‌ی کروم کلود برای کاربران مکس منتشر شد. قبلاً در لیست انتظار ثبت شده بودند. اگرچه معیارها در مقایسه با تکرارهای قبلی بهبودهای قابل توجهی را نشان می‌دهند، اما آنتروپیک خاطرنشان می‌کند که عملکرد واقعی به مورد استفاده و بودجه استدلال پیکربندی شده برای هر کار بستگی دارد.

با ترکیبی از پیشرفت‌ها در کدنویسی، استقلال بیشتر برای عامل‌ها و تمرکز دقیق‌تر بر امنیت، Claude Sonnet 4.5 به عنوان یک گزینه مطمئن قرار گرفته است برای تیم‌های فنی که به تداوم و کنترل در فرآیندهای طولانی نیاز دارند، حفظ هزینه‌های پایدار و سازگاری با اکوسیستم مستقر شده‌ی آنتروپیک.

هوش مصنوعی تنظیم لینکدین
مقاله مرتبط:
لینکدین هوش مصنوعی خود را تنظیم می‌کند: تغییرات حریم خصوصی، مناطق و نحوه غیرفعال کردن آن