- این دستگاه در OSWorld 61,4٪ عملکرد دارد و در SWE-bench Verified پیشتاز است.
- وظایف پیچیده را بیش از 30 ساعت انجام میدهد و تا 64.000 توکن تولید میکند
- بهروزرسانیهای Claude Code و SDK جدید Claude Agent برای Agentها
- امنیت پیشرفته (ASL-3) و قیمت مشابه: ۳/۱۵ دلار به ازای هر میلیون توکن
شرکت آنتروپیک (Anthropic) نرمافزار Claude Sonnet 4.5 را منتشر کرده است، انقلابی که بر برنامهنویسی، عاملها (Agents) و کنترل کامپیوتر تمرکز دارد و به دنبال تثبیت پلتفرم در محیطهای حرفهای است. در چشماندازی با رقبای سطح بالا، این شرکت این نسخه را به عنوان ... توصیف میکند. مدلی اصلاحشدهتر و مفیدتر برای کارهای مهندسی تا به امروز
نسخه جدید بر اساس سابقه خانواده Sonnet ساخته شده است که در نسخههای قبلی استدلال و کدنویسی را بهبود بخشیده بودند. با تکیه بر این پایه، نسخه ۴.۵ قصد دارد دامنه عملی را با پیشرفتهایی در ... گسترش دهد. تداوم توجه، استفاده از ابزار و بهرهوری، حفظ یک استراتژی محتاطانه در امنیت و هماهنگی.
قابلیتهای کلیدی و بهبود عملکرد

به گفته آنتروپیک، کلود سونت ۴.۵ قادر است بیش از ۳۰ ساعت روی کارهای پیچیده تمرکز خود را حفظ کند. و چند مرحلهای، که برای پروژههای طولانی که در آنها پیوستگی زمینه مورد نیاز است، مناسب است. همچنین از خروجیهایی تا ... پشتیبانی میکند. ۶۴۰۰۰ توکن در یک پاسخ واحدو کنترلهایی را برای تنظیم «زمان تفکر» قبل از پاسخ دادن ارائه میدهد و در صورت نیاز، سرعت و جزئیات را متعادل میکند.
در کارهای واقعی جلوی کامپیوتر، این شرکت در OSWorld امتیاز ۶۱.۴٪ را گزارش میدهد که جهشی قابل توجه نسبت به امتیاز ۴۲.۲٪ مدل قبلی خود در همین آزمون است.در سناریوهای عملی، مدل میتواند وب را مرور کنید، صفحات گسترده را تکمیل کنید و اقدامات لازم را انجام دهید در برنامههای دسکتاپ از افزونه کروم، که باعث کاهش نظارت مداوم کاربر میشود.
سرزمینِ برنامهنویسی بیشترین پیشرفتها را متمرکز میکنددر ارزیابی SWE-bench Verified، که بر کدنویسی اعمال شده در پروژههای دنیای واقعی تمرکز داشت، Sonnet 4.5 با 77,2٪ پیشتاز است (با پیکربندیهایی که تعداد را تحت محاسبات موازی افزایش میدهند). آنتروپیک پیشنهاد میکند که این مدل کل چرخه توسعه را پوشش دهد: برنامهریزی، پیادهسازی، ریفکتورینگ و نگهداری پایگاههای کد بزرگ.
فراتر از توسعهی محض، آنتروپیک کاربردهایی را شناسایی میکند که نیاز به جریانهای طولانی و هماهنگی مراحل دارند.از امنیت سایبری و امور مالی گرفته تا بهرهوری اداری و تحقیقات با استفاده از دادههای داخلی و خارجی. در این زمینهها، نویدبخش، وجود عوامل پایدارتری است که قادر به حفظ کار بلندمدت بدون از دست دادن ثبات باشند.
ابزارها و اکوسیستم توسعهدهندگان

این پرتاب همراه با چه خبر از کلود کد: ایست بازرسی برای ذخیره پیشرفت و بازگشت به حالتهای قبلی، مانند تاریخچه نسخه، یکی از رابط ترمینال اصلاحشده, افزونه بومی برای ویژوال استودیو کد و بهبودهایی در ویرایش متن و حافظه از طریق API برای اجرای وظایف طولانیتر.
آنتروپیک همچنین اولین نمایش را ارائه میدهد کلود ایجنت SDK, که زیرساختی را که شرکت برای ساخت نمایندگان خود استفاده میکند، شبیهسازی میکند.این کیت ابزارهایی برای حافظه بلندمدت، سیستمهای مجوز و هماهنگی زیرعامل ارائه میدهد و ایجاد راهحلهای خودکار را که برای دستیابی به اهداف مشترک و اتصال امن با ابزارهایی مانند ... همکاری میکنند، تسهیل میکند. WireGuard.
به عنوان مکمل، این شرکت به طور موقت «با کلود تصور کنید» را فعال میکند.، نمایشی که به ما امکان میدهد مشاهده کنیم که مدل چگونه تولید نرمافزار به صورت بلادرنگ بدون کد از پیش تعریف شده. این پیشنمایش که برای مدت محدودی برای کاربران مکس در دسترس است، پتانسیل مدل را برای ایجاد تعاملی نشان میدهد.
امنیت، هماهنگی و انعطافپذیری
آنتروپیک، Sonnet 4.5 را در سطح حفاظت خود قرار میدهد. سطح ایمنی هوش مصنوعی ۳ (ASL-3), با فیلترهایی که برای تشخیص محتوای خطرناک، به ویژه موارد مرتبط با خطرات CBRN، آموزش دیدهاند. این شرکت ادعا میکند که کاهش یافته است مثبتهای کاذب با ضریب ده در مقایسه با نسخه اولیه این طبقهبندیکنندهها، و ارائه میدهد تداوم مکالمه با Sonnet 4 در صورت وقوع قفل امنیتی.
به طور موازی، شرکت تضمین میکند که این مدل رفتارهای ناخواسته مانند چاپلوسی یا پاسخهای فریبنده را کاهش میدهد و دفاع در برابر تلاشها برای ... را تقویت میکند. تزریق سریعاین اقدامات به استفاده اشاره دارد در محیطهای شرکتی قابل اعتمادتر است، جایی که اجرای اقدامات خودکار نیاز به کنترل و قابلیت ردیابی دارد.
در دسترس بودن، پلتفرمها و قیمتها

Claude Sonnet 4.5 در Claude.ai موجود است. (وب، iOS و اندروید) و برای توسعهدهندگان از طریق پلتفرم توسعهدهندگان کلودبا ادغام در سرویسهایی مانند Amazon Bedrock و Google Cloud Vertex AI. طرح رایگان با محدودیت تعداد جلسات که هر پنج ساعت یکبار ریست میشود و تعداد متغیری پیام بنا به تقاضا کار میکند. قیمتها ثابت میمانند.: ۳ دلار به ازای هر میلیون توکن ورودی و ۱۵ دلار به ازای هر میلیون توکن خروجی.
از جمله ویژگیهای دسترسی جدید، افزونهی کروم کلود برای کاربران مکس منتشر شد. قبلاً در لیست انتظار ثبت شده بودند. اگرچه معیارها در مقایسه با تکرارهای قبلی بهبودهای قابل توجهی را نشان میدهند، اما آنتروپیک خاطرنشان میکند که عملکرد واقعی به مورد استفاده و بودجه استدلال پیکربندی شده برای هر کار بستگی دارد.
با ترکیبی از پیشرفتها در کدنویسی، استقلال بیشتر برای عاملها و تمرکز دقیقتر بر امنیت، Claude Sonnet 4.5 به عنوان یک گزینه مطمئن قرار گرفته است برای تیمهای فنی که به تداوم و کنترل در فرآیندهای طولانی نیاز دارند، حفظ هزینههای پایدار و سازگاری با اکوسیستم مستقر شدهی آنتروپیک.
من یک علاقه مند به فناوری هستم که علایق "گیک" خود را به یک حرفه تبدیل کرده ام. من بیش از 10 سال از زندگی خود را صرف استفاده از فناوری های پیشرفته و سرهم بندی کردن انواع برنامه ها از روی کنجکاوی کرده ام. اکنون در زمینه فناوری رایانه و بازی های ویدیویی تخصص دارم. این به این دلیل است که بیش از 5 سال است که برای وب سایت های مختلف در زمینه فناوری و بازی های ویدیویی می نویسم و مقالاتی را ایجاد می کنم که به دنبال ارائه اطلاعات مورد نیاز شما به زبانی قابل فهم برای همه هستند.
اگر سوالی دارید، دانش من از همه چیز مربوط به سیستم عامل ویندوز و همچنین اندروید برای تلفن های همراه است. و تعهد من به شماست، من همیشه حاضرم چند دقیقه وقت بگذارم و به شما کمک کنم تا هر سوالی را که ممکن است در این دنیای اینترنتی داشته باشید حل کنید.