Claude Sonnet 4.5: Kod, Agent və Təhlükəsizlik Təkmilləşdirmələri

OSWorld-də 61,4% performans göstərir və SWE-bench Verified-də liderdir
30 saatdan çox mürəkkəb tapşırıqları yerinə yetirir və 64.000-ə qədər token yaradır
Claude Code və agentlər üçün yeni Claude Agent SDK yeniləmələri
Təkmil təhlükəsizlik (ASL-3) və eyni qiymət: milyon token üçün $3/$15

Claude Sonnet 4.5 modelinin şəkli

Anthropic, platformanı peşəkar mühitlərdə birləşdirməyə çalışan proqramlaşdırma, agentlər və kompüter nəzarətinə yönəlmiş təkamül olan Claude Sonnet 4.5-i buraxdı. Yüksək səviyyəli rəqibləri olan bir mənzərədə şirkət bu buraxılışı özünün kimi təsvir edir mühəndislik işləri üçün daha incə və faydalı model Bu günə qədər

Yeni versiya əvvəlki iterasiyalarda düşünmə və kodlaşdırmanı təkmilləşdirmiş Sonnet ailəsinin təcrübəsinə əsaslanır. Bu təməl üzərində qurulan 4.5, irəliləyişlərlə praktiki əhatə dairəsini genişləndirməyi hədəfləyir diqqətin davamlılığı, alətlərdən istifadə və məhsuldarlıq, təhlükəsizlik və uyğunlaşmada ehtiyatlı strategiyanın saxlanması.

Əsas imkanlar və performans təkmilləşdirmələri

Claude Sonnetin ümumi şəkli 4.5

Anthropic-ə görə, Claude Sonnet 4.5 mürəkkəb tapşırıqlar üzərində 30 saatdan çox diqqəti saxlamağa qadirdir. və kontekstin davamlılığının tələb olunduğu uzun layihələrə üstünlük verən çox mərhələli. O, həmçinin qədər çıxışları dəstəkləyir Bir cavabda 64.000 token, və cavab vermədən əvvəl "düşünmə vaxtını" tənzimləmək, sürəti və lazımi detalları balanslaşdırmaq üçün nəzarət təklif edir.

Eksklüziv məzmun - Bura klikləyin ChatGPT-də Şirkət Biliyi: bu nədir və necə işləyir

Kompüter qarşısında real işlərdə, Şirkət OSWorld-də 61,4%, sələfinin bu eyni testdəki 42,2%-dən nəzərəçarpacaq bir artım olduğunu bildirir.Praktik ssenarilərdə model edə bilər internetə göz atın, cədvəlləri tamamlayın və hərəkətlər edin Chrome genişlənməsindən masaüstü proqramlarda davamlı istifadəçi monitorinqini azaldır.

torpağı Proqramlaşdırma təkmilləşdirmələrin çoxunu cəmləşdirir. Real layihələrə tətbiq edilən kodlaşdırmaya diqqət yetirən SWE-bench Verified qiymətləndirməsində, Sonnet 4.5 77,2% ilə liderlik edir (paralel hesablama altında sayını artıran konfiqurasiyalarla). Anthropic, modelin bütün inkişaf dövrünü əhatə etdiyini təklif edir: böyük kod bazalarının planlaşdırılması, həyata keçirilməsi, refaktorinqi və saxlanılması.

Təmiz inkişafdan kənar, Antropik uzunmüddətli axınlar və addımların koordinasiyası tələb edən istifadələri müəyyən edir.Kibertəhlükəsizlik və maliyyədən tutmuş ofis məhsuldarlığına və daxili və xarici məlumatlardan istifadə edərək tədqiqata qədər. Bu kontekstlərdə vəd ardıcıllığı itirmədən uzunmüddətli işi davam etdirə bilən daha stabil agentlərdədir.

Tərtibatçı Alətləri və Ekosistemi

Klod Kodu

Başlatma müşayiəti ilə gəlir Claude Code-da yeniliklər: nəzarət nöqtələri tərəqqini saxlamaq və əvvəlki vəziyyətlərə qayıtmaq üçün, məsələn versiya tarixçəsi, One yenilənmiş terminal interfeysi, Visual Studio Kodu üçün yerli genişləndirmə və daha uzun tapşırıqları yerinə yetirmək üçün API vasitəsilə kontekst və yaddaş redaktəsində təkmilləşdirmələr.

Eksklüziv məzmun - Bura klikləyin Google Maps indi əsl ikinci pilot kimi danışır: Əkizlər sükanı idarə edir

Antropik filmin də premyerası var Claude Agent SDK, şirkətin öz agentlərini qurmaq üçün istifadə etdiyi infrastrukturu təkrarlayırDəst uzunmüddətli yaddaş, icazə sistemləri və subagent koordinasiyası üçün alətlər təklif edir, ümumi məqsədlərə doğru əməkdaşlıq edən avtomatlaşdırılmış həllərin yaradılmasını asanlaşdırır və alətlərlə təhlükəsiz əlaqə yaradır. WireGuard.

tamamlayıcı olaraq, Firma müvəqqəti olaraq “Klodla Təsəvvür Et”i işə salır., modelin necə olduğunu müşahidə etməyə imkan verən bir nümayiş real vaxt rejimində proqram təminatı yaradır Əvvəlcədən təyin edilmiş kod yoxdur. Maks istifadəçiləri üçün məhdud müddətə təqdim edilən bu önizləmə modelin interaktiv yaratma potensialını göstərir.

Təhlükəsizlik, uyğunlaşma və möhkəmlik

Anthropic, Sonnet 4.5-i qoruma səviyyəsinə daxildir AI Təhlükəsizlik Səviyyəsi 3 (ASL-3), təhlükəli məzmunu, xüsusən də KBRN riskləri ilə əlaqəli olanları aşkar etmək üçün öyrədilmiş filtrlərlə. Şirkət azaldığını iddia edir on dəfə yanlış pozitivlər bu təsnifatçıların ilkin versiyası ilə müqayisədə və təkliflər Təhlükəsizlik kilidi baş verərsə, Sonnet 4 ilə söhbətin davamlılığı.

Paralel olaraq şirkət bunu təmin edir Model yaltaqlıq və ya aldadıcı cavablar kimi arzuolunmaz davranışları azaldır və cəhdlərə qarşı müdafiəni gücləndirir. təcili inyeksiyaBu tədbirlər istifadəyə işarə edir korporativ mühitlərdə daha etibarlıdır, burada avtomatlaşdırılmış hərəkətlərin icrası nəzarət və izlənilmə tələb edir.

Eksklüziv məzmun - Bura klikləyin NotebookLM indi Android-də əlçatandır: qeydlərinizi yaratmaq, ümumiləşdirmək və dinləmək üçün Google-un süni intellekt proqramı haqqında hər şey.

Mövcudluq, platformalar və qiymətlər

Claude Sonnet tərəfindən hazırlanmış şəkil 4.5

Claude Sonnet 4.5 Claude.ai saytında mövcuddur (veb, iOS və Android) və Claude Developer Platforması vasitəsilə tərtibatçılar üçün, Amazon Bedrock və Google Cloud Vertex AI kimi xidmətlərə inteqrasiya ilə. Pulsuz plan hər beş saatdan bir sıfırlanan sessiya limiti və tələb olunan mesajların dəyişən sayı ilə işləyir. Qiymətlər eyni qalır.: milyon giriş tokeni üçün 3 dollar və milyon çıxış tokeni üçün 15 dollar.

Yeni giriş xüsusiyyətləri arasında, Claude-un Chrome genişləndirməsi Max istifadəçilərinə yayılır. əvvəllər gözləmə siyahısında qeydiyyatdan keçmişdir. Qiymətləndirmələr əvvəlki iterasiyalarla müqayisədə əhəmiyyətli təkmilləşdirmələr təklif etsə də, Anthropic bizə xatırladır ki, faktiki performans istifadə vəziyyətindən və hər bir tapşırıq üçün konfiqurasiya edilmiş əsaslandırma büdcəsindən asılıdır.

Kodlaşdırmada irəliləyişlərin birləşməsi, agentlər üçün daha çox muxtariyyət və təhlükəsizliyə daha ciddi diqqət yetirməklə, Claude Sonnet 4.5 möhkəm seçim kimi yerləşdirilib uzun proseslərdə davamlılığa və nəzarətə ehtiyacı olan texniki qruplar üçün, sabit xərcləri və Anthropic-in artıq yerləşdirilmiş ekosistemi ilə uyğunluğu qorumaq.

Əlaqədar məqalə:

LinkedIn süni intellektini tənzimləyir: məxfilik dəyişiklikləri, bölgələr və onu necə söndürmək olar

Alberto navarro

Mən öz "geek" maraqlarını peşəyə çevirmiş texnologiya həvəskarıyam. Mən həyatımın 10 ilindən çoxunu qabaqcıl texnologiyadan istifadə edərək və hər cür proqramlarla maraqlanaraq sərf etmişəm. İndi mən kompüter texnologiyası və video oyunları üzrə ixtisaslaşmışam. Bunun səbəbi, 5 ildən artıqdır ki, texnologiya və video oyunlarla bağlı müxtəlif saytlar üçün yazılar yazıram, sizə lazım olan məlumatları hamı üçün başa düşülən dildə verməyə çalışan məqalələr hazırlayıram.

Hər hansı bir sualınız varsa, mənim biliklərim Windows əməliyyat sistemi, eləcə də mobil telefonlar üçün Android ilə əlaqəli hər şeyi əhatə edir. Və mənim öhdəliyim sizədir, mən həmişə bir neçə dəqiqə sərf etməyə və bu internet dünyasında yarana biləcək bütün suallarınızı həll etməyə kömək etməyə hazıram.