- Այն OSWorld-ում կատարում է 61,4% և առաջատար է SWE-bench-ում։ Verified
- Կատարում է բարդ առաջադրանքներ ավելի քան 30 ժամ և ստեղծում է մինչև 64.000 տոկեն
- Claude Code-ի և գործակալների համար նախատեսված նոր Claude Agent SDK-ի թարմացումներ
- Բարելավված անվտանգություն (ASL-3) և նույն գինը՝ $3/$15 մեկ միլիոն տոկենի համար
Anthropic-ը թողարկել է Claude Sonnet 4.5-ը, որը ծրագրավորման, գործակալների և համակարգչային կառավարման վրա կենտրոնացած էվոլյուցիա է և ձգտում է ամրապնդել հարթակը մասնագիտական միջավայրերում: Բարձր մակարդակի մրցակիցների հետ համադրման պայմաններում ընկերությունը այս թողարկումը նկարագրում է որպես իր... ավելի կատարելագործված և օգտակար մոդել ինժեներական առաջադրանքների համար մինչ օրս
Նոր տարբերակը հիմնված է Sonnet ընտանիքի փորձի վրա, որն արդեն բարելավել էր դատողությունն ու կոդավորումը նախորդ տարբերակներում: Այդ հիմքի վրա հիմնվելով՝ 4.5-ը նպատակ ունի ընդլայնել գործնական շրջանակը՝ առաջընթացներ կատարելով... ուշադրության, գործիքների օգտագործման և արտադրողականության կայունություն, պահպանելով անվտանգության և համաձայնեցվածության խոհեմ ռազմավարություն։
Հիմնական հնարավորություններ և կատարողականի բարելավումներ

Ըստ Անտրոպիկի՝ Claude Sonnet 4.5-ը կարող է կենտրոնացվածությունը պահպանել ավելի քան 30 ժամ բարդ առաջադրանքների վրա։ և բազմափուլ, որը նախապատվություն է տալիս երկարատև նախագծերին, որտեղ պահանջվում է համատեքստի շարունակականություն: Այն նաև աջակցում է մինչև 64.000 թոքեն մեկ պատասխանումև առաջարկում է կառավարման տարրեր՝ արձագանքելուց առաջ «մտածելու ժամանակը» կարգավորելու համար՝ անհրաժեշտության դեպքում հավասարակշռելով արագությունն ու մանրամասները։
Համակարգչի առջև իրական առաջադրանքներ կատարելիս, Ընկերությունը OSWorld-ում հայտնում է 61,4% ցուցանիշի մասին, ինչը նշանակալի աճ է նախորդի 42,2%-ի համեմատ, որը գրանցվել էր նույն թեստում։Գործնական իրավիճակներում մոդելը կարող է զննել համացանցը, լրացնել աղյուսակներ և կատարել գործողություններ Chrome ընդլայնման աշխատասեղանի հավելվածներում՝ նվազեցնելով օգտատիրոջ շարունակական մոնիթորինգը։
Երկիրը Ծրագրավորումը կենտրոնանում է բարելավումների մեծ մասի վրաSWE-bench Verified գնահատման մեջ, որը կենտրոնացած էր իրական աշխարհի նախագծերում կիրառվող կոդավորման վրա, Sonnet 4.5-ը առաջատարն է՝ 77,2%-ով (զուգահեռ հաշվարկների դեպքում քանակը մեծացնող կոնֆիգուրացիաներով): Anthropic-ը առաջարկում է, որ մոդելը ընդգրկի ամբողջ մշակման ցիկլը. խոշոր կոդային բազաների պլանավորում, իրականացում, վերակառուցում և պահպանում.
Մաքուր զարգացումից այն կողմ, Անթրոպը նույնականացնում է այնպիսի օգտագործումներ, որոնք պահանջում են երկարատև հոսքեր և քայլերի համակարգում։Կիբերանվտանգությունից և ֆինանսներից մինչև գրասենյակային արտադրողականություն և հետազոտություններ՝ օգտագործելով ներքին և արտաքին տվյալներ: Այս համատեքստերում խոստումնալից է ավելի կայուն գործակալների առկայությունը, որոնք ունակ են երկարատև աշխատանք իրականացնել՝ առանց կայունությունը կորցնելու:
Մշակողի գործիքներ և էկոհամակարգ

Մեկնարկը ուղեկցվում է Ի՞նչ նորություններ կան Claude Code-ում: անցակետեր առաջընթացը պահպանելու և նախորդ վիճակներին վերադառնալու համար, օրինակ՝ վարկածի պատմություն, ՄԵԿ վերափոխված տերմինալի ինտերֆեյս, Visual Studio Code-ի բնիկ ընդլայնում և API-ի միջոցով համատեքստի և հիշողության խմբագրման բարելավումներ՝ ավելի երկար առաջադրանքներ կատարելու համար։
«Անթրոպիկ»-ը նաև պրեմիերա է անցկացնում Կլոդ Ագենտի SDK, որը կրկնօրինակում է այն ենթակառուցվածքը, որն ընկերությունն օգտագործում է իր սեփական գործակալները կառուցելու համարՀավաքածուն առաջարկում է գործիքներ երկարատև հիշողության, թույլտվությունների համակարգերի և ենթագործակալների համակարգման համար՝ նպաստելով ավտոմատացված լուծումների ստեղծմանը, որոնք համագործակցում են ընդհանուր նպատակների համար և անվտանգ կապ են ապահովում այնպիսի գործիքների հետ, ինչպիսիք են՝ WireGuard- ը.
Որպես լրացում, Ընկերությունը ժամանակավորապես գործարկում է «Պատկերացրեք Կլոդի հետ» ծրագիրը, ցուցադրություն, որը թույլ է տալիս մեզ դիտարկել, թե ինչպես է մոդելը ստեղծում է ծրագրային ապահովում իրական ժամանակում Նախապես սահմանված կոդ չկա: Այս նախադիտումը, որը սահմանափակ ժամանակով հասանելի է Max օգտատերերի համար, ցույց է տալիս մոդելի ներուժը ինտերակտիվ ստեղծման համար:
Անվտանգություն, համընկնում և դիմադրողականություն
Anthropic-ը իր պաշտպանության մակարդակում ներառում է Sonnet 4.5-ը Արհեստական ինտելեկտի անվտանգության մակարդակ 3 (ASL-3), վտանգավոր բովանդակությունը հայտնաբերելու համար պատրաստված ֆիլտրերով, մասնավորապես՝ ՀԲՌՆ ռիսկերի հետ կապվածները: Ընկերությունը պնդում է, որ նվազեցրել է կեղծ դրական արդյունքներ՝ տասնապատիկ անգամ համեմատած այս դասակարգիչների սկզբնական տարբերակի հետ և առաջարկում է Sonnet 4-ի հետ զրույցի շարունակականությունը անվտանգության արգելափակման դեպքում.
Միաժամանակ, ընկերությունը ապահովում է, որ Մոդելը նվազեցնում է անցանկալի վարքագծերը, ինչպիսիք են շողոքորթությունը կամ խաբուսիկ պատասխանները, և ուժեղացնում է պաշտպանությունը… արագ ներարկումԱյս միջոցառումները ցույց են տալիս օգտագործումը ավելի հուսալի կորպորատիվ միջավայրերում, որտեղ ավտոմատացված գործողությունների կատարումը պահանջում է վերահսկողություն և հետագծելիություն։
Հասանելիություն, հարթակներ և գներ

Claude Sonnet 4.5-ը հասանելի է Claude.ai կայքում (վեբ, iOS և Android) և մշակողների համար՝ Claude Developer Platform-ի միջոցով, ինտեգրված այնպիսի ծառայությունների հետ, ինչպիսիք են Amazon Bedrock-ը և Google Cloud Vertex AI-ը: Անվճար պլանը գործում է յուրաքանչյուր հինգ ժամը մեկ զրոյացվող սեսիաների սահմանափակմամբ և պահանջարկի դեպքում հաղորդագրությունների փոփոխական քանակով: Գները մնում են նույնը:$3 մեկ միլիոն մուտքային տոկենների համար և $15 մեկ միլիոն ելքային տոկենների համար.
Նոր մուտքի հնարավորությունների շարքում, Claude's Chrome ընդլայնումը հասանելի է Max օգտատերերի համար։ նախկինում գրանցված է եղել սպասման ցուցակում։ Չնայած չափանիշները ենթադրում են էական բարելավումներ նախորդ տարբերակների համեմատ, Anthropic-ը նշում է, որ իրական կատարողականը կախված է օգտագործման դեպքից և յուրաքանչյուր առաջադրանքի համար կարգավորված դատողության բյուջեից։
Կոդավորման առաջընթացի, գործակալների ավելի մեծ ինքնավարության և անվտանգության վրա ավելի խիստ ուշադրության համադրությամբ, Claude Sonnet 4.5-ը դիրքավորվում է որպես ամուր տարբերակ տեխնիկական թիմերի համար, որոնք երկարատև գործընթացներում անընդհատության և վերահսկողության կարիք ունեն, պահպանելով կայուն ծախսեր և համատեղելիություն Anthropic-ի արդեն իսկ տեղակայված էկոհամակարգի հետ.
Ես տեխնոլոգիայի էնտուզիաստ եմ, ով իր «գիկ» հետաքրքրությունները վերածել է մասնագիտության։ Ես իմ կյանքի ավելի քան 10 տարին անցկացրել եմ՝ օգտագործելով նորագույն տեխնոլոգիաներ և զուտ հետաքրքրասիրությունից դրդված բոլոր տեսակի ծրագրերի հետ աշխատելիս: Այժմ ես մասնագիտացել եմ համակարգչային տեխնիկայի և տեսախաղերի մեջ։ Դա պայմանավորված է նրանով, որ ավելի քան 5 տարի ես գրում եմ տարբեր կայքերի համար տեխնոլոգիայի և վիդեոխաղերի վերաբերյալ՝ ստեղծելով հոդվածներ, որոնք փորձում են ձեզ տրամադրել ձեզ անհրաժեշտ տեղեկատվությունը բոլորին հասկանալի լեզվով:
Եթե ունեք հարցեր, իմ գիտելիքները տատանվում են Windows օպերացիոն համակարգի հետ կապված ամեն ինչից, ինչպես նաև բջջային հեռախոսների համար նախատեսված Android-ից: Եվ իմ հանձնառությունն է ձեզ, ես միշտ պատրաստ եմ մի քանի րոպե ծախսել և օգնել ձեզ լուծել ցանկացած հարց, որը կարող եք ունենալ այս ինտերնետային աշխարհում: