Կլոդ Սոնետ 4.5. Ցատկ կոդավորման, գործակալների և համակարգչի օգտագործման մեջ

Վերջին թարմացումը. 02/10/2025

  • Այն OSWorld-ում կատարում է 61,4% և առաջատար է SWE-bench-ում։ Verified
  • Կատարում է բարդ առաջադրանքներ ավելի քան 30 ժամ և ստեղծում է մինչև 64.000 տոկեն
  • Claude Code-ի և գործակալների համար նախատեսված նոր Claude Agent SDK-ի թարմացումներ
  • Բարելավված անվտանգություն (ASL-3) և նույն գինը՝ $3/$15 մեկ միլիոն տոկենի համար

Claude Sonnet 4.5 մոդելի պատկերը

Anthropic-ը թողարկել է Claude Sonnet 4.5-ը, որը ծրագրավորման, գործակալների և համակարգչային կառավարման վրա կենտրոնացած էվոլյուցիա է և ձգտում է ամրապնդել հարթակը մասնագիտական ​​միջավայրերում: Բարձր մակարդակի մրցակիցների հետ համադրման պայմաններում ընկերությունը այս թողարկումը նկարագրում է որպես իր... ավելի կատարելագործված և օգտակար մոդել ինժեներական առաջադրանքների համար մինչ օրս

Նոր տարբերակը հիմնված է Sonnet ընտանիքի փորձի վրա, որն արդեն բարելավել էր դատողությունն ու կոդավորումը նախորդ տարբերակներում: Այդ հիմքի վրա հիմնվելով՝ 4.5-ը նպատակ ունի ընդլայնել գործնական շրջանակը՝ առաջընթացներ կատարելով... ուշադրության, գործիքների օգտագործման և արտադրողականության կայունություն, պահպանելով անվտանգության և համաձայնեցվածության խոհեմ ռազմավարություն։

Հիմնական հնարավորություններ և կատարողականի բարելավումներ

Կլոդ Սոնետ 4.5-ի ընդհանուր պատկերը

Ըստ Անտրոպիկի՝ Claude Sonnet 4.5-ը կարող է կենտրոնացվածությունը պահպանել ավելի քան 30 ժամ բարդ առաջադրանքների վրա։ և բազմափուլ, որը նախապատվություն է տալիս երկարատև նախագծերին, որտեղ պահանջվում է համատեքստի շարունակականություն: Այն նաև աջակցում է մինչև 64.000 թոքեն մեկ պատասխանումև առաջարկում է կառավարման տարրեր՝ արձագանքելուց առաջ «մտածելու ժամանակը» կարգավորելու համար՝ անհրաժեշտության դեպքում հավասարակշռելով արագությունն ու մանրամասները։

Բացառիկ բովանդակություն - Սեղմեք այստեղ  YouTube-ը խստացնում է իր քաղաքականությունը զանգվածային արտադրության և արհեստական ​​ինտելեկտով աշխատող տեսանյութերի դեմ

Համակարգչի առջև իրական առաջադրանքներ կատարելիս, Ընկերությունը OSWorld-ում հայտնում է 61,4% ցուցանիշի մասին, ինչը նշանակալի աճ է նախորդի 42,2%-ի համեմատ, որը գրանցվել էր նույն թեստում։Գործնական իրավիճակներում մոդելը կարող է զննել համացանցը, լրացնել աղյուսակներ և կատարել գործողություններ Chrome ընդլայնման աշխատասեղանի հավելվածներում՝ նվազեցնելով օգտատիրոջ շարունակական մոնիթորինգը։

Երկիրը Ծրագրավորումը կենտրոնանում է բարելավումների մեծ մասի վրաSWE-bench Verified գնահատման մեջ, որը կենտրոնացած էր իրական աշխարհի նախագծերում կիրառվող կոդավորման վրա, Sonnet 4.5-ը առաջատարն է՝ 77,2%-ով (զուգահեռ հաշվարկների դեպքում քանակը մեծացնող կոնֆիգուրացիաներով): Anthropic-ը առաջարկում է, որ մոդելը ընդգրկի ամբողջ մշակման ցիկլը. խոշոր կոդային բազաների պլանավորում, իրականացում, վերակառուցում և պահպանում.

Մաքուր զարգացումից այն կողմ, Անթրոպը նույնականացնում է այնպիսի օգտագործումներ, որոնք պահանջում են երկարատև հոսքեր և քայլերի համակարգում։Կիբերանվտանգությունից և ֆինանսներից մինչև գրասենյակային արտադրողականություն և հետազոտություններ՝ օգտագործելով ներքին և արտաքին տվյալներ: Այս համատեքստերում խոստումնալից է ավելի կայուն գործակալների առկայությունը, որոնք ունակ են երկարատև աշխատանք իրականացնել՝ առանց կայունությունը կորցնելու:

Մշակողի գործիքներ և էկոհամակարգ

Կլոդ Կոդ

Մեկնարկը ուղեկցվում է Ի՞նչ նորություններ կան Claude Code-ում: անցակետեր առաջընթացը պահպանելու և նախորդ վիճակներին վերադառնալու համար, օրինակ՝ վարկածի պատմություն, ՄԵԿ վերափոխված տերմինալի ինտերֆեյս, Visual Studio Code-ի բնիկ ընդլայնում և API-ի միջոցով համատեքստի և հիշողության խմբագրման բարելավումներ՝ ավելի երկար առաջադրանքներ կատարելու համար։

Բացառիկ բովանդակություն - Սեղմեք այստեղ  Անթրոպիկը և արհեստական ​​ինտելեկտի դեպքը, որը խորհուրդ տվեց սպիտակեցնող խմել. երբ մոդելները խաբում են

«Անթրոպիկ»-ը նաև պրեմիերա է անցկացնում Կլոդ Ագենտի SDK, որը կրկնօրինակում է այն ենթակառուցվածքը, որն ընկերությունն օգտագործում է իր սեփական գործակալները կառուցելու համարՀավաքածուն առաջարկում է գործիքներ երկարատև հիշողության, թույլտվությունների համակարգերի և ենթագործակալների համակարգման համար՝ նպաստելով ավտոմատացված լուծումների ստեղծմանը, որոնք համագործակցում են ընդհանուր նպատակների համար և անվտանգ կապ են ապահովում այնպիսի գործիքների հետ, ինչպիսիք են՝ WireGuard- ը.

Որպես լրացում, Ընկերությունը ժամանակավորապես գործարկում է «Պատկերացրեք Կլոդի հետ» ծրագիրը, ցուցադրություն, որը թույլ է տալիս մեզ դիտարկել, թե ինչպես է մոդելը ստեղծում է ծրագրային ապահովում իրական ժամանակում Նախապես սահմանված կոդ չկա: Այս նախադիտումը, որը սահմանափակ ժամանակով հասանելի է Max օգտատերերի համար, ցույց է տալիս մոդելի ներուժը ինտերակտիվ ստեղծման համար:

Անվտանգություն, համընկնում և դիմադրողականություն

Anthropic-ը իր պաշտպանության մակարդակում ներառում է Sonnet 4.5-ը Արհեստական ​​​​ինտելեկտի անվտանգության մակարդակ 3 (ASL-3), վտանգավոր բովանդակությունը հայտնաբերելու համար պատրաստված ֆիլտրերով, մասնավորապես՝ ՀԲՌՆ ռիսկերի հետ կապվածները: Ընկերությունը պնդում է, որ նվազեցրել է կեղծ դրական արդյունքներ՝ տասնապատիկ անգամ համեմատած այս դասակարգիչների սկզբնական տարբերակի հետ և առաջարկում է Sonnet 4-ի հետ զրույցի շարունակականությունը անվտանգության արգելափակման դեպքում.

Միաժամանակ, ընկերությունը ապահովում է, որ Մոդելը նվազեցնում է անցանկալի վարքագծերը, ինչպիսիք են շողոքորթությունը կամ խաբուսիկ պատասխանները, և ուժեղացնում է պաշտպանությունը… արագ ներարկումԱյս միջոցառումները ցույց են տալիս օգտագործումը ավելի հուսալի կորպորատիվ միջավայրերում, որտեղ ավտոմատացված գործողությունների կատարումը պահանջում է վերահսկողություն և հետագծելիություն։

Բացառիկ բովանդակություն - Սեղմեք այստեղ  Gemini AI-ն այժմ կարող է գտնել երգեր, ինչպիսին է Shazam-ը, ձեր բջջային հեռախոսից

Հասանելիություն, հարթակներ և գներ

Պատկերը՝ Կլոդ Սոննե 4.5-ի

Claude Sonnet 4.5-ը հասանելի է Claude.ai կայքում (վեբ, iOS և Android) և մշակողների համար՝ Claude Developer Platform-ի միջոցով, ինտեգրված այնպիսի ծառայությունների հետ, ինչպիսիք են Amazon Bedrock-ը և Google Cloud Vertex AI-ը: Անվճար պլանը գործում է յուրաքանչյուր հինգ ժամը մեկ զրոյացվող սեսիաների սահմանափակմամբ և պահանջարկի դեպքում հաղորդագրությունների փոփոխական քանակով: Գները մնում են նույնը:$3 մեկ միլիոն մուտքային տոկենների համար և $15 մեկ միլիոն ելքային տոկենների համար.

Նոր մուտքի հնարավորությունների շարքում, Claude's Chrome ընդլայնումը հասանելի է Max օգտատերերի համար։ նախկինում գրանցված է եղել սպասման ցուցակում։ Չնայած չափանիշները ենթադրում են էական բարելավումներ նախորդ տարբերակների համեմատ, Anthropic-ը նշում է, որ իրական կատարողականը կախված է օգտագործման դեպքից և յուրաքանչյուր առաջադրանքի համար կարգավորված դատողության բյուջեից։

Կոդավորման առաջընթացի, գործակալների ավելի մեծ ինքնավարության և անվտանգության վրա ավելի խիստ ուշադրության համադրությամբ, Claude Sonnet 4.5-ը դիրքավորվում է որպես ամուր տարբերակ տեխնիկական թիմերի համար, որոնք երկարատև գործընթացներում անընդհատության և վերահսկողության կարիք ունեն, պահպանելով կայուն ծախսեր և համատեղելիություն Anthropic-ի արդեն իսկ տեղակայված էկոհամակարգի հետ.

LinkedIn-ի կարգավորման արհեստական ​​բանականություն
Առնչվող հոդված.
LinkedIn-ը կարգավորում է իր արհեստական ​​ինտելեկտը. գաղտնիության փոփոխություններ, տարածաշրջաններ և ինչպես այն անջատել