Клод Санэт 4.5: Скачок у кадаванні, агентах і выкарыстанні кампутараў

Апошняе абнаўленне: 02/10/2025

  • Ён мае паказчык 61,4% у OSWorld і лідзіруе ў SWE-bench Verified.
  • Выконвае складаныя задачы больш за 30 гадзін і генеруе да 64 000 токенаў
  • Абнаўленні Claude Code і новы SDK Claude Agent для агентаў
  • Палепшаная бяспека (ASL-3) і тая ж цана: $3/$15 за мільён токенаў

Выява мадэлі Claude Sonnet 4.5

Anthropic выпусціла Claude Sonnet 4.5, эвалюцыйную версію, арыентаваную на праграмаванне, агентаў і кіраванне камп'ютарам, якая імкнецца кансалідаваць платформу ў прафесійным асяроддзі. У асяроддзі з высокакваліфікаванымі канкурэнтамі кампанія апісвае гэты рэліз як свой... больш дасканалая і карысная мадэль для інжынерных задач На сённяшні дзень

Новая версія грунтуецца на досведзе сямейства праграм Sonnet, якое ўжо палепшыла лагічнае мысленне і кадаванне ў папярэдніх ітэрацыях. Абапіраючыся на гэты падмурак, версія 4.5 імкнецца пашырыць практычную сферу прымянення з дапамогай дасягненняў у... устойлівасць увагі, выкарыстанне інструментаў і прадукцыйнасць, падтрымліваючы разумную стратэгію ў галіне бяспекі і ўзгаднення.

Ключавыя магчымасці і паляпшэнні прадукцыйнасці

Агульны вобраз Клода Санэта 4.5

Паводле звестак Антропіка, Claude Sonnet 4.5 здольны заставацца сканцэнтраваным на складаных задачах больш за 30 гадзін. і шматэтапны, што спрыяе працяглым праектам, дзе патрабуецца бесперапыннасць кантэксту. Ён таксама падтрымлівае вынікі да 64 000 токенаў у адным адказеі прапануе элементы кіравання для рэгулявання «часу на абдумванне» перад адказам, збалансаваўшы хуткасць і дэталізацыю па меры неабходнасці.

Эксклюзіўны кантэнт - націсніце тут  YouTube узмацняе сваю палітыку ў дачыненні да масавай вытворчасці відэа і відэа з выкарыстаннем штучнага інтэлекту

У рэальных задачах перад кампутарам, Кампанія паведамляе пра 61,4% у OSWorld, што значна больш, чым у папярэдніка, які паказваў 42,2% у тым жа тэсце.У практычных выпадках мадэль можа праглядаць вэб-старонкі, запаўняць электронныя табліцы і выконваць дзеянні у настольных праграмах з пашырэння Chrome, што памяншае бесперапынны маніторынг карыстальнікаў.

Зямля Праграмаванне сканцэнтравана на большасці паляпшэнняўУ рамках ацэнкі SWE-bench Verified, якая была сканцэнтравана на кадаванні, прымененым да рэальных праектаў, Sonnet 4.5 лідзіруе з 77,2% (з канфігурацыямі, якія павялічваюць колькасць пры паралельных вылічэннях). Anthropic прапануе, каб мадэль ахоплівала ўвесь цыкл распрацоўкі: планаванне, рэалізацыя, рэфактарынг і падтрымка вялікіх баз кода.

Акрамя чыстага развіцця, Антрапічны вызначае спосабы выкарыстання, якія патрабуюць працяглых патокаў і каардынацыі крокаў.Ад кібербяспекі і фінансаў да офіснай прадукцыйнасці і даследаванняў з выкарыстаннем унутраных і знешніх дадзеных. У гэтых кантэкстах перспектывай з'яўляюцца больш стабільныя агенты, здольныя падтрымліваць доўгатэрміновую працу без страты паслядоўнасці.

Інструменты і экасістэма распрацоўшчыка

Клод Код

Запуск суправаджаецца Што новага ў Claude Code: кантрольна-прапускныя пункты каб захаваць прагрэс і вярнуцца да папярэдніх станаў, такіх як гісторыя версій, One абноўлены інтэрфейс тэрмінала, натыўнае пашырэнне для Visual Studio Code і паляпшэнні рэдагавання кантэксту і памяці праз API для выканання больш працяглых задач.

Эксклюзіўны кантэнт - націсніце тут  Anthropic і выпадак штучнага інтэлекту, які рэкамендаваў піць адбельвальнік: калі мадэлі падманваюць

У фільме «Антрапік» таксама прэм'ера SDK агента Клода, якая паўтарае інфраструктуру, якую кампанія выкарыстоўвае для стварэння ўласных агентаўКамплект прапануе інструменты для доўгатэрміновай памяці, сістэм дазволаў і каардынацыі субагентаў, што спрыяе стварэнню аўтаматызаваных рашэнняў, якія супрацоўнічаюць для дасягнення агульных мэтаў і забяспечваюць бяспечнае падключэнне з дапамогай такіх інструментаў, як WireGuard.

У якасці дапаўнення, Фірма часова дазваляе «Уявіце сабе з Клодам», дэманстрацыя, якая дазваляе нам назіраць, як мадэль генеруе праграмнае забеспячэнне ў рэжыме рэальнага часу Няма загадзя вызначанага кода. Гэты папярэдні прагляд, даступны на працягу абмежаванага часу для карыстальнікаў Max, ілюструе патэнцыял мадэлі для стварэння інтэрактыўных элементаў.

Бяспека, узгодненасць і ўстойлівасць

Anthropic уключае Sonnet 4.5 у свой узровень абароны Узровень бяспекі штучнага інтэлекту 3 (ASL-3), з фільтрамі, падрыхтаванымі для выяўлення небяспечнага кантэнту, асабліва таго, што звязана з рызыкамі ХБРЯ. Кампанія сцвярджае, што знізіла ілжываспрацоўваючых вынікаў у дзесяць разоў у параўнанні з пачатковай версіяй гэтых класіфікатараў і прапануе Бесперапыннасць размовы з Sonnet 4 у выпадку блакіроўкі сістэмы бяспекі.

Адначасова кампанія гарантуе, што Мадэль памяншае непажаданыя паводзіны, такія як ліслівасць або падманныя рэакцыі, і ўмацоўвае абарону ад спроб хуткая ін'екцыяГэтыя меры паказваюць на выкарыстанне больш надзейныя ў карпаратыўным асяроддзі, дзе выкананне аўтаматызаваных дзеянняў патрабуе кантролю і адсочвання.

Эксклюзіўны кантэнт - націсніце тут  Цяпер штучны інтэлект Gemini можа знаходзіць песні, падобныя да Shazam, на вашым мабільным тэлефоне.

Даступнасць, платформы і цэны

Выява Клода Санэта 4.5

Клод Санет 4.5 даступны на Claude.ai (вэб, iOS і Android) і для распрацоўшчыкаў праз платформу распрацоўшчыкаў Claude, з інтэграцыяй у такія сэрвісы, як Amazon Bedrock і Google Cloud Vertex AI. Бясплатны план працуе з лімітам сесій, які скідаецца кожныя пяць гадзін, і зменнай колькасцю паведамленняў па запыце. Цэны застаюцца ранейшымі.3 долары за мільён уваходных токенаў і 15 долараў за мільён выходных токенаў.

Сярод новых функцый доступу, Пашырэнне Claude для Chrome даступнае для карыстальнікаў Max. раней зарэгістраваны ў спісе чакання. Нягледзячы на ​​тое, што тэсты сведчаць аб істотных паляпшэннях у параўнанні з папярэднімі ітэрацыямі, Anthropic адзначае, што рэальная прадукцыйнасць залежыць ад сцэнарыя выкарыстання і бюджэту разважанняў, настроенага для кожнай задачы.

Дзякуючы спалучэнню дасягненняў у кадаванні, большай аўтаноміі агентаў і большай увагі да бяспекі, Claude Sonnet 4.5 пазіцыянуецца як надзейны варыянт для тэхнічных каманд, якім патрэбна бесперапыннасць і кантроль у працяглых працэсах, падтрыманне стабільных выдаткаў і сумяшчальнасці з ужо разгорнутай экасістэмай Anthropic.

карэкціроўка LinkedIn штучны інтэлект
звязаныя артыкулы:
LinkedIn карэктуе свой штучны інтэлект: змены ў прыватнасці, рэгіёны і як яго адключыць