Клод Соннет 4.5: Коддошуу, агенттер жана компьютерди колдонуудагы секирик

Акыркы жаңыртуу: 02/10/2025

  • Ал OSWorldда 61,4% аткарат жана SWE-bench Verifiedде лидерлик кылат
  • 30 сааттан ашык татаал тапшырмаларды аткарат жана 64 000ге чейин токендерди жаратат
  • Клод кодексине жаңыртуулар жана агенттер үчүн жаңы Клод Агент SDK
  • Өркүндөтүлгөн коопсуздук (ASL-3) жана ошол эле баа: миллион токендерге $3/$15

Claude Sonnet 4.5 моделинин сүрөтү

Anthropic профессионалдык чөйрөдө платформаны консолидациялоого умтулган программалоого, агенттерге жана компьютердик башкарууга багытталган эволюция Клод Соннет 4.5ти чыгарды. Жогорку деңгээлдеги атаандаштары бар пейзажда компания бул чыгарылышты өзүнүн катары сүрөттөйт инженердик тапшырмалар үчүн дагы такталган жана пайдалуу модель күнгө чейин.

Жаңы версия мурунку итерацияларда ой жүгүртүүнү жана коддоону жакшырткан Sonnet үй-бүлөсүнүн тажрыйбасына негизделет. Ошол негизге таянып, 4.5 жетишкендиктер менен практикалык чөйрөнү кеңейтүүгө багытталган көңүл буруунун туруктуулугу, куралды колдонуу жана өндүрүмдүүлүк, коопсуздук жана тегиздөө боюнча сарамжалдуу стратегияны сактоо.

Негизги мүмкүнчүлүктөр жана аткарууну жакшыртуу

Клод Соннеттин жалпы сүрөтү 4.5

Anthropic айтымында, Claude Sonnet 4.5 татаал тапшырмаларды аткарууда 30 сааттан ашык көңүл бурууга жөндөмдүү. жана көп баскычтуу, бул контексттин үзгүлтүксүздүгү талап кылынган узак долбоорлорду жактырат. Ал ошондой эле жыйынтыктарды колдойт Бир жоопто 64 000 токен, жана жооп берүүдөн мурун "ойлонуу убактысын" тууралоо үчүн башкаруу элементтерин сунуштайт, ылдамдык менен деталдарды керек болсо тең салмактайт.

Эксклюзивдүү мазмун - Бул жерди басыңыз  Claude Code Slack менен интеграцияланып, биргелешкен программалоону кайра аныктайт

Компьютердин алдындагы реалдуу тапшырмаларда, Компания OSWorld боюнча 61,4% ды түздү, бул ошол эле тестте мурунку 42,2%дан көрүнүктүү секирик.Практикалык сценарийлерде модель болот интернетти карап, электрондук таблицаларды толтуруңуз жана аракеттерди аткарыңыз Chrome кеңейтүүсүнөн рабочий колдонмолордо колдонуучу үзгүлтүксүз мониторингди азайтат.

жери Программалоо жакшыртуулардын көбүн топтойт. SWE-bench Verified баалоосунда, реалдуу дүйнөдөгү долбоорлорго колдонулган коддоого багытталган, Sonnet 4.5 77,2% менен алдыда (параллель эсептөөдө санды көбөйтүүчү конфигурациялар менен). Anthropic модели бүт өнүгүү циклин камтыйт деп сунуш кылат: пландаштыруу, ишке ашыруу, рефакторинг жана ири коддук базаларды колдоо.

Таза өнүгүүдөн тышкары, Anthropic узакка созулган агымдарды жана кадамдарды координациялоону талап кылган колдонууну аныктайт.Киберкоопсуздуктан жана финансыдан кеңсенин өндүрүмдүүлүгүнө жана ички жана тышкы маалыматтарды колдонуу менен изилдөөгө чейин. Бул контексттерде убада ырааттуулугун жоготпостон, узак мөөнөттүү иштөөгө жөндөмдүү бир кыйла туруктуу агенттерде турат.

Иштеп чыгуучунун куралдары жана экосистемасы

Клод Код

ишке киргизүү менен коштолот Клод кодексиндеги жаңылыктар: өткөрүү пункттары прогрессти сактап калуу жана мурунку абалына кайтуу, мисалы версия тарыхыбир жаңыланган терминалдык интерфейс, Visual Studio Code үчүн жергиликтүү кеңейтүү жана узак тапшырмаларды аткаруу үчүн API аркылуу контекстти жана эстутумду түзөтүүнү жакшыртуу.

Эксклюзивдүү мазмун - Бул жерди басыңыз  Microsoft NLWeb: AI чатботторун бүт интернетке алып келген протокол

Антропикалык фильмдин да премьерасы Claude Agent SDK, бул компания өзүнүн агенттерин куруу үчүн колдонгон инфраструктураны кайталайтКомплект узак мөөнөттүү эс тутум, уруксат системалары жана субагентти координациялоо үчүн куралдарды сунуштайт, бул жалпы максаттарга жана шаймандар менен коопсуз туташууга багытталган автоматташтырылган чечимдерди түзүүгө көмөктөшөт. WireGuard.

кошумча катары, Фирма убактылуу "Клод менен элестетүү" функциясын иштетет., моделдин кандай экенин байкоого мүмкүндүк берген демонстрация реалдуу убакытта программалык камсыздоону жаратат Алдын ала аныкталган код жок. Бул алдын ала көрүү, Max колдонуучулары үчүн чектелген убакытка жеткиликтүү, моделдин интерактивдүү түзүү мүмкүнчүлүгүн көрсөтөт.

Коопсуздук, тегиздөө жана туруктуулук

Anthropic өзүнүн коргоо деңгээлинде Sonnet 4.5ти камтыйт AI коопсуздук деңгээли 3 (ASL-3), коркунучтуу мазмунду аныктоо үчүн үйрөтүлгөн чыпкалар менен, өзгөчө CBRN тобокелдиктери менен байланышкан. Компания кыскарганын айтууда он эсе жалган позитивдерди бул классификаторлордун баштапкы нускасы менен салыштырганда, жана сунуштар Коопсуздук кулпусу пайда болсо, Sonnet 4 менен сүйлөшүүнүн үзгүлтүксүздүгү.

Ошол эле учурда компания муну камсыздайт Модель кошомат кылуу же алдамчы жооптор сыяктуу керексиз жүрүм-турумду азайтат жана аракетке каршы коргонууну күчөтөт. тез инъекцияБул чаралар колдонууну көрсөтүп турат корпоративдик чөйрөдө ишенимдүү, бул жерде автоматташтырылган иш-аракеттердин аткарылышы башкарууну жана байкоону талап кылат.

Эксклюзивдүү мазмун - Бул жерди басыңыз  Activision AI тарабынан түзүлгөн Guitar Hero Mobile жана Call of Duty жарнамалары үчүн сынга кабылды

Жеткиликтүүлүк, платформалар жана баалар

Клод Соннеттин сүрөтү 4.5

Claude Sonnet 4.5 Claude.ai сайтында жеткиликтүү (Интернет, iOS жана Android) жана Claude Developer Platform аркылуу иштеп чыгуучулар үчүн, Amazon Bedrock жана Google Cloud Vertex AI сыяктуу кызматтарга интеграциялоо менен. Акысыз план ар бир беш саатта баштапкы абалга келтирилүүчү сеанс чеги жана суроо-талап боюнча өзгөрүлмө сандагы билдирүүлөр менен иштейт. Баалар ошол эле бойдон калууда.: $ 3 миллион киргизүү Токендерди жана $ 15 миллион чыгаруу Токендерди.

Жаңы мүмкүнчүлүктөрдүн арасында, Клоддун Chrome кеңейтүүсү Max колдонуучуларына жайылууда. мурда күтүү тизмесине катталган. Эталондук көрсөткүчтөр мурунку итерацияларга салыштырмалуу олуттуу жакшырууну сунуш кылса да, Anthropic иш жүзүндөгү аткаруу ар бир тапшырма үчүн конфигурацияланган колдонуу учурунан жана ой жүгүртүү бюджетинен көз каранды экенин белгилейт.

Коддоштуруудагы жетишкендиктер, агенттер үчүн көбүрөөк автономия жана коопсуздукка көбүрөөк көңүл буруу менен, Claude Sonnet 4.5 катуу вариант катары жайгашкан узак процесстерде үзгүлтүксүздүктү жана контролду талап кылган техникалык топтор үчүн, туруктуу чыгымдарды жана Anthropicтин орнотулган экосистемасы менен шайкештикти сактоо.

linkedin тууралоо ai
Окшош макала:
LinkedIn өзүнүн AI'ин тууралайт: купуялыктын өзгөрүшү, аймактар ​​жана аны кантип өчүрүү керек