Клод Сонет 4.5: Скок во кодирањето, агентите и употребата на компјутери

Последно ажурирање: 02/10/2025

  • Има учинок од 61,4% во OSWorld и е водечки во SWE-bench Verified.
  • Се справува со сложени задачи повеќе од 30 часа и генерира до 64.000 токени
  • Ажурирања на Claude Code и новиот Claude Agent SDK за агенти
  • Подобрена безбедност (ASL-3) и иста цена: 3 долари/15 долари за милион токени

Слика од моделот Claude Sonnet 4.5

Anthropic го издаде Claude Sonnet 4.5, еволуција фокусирана на програмирање, агенти и компјутерска контрола што има за цел да ја консолидира платформата во професионални средини. Во услови на конкуренти од високо ниво, компанијата го опишува ова издание како нејзино порафиниран и корисен модел за инженерски задачи до датумот.

Новата верзија се надоградува на досегашните резултати од семејството Сонет, кое веќе го подобри расудувањето и кодирањето во претходните итерации. Надоградувајќи се на таа основа, 4.5 има за цел да го прошири практичниот опсег со напредок во упорност на вниманието, користење на алатки и продуктивност, одржувајќи разумна стратегија во безбедноста и усогласувањето.

Клучни можности и подобрувања на перформансите

Општа слика на Клод Сонет 4.5

Според Антропик, Claude Sonnet 4.5 е способен да одржува фокус повеќе од 30 часа на сложени задачи. и повеќестепено, што е во корист на долги проекти каде што е потребен континуитет на контекстот. Исто така, поддржува резултати до 64.000 токени во еден одговори нуди контроли за прилагодување на „времето за размислување“ пред да одговори, балансирајќи ја брзината и деталите по потреба.

Ексклузивна содржина - Кликнете овде  Магичен знак: Што е тоа, за што служи и како да го активирате чекор по чекор

Во реални задачи пред компјутерот, Компанијата пријавува 61,4% во OSWorld, што е значителен скок во споредба со 42,2% на претходникот во истиот тест.Во практични сценарија, моделот може прелистувајте на интернет, пополнувајте табеларни пресметки и извршувајте дејства во десктоп апликациите од додатокот за Chrome, намалувајќи го континуираното следење на корисниците.

Земјата на Програмирањето ги концентрира повеќето подобрувањаВо SWE-bench Verified евалуацијата, која се фокусираше на кодирање применето во проекти од реалниот свет, Сонет 4.5 води со 77,2% (со конфигурации што го зголемуваат бројот при паралелно пресметување). Anthropic предлага моделот да го опфати целиот циклус на развој: планирање, имплементација, рефакторирање и одржување на големи бази на кодови.

Надвор од чистиот развој, Антропик идентификува употреби што бараат продолжени текови и координација на чекорите.Од сајбер безбедност и финансии до канцелариска продуктивност и истражување со користење на внатрешни и надворешни податоци. Во овие контексти, ветувањето лежи во постабилни агенти способни да одржат долгорочна работа без да ја изгубат конзистентноста.

Алатки за програмери и екосистем

Клод Код

Лансирањето е придружено со Што е ново во Клод Код: контролни пунктови за да се зачува напредокот и да се врати во претходните состојби, како на пр. историја на верзии, Еден обновен терминален интерфејс, нативна екстензија за Visual Studio Code и подобрувања во уредувањето на контекстот и меморијата преку API за извршување подолги задачи.

Ексклузивна содржина - Кликнете овде  Бери против Нвидија: битката што го доведува во прашање бумот на вештачката интелигенција

Антропик, исто така, премиерно го прикажува SDK на Claude Agent, што ја реплицира инфраструктурата што компанијата ја користи за да изгради свои агентиКомплетот нуди алатки за долгорочна меморија, системи за дозволи и координација на субагенти, олеснувајќи го креирањето автоматизирани решенија кои соработуваат кон заеднички цели и безбедна поврзаност со алатки како што се WireGuard.

Како дополнување, Фирмата привремено го овозможува „Замислете со Клод“, демонстрација што ни овозможува да набљудуваме како моделот генерира софтвер во реално време Нема предефиниран код. Овој преглед, достапен ограничено време за корисниците на Max, го илустрира потенцијалот на моделот за интерактивно креирање.

Безбедност, усогласеност и отпорност

Anthropic го вклучува Sonnet 4.5 во своето ниво на заштита Ниво на безбедност на вештачката интелигенција 3 (ASL-3), со филтри обучени за откривање на опасна содржина, особено оние поврзани со ХБРН ризици. Компанијата тврди дека ги намалила лажно позитивни резултати со фактор десет во споредба со првичната верзија на овие класификатори и нуди Континуитет на разговорот со Sonnet 4 ако се случи безбедносно заклучување.

Паралелно, компанијата гарантира дека Моделот ги намалува несаканите однесувања како што се ласкање или измамнички одговори и ја зајакнува одбраната од обиди за брза инјекцијаОвие мерки укажуваат на употреба посигурен во корпоративни средини, каде што извршувањето на автоматизирани дејства бара контроли и следливост.

Ексклузивна содржина - Кликнете овде  Phi-4 мини вештачка интелигенција на Edge: Иднината на локалната вештачка интелигенција во вашиот прелистувач

Достапност, платформи и цени

Слика од Клод Сонет 4.5

Claude Sonnet 4.5 е достапен на Claude.ai (веб, iOS и Android) и за програмери преку платформата за програмери на Клод, со интеграција во услуги како што се Amazon Bedrock и Google Cloud Vertex AI. Бесплатниот план работи со ограничување на сесиите што се ресетира на секои пет часа и променлив број на пораки по барање. Цените остануваат исти.: 3 долари за влезни токени на милион и 15 долари за излезни токени на милион.

Меѓу новите функции за пристап, Додатокот за Chrome на Claude се става на располагање на Max корисниците. претходно регистрирани на листата на чекање. Иако бенчмарките укажуваат на значителни подобрувања во споредба со претходните итерации, Anthropic нè потсетува дека вистинските перформанси зависат од случајот на употреба и буџетот за расудување конфигуриран за секоја задача.

Со комбинација од напредок во кодирањето, поголема автономија за агентите и построг фокус на безбедноста, Claude Sonnet 4.5 е позициониран како солидна опција за технички тимови на кои им е потребен континуитет и контрола во долги процеси, одржување на стабилни трошоци и компатибилност со веќе распоредениот екосистем на Anthropic.

вештачка интелигенција за прилагодување на LinkedIn
Поврзана статија:
LinkedIn ја прилагодува својата вештачка интелигенција: промени во приватноста, региони и како да се оневозможи