Claude Sonnet 4.5: Подобрувања во кодот, агентот и безбедноста

Има учинок од 61,4% во OSWorld и е водечки во SWE-bench Verified.
Се справува со сложени задачи повеќе од 30 часа и генерира до 64.000 токени
Ажурирања на Claude Code и новиот Claude Agent SDK за агенти
Подобрена безбедност (ASL-3) и иста цена: 3 долари/15 долари за милион токени

Слика од моделот Claude Sonnet 4.5

Anthropic го издаде Claude Sonnet 4.5, еволуција фокусирана на програмирање, агенти и компјутерска контрола што има за цел да ја консолидира платформата во професионални средини. Во услови на конкуренти од високо ниво, компанијата го опишува ова издание како нејзино порафиниран и корисен модел за инженерски задачи до датумот.

Новата верзија се надоградува на досегашните резултати од семејството Сонет, кое веќе го подобри расудувањето и кодирањето во претходните итерации. Надоградувајќи се на таа основа, 4.5 има за цел да го прошири практичниот опсег со напредок во упорност на вниманието, користење на алатки и продуктивност, одржувајќи разумна стратегија во безбедноста и усогласувањето.

Клучни можности и подобрувања на перформансите

Општа слика на Клод Сонет 4.5

Според Антропик, Claude Sonnet 4.5 е способен да одржува фокус повеќе од 30 часа на сложени задачи. и повеќестепено, што е во корист на долги проекти каде што е потребен континуитет на контекстот. Исто така, поддржува резултати до 64.000 токени во еден одговори нуди контроли за прилагодување на „времето за размислување“ пред да одговори, балансирајќи ја брзината и деталите по потреба.

Ексклузивна содржина - Кликнете овде Магичен знак: Што е тоа, за што служи и како да го активирате чекор по чекор

Во реални задачи пред компјутерот, Компанијата пријавува 61,4% во OSWorld, што е значителен скок во споредба со 42,2% на претходникот во истиот тест.Во практични сценарија, моделот може прелистувајте на интернет, пополнувајте табеларни пресметки и извршувајте дејства во десктоп апликациите од додатокот за Chrome, намалувајќи го континуираното следење на корисниците.

Земјата на Програмирањето ги концентрира повеќето подобрувањаВо SWE-bench Verified евалуацијата, која се фокусираше на кодирање применето во проекти од реалниот свет, Сонет 4.5 води со 77,2% (со конфигурации што го зголемуваат бројот при паралелно пресметување). Anthropic предлага моделот да го опфати целиот циклус на развој: планирање, имплементација, рефакторирање и одржување на големи бази на кодови.

Надвор од чистиот развој, Антропик идентификува употреби што бараат продолжени текови и координација на чекорите.Од сајбер безбедност и финансии до канцелариска продуктивност и истражување со користење на внатрешни и надворешни податоци. Во овие контексти, ветувањето лежи во постабилни агенти способни да одржат долгорочна работа без да ја изгубат конзистентноста.

Алатки за програмери и екосистем

Клод Код

Лансирањето е придружено со Што е ново во Клод Код: контролни пунктови за да се зачува напредокот и да се врати во претходните состојби, како на пр. историја на верзии, Еден обновен терминален интерфејс, нативна екстензија за Visual Studio Code и подобрувања во уредувањето на контекстот и меморијата преку API за извршување подолги задачи.

Ексклузивна содржина - Кликнете овде Бери против Нвидија: битката што го доведува во прашање бумот на вештачката интелигенција

Антропик, исто така, премиерно го прикажува SDK на Claude Agent, што ја реплицира инфраструктурата што компанијата ја користи за да изгради свои агентиКомплетот нуди алатки за долгорочна меморија, системи за дозволи и координација на субагенти, олеснувајќи го креирањето автоматизирани решенија кои соработуваат кон заеднички цели и безбедна поврзаност со алатки како што се WireGuard.

Како дополнување, Фирмата привремено го овозможува „Замислете со Клод“, демонстрација што ни овозможува да набљудуваме како моделот генерира софтвер во реално време Нема предефиниран код. Овој преглед, достапен ограничено време за корисниците на Max, го илустрира потенцијалот на моделот за интерактивно креирање.

Безбедност, усогласеност и отпорност

Anthropic го вклучува Sonnet 4.5 во своето ниво на заштита Ниво на безбедност на вештачката интелигенција 3 (ASL-3), со филтри обучени за откривање на опасна содржина, особено оние поврзани со ХБРН ризици. Компанијата тврди дека ги намалила лажно позитивни резултати со фактор десет во споредба со првичната верзија на овие класификатори и нуди Континуитет на разговорот со Sonnet 4 ако се случи безбедносно заклучување.

Паралелно, компанијата гарантира дека Моделот ги намалува несаканите однесувања како што се ласкање или измамнички одговори и ја зајакнува одбраната од обиди за брза инјекцијаОвие мерки укажуваат на употреба посигурен во корпоративни средини, каде што извршувањето на автоматизирани дејства бара контроли и следливост.

Ексклузивна содржина - Кликнете овде Phi-4 мини вештачка интелигенција на Edge: Иднината на локалната вештачка интелигенција во вашиот прелистувач

Достапност, платформи и цени

Слика од Клод Сонет 4.5

Claude Sonnet 4.5 е достапен на Claude.ai (веб, iOS и Android) и за програмери преку платформата за програмери на Клод, со интеграција во услуги како што се Amazon Bedrock и Google Cloud Vertex AI. Бесплатниот план работи со ограничување на сесиите што се ресетира на секои пет часа и променлив број на пораки по барање. Цените остануваат исти.: 3 долари за влезни токени на милион и 15 долари за излезни токени на милион.

Меѓу новите функции за пристап, Додатокот за Chrome на Claude се става на располагање на Max корисниците. претходно регистрирани на листата на чекање. Иако бенчмарките укажуваат на значителни подобрувања во споредба со претходните итерации, Anthropic нè потсетува дека вистинските перформанси зависат од случајот на употреба и буџетот за расудување конфигуриран за секоја задача.

Со комбинација од напредок во кодирањето, поголема автономија за агентите и построг фокус на безбедноста, Claude Sonnet 4.5 е позициониран како солидна опција за технички тимови на кои им е потребен континуитет и контрола во долги процеси, одржување на стабилни трошоци и компатибилност со веќе распоредениот екосистем на Anthropic.

вештачка интелигенција за прилагодување на LinkedIn

Поврзана статија:

LinkedIn ја прилагодува својата вештачка интелигенција: промени во приватноста, региони и како да се оневозможи

Алберто Наваро

Јас сум технолошки ентузијаст кој своите „гикови“ интереси ги претвори во професија. Поминав повеќе од 10 години од мојот живот користејќи најсовремена технологија и непречено со сите видови програми од чиста љубопитност. Сега сум специјализиран за компјутерска технологија и видео игри. Тоа е затоа што повеќе од 5 години пишувам за различни веб-локации за технологија и видео игри, создавајќи статии кои се обидуваат да ви ги дадат потребните информации на јазик што е разбирлив за секого.

Ако имате прашања, моето знаење се движи од се што е поврзано со оперативниот систем Виндоус како и Андроид за мобилни телефони. И мојата посветеност е кон вас, јас сум секогаш подготвен да потрошам неколку минути и да ви помогнам да ги решите сите прашања што може да ги имате во овој интернет свет.