- Він показує 61,4% результатів у OSWorld та лідирує у SWE-bench Verified.
- Виконує складні завдання понад 30 годин та генерує до 64 000 токенів
- Оновлення Claude Code та нового SDK Claude Agent для агентів
- Посилена безпека (ASL-3) та та сама ціна: $3/$15 за мільйон токенів
Компанія Anthropic випустила Claude Sonnet 4.5, еволюцію, зосереджену на програмуванні, агентах та управлінні комп'ютером, яка має на меті консолідувати платформу в професійному середовищі. В умовах конкурентів високого рівня компанія описує цей реліз як свій... більш вдосконалена та корисна модель для інженерних завдань до дати.
Нова версія базується на досвіді сімейства Sonnet, яке вже покращило міркування та кодування в попередніх ітераціях. Спираючись на цю основу, версія 4.5 має на меті розширити практичну сферу застосування завдяки досягненням у збереження уваги, використання інструментів та продуктивність, дотримуючись розсудливої стратегії безпеки та узгодження.
Ключові можливості та покращення продуктивності

Згідно з Антропіком, Claude Sonnet 4.5 здатний підтримувати концентрацію понад 30 годин на складних завданнях. та багатоетапний, що сприяє тривалим проектам, де потрібна безперервність контексту. Він також підтримує результати до 64 000 токенів в одній відповіді, і пропонує елементи керування для налаштування «часу на обдумування» перед відповіддю, балансуючи швидкість і деталізацію за потреби.
У реальних завданнях перед комп'ютером, Компанія повідомляє про 61,4% в OSWorld, що є помітним стрибком у порівнянні з 42,2% у попередника в тому ж тесті.У практичних випадках модель може переглядати веб-сторінки, заповнювати електронні таблиці та виконувати дії у настільних програмах із розширення Chrome, що зменшує постійний моніторинг користувачів.
Земля Програмування зосереджує більшість удосконаленьУ перевіреному SWE-bench, яке було зосереджено на кодуванні, застосованому до реальних проектів, Сонет 4.5 лідирує з 77,2% (з конфігураціями, що збільшують кількість при паралельних обчисленнях). Anthropic пропонує, щоб модель охоплювала весь цикл розробки: планування, впровадження, рефакторинг та підтримка великих баз коду.
Поза межами чистого розвитку, Антропний визначає використання, які потребують тривалих потоків та координації кроків.Від кібербезпеки та фінансів до офісної продуктивності та досліджень з використанням внутрішніх та зовнішніх даних. У цих контекстах перспектива полягає в більш стабільних агентах, здатних підтримувати довгострокову роботу без втрати послідовності.
Інструменти та екосистема розробника

Запуск супроводжується Що нового у Claude Code: контрольно-пропускні пункти зберегти прогрес і повернутися до попередніх станів, таких як історія версій, One оновлений інтерфейс терміналу, нативне розширення для Visual Studio Code та покращення редагування контексту та пам'яті через API для виконання довших завдань.
Антропний також прем'єрує SDK агента Клода, яка відтворює інфраструктуру, яку компанія використовує для створення власних агентівКомплект пропонує інструменти для довготривалої пам'яті, систем дозволів та координації субагентів, що сприяє створенню автоматизованих рішень, які співпрацюють для досягнення спільних цілей та забезпечують безпечне з'єднання з такими інструментами, як WireGuard.
Як доповнення, Фірма тимчасово запускає програму «Уяви з Клодом», демонстрація, яка дозволяє нам спостерігати, як модель генерує програмне забезпечення в режимі реального часу Немає попередньо визначеного коду. Цей попередній перегляд, доступний обмежений час для користувачів Max, ілюструє потенціал моделі для інтерактивного створення.
Безпека, узгодженість та стійкість
Anthropic включає Sonnet 4.5 у свій рівень захисту Рівень безпеки ШІ 3 (ASL-3), з фільтрами, навченими виявляти небезпечний контент, особливо пов'язаний з ризиками ХБРЯ. Компанія стверджує, що зменшила хибнопозитивних результатів у десять разів порівняно з початковою версією цих класифікаторів, і пропонує Безперервність розмови з Sonnet 4 у разі блокування системи безпеки.
Паралельно, компанія гарантує, що Модель зменшує небажану поведінку, таку як лестощі чи обманливі реакції, та посилює захист від спроб швидке введенняЦі заходи вказують на використання більш надійний у корпоративному середовищі, де виконання автоматизованих дій вимагає контролю та відстежуваності.
Наявність, платформи та ціни

Клод Сонет 4.5 доступний на Claude.ai (веб, iOS та Android) та для розробників через платформу розробників Claude, з інтеграцією в такі сервіси, як Amazon Bedrock та Google Cloud Vertex AI. Безкоштовний план працює з лімітом сеансів, який скидається кожні п'ять годин, та змінною кількістю повідомлень на вимогу. Ціни залишаються незмінними.3 долари за мільйон вхідних токенів та 15 доларів за мільйон вихідних токенів.
Серед нових функцій доступу, Розширення Chrome від Claude стає доступним для користувачів Max. раніше зареєстровані в списку очікування. Хоча тести свідчать про суттєві покращення порівняно з попередніми ітераціями, Anthropic нагадує нам, що фактична продуктивність залежить від варіанту використання та бюджету міркувань, налаштованого для кожного завдання.
Завдяки поєднанню досягнень у кодуванні, більшої автономії агентів та суворішого акценту на безпеці, Claude Sonnet 4.5 позиціонується як добротний варіант для технічних команд, яким потрібна безперервність та контроль у тривалих процесах, підтримка стабільних витрат та сумісності з уже розгорнутою екосистемою Anthropic.
Я ентузіаст технологій, який перетворив свої "гікові" інтереси на професію. Я провів понад 10 років свого життя, користуючись передовими технологіями та возячись із усіма видами програм із чистої цікавості. Зараз я спеціалізуюся на комп’ютерних технологіях та відеоіграх. Це тому, що більше 5 років я писав для різних веб-сайтів про технології та відеоігри, створюючи статті, які прагнуть надати вам необхідну інформацію мовою, зрозумілою для всіх.
Якщо у вас є запитання, я знаю все, що стосується операційної системи Windows, а також Android для мобільних телефонів. І я зобов’язаний перед вами, я завжди готовий витратити кілька хвилин і допомогти вам вирішити будь-які запитання, які можуть виникнути в цьому світі Інтернету.