Клод Сонет 4.5: Стрибок у кодуванні, агентах та використанні комп'ютерів

Останнє оновлення: 02/10/2025

  • Він показує 61,4% результатів у OSWorld та лідирує у SWE-bench Verified.
  • Виконує складні завдання понад 30 годин та генерує до 64 000 токенів
  • Оновлення Claude Code та нового SDK Claude Agent для агентів
  • Посилена безпека (ASL-3) та та сама ціна: $3/$15 за мільйон токенів

Зображення моделі Claude Sonnet 4.5

Компанія Anthropic випустила Claude Sonnet 4.5, еволюцію, зосереджену на програмуванні, агентах та управлінні комп'ютером, яка має на меті консолідувати платформу в професійному середовищі. В умовах конкурентів високого рівня компанія описує цей реліз як свій... більш вдосконалена та корисна модель для інженерних завдань до дати.

Нова версія базується на досвіді сімейства Sonnet, яке вже покращило міркування та кодування в попередніх ітераціях. Спираючись на цю основу, версія 4.5 має на меті розширити практичну сферу застосування завдяки досягненням у збереження уваги, використання інструментів та продуктивність, дотримуючись розсудливої ​​стратегії безпеки та узгодження.

Ключові можливості та покращення продуктивності

Загальне зображення Клода Сонета 4.5

Згідно з Антропіком, Claude Sonnet 4.5 здатний підтримувати концентрацію понад 30 годин на складних завданнях. та багатоетапний, що сприяє тривалим проектам, де потрібна безперервність контексту. Він також підтримує результати до 64 000 токенів в одній відповіді, і пропонує елементи керування для налаштування «часу на обдумування» перед відповіддю, балансуючи швидкість і деталізацію за потреби.

Ексклюзивний вміст - натисніть тут  YouTube посилює свою політику проти масового виробництва відео та відео, створених за допомогою штучного інтелекту.

У реальних завданнях перед комп'ютером, Компанія повідомляє про 61,4% в OSWorld, що є помітним стрибком у порівнянні з 42,2% у попередника в тому ж тесті.У практичних випадках модель може переглядати веб-сторінки, заповнювати електронні таблиці та виконувати дії у настільних програмах із розширення Chrome, що зменшує постійний моніторинг користувачів.

Земля Програмування зосереджує більшість удосконаленьУ перевіреному SWE-bench, яке було зосереджено на кодуванні, застосованому до реальних проектів, Сонет 4.5 лідирує з 77,2% (з конфігураціями, що збільшують кількість при паралельних обчисленнях). Anthropic пропонує, щоб модель охоплювала весь цикл розробки: планування, впровадження, рефакторинг та підтримка великих баз коду.

Поза межами чистого розвитку, Антропний визначає використання, які потребують тривалих потоків та координації кроків.Від кібербезпеки та фінансів до офісної продуктивності та досліджень з використанням внутрішніх та зовнішніх даних. У цих контекстах перспектива полягає в більш стабільних агентах, здатних підтримувати довгострокову роботу без втрати послідовності.

Інструменти та екосистема розробника

Клод Код

Запуск супроводжується Що нового у Claude Code: контрольно-пропускні пункти зберегти прогрес і повернутися до попередніх станів, таких як історія версій, One оновлений інтерфейс терміналу, нативне розширення для Visual Studio Code та покращення редагування контексту та пам'яті через API для виконання довших завдань.

Ексклюзивний вміст - натисніть тут  Anthropic та випадок зі штучним інтелектом, який рекомендував пити відбілювач: коли моделі обманюють

Антропний також прем'єрує SDK агента Клода, яка відтворює інфраструктуру, яку компанія використовує для створення власних агентівКомплект пропонує інструменти для довготривалої пам'яті, систем дозволів та координації субагентів, що сприяє створенню автоматизованих рішень, які співпрацюють для досягнення спільних цілей та забезпечують безпечне з'єднання з такими інструментами, як WireGuard.

Як доповнення, Фірма тимчасово запускає програму «Уяви з Клодом», демонстрація, яка дозволяє нам спостерігати, як модель генерує програмне забезпечення в режимі реального часу Немає попередньо визначеного коду. Цей попередній перегляд, доступний обмежений час для користувачів Max, ілюструє потенціал моделі для інтерактивного створення.

Безпека, узгодженість та стійкість

Anthropic включає Sonnet 4.5 у свій рівень захисту Рівень безпеки ШІ 3 (ASL-3), з фільтрами, навченими виявляти небезпечний контент, особливо пов'язаний з ризиками ХБРЯ. Компанія стверджує, що зменшила хибнопозитивних результатів у десять разів порівняно з початковою версією цих класифікаторів, і пропонує Безперервність розмови з Sonnet 4 у разі блокування системи безпеки.

Паралельно, компанія гарантує, що Модель зменшує небажану поведінку, таку як лестощі чи обманливі реакції, та посилює захист від спроб швидке введенняЦі заходи вказують на використання більш надійний у корпоративному середовищі, де виконання автоматизованих дій вимагає контролю та відстежуваності.

Ексклюзивний вміст - натисніть тут  Штучний інтелект Gemini тепер може знаходити пісні, такі як Shazam, на вашому мобільному телефоні.

Наявність, платформи та ціни

Зображення Клода Соннета 4.5

Клод Сонет 4.5 доступний на Claude.ai (веб, iOS та Android) та для розробників через платформу розробників Claude, з інтеграцією в такі сервіси, як Amazon Bedrock та Google Cloud Vertex AI. Безкоштовний план працює з лімітом сеансів, який скидається кожні п'ять годин, та змінною кількістю повідомлень на вимогу. Ціни залишаються незмінними.3 долари за мільйон вхідних токенів та 15 доларів за мільйон вихідних токенів.

Серед нових функцій доступу, Розширення Chrome від Claude стає доступним для користувачів Max. раніше зареєстровані в списку очікування. Хоча тести свідчать про суттєві покращення порівняно з попередніми ітераціями, Anthropic нагадує нам, що фактична продуктивність залежить від варіанту використання та бюджету міркувань, налаштованого для кожного завдання.

Завдяки поєднанню досягнень у кодуванні, більшої автономії агентів та суворішого акценту на безпеці, Claude Sonnet 4.5 позиціонується як добротний варіант для технічних команд, яким потрібна безперервність та контроль у тривалих процесах, підтримка стабільних витрат та сумісності з уже розгорнутою екосистемою Anthropic.

коригування LinkedIn штучний інтелект
Пов'язана стаття:
LinkedIn налаштовує свій штучний інтелект: зміни конфіденційності, регіони та як його вимкнути