Клод Соннет 4.5: Скачок в кодировании, агентах и ​​использовании компьютеров

Последнее обновление: 02/10/2025

  • Результат составляет 61,4% в OSWorld и лидирует в SWE-bench. Проверено.
  • Выполняет сложные задачи более 30 часов и генерирует до 64 000 токенов.
  • Обновления Claude Code и новый Claude Agent SDK для агентов
  • Повышенная безопасность (ASL-3) и та же цена: 3/15 долларов за миллион токенов

Изображение модели Клода Соннета 4.5

Компания Anthropic выпустила Claude Sonnet 4.5 – новую версию, ориентированную на программирование, агентов и управление компьютером, которая призвана консолидировать платформу в профессиональной среде. В условиях конкуренции с высокоуровневыми системами компания описывает этот релиз как более совершенная и полезная модель для инженерных задач на сегодняшний день.

Новая версия основана на опыте семейства Sonnet, которое уже улучшило процессы рассуждения и кодирования в предыдущих версиях. Опираясь на эту основу, версия 4.5 стремится расширить практическую область применения благодаря достижениям в устойчивость внимания, использование инструментов и производительность, поддерживая разумную стратегию в вопросах безопасности и согласованности.

Ключевые возможности и улучшения производительности

Общее изображение Клода Соннета 4.5

По данным Anthropic, Claude Sonnet 4.5 способен сохранять концентрацию более 30 часов на сложных задачах. и многошаговый, что благоприятствует длительным проектам, где требуется непрерывность контекста. Он также поддерживает выходы до 64 000 токенов за один ответи предлагает элементы управления для регулировки «времени на обдумывание» перед ответом, балансируя скорость и детализацию по мере необходимости.

Эксклюзивный контент – нажмите здесь  Warner Music и Suno заключили новаторский альянс по регулированию музыки, созданной с помощью искусственного интеллекта

В реальных задачах перед компьютером, Компания сообщает о 61,4% в OSWorld, что является заметным ростом по сравнению с 42,2% ее предшественника в этом же тесте.В практических сценариях модель может просматривать веб-страницы, заполнять электронные таблицы и выполнять действия в настольных приложениях из расширения Chrome, что снижает необходимость постоянного контроля за пользователями.

Земля Программирование концентрирует большую часть улучшенийВ оценке SWE-bench Verified, которая была сосредоточена на кодировании, применяемом к реальным проектам, Сонет 4.5 лидирует с 77,2% (с конфигурациями, увеличивающими количество параллельных вычислений). Anthropic предлагает, чтобы модель охватывала весь цикл разработки: планирование, реализация, рефакторинг и обслуживание больших кодовых баз.

Помимо чистого развития, Антропный определяет виды деятельности, требующие длительных потоков и координации шагов.От кибербезопасности и финансов до офисной производительности и исследований с использованием внутренних и внешних данных. В этих контекстах перспектива заключается в более стабильных агентах, способных поддерживать долгосрочную работу без потери стабильности.

Инструменты и экосистема разработчика

код Клода

Запуск сопровождается Что нового в Claude Code: контрольно-пропускные пункты чтобы сохранить прогресс и вернуться к предыдущим состояниям, таким как история версий, una обновленный интерфейс терминала, собственное расширение для Visual Studio Code и улучшения редактирования контекста и памяти через API для выполнения более длительных задач.

Эксклюзивный контент – нажмите здесь  AMD и Stability AI совершают революцию в локальном рендеринге ИИ на ноутбуках с помощью Amuse 3.1

Anthropic также представляет премьеру Клод Агент SDK, которая копирует инфраструктуру, которую компания использует для создания собственных агентовКомплект предлагает инструменты для долговременной памяти, систем разрешений и координации субагентов, облегчая создание автоматизированных решений, которые взаимодействуют для достижения общих целей и обеспечивают безопасное соединение с такими инструментами, как WireGuard.

В качестве дополнения, Компания временно запускает акцию «Воображайте с Клодом»., демонстрация, которая позволяет нам наблюдать, как модель генерирует программное обеспечение в реальном времени Нет предустановленного кода. Этот предварительный просмотр, доступный ограниченное время пользователям Max, иллюстрирует потенциал модели для интерактивного творчества.

Безопасность, согласованность и устойчивость

Anthropic включает Sonnet 4.5 в свой уровень защиты Уровень безопасности ИИ 3 (ASL-3), с фильтрами, обученными обнаруживать опасный контент, особенно связанный с рисками ХБРЯ. Компания утверждает, что сократила ложных срабатываний в десять раз по сравнению с первоначальной версией этих классификаторов, и предлагает Продолжение разговора с Sonnet 4 в случае возникновения блокировки безопасности.

Параллельно компания обеспечивает, чтобы Модель уменьшает нежелательное поведение, такое как лесть или обманчивые ответы, и усиливает защиту от попыток быстрая инъекцияЭти меры указывают на использование более надежен в корпоративной среде, где выполнение автоматизированных действий требует контроля и прослеживаемости.

Эксклюзивный контент – нажмите здесь  Как будет выглядеть взаимодействие человека и компьютера в будущем?

Доступность, платформы и цены

Изображение Клода Соннета 4.5

Claude Sonnet 4.5 доступен на Claude.ai (веб, iOS и Android) и для разработчиков через платформу разработчиков Claudeс интеграцией в такие сервисы, как Amazon Bedrock и Google Cloud Vertex AI. Бесплатный тарифный план включает ограничение на количество сеансов, которое сбрасывается каждые пять часов, и переменное количество сообщений по запросу. Цены остаются прежними.: 3 доллара за миллион входящих токенов и 15 долларов за миллион исходящих токенов.

Среди новых функций доступа: Расширение Клода для Chrome становится доступно пользователям Max. ранее зарегистрированных в списке ожидания. Хотя результаты тестов показывают существенное улучшение по сравнению с предыдущими версиями, Anthropic отмечает, что фактическая производительность зависит от сценария использования и бюджета рассуждений, настроенного для каждой задачи.

Благодаря сочетанию достижений в кодировании, большей автономии агентов и более строгому вниманию к безопасности, Claude Sonnet 4.5 позиционируется как надежный вариант для технических команд, которым нужна преемственность и контроль в длительных процессах, поддержание стабильных затрат и совместимости с уже развернутой экосистемой Anthropic.

корректировка ИИ в LinkedIn
Теме статьи:
LinkedIn корректирует свой ИИ: изменения в конфиденциальности, регионах и как его отключить