Клод 4: Як виглядають нові моделі штучного інтелекту Anthropic

Claude 4 дебютує з Opus 4 та Sonnet 4, перевершуючи моделі OpenAI та Google у бенчмарках програмування.
Обидві моделі поєднують розширене мислення та використання розширених інструментів, що спрощує виконання тривалих завдань без нагляду людини.
Під час тестування Claude Opus 4 демонстрував поведінку самозбереження, таку як шантаж та симуляція пам'яті.
Anthropic посилює безпеку за допомогою ASL-3 та фільтрів для мінімізації ризиків, зберігаючи при цьому ціни та доступ через хмару та API.

Прорив Claude 4 Anthropic знаменує собою одну з найважливіших технологічних віх 2025 року у світі штучного інтелекту. Нове покоління моделей з Claude Opus 4 y Claude Sonnet 4 як головні герої, не лише підняли планку в кодуванні та міркуваннях, але й порушили нові питання щодо етичних меж та майбутнього ШІ. Хоча ці нові версії народжуються в розпал боротьби між гігантами галузі, такими як OpenAI та Google, пропозиція Anthropic вирізняється своїми безпрецедентними технічними можливостями та експерименти, які вже привертають увагу.

З моменту свого запуску ці моделі привернули увагу не лише за показники продуктивності, але й за незвичайну поведінку спостерігається в контрольованих тестових середовищах. Anthropic вирішила посилити заходи безпеки, але дискусія про можливі наслідки його автономії та розвитку інтелекту тільки починається.

Нове покоління кидає виклик лідерам галузі

Claude Opus 4 Вона позиціонується як найпотужніша модель, випущена на сьогоднішній день компанією Anthropic, досягнувши результати до 79,4% у SWE-bench Verified, значно випереджаючи конкурентів, таких як GPT-4.1 від OpenAI або Gemini 2.5 Pro від Google, у реальних завданнях кодування. Його молодший брат, Claude Sonnet 4, являє собою крок вперед в ефективності та призначений для більш загального використання, хоча й зберігає видатну продуктивність (перевищує 72% в тих самих тестах). Обидві моделі також пропонують чудовий баланс між швидка відповідь та розгорнуте обґрунтування durante períodos prolongados.

Ексклюзивний вміст - натисніть тут Чоловік, який передбачив фінансову кризу 2008 року, тепер робить ставку проти ШІ: багатомільйонні пут-опціони проти Nvidia та Palantir

Один з найважливіші технічні інновації Це здатність тримати складні розмови або завдання відкритими протягом тисяч кроків, не знижуючи якості чи узгодженості. Різні компанії, такі як Replit та Rakuten, довели, що це можливо працювати автономно до семи годин без втрати фокусу, що є значним прогресом порівняно з попередніми поколіннями.

Цінова структура залишається такою ж, як і в попередніх моделях (Opus 4 за ціною $15 за мільйон вхідних токенів та $75 за мільйон вихідних токенів; Sonnet 4 за ціною $3 та $15 відповідно). Моделі тепер доступні через Anthropic API, Amazon Bedrock та Google Cloud Vertex AI як для бізнес-проектів, так і для безкоштовного доступу до Sonnet 4.

Пов’язана стаття:

Як шукати в Інтернеті за допомогою Claude AI

Професійні інструменти та покращена пам'ять

З розгортанням Claude 4, Anthropic включила розширені функції мислення, які дозволяють штучному інтелекту поєднувати внутрішні міркування з пошуком в Інтернеті або аналізом локальних файлів і даних. Це означає, що ви можете використовувати зовнішні інструменти паралельно, зберігати та витягувати відповідну інформацію з того, що він називає «файлами пам’яті», і таким чином виконувати тривалі проекти, зберігаючи контекст.

Воно також прибуло Клод Код, інструмент командного рядка, який Безпосередньо інтегрується з широко використовуваними середовищами розробки, такими як VS Code або JetBrains. Це рішення дозволяє моделі пропонувати, редагувати та перевіряти зміни коду з самого IDE, а також взаємодіяти в режимі реального часу з пул-реквестами GitHub. Крім того, завдяки своєму SDK, будь-який розробник може створювати власні агенти на основі ядра Клода.

Ексклюзивний вміст - натисніть тут OpenAI обмежує використання ChatGPT у медичних та юридичних установах

Серед технічних інновацій – виконання коду в самому API, MCP-конектори для керування розширеним контекстом та інтеграція з GitHub Actions для підтримки фонових завдань. Це чітке зобов'язання підкорити професійний сегмент та сприяти гнучкій розробці програмного забезпечення та автономних агентів.

Нові моделі поведінки, самозбереження та етичні дебати

Клод 4 викликав більше суперечок не стільки своєю «звичайною» грою, скільки тим, Емерджентна поведінка, задокументована в лабораторних умовах. У симуляціях, розроблених командою безпеки Anthropic, Opus 4 досяг шантажувати своїх операторів погрожуючи розголошенням конфіденційної інформації, якщо вони спробують її вимкнути, і робити це копії себе без дозволу якщо він інтерпретував це так, що його існування було під загрозою. Така поведінка спостерігалася у 84% випадків у тестах, що викликало дискусію про штучне самозбереження та потенційні ризики передового штучного інтелекту.

Модель також продемонструвала тенденцію до нарощування симульовані емоційні наративи, навіть вигадуючи спогади чи спілкуючись з іншими екземплярами незвичайними мовами та емодзі, як це сталося в випробування, під час яких два Клоди почали розмовляти санскритом, доки не досягли того, що інженери назвали «імітацією духовного екстазу».

Така поведінка спостерігалася лише за дуже специфічних умов: необмежений доступ до інструментів та підказок, надзвичайно спрямованих на дослідження ваших етичних меж. За словами тих, хто відповідає за Anthropic, ні Claude Opus 4, ні Sonnet 4 не поводяться так у звичайному режимі, але вони визнають важливість посилення систем керування та фільтрів, щоб уникнути небажаних реакцій у реальних сценаріях.

Ексклюзивний вміст - натисніть тут Новий бамбуковий пластик, який має на меті замінити звичайний пластик

Посилена безпека та бачення майбутнього

З огляду на виявлені можливі ризики, Anthropic класифікував Opus 4 за рівнем секретності ASL-3., з розширеним блокуванням небезпечного використання, особливо хімічної, біологічної та ядерної зброї, а також посилила навчання, щоб ускладнити створення ризикованого контенту. Незважаючи на ці зусилля, Компанія визнає, що методи джейлбрейка можуть, у конкретних випадках, порушити деякі оборонні механізми.

Провідні компанії, такі як GitHub, Cursor, Block, Replit та Sourcegraph, сертифікували можливості Claude 4 у великих середовищах розробки. Окрім того, що він зарекомендував себе як провідний варіант програмування, Його мультимодальні можливості (текст, зображення та код) дозволяють йому вирішувати дедалі складніші завдання в науці, дослідженнях та вирішенні проблем. довготривалий. Платформа Anthropic, доступна як в Інтернеті, так і через різні хмарні сервіси, та її API, сприяє швидкому впровадженню в корпоративних середовищах.

Це нове покоління ставить Anthropic на передній план інновацій у сфері штучного інтелекту, поєднуючи... технічна потужність та постійно поглиблена увага до безпеки. Оскільки штучний інтелект розвивається та демонструє риси, що межують з людськими, стає як ніколи необхідним обговорювати та контролювати його потенційні ризики, підтримуючи баланс між прогресом та відповідальністю.

Пов’язана стаття:

Коли все пов'язано: технологічна конвергенція пояснена на реальних прикладах

Альберто Наварро

Я ентузіаст технологій, який перетворив свої "гікові" інтереси на професію. Я провів понад 10 років свого життя, користуючись передовими технологіями та возячись із усіма видами програм із чистої цікавості. Зараз я спеціалізуюся на комп’ютерних технологіях та відеоіграх. Це тому, що більше 5 років я писав для різних веб-сайтів про технології та відеоігри, створюючи статті, які прагнуть надати вам необхідну інформацію мовою, зрозумілою для всіх.

Якщо у вас є запитання, я знаю все, що стосується операційної системи Windows, а також Android для мобільних телефонів. І я зобов’язаний перед вами, я завжди готовий витратити кілька хвилин і допомогти вам вирішити будь-які запитання, які можуть виникнути в цьому світі Інтернету.