クロード・ソネット 4.5: コーディング、エージェント、そしてコンピュータ利用の飛躍

最終更新: 02/10/2025

  • OSWorldでは61,4%のパフォーマンスを発揮し、SWE-bench Verifiedではトップに立つ
  • 30時間以上複雑なタスクを処理し、最大64.000トークンを生成します
  • Claude Code のアップデートとエージェント向けの新しい Claude Agent SDK
  • 強化されたセキュリティ(ASL-3)と同じ価格:100万トークンあたり3ドル/15ドル

クロード・ソネット4.5モデルの画像

アントロピックは、プログラミング、エージェント、コンピュータ制御に重点を置いた進化版であるClaude Sonnet 4.5をリリースしました。これは、プロフェッショナル環境におけるプラットフォームの強化を目指したものです。ハイレベルなライバルがひしめく市場において、同社はこのリリースを「 エンジニアリングタスクのためのより洗練された有用なモデル 今日まで。

新バージョンは、以前のバージョンで推論とコーディングの性能向上を実現してきたSonnetファミリーの実績を基盤としています。その基盤の上に、4.5では、以下の点の進歩により実用範囲の拡大を目指しています。 注意力、道具の使用、生産性の持続セキュリティと整合性に関して慎重な戦略を維持します。

主な機能とパフォーマンスの改善

クロード・ソネット 4.5 の一般的な画像

アントロピックによれば、 Claude Sonnet 4.5 は、複雑なタスクでも 30 時間以上集中力を維持することができます。 マルチステップなので、コンテキストの連続性が求められる長期プロジェクトに適しています。また、最大 1回の応答で64.000トークンまた、応答前の「考える時間」を調整するためのコントロールも提供しており、必要に応じて速度と詳細のバランスをとります。

限定コンテンツ - ここをクリックしてください  YouTubeは大量生産された動画やAIを活用した動画に対するポリシーを強化した

コンピュータの前での実際の作業では、 同社は OSWorld で 61,4% というスコアを報告しており、これは同じテストで前身が記録した 42,2% から大幅に上昇した数値である。実際のシナリオでは、このモデルは ウェブを閲覧したり、スプレッドシートを完成させたり、アクションを実行したりします Chrome 拡張機能からデスクトップ アプリケーションで実行できるため、継続的なユーザー監視が軽減されます。

の土地 プログラミングは改善の大部分を集中させる実際のプロジェクトに適用されたコーディングに焦点を当てたSWEベンチ検証評価では、 ソネット4.5が77,2%でトップ (並列計算で数値が増加する構成の場合)。Anthropicは、モデルが開発サイクル全体をカバーすることを提案しています。 大規模コードベースの計画、実装、リファクタリング、保守.

純粋な開発を超えて、 Anthropic は、長時間の流れとステップの調整を必要とする用途を識別します。サイバーセキュリティや金融から、オフィスの生産性向上、社内外のデータを活用した研究まで、これらの分野において期待されるのは、一貫性を失うことなく長期的な業務を維持できる、より安定したエージェントです。

開発者ツールとエコシステム

クロード・コード

発売に伴って クロード・コードの最新情報: チェックポイント 進行状況を保存して以前の状態に戻るには、 バージョン履歴改良された端末インターフェース, Visual Studio Code のネイティブ拡張機能 また、より長いタスクを実行するために、API 経由のコンテキストとメモリの編集も改善されました。

限定コンテンツ - ここをクリックしてください  人間中心主義と漂白剤を飲むことを推奨したAIの事例:モデルが不正行為をするとき

アントロピックはまた、 クロードエージェントSDK, これは同社が独自のエージェントを構築するために使用するインフラストラクチャを複製するものであるこのキットは、長期記憶、許可システム、サブエージェント調整のためのツールを提供し、共通の目標に向けて協力し、次のようなツールとの安全な接続を実現する自動化ソリューションの作成を容易にします。 ワイヤガード.

補足として、 同社は一時的に「クロードと想像する」を有効化している。モデルがどのように動作するかを観察できるデモンストレーション リアルタイムでソフトウェアを生成する 事前定義されたコードはありません。このプレビューは、Maxユーザー向けに期間限定で公開されており、インタラクティブな作成におけるモデルの可能性を示しています。

セキュリティ、整合性、回復力

AnthropicはSonnet 4.5を保護レベルに含めています AI安全レベル3(ASL-3), 危険なコンテンツ、特にCBRNリスクに関連するコンテンツを検出するように訓練されたフィルターを搭載。同社は、 誤検出が10倍に これらの分類器の初期バージョンと比較して、 セキュリティロックアウトが発生した場合でも、Sonnet 4 との会話は継続されます.

同時に、同社は このモデルは、お世辞や欺瞞的な反応などの望ましくない行動を減らし、 即注射これらの措置は、 企業環境でより信頼性が高い自動化されたアクションの実行には制御と追跡可能性が必要です。

限定コンテンツ - ここをクリックしてください  Gemini AIは、Shazamのように携帯電話から曲を検索できるようになりました

入手可能状況、プラットフォーム、価格

画像提供:クロード・ソネット 4.5

Claude Sonnet 4.5はClaude.aiで入手可能です。 (ウェブ、iOS、Android) 開発者向けClaude Developer PlatformAmazon BedrockやGoogle Cloud Vertex AIなどのサービスとの統合が可能です。無料プランでは、5時間ごとにリセットされるセッション制限と、必要に応じて送信できるメッセージ数が調整されます。料金は変わりません。: 入力トークン100万個あたり3ドル、出力トークン100万個あたり15ドル.

新しいアクセス機能の中には、 Claude の Chrome 拡張機能が Max ユーザーに展開されています。 以前に待機リストに登録されていたもの。ベンチマークでは以前のバージョンと比較して大幅な改善が示されていますが、Anthropic社は実際のパフォーマンスはユースケースと各タスクに設定された推論予算に依存すると指摘しています。

コーディングの進歩、エージェントの自律性の向上、そしてセキュリティへのより厳格な重点の組み合わせにより、 クロード・ソネット4.5は堅実な選択肢として位置付けられている 長期にわたるプロセスで継続性と制御を必要とする技術チームにとって、 安定したコストと、Anthropicのすでに展開されているエコシステムとの互換性を維持する.

リンクトイン調整AI
関連記事
LinkedInがAIを調整:プライバシーの変更、地域、無効化の方法