アントロピックのAIクロードがTwitchでポケモンをプレイし、その推論能力で驚かせる

最終更新日: 2025年02月28日

  • Anthropic の Claude 3.7 Sonnet は、Twitch でポケモン レッドをプレイしてテストされました。
  • AIモデルは推論と意思決定において大きな進歩を示しました。
  • 彼はゲームの最初の 3 人のジムリーダーを倒すことに成功しましたが、これは以前のバージョンでは達成できませんでした。
  • Anthropic は、人工知能の評価方法としてのビデオ ゲームの使用を強調しています。
ポケモンにおけるクロード・アイの最も重要な瞬間

アントロピックは人工知能の世界を驚かせた 新しい Claude 3.7 Sonnet モデルが複雑なタスクでどこまで実行できるかを実証します。この機会に、革新的な能力テストの一環として、 AIシステムはポケモンレッドをプレイするために投入されました ツイッチ視聴者はライブで進行状況を追うことができました。

この実験は、人工知能がどのように tomar decisiones estratégicas 人間の介入なしに動的な環境をナビゲートする方法を学びます。これは、ゲーム内の初期の障壁を克服できなかった以前のバージョンのモデルと比較すると、画期的な出来事です。

限定コンテンツ - ここをクリックしてください  OpenAIがGPT-4.1をリリース:ChatGPTの大幅な改善と全ユーザー向けの新機能

クロード 3.7 ソネットは推論の進歩を示す

Claude 3.7 Sonnet

AI モデルの改善を評価するために、Anthropic はいくつかの重要なツールを提供しました。 ディスプレイピクセル入力、基本メモリ、ボタンコントロール。これらの要素のおかげで、クロードはゲーム内で何が起こっているかを解釈し、その内部ロジックに基づいて決定を下すことができました。

クロード3.0ソネットなどの以前のモデルでは、人工知能 彼は主人公の家から出ることすらできなかった。。しかし、この新しいバージョンでは、システムが大幅に進歩し、ゲームの最初の 3 人のジムリーダーであるブロック、カスミ、およびサージを倒すことに成功しました。

ポケモンの世界で35.000のアクションの旅

クロードAIがポケモンをプレイ

ポケットモンスター 赤でのクロードの旅は簡単ではありませんでした。 Anthropicが提供したデータによると、AIは alrededor de 35.000 acciones シウダー・カルミンステージをなんとか克服するまで。このプロセスにかかった正確な時間は明らかにされていないが、モデルの 変化に適応し、パターンを学ぶ パフォーマンス中に。

限定コンテンツ - ここをクリックしてください  マーベルの『サンダーボルト』:予告編、キャスト、プレミアのすべて

ビデオゲームを使用して人工知能を評価することは新しいことではありません。しかし、この実験は、 これらの環境は基本的なツールとなり得る 推論と適応が可能な AI モデルの進歩を測定するため。

ゲームを超えて: クロード 3.7 ソネットとその現実世界での応用

アントロピックがクロード 3.7 ソネット 2 を発表

ポケモンレッド内でのスキルの実証に加えて、アントロピックは、そのAIモデルが resolver problemas complejos 数学、プログラミング、コーディングなどの分野で。改良の一環として、Claude Code と呼ばれる機能が追加されました。これにより、AI はコードの検索と編集、テストの実行、さらには GitHub などのツールとの連携が可能になります。

このモデルの機能をテストしたい人のために、Claude 3.7 Sonnetは現在、さまざまなプラットフォームで利用可能です。 Claude のアプリ、Anthropic API、Amazon Bedrock、Google Cloud以前のバージョンと同じアクセスコストを維持します。

Claude 3.7 Sonnet
関連記事:
Anthropic が Claude 3.7 Sonnet を発表: 高度な推論機能を備えたハイブリッド AI

クロード3.7ソネットがポケモンレッドの重要なステージを乗り越えたという事実は、 人工知能は推論と学習の面で飛躍的に進歩している。このタイプのテストは、 新しい現実世界のアプリケーションタスクの自動化から、人間の介入なしでの複雑な問題の解決まで。

限定コンテンツ - ここをクリックしてください  マラソンは招待制のクローズドテクニカルテストの実施を発表