- Anthropic の Claude 3.7 Sonnet は、Twitch でポケモン レッドをプレイしてテストされました。
- AIモデルは推論と意思決定において大きな進歩を示しました。
- 彼はゲームの最初の 3 人のジムリーダーを倒すことに成功しましたが、これは以前のバージョンでは達成できませんでした。
- Anthropic は、人工知能の評価方法としてのビデオ ゲームの使用を強調しています。
アントロピックは人工知能の世界を驚かせた 新しい Claude 3.7 Sonnet モデルが複雑なタスクでどこまで実行できるかを実証します。この機会に、革新的な能力テストの一環として、 AIシステムはポケモンレッドをプレイするために投入されました Twitch視聴者はライブで進行状況を追うことができました。
この実験は、人工知能がどのように 戦略的意思決定を行う 人間の介入なしに動的な環境をナビゲートする方法を学びます。これは、ゲーム内の初期の障壁を克服できなかった以前のバージョンのモデルと比較すると、画期的な出来事です。
クロード 3.7 ソネットは推論の進歩を示す

AI モデルの改善を評価するために、Anthropic はいくつかの重要なツールを提供しました。 ディスプレイピクセル入力、基本メモリ、ボタンコントロール。これらの要素のおかげで、クロードはゲーム内で何が起こっているかを解釈し、その内部ロジックに基づいて決定を下すことができました。
クロード3.0ソネットなどの以前のモデルでは、人工知能 彼は主人公の家から出ることすらできなかった。。しかし、この新しいバージョンでは、システムが大幅に進歩し、ゲームの最初の 3 人のジムリーダーであるブロック、カスミ、およびサージを倒すことに成功しました。
ポケモンの世界で35.000のアクションの旅

ポケットモンスター 赤でのクロードの旅は簡単ではありませんでした。 Anthropicが提供したデータによると、AIは 約35.000株 シウダー・カルミンステージをなんとか克服するまで。このプロセスにかかった正確な時間は明らかにされていないが、モデルの 変化に適応し、パターンを学ぶ パフォーマンス中に。
ビデオゲームを使用して人工知能を評価することは新しいことではありません。しかし、この実験は、 これらの環境は基本的なツールとなり得る 推論と適応が可能な AI モデルの進歩を測定するため。
ゲームを超えて: クロード 3.7 ソネットとその現実世界での応用

ポケモンレッド内でのスキルの実証に加えて、アントロピックは、そのAIモデルが 複雑な問題を解決する 数学、プログラミング、コーディングなどの分野で。改良の一環として、Claude Code と呼ばれる機能が追加されました。これにより、AI はコードの検索と編集、テストの実行、さらには GitHub などのツールとの連携が可能になります。
このモデルの機能をテストしたい人のために、Claude 3.7 Sonnetは現在、さまざまなプラットフォームで利用可能です。 Claude のアプリ、Anthropic API、Amazon Bedrock、Google Cloud以前のバージョンと同じアクセスコストを維持します。
クロード3.7ソネットがポケモンレッドの重要なステージを乗り越えたという事実は、 人工知能は推論と学習の面で飛躍的に進歩している。このタイプのテストは、 新しい現実世界のアプリケーションタスクの自動化から、人間の介入なしでの複雑な問題の解決まで。
私はテクノロジー愛好家であり、その「オタク」の興味を職業に変えています。私は 10 年以上、純粋な好奇心から最先端のテクノロジーを使用し、あらゆる種類のプログラムをいじくり回してきました。現在はコンピューター技術とビデオゲームを専門にしています。これは、私が 5 年以上、テクノロジーやビデオ ゲームに関するさまざまな Web サイトに執筆し、誰にでも理解できる言語で必要な情報を提供することを目的とした記事を作成しているためです。
ご質問がございましたら、私の知識は Windows オペレーティング システムから携帯電話用の Android に関連するあらゆるものまで多岐にわたります。そして、私はあなたに対して、いつでも喜んで数分を費やして、このインターネットの世界であなたが抱いている疑問を解決するお手伝いをしたいと考えています。