クロードがTwitchでポケモンをプレイ：AIはこんなに賢い

Anthropic の Claude 3.7 Sonnet は、Twitch でポケモンレッドをプレイしてテストされました。
AIモデルは推論と意思決定において大きな進歩を示しました。
彼はゲームの最初の 3 人のジムリーダーを倒すことに成功しましたが、これは以前のバージョンでは達成できませんでした。
Anthropic は、人工知能の評価方法としてのビデオゲームの使用を強調しています。

アントロピックは人工知能の世界を驚かせた 新しい Claude 3.7 Sonnet モデルが複雑なタスクでどこまで実行できるかを実証します。この機会に、革新的な能力テストの一環として、 AIシステムはポケモンレッドをプレイするために投入されましたツイッチ視聴者はライブで進行状況を追うことができました。

この実験は、人工知能がどのように tomar decisiones estratégicas 人間の介入なしに動的な環境をナビゲートする方法を学びます。これは、ゲーム内の初期の障壁を克服できなかった以前のバージョンのモデルと比較すると、画期的な出来事です。

限定コンテンツ - ここをクリックしてください OpenAIがGPT-4.1をリリース：ChatGPTの大幅な改善と全ユーザー向けの新機能

クロード 3.7 ソネットは推論の進歩を示す

AI モデルの改善を評価するために、Anthropic はいくつかの重要なツールを提供しました。 ディスプレイピクセル入力、基本メモリ、ボタンコントロール。これらの要素のおかげで、クロードはゲーム内で何が起こっているかを解釈し、その内部ロジックに基づいて決定を下すことができました。

クロード3.0ソネットなどの以前のモデルでは、人工知能 彼は主人公の家から出ることすらできなかった。。しかし、この新しいバージョンでは、システムが大幅に進歩し、ゲームの最初の 3 人のジムリーダーであるブロック、カスミ、およびサージを倒すことに成功しました。

ポケモンの世界で35.000のアクションの旅

クロードAIがポケモンをプレイ

ポケットモンスター赤でのクロードの旅は簡単ではありませんでした。 Anthropicが提供したデータによると、AIは alrededor de 35.000 acciones シウダー・カルミンステージをなんとか克服するまで。このプロセスにかかった正確な時間は明らかにされていないが、モデルの 変化に適応し、パターンを学ぶ パフォーマンス中に。

限定コンテンツ - ここをクリックしてくださいマーベルの『サンダーボルト』：予告編、キャスト、プレミアのすべて

ビデオゲームを使用して人工知能を評価することは新しいことではありません。しかし、この実験は、 これらの環境は基本的なツールとなり得る 推論と適応が可能な AI モデルの進歩を測定するため。

ゲームを超えて: クロード 3.7 ソネットとその現実世界での応用

アントロピックがクロード 3.7 ソネット 2 を発表

ポケモンレッド内でのスキルの実証に加えて、アントロピックは、そのAIモデルが resolver problemas complejos 数学、プログラミング、コーディングなどの分野で。改良の一環として、Claude Code と呼ばれる機能が追加されました。これにより、AI はコードの検索と編集、テストの実行、さらには GitHub などのツールとの連携が可能になります。

このモデルの機能をテストしたい人のために、Claude 3.7 Sonnetは現在、さまざまなプラットフォームで利用可能です。 Claude のアプリ、Anthropic API、Amazon Bedrock、Google Cloud以前のバージョンと同じアクセスコストを維持します。

Anthropic が Claude 3.7 Sonnet を発表: 高度な推論機能を備えたハイブリッド AI

クロード3.7ソネットがポケモンレッドの重要なステージを乗り越えたという事実は、 人工知能は推論と学習の面で飛躍的に進歩している。このタイプのテストは、 新しい現実世界のアプリケーションタスクの自動化から、人間の介入なしでの複雑な問題の解決まで。

限定コンテンツ - ここをクリックしてくださいマラソンは招待制のクローズドテクニカルテストの実施を発表

アルベルト・ナバロ

私はテクノロジー愛好家であり、その「オタク」の興味を職業に変えています。私は 10 年以上、純粋な好奇心から最先端のテクノロジーを使用し、あらゆる種類のプログラムをいじくり回してきました。現在はコンピューター技術とビデオゲームを専門にしています。これは、私が 5 年以上、テクノロジーやビデオゲームに関するさまざまな Web サイトに執筆し、誰にでも理解できる言語で必要な情報を提供することを目的とした記事を作成しているためです。

ご質問がございましたら、私の知識は Windows オペレーティングシステムから携帯電話用の Android に関連するあらゆるものまで多岐にわたります。そして、私はあなたに対して、いつでも喜んで数分を費やして、このインターネットの世界であなたが抱いている疑問を解決するお手伝いをしたいと考えています。