OpenAI は、複雑なタスクを実行する自律エージェントによって ChatGPT に革命をもたらします。

最終更新: 18/07/2025

  • ChatGPT は、安全な仮想環境で複雑なタスクを実行する自律エージェントを追加します。
  • ユーザーは、プレゼンテーションの作成、オンライン ショッピング、データの分析などのタスクを委任できます。
  • AI は強化されたセキュリティとプライバシー対策を備え、ユーザーの制御下で動作します。
  • このエージェントは現在、Pro、Plus、Team プランで利用可能で、間もなくさらに多くのユーザーが使用できるようになります。

ChatGPT自律エージェントの動作

人工知能にさらなる能力を与える競争は、 ChatGPT スタンドアロンエージェントは、OpenAIの有名なチャットボットの通常の体験を完全に変える機能です。さて、 ChatGPTはある程度の複雑さのタスクを実行できる 独自の仮想コンピューターを自律的に使用し、さまざまなツールにアクセスし、Web サイト、ファイル、外部サービスとリアルタイムで対話することができます。

この画期的な進歩は、単純な会話を超えることを意味します。 エージェントは意思決定を行い、ウェブをナビゲートし、文書を生成し、プロセスを自動化しますユーザーがステップバイステップで指示を出す必要はありません。すべては同じChatGPT環境内で行われ、常にユーザーの監視と検証の下で行われます。ユーザーはいつでもタスクを中断したり調整したりできます。

限定コンテンツ - ここをクリックしてください  Google Gemini を使用して都市のどの場所を訪れるべきかを知る方法

従来の技術を統合した機能

ChatGPTへのエージェントの導入は、OpenAIの最近の開発成果を統合するものである。 Operator (これにより、チャットボットはWebページと対話できるようになりました) 深い研究 (複数のソースからの高度なレポート作成に重点を置く)。この組み合わせにより、システムは単なるインテリジェントチャットから 最初から最後までタスクを実行できる協力者ユーザーは、情報の収集、イベントの計画、スプレッドシートの作成、プレゼンテーションの生成などのプロセスを委任することができ、エージェントはワークフロー全体を処理して、必要に応じて確認を求めます。

ChatGPT エージェントは具体的に何ができるのでしょうか?

GPTエージェント

デモでは、 包括的なウェディングプランニング (ホテル検索、天気予報、ギフトの識別、さらには購入予定のリマインダーなど)、公式文書の生成、オンライン購入の自動化などです。 複数のタブやアプリを切り替える必要がなくなります。: エージェントはすべてを 1 つの会話に統合します。

間で 最も優れた機能 次のとおりです。

  • 作成と操作 スプレッドシートとプレゼンテーション 実際のデータに基づいています。
  • 夕食の計画、買い物リスト、配送の調整.
  • 製品の検索と購入 ChatGPTのオンラインストアで購入できます。
  • リザーブ 好みや予算を考慮したレストラン、ホテル、サービスを検索します。
  • 個人管理 (議題、リマインダー、予定) と複雑なデータの専門的な分析。
限定コンテンツ - ここをクリックしてください  Copilot Search: それが何であるか、どのように機能するか、そしてそれを最大限に活用する方法

人工知能が利用できる仮想コンピュータ

ChatGPTエージェント

新しいエージェントの運用の鍵となるのは、 OpenAIが管理する仮想環境そこでは、ビジュアル ブラウザーを使用して人間と同じように Web サイトを操作したり、ターミナルにアクセスしてコードを実行したりファイルを操作したり、ユーザーが許可した場合は外部アプリケーション (Google Drive、GitHub、Gmail など) に接続したりできます。 各タスクは独立した一時セッションで実行されますその 完了すると削除されます セキュリティとプライバシーを強化するため。

このデザインにより、 情報をリアルタイムで分析し、ドキュメントを編集し、状況に応じた意思決定を行うたとえば、カレンダーで予定を識別し、必要に応じてスケジュールを変更したり、その日付にリンクされたレポートを準備したりできます。

ベンチマーク: エージェントのパフォーマンスは人間や他のモデルと比べてどうでしょうか?

最初の比較テスト(スプレッドシートベンチ, DSベンチ y ブラウズコンプ)は、 ChatGPTエージェントは、分析、編集、ナビゲーションのタスクにおいて、以前のAIモデルや多くの人間よりも優れたパフォーマンスを発揮します。スプレッドシートとデータ サイエンスのベンチマークでは、エージェントは記録破りの精度と効率を達成し、技術的に大きく成熟していることを示しています。

限定コンテンツ - ここをクリックしてください  ジェマ・3n:あらゆるデバイスに高度なAIをもたらすGoogleの新たな取り組み

実際の環境では、 大量の電子メールや顧客メッセージを分析し、ユーザー プロファイルを統合し、財務レポートを自動化し、マーケティング タスクを管理する能力があることが実証されています。これらすべてを数分で実行でき、ユーザーが介入する必要もありません。

プライバシーとセキュリティ: 完全なユーザーコントロール

OpenAIは特別な セキュリティを重視し、ユーザーにエージェントのアクションを完全に制御させる機密性の高い操作(フォームの送信、予約の作成、コードの実行など) 実行前に明示的な確認が必要エージェントは次のようにプログラムされている。 リスクの高い行動を拒否する金融取引や潜在的に危険なタスクなど、あらゆるアクティビティをワンクリックで消去でき、セッション終了後はユーザーデータは保存されません。

システムはプロセス全体を監視し、AIが実行するステップをリアルタイムで観察できます。ユーザーは必要に応じて、アクションが最終的に実行される前に一時停止または中断することができ、ツールの透明性と信頼性を強化します。