OpenAI 通过执行复杂任务的自主代理彻底改变了 ChatGPT。

最后更新: 18/07/2025

  • ChatGPT 添加了在安全虚拟环境中执行复杂任务的自主代理。
  • 用户可以委派创建演示文稿、在线购物或分析数据等任务。
  • 人工智能在用户控制下运行,并具有增强的安全性和隐私措施。
  • 该代理现在可在 Pro、Plus 和 Team 计划中使用;更多用户将很快能够使用它。

ChatGPT 自主代理的实际应用

随着 ChatGPT 独立代理这项功能彻底改变了 OpenAI 著名聊天机器人的常规使用体验。现在, ChatGPT 能够执行一定复杂的任务 自主使用您自己的虚拟计算机,可以访问不同的工具并能够与网站、文件和外部服务实时交互。

这一突破意味着超越简单的对话: 代理做出决策、浏览网页、生成文档并自动化流程无需用户提供分步说明。所有操作均在同一个 ChatGPT 环境中进行,并始终在用户的监督和验证下进行,用户可以随时中断或调整任务。

独家内容 - 点击这里  如何使用 Google Gemini 了解城市中哪些地方值得参观

基于先前技术集成的功能

ChatGPT 代理的出现统一了 OpenAI 近期的几项发展,例如 操作者 (这已经允许聊天机器人与网页进行交互)和 深入研究 (专注于来自多个来源的高级报告)。这种组合将系统从单纯的智能聊天转变为 能够从头到尾执行任务的合作者用户可以委托收集信息、规划活动、创建电子表格或生成演示文稿等流程,代理处理整个工作流程,并在必要时请求确认。

ChatGPT 代理到底能做什么?

GPT 代理

在示威活动中,各种例子包括 全面的婚礼策划 (包括酒店搜索、天气预报、礼品识别,甚至待处理购买的提醒)、官方文件的生成或在线购买的自动化。 无需再在多个选项卡或应用程序之间切换。:代理将所有内容整合到一次对话中。

其中 特色功能 分别是:

  • 创建和操纵 电子表格和演示文稿 基于真实数据。
  • 晚餐计划、购物清单和运输协调.
  • 搜索和购买产品 在 ChatGPT 的在线商店中。
  • 储备 考虑到偏好和预算的餐厅、酒店或服务。
  • 个人管理 (议程、提醒、约会)和复杂数据的专业分析。
独家内容 - 点击这里  Copilot Search:它是什么、如何工作以及如何最大限度地利用它

供人工智能使用的虚拟计算机

ChatGPT 代理

新代理商运营的关键在于其永久访问 由 OpenAI 管理的虚拟环境在那里,您可以使用可视化浏览器像人类一样与网站进行交互,访问终端来运行代码或操作文件,并在用户授权的情况下连接到外部应用程序(例如 Google Drive、GitHub 或 Gmail)。 每个任务都在独立的临时会话中运行完成后删除 加强安全性和隐私性。

这种设计可以让你 实时分析信息、编辑文档并做出情境化决策例如,您可以在日历中确定一个约会,如果愿意,可以重新安排它或准备与该日期相关的报告。

基准:代理与人类和其他模型相比表现如何?

第一次比较测试(电子表格工作台, 数据基准测试 y 浏览Comp) 表明 ChatGPT 代理在分析、编辑和导航任务方面的表现优于之前的 AI 模型和许多人类在电子表格和数据科学基准测试中,该代理实现了破纪录的准确性和效率,表明其技术已达到相当的成熟度。

独家内容 - 点击这里  Gemma 3n:谷歌的新项目将先进的人工智能带入任何设备

在现实环境中, 事实证明,它能够分析大量电子邮件或客户消息、综合用户资料、自动生成财务报告和管理营销任务。,所有操作只需几分钟,且无需用户持续干预。

隐私和安全:绝对的用户控制

OpenAI 特别 强调安全性并让用户完全控制代理的行为. 任何敏感操作(例如提交表单、进行预订或执行代码) 执行前需要明确确认. 代理被编程为 拒绝高风险行动,例如金融交易或潜在危险任务。此外,只需单击即可清除所有活动,会话结束后不会存储用户数据。

该系统监控整个流程,并允许实时观察人工智能执行的步骤。如果用户愿意,他们可以在任何操作最终执行之前暂停或中断该操作,从而增强透明度并增强对该工具的信任。