- 在修改后的图灵测试中,GPT-4.5 成功让 73% 的参与者相信它是人类。
- 实验表明,人工智能的成功很大程度上取决于指令和“个性”的采用。
- LLaMa-3.1 等其他模型的成功率较低,并且如果没有个性化,结果会大幅下降。
- 这项研究对人工智能的当前局限性以及其日益增强的对话真实感所带来的风险提出了质疑。

你能区分与真人和机器的对话吗? 这个问题最早由艾伦·图灵在七十多年前提出,在最近的一项实验中,该实验在具有挑战性的环境下测试了最先进的人工智能模型,因此这个问题再次引起了人们的关注。
加州大学圣地亚哥分校的研究人员进行了一项 这项研究挑战了我们区分人类和人工智能的能力。湖在实验的中心, GPT-4.5模型 OpenAI 不仅在特定条件下通过了图灵测试,而且 他被认定为人类的次数甚至比被认定为真实人类的次数还多。
严格条件下的实验
这项研究由研究员 Cameron Jones 和 Benjamin Bergen 领导, 专注于经典图灵测试的修改版本,共有超过300人参加,其中包括大学生和网络平台用户。在五分钟的会议期间,每位参与者同时进行两次对话:一次与人,一次与人工智能系统。到底, 他们必须判断对话者中哪一个是人类.
结果是惊人的: GPT-4.5 模型在 73% 的情况下被认为是人类 当他被赋予一种明确的性格时——例如,一个拥有数字文化知识的年轻人。这个百分比不仅超出了认为测试通过的统计阈值,也超出了真实人类在本次实验中表现出的人性的能力。这种方法强化了这样的想法 la 人工智能 已在近几十年中不断发展。
然而,当没有赋予人工智能特定的个性,而只是被要求在没有进一步提示的情况下表现出人类特征时,其有效性就会暴跌至 36%。这强调了 提示中上下文和个性化的重要性 赋予语言模型。
模型与意外结果的比较
除了 GPT-4.5 之外,该实验还包括其他模型,例如 Meta 的 LLaMa-3.1-405B当赋予虚构人物时,准确率仍达到 56%。虽然这一数字低于 GPT-4.5,但仍高于偶然概率。相比之下,其他版本如GPT-4o或60世纪21年代的老牌聊天机器人ELIZA,分别不超过23%和XNUMX%,这清楚地表明了当前技术与原始技术之间的差距。
这些结果 表明人工智能在图灵测试等任务中的成功更多地取决于如何指导它,而不是模型本身。关键是要采用可信的角色,而不是有意识地模拟人类的智能。如果你想深入了解 计算机 随着时间的推移,你会发现有趣的信息。
此外,研究发现,即使有复杂的指令,一些模型也无法维持足够令人信服的对话。 GPT-4o 承认自己是一款几乎没有挑战的人工智能。,这种说法很快就在人类对话者中失去了可信度。
欺骗,还是思考?图灵测试争议
通过图灵测试并不意味着人工智能理解你所说的话或意识到你的话。这是专家们之间的一次精彩讨论。虽然一些人认为这一成就是模拟人类行为的重大进步,但另一些人认为 这种测试对于衡量人工智能系统的“真实智能”已经不再可靠。.
谷歌工程师 François Chollet 等专家指出, 图灵测试更多的是一个哲学实验,而不是目前有用的测量方法。。根据这种观点,人工智能欺骗了我们,并不意味着它能够推理或对世界有深刻的理解。相反,它利用从数百万文本中学习到的模式来构建合理的答案。为了更好地了解这个领域,你可以查看谁是 人工智能创始人.
因此,令人担忧的并不是这些人工智能能做什么,而是我们认为它们能做什么。 人类倾向于将对话系统拟人化就像 60 世纪 XNUMX 年代的 ELIZA 一样,它似乎并没有随着时间的推移而消失。如今,这一现象通过更为复杂的模型被放大。
听起来太过人性化的人工智能的应用和风险
人工智能可以在简短对话中模仿人类,这不仅带来了机遇,也 构成重大风险 在安全、教育和社会关系方面。
- 身份欺诈: 令人信服的人工智能可用于诈骗或社会工程活动。
- 虚假信息: 能够生成人类语音的模型可以成为操纵或传播虚假新闻的有效工具。
- 劳动自动化: 客户服务或技术支持等领域可能会被这些对话式人工智能所取代,从而影响人类的就业。
- 教育与评估: 检测文本是由人还是人工智能编写成为一项复杂的任务,并对学术领域产生影响。
研究人员还警告说 这些技术的标准化可能会使它们的检测更加困难。 将来。随着我们越来越习惯于与自动化系统交互,我们可能会放松警惕,使得这些模型在我们不知不觉中变得与人类对话者难以区分。
另一个反复出现的担忧是其实施的道德问题。人工智能应该在多大程度上假装人类而不暴露其人工智能的本质?是否应该对其在现实生活中的使用方式和时间作出明确的限制?
GPT-4.5 并未证明机器能够像我们一样推理但它明确表示,它们可以以一种让人难以区分的方式模仿我们。这个里程碑标志着一个转折点,这并不是因为机器是什么,而是因为它让我们质疑:在人工与现实相融合的数字时代,我们对于“成为人类”的意义的看法。
我是一名技术爱好者,已将自己的“极客”兴趣变成了职业。出于纯粹的好奇心,我花了 10 多年的时间使用尖端技术并修改各种程序。现在我专攻计算机技术和视频游戏。这是因为 5 年多来,我一直在为各种技术和视频游戏网站撰写文章,旨在以每个人都能理解的语言为您提供所需的信息。
如果您有任何疑问,我的知识范围涵盖与 Windows 操作系统以及手机 Android 相关的所有内容。我对您的承诺是,我总是愿意花几分钟帮助您解决在这个互联网世界中可能遇到的任何问题。


