图灵测试已经过时了！量子计算之父奥特曼提出的2.0即将来临

新智慧报告编辑：Allen 【新智慧简介】几十年前的标准开始变得过时，因为今天的伟大模型可以轻松通过图灵测试。 Altman 和量子计算之父 David Deutsch 讨论了新的图灵测试 2.0 标准，该标准可以更好地衡量什么类型的 AI 被认为具有真正的智能。如果去年我们还在用图灵测试来判断大型模型是否智能，我们可能会落后一些。从GPT-4、Claude 2、Gemini、LLaMA 3开始的这些模型已经可以轻松通过图灵测试。一些研究人员表示图灵测试已经过时了。模型在线时间越长，拥有的知识越多，就越能愚弄大多数人类法官。问题是：会说话的机器真的能听懂你说的话吗？在阿克塞尔·施普林格奖颁奖典礼的招待会上，奥特曼与量子物理学家大卫·多伊奇对峙，设定了新标准。在他们交谈的过程中于是，一个大胆的提议出现了：图灵测试2.0。图灵测试 1950年，图灵在他的著名论文《计算机器与智能》中设想：如果一台机器能够通过文本通信欺骗人类审稿人，让人们认为它不是某个人，那么它就是智能的。虽然这个标准在 70 年前可能已经非常先进，但对于当前的模型来说，它已经有些脆弱了。 2023 年末，加州大学圣地亚哥分校的一项研究要求 500 名受访者与大型模型进行互动。结果发现，GPT-4伪装成人类时的胜率超过50%，这也是本次测试中唯一对人类的识别率。 Claude 2和LLaMA 3在类似的实验中也表现出色，通过了测试。也就是说，根据图灵标准，他们已经可以被认为是“智能”的。但这真的足够了吗？图灵测试2.0：解决量子引力，再告诉我一次。在阿克塞尔·施普林格颁奖典礼上，主持人说奥特曼最喜欢的书之一是《无限乞求》局：世界进步的起源，因此组织者制作了一个“惊喜连接”，其中作家大卫·多伊奇出现在屏幕上。由此开始了一场关于人工智能是否真的“懂得如何思考”的争论。多伊奇的中心观点是，真正的智能必须能够创造新知识、提出新假设、解决新问题，甚至扭转旧观念。奥特曼提出以下假设。 “如果一个模型有一天能够解决量子引力问题，并清楚地告诉我们它在想什么以及为什么做出这样的决定，那会是真正的智能吗？”多伊奇回应道。奥特曼点点头。 “好的，这也同意使用这个标准。”我们一拍即合。奥特曼和德国版图灵测试试验2.0诞生了。关于大卫·多伊奇大卫·多伊奇是一个非常特别的人。他是量子计算理论的早期支持者。 1985年发表论文《量子理论、丘奇-图灵原理和通用量子计算机》”，为后来的量子计算模型奠定了基础。但他圈外的身份是一位科学和哲学的布道者。在《无限的开端：世界进步的起源》中，他提出人类文明的进步是通过不断创造更好的解释来实现的。所以，在那些对话中，我们总是强调“解释力”，不仅要得到答案，还要能够清楚地解释为什么它是正确的。否则，只会为什么我们需要图灵测试2.0 从一开始，图灵测试就不是测试AI是否智能，而是它是否能欺骗人类。但是现在的模型越来越具有误导性，有时很难判断它们是否是AI。这导致图灵测试失去了一些参考价值。envision更多的是一种“创造性测试”：一个模型是否能够进行科学研究，是否能够提出新的理论，是否能够对自己的推论提供自洽的解释。这个标准太高了，并不是目前所有的AI都能达到。但至少它指向了某个方向。我们真正关心的不仅仅是机器能否像人类一样说话，更重要的是它们能否成为我们理解世界的伙伴。参考资料： https://www.youtube.com/watch?v=o80PeJ0P1YM https://www.businessinsider.com/sam-altman-openai-david-deutsch-turing-test-for-agi-2025-9
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注：以上内容（包括图片和视频，如有）由网易号社交媒体平台用户上传发布仅提供信息存储服务。。

图灵测试已经过时了！量子计算之父奥特曼提出的2.0即将来临

发表回复取消回复

归档

功能

图灵测试已经过时了！量子计算之父奥特曼提出的2.0即将来临

发表回复 取消回复

归档

功能

发表回复取消回复