图灵测试已经过时了!量子计算之父奥特曼提出的2.0即将来临

新智慧报告编辑:Allen 【新智慧简介】几十年前的标准开始变得过时,因为今天的伟大模型可以轻松通过图灵测试。 Altman 和量子计算之父 David Deutsch 讨论了新的图灵测试 2.0 标准,该标准可以更好地衡量什么类型的 AI 被认为具有真正的智能。如果去年我们还在用图灵测试来判断大型模型是否智能,我们可能会落后一些。从GPT-4、Claude 2、Gemini、LLaMA 3开始的这些模型已经可以轻松通过图灵测试。一些研究人员表示图灵测试已经过时了。模型在线时间越长,拥有的知识越多,就越能愚弄大多数人类法官。问题是:会说话的机器真的能听懂你说的话吗?在阿克塞尔·施普林格奖颁奖典礼的招待会上,奥特曼与量子物理学家大卫·多伊奇对峙,设定了新标准。在他们交谈的过程中于是,一个大胆的提议出现了:图灵测试2.0。图灵测试 1950年,图灵在他的著名论文《计算机器与智能》中设想:如果一台机器能够通过文本通信欺骗人类审稿人,让人们认为它不是某个人,那么它就是智能的。虽然这个标准在 70 年前可能已经非常先进,但对于当前的模型来说,它已经有些脆弱了。 2023 年末,加州大学圣地亚哥分校的一项研究要求 500 名受访者与大型模型进行互动。结果发现,GPT-4伪装成人类时的胜率超过50%,这也是本次测试中唯一对人类的识别率。 Claude 2和LLaMA 3在类似的实验中也表现出色,通过了测试。也就是说,根据图灵标准,他们已经可以被认为是“智能”的。但这真的足够了吗?图灵测试2.0:解决量子引力,再告诉我一次。在阿克塞尔·施普林格颁奖典礼上,主持人说奥特曼最喜欢的书之一是《无限乞求》局:世界进步的起源,因此组织者制作了一个“惊喜连接”,其中作家大卫·多伊奇出现在屏幕上。由此开始了一场关于人工智能是否真的“懂得如何思考”的争论。多伊奇的中心观点是,真正的智能必须能够创造新知识、提出新假设、解决新问题,甚至扭转旧观念。奥特曼提出以下假设。 “如果一个模型有一天能够解决量子引力问题,并清楚地告诉我们它在想什么以及为什么做出这样的决定,那会是真正的智能吗?”多伊奇回应道。奥特曼点点头。 “好的,这也同意使用这个标准。”我们一拍即合。奥特曼和德国版图灵测试试验2.0诞生了。关于大卫·多伊奇 大卫·多伊奇是一个非常特别的人。他是量子计算理论的早期支持者。 1985年发表论文《量子理论、丘奇-图灵原理和通用量子计算机》”,为后来的量子计算模型奠定了基础。但他圈外的身份是一位科学和哲学的布道者。在《无限的开端:世界进步的起源》中,他提出人类文明的进步是通过不断创造更好的解释来实现的。所以,在那些对话中,我们总是强调“解释力”,不仅要得到答案,还要能够清楚地解释为什么它是正确的。否则,只会为什么我们需要图灵测试2.0 从一开始,图灵测试就不是测试AI是否智能,而是它是否能欺骗人类。但是现在的模型越来越具有误导性,有时很难判断它们是否是AI。这导致图灵测试失去了一些参考价值。envision更多的是一种“创造性测试”:一个模型是否能够进行科学研究,是否能够提出新的理论,是否能够对自己的推论提供自洽的解释。这个标准太高了,并不是目前所有的AI都能达到。但至少它指向了某个方向。我们真正关心的不仅仅是机器能否像人类一样说话,更重要的是它们能否成为我们理解世界的伙伴。参考资料: https://www.youtube.com/watch?v=o80PeJ0P1YM https://www.businessinsider.com/sam-altman-openai-david-deutsch-turing-test-for-agi-2025-9
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号社交媒体平台用户上传发布仅提供信息存储服务。 。

此条目发表在每日更新分类目录。将固定链接加入收藏夹。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注