重新思考图灵测试
在6月的一场比赛中,一个名叫尤金的聊天机器人欺骗了一群人类评委,让他们相信这是一名乌克兰少年。评委们称赞这是机器首次通过图灵测试。图灵测试是计算机科学家艾伦·图灵在1950年提出的人工智能的神圣指标。
尤金的胜利是短暂的。几天之内,人工智能研究人员就将聊天机器人的成就斥为一系列罐头回答。然后他们对图灵测试本身提出了质疑。该测试被视为一种存在主义的客厅游戏,要求人类和机器回答远程审讯者的问题。一台被误认为是人的计算机将证明它已经发展出模仿我们自己思维过程的能力。
这一切听起来都很好,但“人们很容易被欺骗,”纽约大学的计算机科学家厄尼·戴维斯说。“我们已经习惯了一个安全的假设,即与我们交谈的人实际上是一个聪明的人。”因此,人类官员可能会让计算机从怀疑中获益。此外,聊天机器人经常通过给人的印象是头脑混乱来掩盖他们缺乏推理。例如,未来学家雷·库兹韦尔曾经问尤金,“如果我碗里有两个弹珠,我再加两个,碗里现在有多少弹珠?”“不会太多,”尤金写道。“我不能告诉你确切的数字;我忘记了。如果我没弄错,你还是没有告诉我你住在哪里。”
“我们习惯了一个安全的假设,即与我们交谈的人实际上是一个聪明人。”
这样一来,图灵测试并没有促进具有人类水平的适应性智能的机器的发展。相反,它暴露了我们自己的轻信,并催生了一些程序,这些程序最大的创新是对尖刻的不合理推理和操纵魅力的战术使用。
人工智能最著名的基准受到严厉批评之际,人们对该领域的兴趣和投资正在飙升。谷歌最近以4亿美元收购了人工智能公司DeepMind,IBM正在向其沃森系统投资10亿美元,沃森系统是前危险!现在正在解开脑癌基因的赢家。今年秋天,就连已故的艾伦·图灵也将获得好莱坞的待遇,作为传记电影《模仿游戏》的主题。有人可能会说,人工智能领域不再需要图灵测试了。我们应该让机器按照自己非人的条件变得更聪明。
那将是一个错误。图灵测试的天才之处在于它抓住了公众的想象力并推动了创新。那么,为什么不建立一个更适合证明真正人工智能任务的新测试呢?斯坦福大学的认知科学家诺亚·古德曼说:“也许我们应该试着理解如何迈出一系列小步骤,引导我们沿着有用的道路前进。”机器应该处理一系列强调灵活、现场思考的任务。它能在第一次看到视频后描述视频,用直接的答案回应直接的问题,并识别语言中的细微差别吗?用图灵的话来说,这样一个系统不仅仅是一个噱头,最终将展示“一台会思考的机器”。尤金差得很远。
本文最初发表于《科普》2014年10月刊。
重新思考图灵测试