找回密码
 欢迎注册
查看: 6940|回复: 5

[转载] 计算机首次“通过”图灵测试

[复制链接]
发表于 2014-6-10 20:55:09 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?欢迎注册

×
http://www.guokr.com/article/438567/

2014年6月7日是计算机科学之父阿兰·图灵(Alan Turing)逝世60周年纪念日。这一天,在英国皇家学会举行的“2014图灵测试”大会上,聊天程序“尤金·古斯特曼”(Eugene Goostman)首次“通过”了图灵测试。


1.jpg
通过图灵测试的程序“尤金·古斯特曼”。图片来源:cdn-static.zdnet.com

尤金最初在2001年由弗拉基米尔·维西罗夫(Vladimir Veselov)、谢尔盖·乌拉森(Sergey Ulasen)和尤金·杰姆琴科(Eugene Demchenko)在俄罗斯圣彼得堡共同开发,它模拟的是一个13岁乌克兰男孩。“尤金诞生于2001年。”维西罗夫介绍道:“我们当时的主要想法是,尤金能够声称自己知道所有事情,但考虑到他的年龄,他不知道所有事情也是很合理的。”“我们花了很多时间去使他具备可信的人格。今年,我们改进了尤金的‘对话控制器’,使得跟只会回答问题的程序比起来,尤金在对话中更加像人类。”

2.gif

模拟这样一个乌克兰小孩是“公平”的吗?其实两年前Abstrusegoose就嘲笑过这种思路。图片来源:科学松鼠会

这届图灵测试大会由雷丁大学系统工程组织。按照大会规则,如果在一系列时长为5分钟的键盘对话中,某台计算机被误认为是人类的比例超过30%,那么这台计算机就被认为通过了图灵测试。此前,从未有任何计算机达到过这一水平。2014图灵测试大会共有5个聊天机器人参与,其中尤金成功地被33%的评委判定为人类。负责区分参赛者是人类还是计算机的评委包括了英国演员罗伯特·卢埃林(Robert Llewellyn),他曾成功发起要求政府授予图灵死后赦免状的运动。

3.png

一个人(C)询问两个他看不见的对象(正常思维的人B和机器A),对象能够理解C所用的语言。如果经过若干询问后,C无法区分A与B,则A通过图灵测试。图片来源:维基百科

雷丁大学的客座教授、考文垂大学副校长凯文·沃里克(Kevin Warwick)参与了大会的组织工作。“某些人会说其实图灵测试早已经被通过了,世界各地的类似赛事上都有‘图灵测试’的身影。不过,这次活动所包含的同时比较测试是史上最多的,也通过了独立认证。”他说:“至关重要的是,在这次测试中,对话是不受限制的。真正的图灵测试正是不预设问题或主题的。所以,我们很骄傲地宣布,图灵测试是在这周六才首次被通过的。”沃里克说,图灵自己在逝世前不久就曾预言图灵测试迟早会被通过。

“我希望祝贺每一位曾经参与开发尤金·古斯特曼的人。我们整个团队都对此结果感到非常兴奋。”尤金的创造者维西罗夫在会后表示:“这对我们来说是项了不起的成就,我们希望能借此激发人们对人工智能与聊天机器人的兴趣。”他透露,接下来他们计划让尤金变得更加聪明,并继续致力于提高他的“对话逻辑”。

沃里克指出,计算机能让我们将他人甚至其他东西当做自己信任的人,这无疑在网络犯罪方面为我们敲响了警钟。图灵测试正是对抗这些威胁的重要工具。“理解这类实时在线交流如何让人们对某些事信以为真并对他们造成影响,是非常重要的事情。”沃里克说。(编辑:Ent)

编者的话:
​关于尤金·古斯特曼“通过”图灵测试这件事情,有几点需要说明。这事很牛,但可能没有你想象的那么牛。
1 它不是一台超级计算机,它只是一个程序,一个软件。
2 30%这个比例是图灵说的,但是无论是这个比例还是图灵测试本身,实际上都不是人工智能的完美金标准——这更接近于一种测量计算机能否思考的操作性定义。
3 该程序冒充的是一个来自乌克兰、英语非母语的13岁小孩,这实际上不完全公平。
4 这个程序实际上是一套人类对话的模拟脚本,从认知角度来说,它真不大能算得上是思考……

4.png
计算机在各种游戏上与人类的交锋情况。图片来源:xkcd.com

毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2014-6-10 21:52:56 | 显示全部楼层
最后那张图里,hard的那些都是什么游戏啊?
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2014-6-11 02:44:45 | 显示全部楼层
图灵测试最致命的是无法建立一个严格的“人标准”或者说没有标准人。

评分

参与人数 1威望 +2 鲜花 +2 收起 理由
wayne + 2 + 2

查看全部评分

毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
 楼主| 发表于 2014-6-11 08:24:17 | 显示全部楼层
我猜这个表单的意思是说,越往下越难.
hard的那些游戏我都没听说过。
搜了下, 就<天堂7分钟> 看懂规则了,...
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2014-6-11 20:50:24 | 显示全部楼层
看来常规游戏里,也就是围棋最难了。
那个最难的calvinball真的是没看懂。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

小黑屋|手机版|数学研发网 ( 苏ICP备07505100号 )

GMT+8, 2024-4-16 21:24 , Processed in 0.052990 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表