1950年,数字时代的初期,图灵的《计算机器与智能》发表了。开篇,图灵就提出了那个著名的问题:「机器能思考吗?」

34957+70764=?计算机竟然答错了!图灵设计的人机问答不靠谱?

图灵没有试图定义什么是「机器」/V 0 Z X「思考」,而是提出了一l a x q 8种不同的方法来回答这个问题,这种方法来源于维多利亚时* & m + 8 V代的一种娱乐方式——模仿游戏。

34957+70764=?计算机竟然答错了!图灵设计的人机问答不靠谱?

模仿游戏的规则是这样的,一男一女在不同的房间里,通过手写的笔记与裁判员交a C ) _ I o流。裁判H G r R 7 [ K M员要分辨笔迹各属于谁,但是由于男人试图模仿女人的笔迹,这就加大了游戏的难度。

受到这个游戏的启发,图灵设计了一个思维实验,其中有两名参赛者,一个参赛者比较特殊N t | U W b,是一台计算机。

图灵认为,n N D t A ( x _经过编程,如果这{ P p H q . D i台计算机也可以玩模仿游戏,而且: Q – S f v B水平非常高,连裁判也不能判断他到底在和人交流还是计算机,那就有理由推断:这台计算机是智能的。

这就是「图灵测试q p [ 3 0 4 f *」,一个至今仍然是人工{ A M f智能领域最著名也最具争议的议题之一。

图灵测h m 8 f m Z X试的回答是明确的

图灵测试的持久吸引力在于对「机器能思考吗?」这一哲学上引人深思的问题,它给出了明确的答案。

只要通过测试,这个问题的答案就是肯定的。

t Q : N x 6 $像哲学家Daniel Dennett所描述的:图灵测试就是哲学对话的终结者。

34957+70764=?计算机竟然答错了!图灵设计的人机问答不靠谱?

哲学家Daniel Denne\ j b 5 6 jtt

「与其没完没了地争论思考的终极本质,为什么我们不直接承认不论这个本质是什么,只要通过了测试,那就具备了这一本质。」

a V g H n是仔细阅. ) c d L k 1读图灵的文章,就会发现一个细节,这个细节在测试中引入了模糊性,这表明也许图灵的意思更多的是对机器智能的哲学挑衅,而不是一个实际的测试。

在「计算w 5 9 9 U a D ;机器与智I f 2 & h # G ] v能」的一个章节中,图灵模拟了未来智能计算机的测试情况。(人问问题,计算机回答。)

问: 请给我写一首关于福斯桥的十四行诗。

答:? t h A S ! ? r这事别把我算在内,我从b 1 p来不会写诗。

问: 34957加70764是多少?

答: (暂停30秒,然后给出答案)1g ! v \ Q p ( W05621.

问: 你下国际象棋吗?

答:下。

问: 我的 K1上有 K,没有其他的了。你只有 K在 K 6,R在R1。该你走了。你怎么走?

答: (停顿15秒后) R-R8配对。

出错的肯定是人,机器不会出错

在上面的交流中,计算机实际上犯了一个数学错误。两数字的和应该是105721,而不是105621.

34957+70764=?计算机竟然答错了!图灵设计的人机问答不靠谱?

从这一点看,这些对话的设计不太[ @ x ,可能是图灵,图灵可是一位杰出的数学家,却留下了这样的错误?

更有可能的是,% D S b k S M v k它是一种为警觉的读者准备的复活节彩蛋7 c w 5 _

在文章的其他地方,图灵似乎暗示了计算错误是一种. | n编程技巧,只是想混淆裁判员的判J $ 3 S :断。

\ F [ N t { Y _灵写道,一台机器可以被编程为「故意引入错误,以计划好的方式来迷惑审问者」。

虽然在1950年,B m $用错误来暗示人类$ G C K % A 7 a \「智能」的想法可Z D G f m g . , T能很难理解,\ – q # 7 : \但它已经成为在NLP领域工作的程序员的设计实践。

例如,在2014年6月,一个叫Eugene Goostman的聊天机器人被报道成为第一个通过图灵测试的计算机。但批评者很快指出,Eugene之所以能通过测试,是因为他内在的欺骗: Eugene模拟了一个13岁、英语为第二语言的男孩。

34957+70764=?计算机竟然答错了!图灵设计的人机问答不靠谱?

这意味着他在句法和语法上的错误和他不完整的知识被误认6 i % $ + R ^ V *为是天真和不成熟,而不是自然W 9 x s G N 8 q语言处理能力不足。

同样,去年谷歌的语音助手系统Duplex以其类似人类0 E – 6的语气词 umms 和 ahhs 赢得了人( u d k : ^ s 0 a群的喝彩。许& , p Z x [ /多人指出,这不是系统真正思考的q * % w @结果,\ } m *而是模拟人类认知的手工编码的犹豫。

34957+70764=?计算机竟然答错了!图灵设计的人机问答不靠谱?

这两个例子都体现了图灵的想法,即计算机可以被编程为犯一些简单的错误,以便给人以「我是人」的印象。

和图灵一样,Eugene Goostman和Duplex的程序员也明白,拿人类易犯的错误来伪装就足以愚弄我n 4 # 8 z z V Q们。

也许U f ` m F X * *图灵测试并不评估机器是否智能,而是评估我们是否愿意接l = # k F L 2 9受机器是/ q h c # \ a e U智能Z * !的。

正如图灵自己所说:「智能本身是有情感的,而不是与数字相关的。我们在多大程度上认为某事物具有智能的表现方式,既取决于我们自身的心态和训练,也取决于所考虑对象的性质。」

图灵似乎认为_ [ 7 6 l c . c z,或许智能并不是一种可以编程进入机( _ R { l O 4器的东西,而是一种通过社会互动构建起来的品质。