想象一下,你生活在一个反乌托邦的未来,你被指控是一个先进的人工智能,这在这个社会是非法的。刑罚是**,为了说服法官谁将决定你的命运,你可以说出一个词,字典里你喜欢的任何词,来证明你是有血有肉的。你选什么词?
这听起来像是一部低俗科幻短片的设计,但实际上这是麻省理工学院两位研究人员关于他们称之为“最小图灵测试”的一篇奇怪论文的一部分
英国科学家艾伦·图灵(Alan Turing)在其1950年的开创性论文《计算机械与智能》(Computing machine and Intelligence)中概述了图灵测试的前提,而不是机器试图通过对话说服某人他们是人,最小图灵测试只需要一个词,要么完全自由选择,要么从一对单词中选择。
负责研究的约翰·麦考伊(John McCoy)和托默·厄尔曼(Tomer Ullman)澄清,最小图灵测试不是人工智能进步的基准,而是探索人类如何看待自己与机器的关系的一种方式。这个问题在一个充斥着人工智能助手、冒充人类和谷歌自动回复处理电子邮件的世界里变得越来越重要。在一个人工智能的世界里,我们认为什么使我们与众不同?是什么让我们与众不同?
在McCoy和Ullman的两项测试的第一项中,936名参与者被要求选择任何他们认为可以证明他们人性的单词。尽管可以自由选择,结果还是围绕着少数主题。四个最常用的词是“爱”(134个答案)、“同情”(33个答案)、“人类”(30个答案)和“请”(25个答案),占所有回答的四分之一。其他类别是移情(如“情感”、“感觉”和“同情”),以及信仰和宽恕(如“怜悯”、“希望”和“上帝”)。
总而言之,936个答案涵盖了428个单词,这是一个惊人的衔接量。
在第二次测试中,2405名参与者必须在成对的单词中进行选择,决定他们认为这两个单词中哪一个是由人和机器给出的。同样,像“爱”、“人”和“请”这样的词得分很高,但获胜的词更简单,更具生物学意义:“poop”。是的,在所有的词对中,“poop”被选得最频繁,以表示人类的本质和灵魂。大便。
麻省理工学院斯隆神经经济学实验室的McCoy在对Verge发表讲话时强调,这项测试更多的是关于社会心理学,而不是计算机科学。
“我们没有看到它被用作下一个验证码,”麦考伊说当你考虑到用户界面设计之类的事情时,它在人工智能计算机领域的实际应用就更多了。在这些情况下,了解人们对计算机的看法以及他们的想法将计算机区分开来可能很有用。”
这是有道理的,因为即使是最初的图灵测试作为机器智能测试,也早已不受计算机科学家的青睐。批评者说,它测试了程序员找到比智力更能欺骗人类的对话技巧的能力。
例如,2014年,新闻报道宣布图灵测试已经被聊天机器人通过。程序员通过让机器人识别自己是一个名叫尤金·古斯曼(Eugene Goostman)的13岁乌克兰男孩来欺骗评委。这为机器人的许多错误和无法回答某些问题提供了完美的掩护。正如计算机科学家加里·马库斯(Gary Marcus)等批评家所指出的,“谷歌的胜利真正揭示了。。。不是天网或电子人文化的出现,而是我们可以轻松愚弄他人。”
但这并不是说图灵测试毫无用处。对于人工智能研究人员来说,创建能够令人信服地聊天的计算机程序是一项富有成效的挑战,这可能有益于人类。这个测试仍然是一个奇妙的思维实验,可以帮助我们探索围绕我们对智力理解的复杂问题。我们还可以修改它,让计算机不只是简单地聊天,而是回答那些需要对世界有细致而丰富的理解的问题,从而使它更加专注(一个例子是问一台计算机,“platch”和“snorp”的复数是什么?”一个人可能会回答“platches”和“snorps”,尽管事实上这些词都是无稽之谈,在字典中找不到。)
正是在这个框架中,最小图灵测试作为一种思维实验,而不是人工智能进步的基准,最受欢迎。麦考伊说,这项研究最让他吃惊的是,答案中有多少创造性。”“人们想出了各种各样有趣的废话和双关语,”他说,其中有“bootylic”“supercalifragilisticexpialidocious”等词(在没有谷歌的情况下试着拼写)
麦考伊说:“它告诉你一些关于人类和智能机器人之间的差距的事情,那些以前从未考虑过这种情况的人会得出很多聪明有趣的结果。”换句话说,这是一个计算机很难解决的问题。
...知道后缀和前缀的区别。前缀和后缀是修饰词,当附加到一个词上时,它的意思会改变。前缀附加在单词的开头,后缀附加在单词的末尾。前缀和后缀结合起来称为词缀,或者简单地说是词根的添加。值得注意的是,后缀和前缀...
...帐户。你输入你的**,但在你继续之前,你需要证明你是一个人。勾选标有“我不是机器人”的方框。你可以看到一个模糊的图像,你需要破译歪斜的数字。这些是CAPTCHA,虽然它们可能会令人讨厌,但它们是必要的。 ...
... 一个完全自动化的公共图灵测试来区分计算机和人类(CAPTCHA)是阻止机器人发送垃圾邮件的有用工具。传统的CAPTCHA扭曲了文本,使恶意软件无法读取。然而,人类可以破...
...大肆宣传和弥补风险投资资金的机会。虽然它们都属于同一个大伞下,但它们之间有一些关键的区别。 ...
...果和汉堡包,还有一位著名的妇科医生做父亲。尤金也是一个计算机程序,他的人工智能足够好,赢得了图灵100,历史上最大的图灵测试最高奖。这项测试于上周末在英国米尔顿·凯恩斯附近的布莱奇利公园举行,测试的设计者...
尤金·古斯曼看起来像一个典型的13岁乌克兰男孩——至少,这是本周六图灵测试赛三分之一的评委的想法。古斯曼说他喜欢汉堡包和糖果,他父亲是妇科医生,但这都是谎言。这个男孩是由俄罗斯人弗拉基米尔·维塞洛夫和乌克...
...了图灵测试,诱使一组法官相信它是人类。这一壮举是由一个名叫尤金·古斯曼的聊天机器人完成的,这个机器人假装是一个13岁的孩子,用第二语言写作。但是,尽管这台机器显然通过了它所在的竞争对手提出的测试,但许多...
...人类,而第三个非人类玩家被作为单向查询的对象引入,一个玻璃盒子中的样本(稍后将详细介绍盒子!)。 性别角色并非偶然 在《Ex Machina》中,Caleb(Domnhall Gleeson)是谷歌BlueBook替身的一名低级程序员,他赢得了在Blu...
...自己的显示器生产足够数量的产品。 Appassionato还将配备一个名为“Alan爵士”的数字助理和礼宾服务,它将结合传统的语音控制和随叫随到的人工助手,提供“亲密而智能的体验”。TRI说,它的目标是在今年9月将**交付给客户,...