这是当今人工智能面临的三大问题

上个月在伦敦举行的一次深度学习会议上，与会者谈到了一个特别值得注意的反复出现的主题：谦逊，或者至少，谦逊的必要性。...

上个月在伦敦举行的一次深度学习会议上，与会者谈到了一个特别值得注意的反复出现的主题：谦逊，或者至少，谦逊的必要性。

虽然像谷歌这样的公司自信地宣称，我们生活在一个“人工智能第一时代”，机器学习在语音和图像识别等领域有了新的突破，但那些处于人工智能研究前沿的公司却热切地指出，还有很多工作要做。仅仅因为我们有听起来像电影里会说话的电脑的数字助理，并不意味着我们离创造真正的人工智能更近了。

问题包括需要大量的数据来驱动深度学习系统；我们无法创造出擅长于多个任务的人工智能；我们对这些系统如何工作缺乏洞察力。2016年的机器学习创造了辉煌的工具，但它们很难解释，训练成本很高，甚至对创造者来说也常常很神秘。让我们更详细地看看这些挑战：

首先你得到数据，然后你得到人工智能

我们都知道，人工智能需要数据来了解世界，但我们往往忽略了涉及的数据量。谢菲尔德大学（University of Sheffield）机器学习教授、亚马逊人工智能团队成员尼尔•劳伦斯（Neil Lawrence）表示，这些系统不仅需要比人类更多的信息来理解概念或识别特征，还需要数十万倍的信息如果你看看所有的应用领域，深度学习是成功的，你会发现它们是我们可以获取大量数据的领域。在这里，像Google和Facebook这样的大型科技公司可以访问堆积如山的数据（例如，你在Android上的语音搜索），这使得创建有用的工具变得更加容易。

劳伦斯说，现在的数据就像工业革命初期的煤炭。他举了托马斯·纽科门（Thomas Newcomen）的例子，他是一个英国人，1712年发明了以煤为燃料的蒸汽机的原始版本，比詹姆斯·瓦特早了60年。纽科门的发明不是很好：与瓦特的机器相比，它效率低，运行成本高。这意味着它只能在煤田工作——那里的燃料充足，足以克服机器的缺陷。

<**all/> <**all> A screenshot from Facebook's open-source image recognition tools.</**all>

劳伦斯认为，全世界都有数百名新人在研究自己的机器学习模型。它们可能是革命性的，但如果没有数据让它们发挥作用，我们永远不会知道。像谷歌、Facebook和微软这样的大型科技公司是今天的煤矿。它们拥有丰富的数据，因此能够运行效率低下的机器学习系统，并改进它们。规模较小的初创公司可能有好主意，但如果没有数据，他们将无法坚持到底。

“强迫人们生病获取数据被认为是不道德的。”

当你审视那些数据难以获取的领域时，问题就更大了。以医疗保健为例，人工智能被用于机器视觉任务，如在X射线扫描中识别肿瘤，但数字化数据可能是稀疏的。正如劳伦斯所指出的，这里的棘手之处在于“通常认为强迫人们生病来获取数据是不道德的。”（这就是为什么谷歌和英国国家卫生服务局之间达成的协议如此重要。）劳伦斯说，问题其实不是找到分发数据的方法，但是要让我们的深度学习系统更高效，能够用更少的数据工作。就像瓦特的改进一样，这可能还需要60年。

专门化是为昆虫-人工智能需要能够多任务

深度学习还有一个关键问题：事实上，我们现有的系统基本上都是**学者。谷歌DeepMind研究公司的科学家Raia Hadsell说，一旦他们接受了训练，他们在识别猫或玩Atari游戏等任务上的效率会非常高。但是“世界上没有神经网络，现在也没有可以训练的方法来识别物体和图像，玩太空入侵者，听音乐。”

“我们甚至不能学习多个游戏。”

不过，问题更严重。当谷歌的DeepMind在去年2月宣布它已经建立了一个可以击败49款Atari游戏的系统时，这无疑是一个巨大的成就，但是每次它击败一款游戏时，这个系统都需要重新训练才能击败下一款。正如Hadsell所指出的，你不能试图同时学习所有不同的游戏，因为规则最终会互相干扰。你可以一次只学一个，但最终你会忘记你对以前比赛的了解。”为了获得人工通用智能，我们需要一些能够学习多种任务的东西但我们甚至无法学习多个游戏。”

解决这个问题的方法可能是一种叫做渐进式神经网络的方法——这意味着将不同的深度学习系统连接在一起，这样它们就可以传递特定的信息。在六月份发表的一篇关于这个话题的论文中，Hadsell和她的团队展示了他们的渐进式神经网络是如何适应变化不大的乒乓球游戏的（在一个版本中，颜色是颠倒的；在另一个实验中，控制被翻转）比正常的神经网络快得多，后者必须从头开始学习每一个游戏。

<**all/> <**all> The basic layout of a progressive neural network. (Image credit: DeepMind / Raia Hadsell) </**all>

这是一种很有前途的方法，在最近的实验中，它甚至被应用到了机器人手臂上——将他们的学习过程从几周加速到一天。然而，也有很大的局限性，Hadsell指出，渐进式神经网络不能简单地不断地向他们的记忆中添加新的任务。她说，如果你一直把系统连在一起，迟早你会得到一个“太大而不易处理”的模型。在这种情况下，管理的不同任务本质上是相似的——创造一种人类水平的智能，可以写诗、解微分方程、设计椅子，完全是另外一回事。

只有你能表现出你的工作能力，这才是真正的智慧

另一个主要挑战是理解人工智能首先是如何得出结论的。神经网络对于观察者来说通常是不可理解的。尽管我们知道它们是如何组合在一起的，也知道其中的信息，但它们做出某些决定的原因通常无法解释。

我在地板上找窗帘，不是在窗户上

弗吉尼亚理工大学（Virginia Tech）的一个实验很好地证明了这一问题。研究人员创造了一个基本上是神经网络的眼睛跟踪系统，它记录了计算机首先看到的像素。研究人员展示了卧室的神经网络图片，并问人工智能：“什么东西遮住了窗户？”他们发现人工智能没有看窗户，而是看地板。然后，如果它找到了一张床，它会给出答案“窗帘遮住了窗户”。这恰好是对的，但这只是因为网络训练的数据有限。根据展示的图片，神经网络推断如果它在卧室里，窗户上会有窗帘。所以当它看到一张床时，它就不再看了——它的眼睛里看到了窗帘。当然合乎逻辑，但也很愚蠢。很多卧室没有窗帘！

眼动追踪是一种对内部工作原理进行了解的方法，但另一种可能是从一开始就在深层学习系统中建立更多的连贯性。伦敦帝国理工学院（Imperial College London）认知机器人学教授（也是前机器科学顾问）默里•沙纳汉（Murray Shanahan）说，实现这一目标的一种方法是重新审视一种古老的、不流行的人工智能，即所谓的符号人工智能或老式人工智能（GOFAI）。这是建立在这样一个假设的基础上的，即大脑中发生的事情可以简化为基本逻辑，世界是由一个复杂的符号字典来定义的。通过组合这些符号——代表动作、事件、对象等——你基本上可以综合思考(如果以这种方式创建人工智能听起来像是一项可怕的、不可思议的任务，那么想象一下在仍然运行在磁带上的计算机上尝试它吧。）

沙纳汉的建议是，我们把歌菲的象征性描述与深度学习结合起来。这将为系统提供一个了解世界的起点，而不仅仅是向它们提供数据并等待它们注意到模式。他说，这不仅可以解决人工智能的透明度问题，还可以解决Hadsell提出的迁移学习问题。”沙纳汉说：“可以很好地说，突破和乒乓球相似，因为他们都有球拍和球，但人类的认知水平使这种联系更具戏剧性。”就像原子结构和太阳系结构之间的联系。”

Shanahan和他在Imperial的团队正在研究这种新方法（他们称之为深层符号强化学习），并发表了一些小实验。它仍处于初级阶段，找出它是否能扩展到更大的系统和不同类型的数据将很有帮助。然而，它完全有可能发展成更多的东西。毕竟，深度学习本身是人工智能的一个不受欢迎的部门，直到研究人员开始利用近年来提供的廉价数据和丰富的处理能力。也许是时候从人工智能的过去的另一个爆炸尝试在一个新的环境中的技能。