deepmind和暴雪发布了使用星际争霸训练人工智能的新工具

教电脑玩游戏一直是衡量他们智力的一个有用的方法（尽管有些粗糙）。但随着我们的机器变得越来越智能，我们必须为它们找到新的挑战。首先是国际象棋，然后是阿塔里，然后是棋盘游戏围棋，现在他们正在接受他们迄今为止最大的挑战：星际争霸。...

教电脑玩游戏一直是衡量他们智力的一个有用的方法（尽管有些粗糙）。但随着我们的机器变得越来越智能，我们必须为它们找到新的挑战。首先是国际象棋，然后是阿塔里，然后是棋盘游戏围棋，现在他们正在接受他们迄今为止最大的挑战：星际争霸。

准确地说，谷歌人工智能子公司DeepMind的研究人员说，星际争霸2是教授计算机记忆和计划等高级技能的完美环境。去年，DeepMind表示，它将与星际争霸创造者暴雪合作，将天基战略游戏变成适合人工智能工程师的研究环境，而今天，该软件正向公众发布。

来自DeepMind和暴雪的工具包捆绑在各种辅助工具中，包括从专业比赛中收集的大量星际争霸2回放数据集（人工智能可以通过观看来学习人类战术）；以及一组小游戏，它们将某些游戏性元素（如地图探索和资源收集）隔离开来，可以用来磨练特定的技能。不过，工具包中最重要的部分是一个API，它可以让人工智能代理像人类一样玩游戏，并将数据反馈给研究人员。这意味着，在通过试错学习的同时，这些代理可以得到与人类相同的约束条件（这样他们就不能一次看到所有的地图，或者不能无限快地点击鼠标），而这一过程在人工智能中被称为“强化学习”。

但是为什么星际争霸是训练人工智能的好方法呢？这不是因为我们想让电脑学习军事战术，而是因为我们需要教他们一些抽象的技能，而电子游戏恰好是一种很好的方式。电子游戏是虚拟的环境，这意味着游戏可以很快地重复一遍又一遍；有大量的训练数据可用，有助于生**类玩游戏；而《星际争霸》本身也有一些游戏机制，对电脑来说尤其具有挑战性。

参与该项目的DeepMind研究员奥里奥尔·维尼亚尔斯（Oriol Vinyals）解释说，该游戏提供的一个有趣的限制是“战争之雾”机制，它掩盖了地图，并迫使玩家探索以找出他们的敌人在干什么。”因此，人工智能特工要记住“啊，我以前在那里见过一个单位，但现在没看到，所以我应该回去侦察，看看他们在那个地方附近有没有基地，”温亚尔斯告诉《边缘报》。

对人类来说，这是一个显而易见的想法，几乎不值得思考，但这是一种常识性的见解，人工智能需要学习才能有用。在《星际争霸》中，思考玩家看不见的东西是获胜的关键——而这是象棋或围棋这样的游戏中不存在的挑战，在这类游戏中，两个玩家都对自己的环境有着完全的了解。

Vinyals说，这种记忆技能可以应用于各种环境，并举例说明了一台计算机管理数据中心的电源以降低电力成本。”它可能会看到，在一个星期天有一个电源高峰，无论出于什么原因，它将不得不记住这个信息下星期天来解释它，“他说记忆在这里起着关键作用，教计算机推断世界的状态对我们来说非常有趣。”

除了教授人工智能某些技能外，新发布的API还为人类与计算机星际争霸决战奠定了基础。暴雪和DeepMind都没有表示他们计划举办类似于AlphaGo对人类冠军的比赛，但星际争霸II最优秀的玩家肯定很热衷。在今年早些时候接受麻省理工学院技术评论的采访时，职业星际争霸选手Byun Hyun-Woo对自己的机会相当有信心。”我不认为AI能打败（职业球员），至少在我有生之年是不行的。”。

问题是，人工智能有一种让人类惊讶的方式，比如当DeepMind的AlphaGo AI在与围棋大师李赛多的比赛中做出了评论员认为荒谬的举动（但后来证明这对它的成功至关重要）。

那么，DeepMind的人工智能会给星际争霸玩家带来惊喜吗？Vinyals说这已经发生了，并举例说明了一个特工的任务是用两个单位尽可能快地探索地图的一部分。Vinyals说，通常情况下，人类玩家会选择这些单位，并使用“移动”命令尽快覆盖地面。”但事实证明，你可以使用另一个名为“巡逻”的命令，而不是使用“移动”。与“移动”不同的是，这迫使部队彼此保持距离，“这样他们可以覆盖更多的地图，更快地收集资源。”

这不是一个突破，但它展示了计算机如何通过对熟悉的问题采取新的方法而占上风。”“我觉得这很有趣，”维亚尔斯说我只是不记得——或者可能不知道——这种行为，“很可能会有更多的惊喜出现。

发表于 2021-05-29 09:31
阅读 ( 92 )
分类：互联网

你可能感兴趣的文章

最初的星际争霸现在在pc和mac上是免费的

星际争霸，有史以来最好的实时战略游戏之一，现在完全免费提供。在今年晚些时候重新**的星际争霸发布之前，暴雪将免费赠送这款经典的RTS游戏。所以，别再看这些胡说八道的东西了，去免费修理星际争霸吧！ ...

发布于 2021-03-14 23:52
阅读 ( 151 )

谷歌的deepmind人工智能已经可以做的5件惊人的事情

人工智能革命既可怕又令人兴奋。尽管如此，我们始终感到安全的假设，有某些工作和任务，只有人类可以做。 ...

发布于 2021-03-22 20:45
阅读 ( 208 )

谷歌地图如何使用deepmind的人工智能工具来预测你的到达时间

...中解释的那样，得益于谷歌母公司Alphabet旗下位于伦敦的人工智能实验室DeepMind提供的机器学习工具，它的功能变得更加准确。在这篇博客文章中，谷歌和DeepMind的研究人员解释了他们如何从各种来源获取数据，并将...

发布于 2021-04-17 19:28
阅读 ( 219 )

星际争霸二今年10岁，暴雪正在庆祝游戏的周年更新

星际争霸2已经问世近十年了。为了纪念这款游戏的十周年，暴雪正在公开测试一个周年更新，为星际争霸II的基础游戏和它的三个扩展版中的每一个任务引入新的战役成就，此外还进行了一些改变，使玩家能够创建自己的定制战...

发布于 2021-04-18 15:45
阅读 ( 180 )

动视表示，《命运》将是有史以来最畅销的原创视频游戏

...）也提到了第三款“大型游戏发行版”将来自魔兽世界和星际争霸创造者暴雪。关于这场比赛的具体内容还有待揭晓。

发布于 2021-04-25 07:08
阅读 ( 129 )

暴雪的《风暴英雄》将于6月2日上映

...用了暴雪深厚的传统游戏资源，让玩家使用暗黑破坏神、星际争霸和魔兽中的角色，该公司称之为“团队斗殴者”。这是一款更为平易近人的动作策略游戏，新手可以拿起玩，但也增加了更高级玩家的难度。 扮演魔兽、星际...

发布于 2021-04-29 14:30
阅读 ( 144 )

暴雪的多人射击游戏5月24日发布

...宣布的，这对暴雪来说是个大问题。该公司主要以魔兽、星际争霸和暗黑破坏神三大特许经营权而闻名，而Overwatch则是其近20年来的首个新资产。这个团队型射手最初是作为长期开发的项目Titan开始的，最初被称为魔兽世界的继...

发布于 2021-05-03 18:29
阅读 ( 169 )

微软的新软件把minecraft变成了人工智能的试验场

人工智能打败了围棋这一古老的棋类游戏，但它能掌握地雷工艺吗？微软的研究人员正在向那些想训练人工智能程序的计算机科学家开放这个游戏。 使用游戏来测试人工智能自学一套规则的能力是一种既定的方法...

发布于 2021-05-03 20:28
阅读 ( 113 )

英伟达凭借强大的新芯片在人工智能上下了大赌注

...省理工学院、斯坦福大学、加州大学伯克利分校等机构的人工智能研究人员。在台上，黄奇帆称DGX-1为“机器的一头野兽” “一台机器的野兽” Nvidia为视频游戏行业打造了高性能图形处理芯片。图形处理需要大量的计算...

发布于 2021-05-04 03:24
阅读 ( 140 )

人工智能研究人员准备与末日游戏挑战的死亡之战

...说：“很明显，人类玩的各种电子游戏都比电脑好，比如星际争霸。”在一个不完善的信息世界里，战略游戏需要高水平的战略能力，即所谓的“部分观察”。很明显，围棋的特点是你可以看到棋盘上的所有东西，所以对电脑来...

发布于 2021-05-04 08:09
阅读 ( 154 )

deepmind和暴雪发布了使用星际争霸训练人工智能的新工具

你可能感兴趣的文章

相关推荐