一款玩ai的电子游戏以一种前所未有的方式击败了q*bert

人工智能研究和电子游戏是天作之合。研究人员获得了一个现成的虚拟环境,具有他们可以完全控制的预定义目标,AI代理可以在不造成任何损害的情况下到处玩耍。但有时,他们确实会破坏东西。...

人工智能研究和电子游戏是天作之合。研究人员获得了一个现成的虚拟环境,具有他们可以完全控制的预定义目标,AI代理可以在不造成任何损害的情况下到处玩耍。但有时,他们确实会破坏东西。

一个例子是本周由德国佛雷堡大学的三位机器学习研究者发表的一篇论文。当他们发现一些奇怪的东西时,他们正在探索一种特殊的方法来教AI代理导航视频游戏(在本例中,是20世纪80年代旧Atari游戏的桌面端口)。他们正在测试的软件在复古视频游戏Q*bert的端口中发现了一个漏洞,使得它可以在无限点附近上架。

正如这三人在预打印服务器arXiv上发表的论文中所描述的那样,代理在学习如何玩Q*bert时发现了一个“有趣的解决方案”。通常,在Q*bert中,玩家从一个立方体跳到另一个立方体,这个动作会改变平台的颜色。更改所有颜色(并派遣一些敌人),您将获得积分并进入下一关。不过,人工智能找到了更好的方法:

First, it completes the first level and then starts to jump from platform to platform in what seems to be a random manner. For a reason unknown to us, the game does not advance to the second round but the platforms start to blink and the agent quickly gains a huge amount of points (close to 1 million for our episode time limit).

人工智能研究员迈尔斯·布伦达奇(Miles Brundage)在推特上分享了论文中的这一怪癖。《连线》记者汤姆·西蒙尼特(Tom Simonite)也加入了对话,并加入了Q*bert设计师沃伦·戴维斯(Warren Davis)的行列,看看他以前是否偶然发现过这个bug。戴维斯说,他没有参与过这个游戏的特定版本,但他评论道:“这看起来肯定不对,但我认为你不会在街机版本中看到同样的行为。”

当多维数据集开始闪烁时,您可以在下面看到错误的样子:

不管是什么情况,这似乎不是人类以前发现的一种利用。如果人工智能代理能够思考的话,它可能会想,当它找到了一种更有效的得分方式时,为什么还要费心在所有这些盒子上跳跃呢。

但是,需要注意的是,代理并不像人类那样处理这个问题。它并没有在游戏中积极寻找类似于计算机视觉的黑客攻击。这篇论文实际上是对一类被称为“进化算法”的广泛人工智能研究的测试。这听起来很像,涉及到将算法相互比较,看看哪一种算法能最好地完成给定的任务,然后给幸存者添加一些小的调整(或突变),看看他们是否能过得更好。这样,算法慢慢变得越来越好。

目前,它不是最强大或使用最广泛的人工智能形式,但它正在卷土重来。破解Q*bert的能力可以被解读为进化算法在未来将非常有用的一个好兆头。

  • 发表于 2021-08-23 02:27
  • 阅读 ( 52 )
  • 分类:互联网

你可能感兴趣的文章

2019年德国柏林国际电子消费品展览会:lg的未来愿景就在这里

... 你能想象在65英寸或更大的显示器上玩电子游戏或看电影,然后按下一个按钮,它就藏在一件家具里吗? ...

  • 发布于 2021-03-19 13:05
  • 阅读 ( 183 )

谷歌的deepmind人工智能已经可以做的5件惊人的事情

... 该算法使用生成性对抗网络(GAN),这是一种人工智能算法,已经存在了一段时间。但让DeepMind AI的图像生成与众不同的是它对技术的改进和优化程度。就用于评估生成图像的质量指标而言,由DeepMind的人工智能...

  • 发布于 2021-03-22 20:45
  • 阅读 ( 207 )

人工智能将如何对抗现代黑客和网络犯罪

... 很高兴看到人工智能以一种可以打击网络犯罪的方式发展,但也许最好的方法是从我们自己开始。尽管人工智能协助的网络犯罪带来的威胁令人恐惧,但更可怕的是,正如2014年IBM的一项研究...

  • 发布于 2021-03-22 21:40
  • 阅读 ( 182 )

现在在playstation上玩的最好的游戏

... 观看和参加极限运动都很有趣。但它们在电子游戏中也很酷。陡坡是极限运动游戏的一个很好的例子,玩家可以像滑雪者、滑雪板运动员、滑翔伞运动员或翼装飞行者一样探索广阔的世界山脉。 ...

  • 发布于 2021-03-30 12:45
  • 阅读 ( 250 )

本周在极客历史上:linux创造者的诞生,调频收音机出现,q*bert发布

...**的曾祖父。早在1982年,Q*Bert就以简单但令人上瘾的游戏方式登上了街机的舞台。你把香肠鼻子的主人公从一个正方形跳到另一个正方形,试图把许多立方体中的每一个都换成相同的颜色,同时避开主人公(蛇和小精灵等等)。...

  • 发布于 2021-04-13 02:56
  • 阅读 ( 162 )

timnit gebru的论文或许可以解释谷歌为什么要开除她

...:“我们,以下签名者,声援蒂姆尼特·格布鲁博士,在前所未有的研究审查之后,她被解除了谷歌员工研究科学家和道德人工智能(AI)团队联合领导的职务。”。 “我们呼吁谷歌研究加强其对研究诚信的承诺,并明确承诺支...

  • 发布于 2021-04-17 00:43
  • 阅读 ( 144 )

twitter透露,它自己的员工工具促成了前所未有的黑客攻击

...响的账户,并删除了攻击者发布的tweet”。Twitter还采取了前所未有的步骤,禁用了已验证账户发送新tweet的能力。 “这是破坏性的,但却是降低风险的重要一步。大多数功能已经恢复,但我们可能会采取进一步的行动,并将更新...

  • 发布于 2021-04-18 13:55
  • 阅读 ( 171 )

noct是一款恐怖游戏,音乐和怪物一样恐怖

... 
 
 当设计师克里斯·埃斯金斯(chriseskins)试图**一款僵尸游戏与他的朋友们一起玩时,这款游戏开始了它的生命。他偶然想到了使用热成像相机作为视点的想法,这有助于为整个体验定下基调。”最终的结果是这种孤独...

  • 发布于 2021-05-01 19:59
  • 阅读 ( 183 )

人工智能胜利的时间表,1997-3041

...师,但由于5000年前围棋游戏的极端复杂性质,这是一次前所未有的混乱,专家们曾预测,再过10年也不会发生这种情况。
 So what does this mean for us, and more dramatically, the rest of humanity? Is it time to welcome our new robot overlord...

  • 发布于 2021-05-03 19:45
  • 阅读 ( 89 )

谷歌的alphago ai再次击败lee se dol,以4比1赢得围棋系列赛

...搏,深入加时赛。AlphaGo是谷歌旗下英国公司DeepMind开发的一款人工智能,上周六,它已经取得了历史性的胜利,成为有史以来第一个击败顶级围棋玩家的电脑程序。
 据DeepMind创始人德米斯·哈萨比斯(Demis Hassabis)...

  • 发布于 2021-05-03 19:57
  • 阅读 ( 151 )
fket174594
fket174594

0 篇文章

相关推荐