最初电脑认出了我们的脸,现在他们知道我们在做什么

我们还没有设计出完全有感知力的人工智能,但我们正在稳步地教计算机如何看到、阅读和理解我们的世界。上个月,谷歌的工程师们展示了他们的“深度梦想”软件,该软件能够拍摄图像,并通过将图像变成一个由肉体和触角融合而成的噩梦来确定其中的内容。此前,斯坦福大学的科学家进行了一项研究,他们开发了一个类似的名为NeuralTalk的程序,能够分析图像并用极其准确的句子描述它们。...

我们还没有设计出完全有感知力的人工智能,但我们正在稳步地教计算机如何看到、阅读和理解我们的世界。上个月,谷歌的工程师们展示了他们的“深度梦想”软件,该软件能够拍摄图像,并通过将图像变成一个由肉体和触角融合而成的噩梦来确定其中的内容。此前,斯坦福大学的科学家进行了一项研究,他们开发了一个类似的名为NeuralTalk的程序,能够分析图像并用极其准确的句子描述它们。

007Ys3FFgy1gq1z92l1swj30pf0evnh0

该项目和相关研究于去年首次发表,是斯坦福人工智能实验室主任李菲菲和研究生安德烈·卡帕蒂的研究成果。他们的软件能够查看复杂场景的图片,并准确识别正在发生的事情。例如,一张穿黑衬衫的男子弹吉他的照片被选为“穿黑衬衫的男子在弹吉他”,而黑白相间的狗跳过酒吧、穿蓝色潜水衣的男子在冲浪、小女孩在吃蛋糕的照片也用一句话来正确描述。在某些情况下,这是令人不安的准确。


就像谷歌的“深梦”一样,该软件使用神经网络计算出每张图片中的情况,将图片的一部分与已经看到的部分进行比较,并将其描述为人类所能看到的。神经网络被设计成类似人脑,它们的工作方式有点像孩子。一旦他们学会了我们世界的基本知识——窗户通常是这样的,桌子通常是这样的,想吃芝士汉堡的猫也是这样的——然后他们就可以把这种理解应用到其他图片和视频中。

最初电脑认出了我们的脸,现在他们知道我们在做什么

它仍然不完美。一个小心翼翼地拿着一个巨大甜甜圈的成年妇女被贴上了“一个头旁拿着吹风机的小女孩”的标签,而一只好奇的长颈鹿则被错误地贴上了一条狗的标签,从窗户向外看。花园里一对欢快的夫妇拿着生日蛋糕出现在“一个穿绿衬衫的人站在一头大象旁边”的标题下,一棵灌木以大象为主角,奇怪的是,蛋糕代表了这个人。但在大多数情况下,这些描述都是次要的猜测——除了大象的建议之外,该节目还正确地将这对蛋糕情侣识别为“一个站在外面拿着椰子蛋糕的女人,一个男人在一旁看着”

这个软件很容易识别一只跳过酒吧的狗

直到最近,互联网上数量惊人的视觉信息还必须人工标注,才能进行搜索。当Google第一次创建Google地图时,它依靠一个员工团队来挖掘和检查每一个条目,人类的任务是查看世界上捕捉到的每一个数字,以确保它表示的是一个真实的地址。当他们完成了,厌倦了无聊的工作,他们建立了谷歌大脑。谷歌大脑此前花了一个团队数周的时间来完成这项任务,它可以在不到一个小时的时间内转录所有来自法国的街景数据。

“我认为图像和视频中的像素数据是互联网的暗物质,”李去年告诉《****》像Facebook和Google这样的网络巨头,正热衷于对数以百万计的图片和搜索结果进行分类。此前的研究主要集中在单一物体识别上——在2012年谷歌的一项研究中,一台计算机自学识别猫——但计算机科学家表示,这忽略了更大的范围。”华盛顿大学的计算机科学家阿里·法哈迪在接受《****》采访时说:“我们关注的是物体,而忽略了动词。”。

最初电脑认出了我们的脸,现在他们知道我们在做什么

但最近的一些程序把重点放在更复杂的数据串上,试图教计算机图片中发生了什么,而不是简单地告诉计算机照片中发生了什么。斯坦福大学的科学家们的研究使用了一种我们最终可以用来搜索图像存储库的自然语言,这导致了一种简单的假设情况,即谷歌照片等服务可以快速调出“狗在沙发上跳的那张照片”,而不是扫描数万张家庭照片,或者“我在时代广场拍的**”,搜索结果也会从这项技术中受益,有可能让你在YouTube或Google上搜索到你想要的确切场景,而不是简单地找到上传者注意到要正确标注的图片或视频。

神经网络在现实世界中也有潜在的应用。在今年的消费电子展上,英伟达的黄仁勋(Jen-Hsun Huang)宣布了他的公司的Drive-PX,这是一台集成了“深度神经网络计算机视觉”的汽车“超级计算机”。黄仁勋说,使用与其他神经网络相同的学习技术,这项技术将能够在你开车时自动发现危险,提醒你注意行人、路标、,救护车,以及其他它知道的东西。这个神经网络意味着驱动PX不需要为每一种汽车都有参考图像——如果它有四个轮子像汽车,一个格栅像汽车,一个挡风玻璃像汽车,它可能是一辆汽车。更大的车可能是SUV,而顶部有灯的车可能是警车。黄的公司也一直在追求这项技术一段时间,提供了斯坦福团队实际使用的图形处理单元。

最初电脑认出了我们的脸,现在他们知道我们在做什么

随着自动计算图像中发生了什么的技术的快速发展,它的领导者正在将他们的工作提供给所有的代码库,比如GitHub。尤其是谷歌的“深梦”,它的视觉副作用吸引了许多人的想象力,在试图找到自己理解的参考点时,它将图像扭曲成狗和鼻涕虫的形状。但这种机器学习的泛滥也有令人毛骨悚然的一面——如果你的电脑能准确地计算出你的图片中发生了什么,那么当它准确地计算出你是什么样的人时会发生什么呢?

  • 发表于 2021-04-30 19:06
  • 阅读 ( 98 )
  • 分类:互联网

你可能感兴趣的文章

在你的新iphone上使用faceid安全吗?

...器。这意味着即使在完全黑暗的情况下,面部识别码也能认出你。 ...

  • 发布于 2021-03-21 12:40
  • 阅读 ( 256 )

人工智能的问题是:机器在学习东西,但不能理解它们

...智能。我们正在创建可以执行特定、狭义任务的程序。 电脑不能“思考” 每当一家公司说它将推出一个新的“人工智能”功能时,通常意味着该公司正在使用机器学习来构建一个神经网络。“机器学习”是一种让机器“学习...

  • 发布于 2021-04-04 05:25
  • 阅读 ( 147 )

如何在macos上训练照片识别人脸

...它将继续识别人员并将其标记为其名称。 一旦你完成了最初的工作,你就不必再去识别你添加到照片中的人了,除非你添加了一个新的人或者一个人的外貌发生了巨大的变化。 现在,下次你真的需要找一张你最好的朋友或某个...

  • 发布于 2021-04-08 16:59
  • 阅读 ( 148 )

当每个人都戴着谷歌眼镜的时候,你还会是个陌生人吗?

...之类的网站上时,你应该期待其他人会看到它但我是一个电脑和电脑保安的老家伙。所以我很久以前就知道网络是不安全的,“毕竟,对Facebook的隐私恐惧很少能阻止人们放弃它。但玻璃的缓慢推出意味着,就目前而言,我们大...

  • 发布于 2021-04-25 17:04
  • 阅读 ( 203 )

迈克·戴西感觉很好

...折、充满咒骂的独白中说道。
 戴西的节目最初的标题是“是的,所有的女人”,这是指上个月底在加利福尼亚州,厌恶**的艾略特·罗杰(Elliot Rodger)疯狂开枪后,女人们用来讲述自己不平等故事的标签。戴西说...

  • 发布于 2021-04-26 18:51
  • 阅读 ( 133 )

回忆失去的图形卡盒艺术

现代的游戏电脑和组件看起来像是野蛮少年设计的跑车。**商用锋利的边缘、蓝色的灯和红色的赛车条纹来塑造它们,使它们走得更快。结果是巨大的,笨重的大厦坐落在卧室的角落,看起来像2001年的方尖碑,如果它是由一个斯...

  • 发布于 2021-05-01 07:38
  • 阅读 ( 180 )

如何做人:我应该牺牲多少来维持一段感情?

...我的问题的关键。我现在和一个认识五年的男人约会,但我们只约会了四个月。我们第一次见面时曾短暂约会,但事情并不顺利,过去四年的大部分时间里,他都和别人约会。我和某人约会已经有一年半了,我住在华盛顿的时候...

  • 发布于 2021-05-03 08:42
  • 阅读 ( 181 )

神经科学家丽莎·费尔德曼·巴雷特解释了情绪是如何产生的

...到悲伤的情况下的感受。 我们在哪里学习这些概念? 在最初的阶段,父母教我们这些概念。 你不必教孩子有感情。婴儿能感觉到痛苦,他们能感觉到快乐,他们确实能,他们肯定能被唤醒或平静。但是情感的概念——比如坏事...

  • 发布于 2021-05-10 16:00
  • 阅读 ( 325 )

阅读史蒂芬·格雷厄姆·琼斯(stephen graham jones)即将出版的中篇小说中令人毛骨悚然的片段

...看了。 我怎么知道是他从一个房子的长度,这不是我会认出他的脸或他的建设。我四岁的时候他就死了,我自己也差点死于肺炎,迪诺一岁的时候,他和一个姑姑住在一起,这样他就不会得肺炎了,而当时妈妈只上了一个班。...

  • 发布于 2021-05-11 00:52
  • 阅读 ( 155 )

埃琳娜阿纳亚揭示背后的秘密动机和她的神奇女侠恶棍悲惨的历史

...可能很难在帕蒂·詹金斯的超级英雄轰动《神奇女人》中认出她。阿纳亚是西班牙的头条人物,在包括佩德罗·阿尔穆德在内的电影中扮演主角óvar是我生活的皮肤,他们都死了,鬼故事脆弱。她也成为国际明星,在英国的《挥手...

  • 发布于 2021-05-11 14:26
  • 阅读 ( 247 )
甜奶龙橙
甜奶龙橙

0 篇文章

相关推荐