facebook正在分发它用来理解照片中物体的软件

Facebook正在公开采购一套计算机视觉软件工具,可以识别照片中物体的种类和形状。这些工具由Facebook人工智能研究(FAIR)团队开发,被称为DeepMask、SharpMask和MultiPathNet,这三种工具协同工作,帮助分解图像的内容并将其上下文化。这些技术虽然目前还没有在Facebook消费类产品中得到积极应用,但与该公司用于向盲人用户描述照片的软件类似,该公司称之为“自动替代...

Facebook正在公开采购一套计算机视觉软件工具,可以识别照片中物体的种类和形状。这些工具由Facebook人工智能研究(FAIR)团队开发,被称为DeepMask、SharpMask和MultiPathNet,这三种工具协同工作,帮助分解图像的内容并将其上下文化。这些技术虽然目前还没有在Facebook消费类产品中得到积极应用,但与该公司用于向盲人用户描述照片的软件类似,该公司称之为“自动替代文本”的功能早在今年4月推出。

007Ys3FFgy1gq9vtk8lmvj31ko11se82

DeepMask和SharpMask是更多的实验性研究项目,专注于FAIR团队所称的细分。虽然人类能在几秒钟内分辨出照片中的各种元素,但这一过程对计算机来说要困难得多,因为计算机将像素视为一系列与颜色变化相对应的数值。要帮助软件理解图像的背景在哪里成为主题,或者前景的哪些部分可以分解成不同的对象,并不容易。让计算机正确识别物体也很困难。

007Ys3FFgy1gq9vtlzsaxj30wx0d0n7q

通过机器学习,一种广泛使用的人工智能训练技术,Facebook能够教算法如何执行传统的人类认知任务,方法是向所谓的神经网络提供大量数据。这些集合基本上是数以百万计的例子,从中这些神经网络可以发展对现实世界物体和环境特征的理解。换言之,向算法展示足够多的绵羊图片,告诉算法它看到的是一只绵羊,然后它就会开始自己识别照片中的动物。

DeepMask用于分割照片中的不同对象

神经网络识别这些物体的过程称为分割,它向计算机询问一系列关于图像的是/否问题,试图对图像内容进行分类。这就是DeepMask的作用,而SharpMask用于优化对象的选择以获得更好的准确性。

“DeepMask对特定的物体类型一无所知,所以虽然它能同时描绘出狗和羊,但却无法区分它们,”FAIR research科学家Piotr Dollar在一篇技术论文中写道。为此,该团队依靠MultiPathNet以及Ross Girshick开发的基础对象识别技术,Ross Girshick曾是微软研究院(Microsoft Research)的成员,现任FAIR Research科学家。MultiPathNet有效地区分对象并对其进行分类。

007Ys3FFgy1gq9vtnrzfmj30ko0fj4i2

FAIR看到了这种类型的图像和对象识别的广泛应用。除了显而易见的用例之外,比如让你搜索图像而不必标记它,这种类型的人工智能对残疾人非常有用。”Dollar写道:“我们的目标是实现更沉浸式的体验,让用户通过手指在图像上滑动,让系统描述他们正在触摸的内容,从而“看到”一张照片。”。

那么Facebook为什么要免费赠送这项技术呢?”“我们将我们的代码开源,并将我们的发现以学术论文的形式发布,这些学术论文可以从开放访问网站免费获得,我们希望鼓励其他人更容易地分享技术和技术,”Facebook发言人对The Verge说我们希望其他人能够与我们合作,改进我们的工具和技术。”

Facebook和谷歌正在竞相开发更智能的人工智能

然而,同样重要的是要记住,这项研究的大部分也是由微软(Microsoft)和谷歌(Google)等公司进行的。后者使用人工智能支持的图像识别技术,当你在谷歌照片中搜索“海滩”时,会将你度假的照片浮出水面,还使用自然语言处理技术,预写电子邮件回复并自动完成搜索请求。谷歌也开放了一些技术,比如TensorFlow人工智能培训软件。因此,Facebook很可能感到了向研究界贡献力量的压力,希望其构建和训练人工智能的方法和工具不会被其他人取代。

展望未来,FAIR希望解决识别视频中发生了什么的挑战,考虑到帧中对象的运动和交互,这是一项更困难的任务。这条以视频为中心的道路对于Facebook来说是一条不需要大脑的道路。首席执行官马克•扎克伯格(markzuckerberg)认为,在虚拟现实(virtualreality)和更强大的人工智能(AI)真正起飞之前,媒体形式将是未来五年社交网络的最大机遇。到目前为止,我们已经看到Facebook在去年将其网站和移动应用程序转变为用户和新闻机构的预录视频和直播视频的首映目的地。下一步是从这些视频中汲取真知灼见,就像Facebook今天处理照片的做法一样。

Dollar解释说:“我们已经在计算机视觉技术上取得了一些进展,可以观看视频,并实时了解和分类视频中的内容,例如,猫或食物。”实时分类可以帮助Facebook上的相关和重要的实时视频浮出水面,而应用更精细的技术来检测时空中的场景、物体和动作,有朝一日可以实现实时叙述。”

  • 发表于 2021-05-07 04:02
  • 阅读 ( 150 )
  • 分类:互联网

你可能感兴趣的文章

照片(photo)和形象(image)的区别

...些细节。图像并不总是照片。这是因为“形象”一词也被用来指一个人的特征或个性,人们期望这个人按照自己的形象行事,这不过是媒体的炒作。例如,一个在电影中扮演严肃角色或角色的演员有一个非常严肃的人的形象,当...

  • 发布于 2020-10-19 14:13
  • 阅读 ( 453 )

数码摄影初学者指南

...。他们会调整设置,以便他们是最佳的特定类型的摄影你正在做。你在这里又失去了控制,但是如果你需要一张快速照片,他们会做这项工作的。 ...

  • 发布于 2021-03-12 14:07
  • 阅读 ( 220 )

如何查看facebook个人资料

在Facebook的早期,用户在网上发布各种各样的个人和私人数据。事后看来,我们都是绿色的,但这并不像是一个隐私问题等待发生。 ...

  • 发布于 2021-03-17 23:07
  • 阅读 ( 239 )

避免在网上和公共场合出现面部识别的4种方法

... 像Facebook这样的社交媒体网站有面部识别算法,可以分析上传到网站上的照片,为谁应该在照片上加标签提出建议。当有人在照片中标记你时,他们正在训练算法,以便更准...

  • 发布于 2021-03-20 12:44
  • 阅读 ( 226 )

你的浏览器正在收集的关于你的10种类型的数据

...一旦启动浏览器,扩展就会开始抓取数据。他们的目标是Facebook帖子、赞助商帖子、tweets、YouTube视频和你曾经互动过的广告。Meshkov在他的博客文章中说,这些扩展甚至试图解析你的Facebook购买历史。 ...

  • 发布于 2021-03-23 09:23
  • 阅读 ( 226 )

copyleft与版权:你需要知道的3个关键概念

...、修改和传播。如果有人以违背创作者允许的方式使用或分发原创作品(“侵权”),创作者有权寻求法律诉讼。 ...

  • 发布于 2021-03-25 19:16
  • 阅读 ( 236 )

人工智能的问题是:机器在学习东西,但不能理解它们

...自动更正功能,我们并不是在创造通用的人工智能。我们正在创建可以执行特定、狭义任务的程序。 电脑不能“思考” 每当一家公司说它将推出一个新的“人工智能”功能时,通常意味着该公司正在使用机器学习来构建一个...

  • 发布于 2021-04-04 05:25
  • 阅读 ( 145 )

微软向警方提供photodna匹配软件,帮助查找儿童色情制品

...。PhotoDNA已经被微软自己的网络服务用来捕捉儿童色情,Facebook去年也许可了该软件。警方可能会用它来扫描公众的照片集或快速浏览证据。 光电纳是与国家失踪和受剥削儿童中心合作开发的,它根据现有的包含儿童...

  • 发布于 2021-04-21 16:54
  • 阅读 ( 154 )

facebook正在开放一些人工智能研究成果供公众使用

...人工智能研究已经成为一种技术军备竞赛,谷歌、微软和Facebook都各自运营着昂贵的尖端实验室。但今天,Facebook的人工智能研究实验室(简称FAIR)正在发布优化某种机器学习软件的新代码。根据Facebook的研究,新的程序可以将...

  • 发布于 2021-04-28 16:45
  • 阅读 ( 103 )

这家初创公司正在弥合当今网络和未来虚拟现实之间的鸿沟

...不是唯一一家使用Sketchfab技术将3D技术带给大众的公司。Facebook正在为自己的虚拟现实平台奠定基础,两个月前与Sketchfab整合,直到今天,这一合作关系还没有公开。这都是向增强和虚拟现实推进的一部分,Digi Capital预计到2020年...

  • 发布于 2021-04-30 09:57
  • 阅读 ( 134 )
i76839275
i76839275

0 篇文章

相关推荐