微软新的图像标题人工智能将有助于在word、outlook和其他应用程序中实现易访问性

微软开发了一种新的图像字幕算法,这种算法在某些有限的测试中超过了人类的精确度。该人工智能系统已被用于更新该公司为视障人士开发的助手应用程序Seeing AI,并将很快被整合到其他微软产品中,如Word、Outlook和PowerPoint。在那里,它将用于创建图像的alt文本这样的任务,这对于提高可访问性特别重要。...

微软开发了一种新的图像字幕算法,这种算法在某些有限的测试中超过了人类的精确度。该人工智能系统已被用于更新该公司为视障人士开发的助手应用程序Seeing AI,并将很快被整合到其他微软产品中,如Word、Outlook和PowerPoint。在那里,它将用于创建图像的alt文本这样的任务,这对于提高可访问性特别重要。

007Ys3FFgy1gpmpucd44zj31v818tjw4

微软人工智能团队的软件工程经理Saqib Shaikh在一份新闻声明中说:“理想情况下,每个人都会在文档、网络和社交媒体中为所有图像添加alt文本,因为这使盲人能够访问内容并参与对话。”。“但是,唉,人们没有。所以,有几个应用程序使用图像字幕来填充丢失的alt文本。”

这些应用包括微软自己的Seing AI,该公司于2017年首次发布。视觉人工智能使用计算机视觉来描述世界,就像通过智能**摄像头为视力受损的人所看到的一样。它可以识别家庭物品,阅读和扫描文本,描述场景,甚至识别朋友。它还可以用来描述其他应用程序中的图像,包括电子邮件客户端、社交媒体应用程序和WhatsApp等消息传递应用程序。

微软没有透露“看见AI”的用户数量,但Azure AI公司副总裁埃里克·博伊德(Eric Boyd)告诉《边缘》杂志,该软件是“盲人或低视力人群的领先应用程序之一。”看见AI连续三年被AppleVis评为“最佳应用程序”或“最佳辅助应用程序”,盲人和低视力iOS用户的社区。

微软新的图像字幕算法将显著提高人工智能的视觉性能,因为它不仅能够识别物体,而且能够更精确地描述物体之间的关系。因此,该算法可以查看图片,不仅可以说图片包含哪些项目和对象(例如,“一个人,一把椅子,一个手风琴”),还可以说它们是如何相互作用的(例如,“一个人坐在椅子上演奏手风琴”)。微软表示,该算法的性能是自2015年以来使用的先前图像字幕系统的两倍。

该算法在9月份出版的一篇预印论文中描述,在名为“nocaps”的图像字幕基准上取得了有史以来的最高分数。这是一个业界领先的图像字幕计分板,尽管它有自己的限制。

nocaps基准由166000多个人工生成的字幕组成,描述了从openimages数据集中获取的15100幅图像。这些图片涵盖了一系列场景,从体育到假日快照,再到美食摄影等等。(你可以通过浏览这里的nocaps数据集或查看下面的图库来了解图像和字幕的混合情况。)对算法为这些图片创建与人类图片相匹配的字幕的能力进行了测试。

Grid View

  • 007Ys3FFgy1gpmpuddo5oj306y06yq33
  • 007Ys3FFgy1gpmpue7w7rj306y06yjri
  • 007Ys3FFgy1gpmpuf04f3j306y06yt8w
  • 007Ys3FFgy1gpmpufvatpj306y06y0sv
  • 007Ys3FFgy1gpmpugonm0j306y06ywel
  • 007Ys3FFgy1gpmpuhjtpsj306y06yjrl
  • 007Ys3FFgy1gpmpuicj8oj306y06yjrm

不过,需要注意的是,nocaps基准测试只捕获了图像字幕作为一般任务复杂性的一小部分。尽管微软在一份新闻稿中声称,它的新算法“能像人们一样描述图像”,但这只适用于nocaps中包含的一小部分图像。

作为Harsh Agrawal,基准的创造者之一,阿加瓦尔告诉《电子邮件的边缘》:“在nocaps上超越人类的表现并不意味着图像字幕是一个已解决的问题。”他指出,用于评估nocaps表现的指标“只与人类偏好大致相关”,而基准本身“只涵盖了所有可能的视觉效果的一小部分”“概念。”

阿加瓦尔说:“与大多数基准一样,nocaps基准只是模型在任务中表现的粗略指标。”。“在nocaps上超过人类的表现并不意味着人工智能系统在图像理解上超过人类。”

这个问题——假设在一个特定的基准上的性能可以更普遍地推断为在底层任务上的性能——在夸大人工智能的能力时是一个常见的问题。事实上,微软过去也曾因其算法理解文字的能力而受到研究人员的批评。

尽管如此,由于人工智能,图像字幕是一项近年来有了巨大改进的任务,微软的算法无疑是最先进的。除了集成到Word、Outlook和PowerPoint中,图像字幕AI还将作为一个独立的模型通过微软的云和AI平台Azure提供。

  • 发表于 2021-04-17 14:17
  • 阅读 ( 182 )
  • 分类:互联网

你可能感兴趣的文章

10款免费microsoft应用程序和工具,以提高生产力

...多应用和工具可以帮助您提高生产力,包括待办事项列表应用程序、笔记应用程序和浏览器扩展,以剪切和保存网页。 ...

  • 发布于 2021-03-11 15:38
  • 阅读 ( 339 )

microsoft office 2013:非正式指南

... MicrosoftOffice2013提供了所有常用的组件应用程序,其中大多数都具有诱人的新功能。与以前的Office版本相比,与Windows的兼容性是有限的,尽管这个新版本确实支持平板电脑的触摸屏,并支持access anywhere文档的...

  • 发布于 2021-03-13 21:40
  • 阅读 ( 364 )

如何轻松地用你的声音键入使用微软口授

每个人现在都想说话——或者更确切地说,用人工智能将语音转换成文本,以节省打字的劳动。那么,微软现在在语音到文本的转换方面有了一个潜在的创新尝试,这是不是让人感到意外呢? ...

  • 发布于 2021-03-14 04:49
  • 阅读 ( 263 )

microsoft office中的5个最佳辅助工具

... 要查找标记为“可访问”的模板,请转到任何Office应用程序中的“文件”>“新建”。在屏幕顶部的搜索框中输入Accessible,然后按Enter键查看所有结果。要进一步优化搜索,请使用右侧窗格中的类别列表。您可以选...

  • 发布于 2021-03-15 07:59
  • 阅读 ( 291 )

microsoft office什么?办公套件生态系统指南

...ffice Mobile、Office 2016或Office 365,你就会知道,对于什么是应用程序和程序的复杂和多方面的生态系统来说,这是一个非常简单的观点。 ...

  • 发布于 2021-03-16 15:52
  • 阅读 ( 358 )

应安装20个microsoft office生产力加载项

...消息,打瞌睡电子邮件,安排约会,等等。它甚至有一个人工智能助理,可以帮助你**更好的电子邮件。 ...

  • 发布于 2021-03-24 14:50
  • 阅读 ( 257 )

微软正在对windows10的邮件应用程序进行重大修改

对于一些人来说,windows10邮件应用程序是一个有用的方式来检查你的电子邮件;对于其他人来说,它只是另一个瓷砖坐在开始菜单上。无论你身处哪个阵营,你都会很高兴地知道,微软计划将邮件应用程序转变为“一个Outlook”...

  • 发布于 2021-03-28 11:30
  • 阅读 ( 158 )

微软推出新的移动办公应用导航工具

...,Microsoft“希望您对这些检测的准确性提供反馈”。由于人工智能算**在学习构成标题的内容,因此改进自动功能可能需要时间。 ...

  • 发布于 2021-03-28 14:42
  • 阅读 ( 217 )

什么是microsoft office桌面应用程序?它有什么好处吗?

...在。但这是因为微软没有宣传它的存在吗?还是因为Office应用程序不是很好? ...

  • 发布于 2021-03-29 14:48
  • 阅读 ( 524 )

如何让每个人都能更容易地访问word文档

...及良好的文本/背景对比: 网上有一些颜色对比度检查器应用程序可以很好地让您知道文档中的对比度是否足够。或者,您可以只使用MicrosoftWord的内置辅助功能检查工具。 构建逻辑文档结构 构建一个逻辑文档结构仅仅意味着使...

  • 发布于 2021-03-31 11:01
  • 阅读 ( 204 )
你的小开
你的小开

0 篇文章

相关推荐