微軟新的影象標題人工智慧將有助於在word、outlook和其他應用程式中實現易訪問性

微軟開發了一種新的影象字幕演算法,這種演算法在某些有限的測試中超過了人類的精確度。該人工智慧系統已被用於更新該公司為視障人士開發的助手應用程式Seeing AI,並將很快被整合到其他微軟產品中,如Word、Outlook和PowerPoint。在那裡,它將用於建立影象的alt文字這樣的任務,這對於提高可訪問性特別重要。...

微軟開發了一種新的影象字幕演算法,這種演算法在某些有限的測試中超過了人類的精確度。該人工智慧系統已被用於更新該公司為視障人士開發的助手應用程式Seeing AI,並將很快被整合到其他微軟產品中,如Word、Outlook和PowerPoint。在那裡,它將用於建立影象的alt文字這樣的任務,這對於提高可訪問性特別重要。

007Ys3FFgy1gpmpucd44zj31v818tjw4

微軟人工智慧團隊的軟體工程經理Saqib Shaikh在一份新聞宣告中說:“理想情況下,每個人都會在文件、網路和社交媒體中為所有影象新增alt文字,因為這使盲人能夠訪問內容並參與對話。”。“但是,唉,人們沒有。所以,有幾個應用程式使用影象字幕來填充丟失的alt文字。”

這些應用包括微軟自己的Seing AI,該公司於2017年首次釋出。視覺人工智慧使用計算機視覺來描述世界,就像透過智慧**攝像頭為視力受損的人所看到的一樣。它可以識別家庭物品,閱讀和掃描文字,描述場景,甚至識別朋友。它還可以用來描述其他應用程式中的影象,包括電子郵件客戶端、社交媒體應用程式和WhatsApp等訊息傳遞應用程式。

微軟沒有透露“看見AI”的使用者數量,但Azure AI公司副總裁埃裡克·博伊德(Eric Boyd)告訴《邊緣》雜誌,該軟體是“盲人或低視力人群的領先應用程式之一。”看見AI連續三年被AppleVis評為“最佳應用程式”或“最佳輔助應用程式”,盲人和低視力iOS使用者的社群。

微軟新的影象字幕演算法將顯著提高人工智慧的視覺效能,因為它不僅能夠識別物體,而且能夠更精確地描述物體之間的關係。因此,該演算法可以檢視圖片,不僅可以說圖片包含哪些專案和物件(例如,“一個人,一把椅子,一個手風琴”),還可以說它們是如何相互作用的(例如,“一個人坐在椅子上演奏手風琴”)。微軟表示,該演算法的效能是自2015年以來使用的先前影象字幕系統的兩倍。

該演算法在9月份出版的一篇預印論文中描述,在名為“nocaps”的影象字幕基準上取得了有史以來的最高分數。這是一個業界領先的影象字幕計分板,儘管它有自己的限制。

nocaps基準由166000多個人工生成的字幕組成,描述了從openimages資料集中獲取的15100幅影象。這些圖片涵蓋了一系列場景,從體育到假日快照,再到美食攝影等等。(你可以透過瀏覽這裡的nocaps資料集或檢視下面的相簿來了解影象和字幕的混合情況。)對演算法為這些圖片建立與人類圖片相匹配的字幕的能力進行了測試。

Grid View

  • 007Ys3FFgy1gpmpuddo5oj306y06yq33
  • 007Ys3FFgy1gpmpue7w7rj306y06yjri
  • 007Ys3FFgy1gpmpuf04f3j306y06yt8w
  • 007Ys3FFgy1gpmpufvatpj306y06y0sv
  • 007Ys3FFgy1gpmpugonm0j306y06ywel
  • 007Ys3FFgy1gpmpuhjtpsj306y06yjrl
  • 007Ys3FFgy1gpmpuicj8oj306y06yjrm

不過,需要注意的是,nocaps基準測試只捕獲了影象字幕作為一般任務複雜性的一小部分。儘管微軟在一份新聞稿中聲稱,它的新演算法“能像人們一樣描述影象”,但這隻適用於nocaps中包含的一小部分影象。

作為Harsh Agrawal,基準的創造者之一,阿加瓦爾告訴《電子郵件的邊緣》:“在nocaps上超越人類的表現並不意味著影象字幕是一個已解決的問題。”他指出,用於評估nocaps表現的指標“只與人類偏好大致相關”,而基準本身“只涵蓋了所有可能的視覺效果的一小部分”“概念。”

阿加瓦爾說:“與大多數基準一樣,nocaps基準只是模型在任務中表現的粗略指標。”。“在nocaps上超過人類的表現並不意味著人工智慧系統在影象理解上超過人類。”

這個問題——假設在一個特定的基準上的效能可以更普遍地推斷為在底層任務上的效能——在誇大人工智慧的能力時是一個常見的問題。事實上,微軟過去也曾因其演算法理解文字的能力而受到研究人員的批評。

儘管如此,由於人工智慧,影象字幕是一項近年來有了巨大改進的任務,微軟的演算法無疑是最先進的。除了整合到Word、Outlook和PowerPoint中,影象字幕AI還將作為一個獨立的模型透過微軟的雲和AI平臺Azure提供。

  • 發表於 2021-04-17 14:17
  • 閱讀 ( 40 )
  • 分類:網際網路

你可能感興趣的文章

microsoft office 2013:非正式指南

... PowerPoint 2013:簡報的新維度 Microsoft Outlook:重新設計 祕密武器:OneNote Office 2013和OneDrive Microsoft Office的其餘部分 Microsoft Office 2013:是否升級? ...

  • 發佈於 2021-03-13 21:40
  • 閲讀 ( 77 )

如何輕鬆地用你的聲音鍵入使用微軟口授

...個實驗性的新應用,它將語音口述應用到了Windows版本的Outlook、Word和PowerPoint中。只需下載light 2 MB外接程式,Ribbon即可開始使用。 ...

  • 發佈於 2021-03-14 04:49
  • 閲讀 ( 44 )

6款人工智慧應用,助你實現目標

...工作請求並確定其優先順序。這個web應用程式透過Slack和微軟團隊平臺工作。 ...

  • 發佈於 2021-03-14 14:19
  • 閲讀 ( 59 )

microsoft office中的5個最佳輔助工具

... 5outlook中的新郵件提示 ...

  • 發佈於 2021-03-15 07:59
  • 閲讀 ( 44 )

5個谷歌新聞替代品,將改變你閱讀新聞的方式

... 微軟新聞(安卓,ios):人工智慧+人類策展 ...

  • 發佈於 2021-03-24 11:01
  • 閲讀 ( 43 )

微軟在android和ios上推出新聞應用

...,微軟Edge瀏覽器中的新聞,適用於Windows 10、Skype、Xbox和Outlook.com,以及針對Android和iOS的新的微軟新聞應用程式。全世界有近5億人。 ...

  • 發佈於 2021-03-24 12:34
  • 閲讀 ( 52 )

應安裝20個microsoft office生產力載入項

... 它面向Outlook使用者。你可以為將來安排電子郵件,跟進訊息,打瞌睡電子郵件,安排約會,等等。它甚至有一個人工智慧助理,可以幫助你**更好的電子郵件。 ...

  • 發佈於 2021-03-24 14:50
  • 閲讀 ( 47 )

microsoft 365移動應用程式集,用於以人工智慧為中心的生產力升級

... 這些更新將為Outlook、Teams、Microsoft Lens和Office mobile應用程式新增新的人工智慧和自然語言功能,並將很快在Android和iOS裝置上提供。 ...

  • 發佈於 2021-03-27 01:12
  • 閲讀 ( 45 )

微軟推出新的移動辦公應用導航工具

針對Android和iOS的微軟Office應用程式將接受一個新的導航系統,使它們在風格上更接近Office桌面應用程式。這一更新將使移動辦公使用者更容易編寫和編輯文件。 ...

  • 發佈於 2021-03-28 14:42
  • 閲讀 ( 47 )

微軟團隊現在支援彈出應用

...地引入團隊的跡象。例如,在2021年3月,您將能夠將來自Outlook的電子郵件整合到團隊中,以便人們可以討論其內容。 ...

  • 發佈於 2021-03-29 00:49
  • 閲讀 ( 43 )
你的小開
你的小開

0 篇文章

作家榜

  1. admin 0 文章
  2. 孫小欽 0 文章
  3. JVhby0 0 文章
  4. fvpvzrr 0 文章
  5. 0sus8kksc 0 文章
  6. zsfn1903 0 文章
  7. w91395898 0 文章
  8. SuperQueen123 0 文章

相關推薦