mozilla正在眾包語音識別,讓人工智慧為人們服務

資料對於構建偉大的人工智慧至關重要,以至於該領域的研究人員將其與工業革命時期的煤炭進行了比較。那些擁有它的人會向前沖。不這樣做的人會被扔在塵土裡。在當前的人工智慧熱潮中,誰擁有它是顯而易見的:像谷歌、Facebook和百度這樣的科技巨頭。...

資料對於構建偉大的人工智慧至關重要,以至於該領域的研究人員將其與工業革命時期的煤炭進行了比較。那些擁有它的人會向前沖。不這樣做的人會被扔在塵土裡。在當前的人工智慧熱潮中,誰擁有它是顯而易見的:像谷歌、Facebook和百度這樣的科技巨頭。

007Ys3FFgy1gqytwamsf8j61b60pumyg02

這是個令人擔憂的訊息。畢竟,這些公司中有許多在搜尋和社交媒體等領域近乎壟斷。他們的位置幫助他們收集資料,這有助於他們建立更好的人工智慧,這有助於他們保持領先於競爭對手。對於企業本身來說,這是一個良性迴圈,但如果沒有可行的競爭,企業可以——而且確實可以——濫用自己的主導地位。

現在,來自Mozilla(Firefox瀏覽器的非盈利創造者)的一個新專案正在試驗一種替代資料壟斷的方法,要求使用者彙集資訊,以推動開源人工智慧計劃。該公司的第一個專案叫做Common Voice,Mozilla要求志願者捐贈聲音樣本,以構建一個開源的語音識別系統,就像Siri和Alexa的語音識別系統一樣。

Mozilla負責新興技術的副總裁肖恩·懷特(Sean White)告訴《邊緣報》(the Verge),“目前,控制語音識別的能力可能只需要幾隻手就能實現,我們不想看到這一點。”。他說,為了獲得資料,大公司“可以過濾所有進入的東西”,但對於其他公司來說,需要其他方法對我們來說,一個有趣的問題是,我們能這樣做嗎?這樣建立資料的人也能從中受益。

目前,Mozilla只是在收集資料,但計劃在年底前推出開源語音識別(它會進入火狐瀏覽器嗎?懷特不願透露,但補充說:“我們已經計劃了一些實驗(為此)”。目前,任何人都可以去公共語音網站,透過朗讀例句“捐贈”自己的語音。他們還可以提供諸如年齡、地點、性別和口音等傳記資訊。懷特說,這些資訊將有助於Mozilla在建立語音識別系統時避免偏見,並確保這項技術能夠處理口音——這是谷歌和蘋果仍在努力解決的問題。

007Ys3FFgy1gqytwbrnpkj60gq0d0gm702

隱私國際的研究員弗雷德裡克·卡圖納(Frederike Kaltheuner)說,這些公司經常把人工智慧作為蒐集有價值個人資料的“藉口”,告訴使用者人工智慧將使他們能夠改進某些服務。她說,這可能是真的,但分享這些資料對整個社會的影響還不太清楚。”作為一個公民,你所需要的東西和符合公司利益的東西之間存在根本的利益衝突。

那麼,像Common Voice這樣的計劃是如何吸引使用者遠離現有的——公認的便利服務的呢?畢竟,開源專案比網際網路存在的時間更長,但除了少數例外,它們無法與商業產品競爭。他們根本不提供類似的服務。

對於Mozilla來說,答案就是個性化。畢竟,雖然人工智慧系統在人口規模的資料集上訓練後,對普通人來說已經足夠好了,但當涉及到服務於較小群體或資料中沒有代表的群體時,它們往往會失敗(通常情況下,資料只是偏向於白人**,這是行業預設的。)

懷特說:“對於我們來說,要想在資料共享上取得成功,除了有一天意識到他們已經洩露了所有的個人資料之外,(使用者)還必須有一個動機。”我們必須讓他們的體驗更好,因為他們參與其中。“在普通語音的情況下,懷特需要盡可能多的口音資料來提高這些人的語音識別能力。”我們希望這個系統能更好地為您服務,因為其中包括了您的一些資料。

提供個性化的資料交換是一個很好的建議,但對於那些反對資料壟斷的人來說,這並不是一個銀彈。首先,大公司可以向用戶提供類似的服務Alexa不明白你的意思?閱讀這個10分鐘的指令碼,我們將改進它的語音識別。”)或者他們可以花錢填補自己資料集的空白。例如,谷歌(Google)讓第三方公司向帶有口音的redditor付費,讓他們錄製自己的語音樣本。

007Ys3FFgy1gqytwds830j615o0rsjyq02

懷特承認,公共語音專案並不能回答很多這樣的問題,但他表示,Mozilla仍然致力於開放資料的核心事業。”這感覺像是一個真正的民主化活動,”他說。有很多組織都有這種精神。有一個機器學習社群Kaggle,它有大量使用者貢獻的資料集供人工智慧科學家使用;elonmusk資助OpenAI,OpenAI的所有工作都是開源的;以及Healthcare.ai,它釋出免費的醫療演算法。他們中的一些人在銷售自己的商業產品(如自動駕駛汽車初創公司Comma.AI)的同時,設法共享開源資料和研究成果。

儘管我們每天與之互動的人工智慧系統都是建立在專有資料的基礎上的,但是有很多研究人員和機構釋出了一些有用的、甚至是最基本的、開源的替代方案。

不過,為了讓這些專案更上一層樓,開源資料的支持者可能已經爭取到了更高的權力來與科技巨頭較量。深度學習公司Skymind的執行長克裡斯•尼克爾森(Chris Nicholson)表示,“我們可能需要第三方介入——非**組織、**、小型私營企業聯盟——並彙集他們的資料。”尼克爾森建議,共享醫療保健資料可以改善醫療成像技術,而駕駛員資料可以讓自動駕駛汽車在路上更自然、更直觀。他說,共享這些型別的資料集“具有明顯的公共利益”

那麼,獻出你的聲音,也許只是個開始。

  • 發表於 2021-05-29 05:04
  • 閱讀 ( 22 )
  • 分類:網際網路

你可能感興趣的文章

bixby voice能做的5件事(還有一件事它做不到)

... 隨著這一生態系統的啟動和準備,三星正在使Bixby成為其智慧家居產品的核心。該公司有一個優勢,因為它的許多智慧家電產品都是在發展中市場推出的,而在這些市場上,googlehome和amazoneecho等產品是不可用的...

  • 發佈於 2021-03-13 03:17
  • 閲讀 ( 46 )

如何輕鬆地用你的聲音鍵入使用微軟口授

每個人現在都想說話——或者更確切地說,用人工智慧將語音轉換成文字,以節省打字的勞動。那麼,微軟現在在語音到文字的轉換方面有了一個潛在的創新嘗試,這是不是讓人感到意外呢? ...

  • 發佈於 2021-03-14 04:49
  • 閲讀 ( 45 )

機器人如何學習閱讀和思考

... 計算語言學的一個領域,稱為自然語言處理(NLP),正在研究這個特別棘手的問題。現在這是一個令人著迷的領域,一旦你對它的工作原理有了一個概念,你就會開始看到它的影響無處不在。 ...

  • 發佈於 2021-03-16 12:24
  • 閲讀 ( 46 )

驗證碼是如何工作的,為什麼這麼難?

您正在嘗試購買商品或登入帳戶。你輸入你的**,但在你繼續之前,你需要證明你是一個人。勾選標有“我不是機器人”的方框。你可以看到一個模糊的影象,你需要破譯歪斜的數字。這些是CAPTCHA,雖然它們可能會令人討厭,但...

  • 發佈於 2021-03-18 09:56
  • 閲讀 ( 51 )

如何使用googletensorflow和raspberry-pi構建diy人工智慧專案

... 谷歌收集了一個超過65000個眾包單詞的資料集。這個開源的資料集訓練神經網路去理解一些單詞。 ...

  • 發佈於 2021-03-23 18:25
  • 閲讀 ( 48 )

voiceitt為家庭助理帶來了以可訪問性為中心的語音識別

以色列Voiceitt公司正在釋出一款應用程式,為患有語言障礙的人提供智慧家庭語音互動的便利。 ...

  • 發佈於 2021-03-29 05:10
  • 閲讀 ( 48 )

銀行利用人工智慧和機器學習更好地為您服務的8種方法

... 投資:憑藉處理海量資料的能力,人工智慧也正在改變投資銀行業。系統可以跟上行業的變化,並隨著時間的推移做出更好的預測。投資者甚至可以在早上的通勤時間進行語音啟用交易。 ...

  • 發佈於 2021-03-29 19:27
  • 閲讀 ( 41 )

人工智慧的問題是:機器在學習東西,但不能理解它們

...自動更正功能,我們並不是在創造通用的人工智慧。我們正在建立可以執行特定、狹義任務的程式。 電腦不能“思考” 每當一家公司說它將推出一個新的“人工智慧”功能時,通常意味著該公司正在使用機器學習來構建一個...

  • 發佈於 2021-04-04 05:25
  • 閲讀 ( 48 )

微軟以197億美元收購人工智慧語音技術公司nuance

...它出現的時候,由於人工智慧的深度學習熱潮,語音技術正在迅速提高,同時也有更多的機會使用它。 從醫學諮詢到董事會會議和大學講座,數字轉錄在各種場合變得更加可靠。遠端工作的上升也創造了新的機會。有這麼多的...

  • 發佈於 2021-04-15 21:36
  • 閲讀 ( 52 )

谷歌搜尋正在獲得新的人工智慧工具來破譯你糟糕的拼寫

谷歌在其“搜尋”活動中詳細介紹了一系列新的改進,這些改進將在未來幾周和幾個月內對其基礎谷歌搜尋服務進行改進。這些變化主要集中在使用新的人工智慧和機器學習技術,為使用者提供更好的搜尋結果。其中最主要的是...

  • 發佈於 2021-04-17 15:01
  • 閲讀 ( 38 )
pn56672
pn56672

0 篇文章

作家榜

  1. admin 0 文章
  2. 孫小欽 0 文章
  3. JVhby0 0 文章
  4. fvpvzrr 0 文章
  5. 0sus8kksc 0 文章
  6. zsfn1903 0 文章
  7. w91395898 0 文章
  8. SuperQueen123 0 文章

相關推薦