亞歷克莎總是在聽,但不是一直在錄音。它不會向雲伺服器傳送任何東西,直到它聽到你說喚醒詞(Alexa、Echo或Computer)。但聽叫醒詞比你想象的要難。
Echo硬體並不是那麼智慧。如果沒有網際網路,你提出的任何要求或問題都會失敗。這是因為您的命令被髮送到雲端進行解釋和決策。亞馬遜不希望你在智慧音箱前的每一次對話都被錄製下來,而是希望你給智慧音箱的命令被錄製下來。出於這個原因,公司使用了一個叫醒詞來吸引聰明的演講者的注意。為了做到這一點,亞馬遜使用了微調麥克風、短記憶緩衝區和神經網路訓練的組合。
語音助理揚聲器(如Echo和Echo Dot)通常有多個內建麥克風。例如,回聲點有七個。這種陣列使這些裝置具有多種能力,從聽到遠處發出的命令,到將背景噪音與聲音分離。
後者特別有助於喚醒詞的檢測。使用它的多個麥克風,回聲可以精確定位你的位置相對於它坐在那裡,聽這個方向,而忽略了房間的其餘部分。
每當你使用wake這個詞的時候,你就會看到它在起作用。站在回聲或回聲點的旁邊,說出喚醒詞。請注意,戒指亮起時是深藍色,然後是淺藍色,因為它的圓圈和“指向”你。現在,移動幾步到一邊,並再次說出喚醒詞。注意,淺藍色的燈光跟著你。
知道你在哪裡,有助於裝置更好地關注你,並排除來自其他地方的噪音。
迴音裝置有大量的儲存空間,但它們使用的空間並不多。亞馬遜公司副總裁、Alexa人工智慧公司首席科學家羅希特·普**德(Rohit Prasad)表示,回聲只能物理儲存幾秒鐘的音訊。
透過減少它的功能,亞馬遜不僅給你更多的隱私(它是一個少一個地方你的聲音儲存),而且防止回聲聽整個對話,限制其重點是尋找喚醒詞。
想象一下你有一盒三秒鐘的錄音帶和一臺錄音機。假設磁帶到達結尾後,會一次又一次地回到開頭。如果你開始錄一段對話,你四秒鐘前說的每句話都會被抹去,並立即錄下來。亞馬遜Echo就是這麼做的。
它不停地記錄,但會同時擦除剛剛記錄的所有內容。這種短暫的注意力跨度意味著它只能聽到“Alexa”這個詞,而不是更多。不過,三秒鐘的時間足以讓這個詞被恰當地記錄、檢查和處理。
最後,Amazon依靠神經網路訓練來教Echo如何進行模式匹配。與其他形式的機器學習非常相似,亞馬遜透過一個接一個地輸入單詞Alexa(或Computer,或Echo,取決於公司正在訓練哪個wake單詞)來訓練演算法。
相關:什麼是演算法,為什麼它們讓人不舒服?
這樣做的目的是覆蓋每一個詞形變化和口音,但也包括上下文。亞馬遜希望你的回聲在你和它說話的時候,在你談論它的時候,或者,也許,在你和一個叫Alexa的人說話的時候,能夠識別出區別。定向麥克風也有助於實現這一目標。
回聲聽到的每一個字,都會透過層層的演算法來傳遞音訊。每一層都被設計用來排除誤報,尋找聲音或上下文線索。如果一個層檢查透過,單詞將轉到下一層。最後,當本地裝置確定它確實聽到了wake這個詞時,它開始錄製音訊並將其傳送到亞馬遜的雲伺服器。亞馬遜採用了四種演算法:一種是針對每個喚醒詞(Alexa、Computer、Echo),另一種是針對Alexa Guard,Alexa Guard將玻璃破碎等特定聲音處理為喚醒詞。
但即使出現匹配,亞馬遜仍會執行更復雜的檢查。你有沒有注意到,當有人在電視節目或廣告中說Alexa這個詞時,通常不會引起你的迴音?這是因為亞馬遜也做雲端計算。
當公司**以Alexa為主角的商業廣告時,他們可以將音訊提交給亞馬遜。該公司透過類似的模式匹配演算法來識別喚醒詞來執行音訊。一旦該例項被完全編目,它就會被新增到資料庫中。
作為接觸雲的過程的一部分,Echo包含了它聽到的喚醒詞的資訊,並檢查資料庫。每當找到匹配項時,Amazon就會指示Echo忽略wake單詞,關閉並丟棄任何錄製的音訊。
此外,Amazon還會檢查同時說出的wake單詞的例項。並非每家公司都向亞馬遜提交音訊,因此該公司提出了一種新穎的備份解決方案。在檢查資料庫匹配後,該公司將wake word imprint與同時出現的任何其他例項進行比較。兩個同時說Alexa的人聽起來不太可能一模一樣,所以如果有匹配的話,Amazon知道這很可能是一個商業或電視節目,並忽略了這個請求。
儘管進行了所有檢查,但仍會出現誤報。你可以聽聽你的回聲在亞馬遜的隱私中心錄下了什麼,你可能會發現其中至少有一個假陽性。但這項技術正在不斷改進,最終,亞馬遜希望它能在沒有任何喚醒詞的情況下正常工作。
... “Alexa,讓AnyPod來彈我是怎麼造的。” “Alexa,叫AnyPod快進2分鐘。” “Alexa,讓AnyPod倒帶30秒。” “Alexa,讓AnyPod在12分25秒開始比賽。” ...
... 你曾經在安卓**上使用過谷歌助手嗎?如果是,你怎麼看?你覺得它比Siri更有用嗎?或者你更喜歡Cortana還是Alexa?你現在會在你的iPhone上安裝Google助手嗎?請在下面的評論中告訴我們! ...
... 那麼Gentoo是怎麼得名的呢?原來,企鵝中的真人是遊得最快的。考慮到Linux的吉祥物是Tux,這個名字告訴你Gentoo的開發者是如何看待競爭的。 ...
...將有豐富的內容去探索。首先要做的是“看看你在2019年是怎麼聽的”。這將“揭示你的頂級藝術家,歌曲和流派的一年和更多”。所有這些都以令人愉悅的視聽幻燈片形式呈現。 ...
... 由於靠近墨西哥,美國講西班牙語的人很多。然而,Google Home在2018年學會了說西班牙語,亞馬遜花了更長時間教Alexa如何說西班牙語。但現在終於發生了。 ...
... 什麼是alexa guard是怎麼工作的(alexa guard and how does it work)? ...
在美國講西班牙語的人很快就能用他們的母語與亞馬遜Alexa進行互動。也是時候了。美國講西班牙語的人很多,然而亞馬遜卻花時間教亞歷克斯說西班牙語。 ...