什麼是機器學習演算法?他們是這樣工作的

機器學習演算法的設計目的是讓生活變得更簡單,改善系統,但它們可能會出錯,帶來不良後果。...

人工智能和機器學習產生了我們今天在技術工業中看到的許多進步。但是機器是如何被賦予學習能力的呢?此外,我們這樣做的方式是如何導致意想不到的後果的?

machine-learning-algorithms

下面是我們關於機器學習算法如何工作的快速解釋,以及一些機器學習出錯的例子。

什麼是機器學習算法(machine learning algorithms)?

機器學習是計算機科學的一個分支,它致力於賦予人工智能學習任務的能力。這包括開發沒有程序員顯式地編寫人工智能來做這些事情的能力。相反,人工智能能夠利用數據來自學。

程序員通過機器學習算法來實現這一點。這些算法是人工智能學習行為所基於的模型。算法,結合訓練數據集,使人工智能學習。

算法通常提供人工智能可以用來解決問題的模型。例如,學習如何識別貓和狗的圖片。人工智能將算法建立的模型應用到一個包含貓和狗圖像的數據集。隨著時間的推移,人工智能將學習如何更準確、更容易地識別貓和狗,而無需人工輸入。

機器學習改進了搜索引擎、智能家居設備、在線服務和自主機器等技術。這是Netflix如何知道你更喜歡哪部電影,以及音樂流媒體服務如何推薦播放列表。

但是,雖然機器學習可以讓我們的生活更輕鬆,也可能會有一些意想不到的後果。

機器學習出錯7次

1谷歌圖片搜索結果的不幸

google-image-search-results-controversies

谷歌搜索使得瀏覽網絡變得簡單多了。引擎的算法在生成結果時考慮了很多因素,比如關鍵字和跳出率。但是該算法也從用戶流量中學習,這會給搜索結果的質量帶來問題。

這一點在圖像結果中最為明顯。由於接收高流量的頁面更有可能顯示其圖像,因此吸引大量用戶(包括clickbait)的故事通常會被優先考慮。

例如,“南非棚戶區難民營”的圖片搜索結果就引起了爭議,因為它被發現以南非白人為主。儘管有統計數據顯示,住在棚屋等非正規住房中的絕大多數人是南非黑人。

谷歌算法中使用的因素也意味著互聯網用戶可以操縱結果。例如,一個由用戶發起的活動影響了谷歌的圖片搜索結果,以至於搜索“**”這個詞會顯示美國總統唐納德·特朗普的圖片。

2微軟機器人變成了納粹

相信Twitter會破壞一個善意的機器學習聊天機器人。這就是微軟現在臭名昭著的chatbottay發佈後一天內發生的事情。

泰模仿了一個十幾歲女孩的語言模式,並通過與其他推特用戶的互動學習。然而,當她開始分享納粹言論和種族誹謗時,她成為最臭名昭著的人工智能失誤之一。結果發現,巨魔們用人工智能的機器學習來對付它,用充滿偏見的交互充斥著它。

不久之後,微軟將泰伊永久下線。

三。人工智能面部識別問題

面部識別人工智能經常因為所有錯誤的原因而成為頭條新聞,比如關於面部識別和隱私問題的報道。但是這個人工智能在試圖識別有色人種時也引起了極大的關注。

2015年,用戶發現谷歌照片將一些黑人歸類為大猩猩。2018年,美國公民自由聯盟(ACLU)的研究顯示,亞馬遜(Amazon)的Rekognition人臉識別軟件將28名美國國會議員確定為警方嫌疑人,假陽性對有色人種的影響不成比例。

另一起事件涉及蘋果的Face ID軟件錯誤地將兩名不同的中國**識別為同一個人。因此,iphonex用戶的同事可以解鎖**。

與此同時,麻省理工學院研究人員喬伊·布奧蘭維尼回憶說,在研究面部識別技術時,為了讓軟件認出她,她經常需要戴上白色的面具。為了解決這樣的問題,Buolamwini和其他IT專業人士正在關注這個問題,並提出需要為AI培訓提供更具包容性的數據集。

4用於惡作劇的假貨

當人們長期使用Photoshop**惡作劇圖像時,機器學習將其提升到了一個新的水平。像FaceApp這樣的軟件可以讓你面對面將主題從一個視頻切換到另一個視頻。

但許多人利用該軟件進行各種惡意使用,包括將名人面孔疊加到***頻或生成惡作劇視頻。與此同時,互聯網用戶幫助改進了這項技術,使得辨別真假視頻變得越來越困難。因此,這使得這類人工智能在傳播假新聞和惡作劇方面非常強大。

為了展示這項技術的威力,導演喬丹·皮爾和BuzzFeed首席執行官喬納·佩雷蒂**了一段deepfake視頻,展示了美國前總統奧巴馬(Barack Obama)就deepfakes的威力發表的PSA。

5推特機器人的興起

Twitter機器人最初是為了自動化品牌的****回覆之類的事情而創建的。但這項技術現在是一個令人擔憂的主要原因。事實上,研究估計,Twitter上多達4800萬用戶實際上是人工智能機器人。

許多bot賬戶不是簡單地使用算法來跟蹤特定的標籤或響應客戶的查詢,而是試圖模仿真實的人。這些“人”隨後會推廣惡作劇,幫助虛假新聞傳播開來。

推特機器人的浪潮甚至在一定程度上影響了英國脫歐和2016年美國總統大選的輿論。Twitter自己也承認,它發現了大約5萬個俄羅斯**的發佈選舉信息的機器人。

機器人繼續困擾著這項服務,散佈謠言。這個問題非常普遍,甚至影響到公司的估值。

6員工們說亞馬遜人工智能決定****更好

2018年10月,路透社報道稱,亞馬遜在該軟件的人工智能決定**候選人優先後,不得不放棄一個招聘工具。

不願透露姓名的員工站出來告訴路透社他們在該項目上的工作。開發人員希望人工智能根據他們的簡歷來確定最佳的求職者。然而,參與這個項目的人很快就注意到AI懲罰了**候選人。他們解釋說,人工智能使用過去十年的簡歷作為訓練數據集,其中大部分來自**。

結果,人工智能開始根據關鍵詞“**”過濾掉簡歷。他們在簡歷中的關鍵詞出現在“女子象棋俱樂部隊長”等活動下。雖然開發者修改了人工智能以防止這種對**簡歷的懲罰,亞馬遜最終還是放棄了這個項目。

7youtube上的不適當內容

YouTube的孩子們有許多愚蠢的,異想天開的視頻,旨在娛樂孩子們。但它也存在操縱平臺算法的垃圾郵件視頻的問題。

這些視頻是基於流行的標籤。由於小孩子不是很有鑑別力的觀眾,使用這些關鍵字的垃圾視頻吸引了數以百萬計的觀眾。人工智能根據趨勢標籤,使用股票動畫元素自動生成其中一些視頻。即使這些視頻是由動畫師**的,它們的標題也是專門為關鍵字填充而生成的。

這些關鍵詞有助於操縱YouTube的算法,使它們最終成為推薦詞。大量不適當的內容出現在使用YouTube兒童應用程序的兒童的feed中。這包括描述暴力、恐怖和性內容的內容。

為什麼機器學習會出錯

機器學習導致意外後果的主要原因有兩個:數據和人。在數據方面,“垃圾進,垃圾出”的口號適用。如果輸入到人工智能的數據是有限的、有偏差的或低質量的,則結果是具有有限範圍或偏差的人工智能。

但是,即使程序員得到了正確的數據,人們也可以在工作中施加干擾。軟件的創造者通常沒有意識到人們是如何惡意地或出於自私的目的使用這項技術的。深度贗品來自用於改善電影特效的技術。

那些旨在提供更多沉浸式娛樂的東西,一旦被利用,最終也會毀了人們的生活。

有人致力於改善機器學習技術的安全措施,以防止惡意使用。但是技術已經在這裡了。同時,許多公司沒有表現出必要的意志力來防止濫用這些發展。

機器學習算法可以幫助我們

當你意識到機器學習和人工智能在很大程度上沒有達到預期時,你可能會覺得有點悲觀。但它也在許多方面幫助我們——不僅僅是在方便方面,而且在總體上改善我們的生活。

如果你對人工智能和機器學習的積極影響有點猶豫不決,那就找出人工智能打擊網絡犯罪和黑客的方法,以恢復一些希望。

  • 發表於 2021-03-23 07:51
  • 閱讀 ( 49 )
  • 分類:科技

你可能感興趣的文章

神經網路(neural network)和深度學習(deep learning)的區別

...是一種實現深度學習的方法。 目錄 1. 概述和主要區別 2. 什麼是神經網路 3. 什麼是深度學習 4. 並列比較-神經網路與表格形式的深度學習 5. 摘要 什麼是神經網路(neural network)? 生物神經元是神經網路的靈感來源。人腦中有數百...

  • 發佈於 2020-10-18 10:17
  • 閲讀 ( 56 )

認知計算(cognitive computing)和機器學習(machine learning)的區別

...的應用很難劃清界限和劃分。 目錄 1. 概述和主要區別 2. 什麼是認知計算 3. 什麼是機器學習 4. 認知計算與機器學習的關係 5. 並列比較-認知計算與表格形式的機器學習 6. 摘要 什麼是認知計算(cognitive computing)? 認知計算技術可...

  • 發佈於 2020-10-18 10:57
  • 閲讀 ( 100 )

被監督的(supervised)和無監督機器學習(unsupervised machine learning)的區別

...他語言,如java、C++和MATLAB。 目錄 1. 概述和主要區別 2. 什麼是監督學習 3. 什麼是無監督學習 4. 有監督和無監督機器學習的相似性 5. 並列比較-表格形式的有監督和無監督機器學習 6. 摘要 什麼是監督學習(supervised learning)? 在基...

  • 發佈於 2020-10-19 03:49
  • 閲讀 ( 51 )

機器學習(machine learning)和人工智慧(artificial intelligence)的區別

...的科學,它像人類一樣聰明。 目錄 1. 概述和主要區別 2. 什麼是機器學習 3. 什麼是人工智慧 4. 機器學習與人工智慧的相似性 5. 並列比較-機器學習與人工智慧的表格形式 6.摘要 什麼是機器學習(machine learning)? 演算法是告訴計算...

  • 發佈於 2020-10-19 20:24
  • 閲讀 ( 49 )

資料探勘(data mining)和機器學習(machine learning)的區別

...則,而機器學習則教會計算機學習和理解給定的規則。 什麼是資料探勘(data mining)? 資料探勘是從資料中提取隱含的、先前未知的、潛在有用的資訊的過程。儘管資料探勘聽起來很新,但技術卻不是。資料探勘是大型資料集中模...

  • 發佈於 2020-10-29 00:13
  • 閲讀 ( 47 )

機器人如何學習閱讀和思考

...論計算機對我們的理解。我們說Google“知道”我們在搜尋什麼,或者Cortana“知道”我們在說什麼,但是“理解”是一個非常困難的概念。尤其是在電腦方面。 ...

  • 發佈於 2021-03-16 12:24
  • 閲讀 ( 46 )

驗證碼是如何工作的,為什麼這麼難?

... 什麼是CAPTCHA?它們是如何工作的?他們和雷帕查斯有何不同?為什麼他們中的許多人如此困難? ...

  • 發佈於 2021-03-18 09:56
  • 閲讀 ( 50 )

deepfakes解釋說:製作假影片的人工智慧太有說服力了

... 什麼是假貨(deepfakes)? ...

  • 發佈於 2021-03-22 15:45
  • 閲讀 ( 46 )

深度學習vs.機器學習vs.人工智慧:它們是如何結合在一起的?

... 什麼是人工智慧(artificial intelligence)? ...

  • 發佈於 2021-03-22 20:26
  • 閲讀 ( 51 )

這4個防病毒工具使用人工智慧來保護你的系統

...科技的幻想畫面,但人工智慧現在已經成為現實。要了解什麼是人工智慧防毒軟體,你需要了解傳統防毒軟體是如何工作的。 ...

  • 發佈於 2021-03-24 02:54
  • 閲讀 ( 78 )