一個機器學習工具能（也不能）告訴我們什麼是人工智慧偏見

這是一個驚人的影象，說明了人工智慧研究根深蒂固的偏見。將美國第一位黑人總統巴拉克奧巴馬（Barack Obama）的一張低解析度照片輸入到一個演算法中，該演算法設計用於生成不相關的人臉，輸出的是一個白人。...

這是一個驚人的影象，說明了人工智慧研究根深蒂固的偏見。將美國第一位黑人總統巴拉克奧巴馬（Barack Obama）的一張低解析度照片輸入到一個演算法中，該演算法設計用於生成不相關的人臉，輸出的是一個白人。

也不僅僅是奧巴馬。用同樣的演算法，從低解析度的輸入中生成女演員Lucy Liu或女議員Alexandria Ocasio Cortez的高解析度影象，得到的人臉看起來明顯是白色的。正如一條引用奧巴馬例子的熱門推特所說：“這張圖片充分說明了人工智慧中偏見的危險。”

但是，是什麼導致了這些輸出，它們真正告訴我們什麼是人工智慧偏差？

首先，我們需要稍微瞭解一下這裡使用的技術。生成這些影象的程式是一種稱為PULSE的演算法，它使用一種稱為放大的技術來處理視覺資料。升級就像你在電視和電影中看到的“縮放和增強”比喻，但是，與好萊塢不同的是，真正的軟體不能無中生有地生成新資料。為了將低解析度影象轉換成高解析度影象，軟體必須使用機器學習來填補空白。

在脈衝的情況下，做這項工作的演算法是StyleGAN，它是由NVIDIA的研究人員建立的。雖然您以前可能沒有聽說過StyleGAN，但您可能對它的工作很熟悉。它的演算法負責**那些你可以在像Th這樣的網站上看到的怪異逼真的人臉isPersonDoesNotExist.com；人臉非常逼真，經常被用來**虛假的社交媒體資料。

PULSE使用StyleGAN來“想象”畫素化輸入的高解析度版本。它不是透過“增強”原始低解析度影象，而是透過生成一個全新的高解析度人臉，當畫素化後，看起來與使用者輸入的一樣。

這意味著每一個分離的影象可以以多種方式放大，就像一套單一的原料**不同的菜餚一樣。這也是為什麼你可以用PULSE來觀察厄運的傢伙，或者Wolfenstein 3D的英雄，甚至是哭泣的表情符號在高解析度下的樣子。並不是像“縮放和增強”的比喻那樣，演算法在影象中“尋找”新的細節；而是發明新的面孔，還原為輸入資料。

這類工作在理論上已經有幾年的可能了，但是，就像人工智慧領域經常發生的情況一樣，當一個易於執行的程式碼版本在本週末被線上分享時，它吸引了更多的讀者。就在那時，種族差異開始出現。

脈搏’研究人員說，這一趨勢很明顯：當使用該演算法放大畫素影象時，該演算法通常會生成具有白種人特徵的人臉。

該演算法的創造者在Github上寫道：“看起來PULSE產生白臉的頻率比有色人種的頻率要高得多。”。“這種偏見很可能是從StyleGAN在[…]上訓練的資料集繼承而來的，儘管可能還有其他我們不知道的因素。”

換言之，由於StyleGAN是在’如果你想得到一張像畫素化輸入影象的臉，它預設為白色特徵。

這個問題在機器學習中非常常見，這也是人臉識別演算法在非白人和**人臉上表現較差的原因之一。用來訓練人工智慧的資料往往偏向於一個單一的人口統計學，即白人，當一個程式看到的資料不在這個人口統計學中時，它的表現就很差。無獨有偶，是白人主導了人工智慧研究。

但是，奧巴馬的例子究竟揭示了什麼樣的偏見，以及它所代表的問題如何得到解決，這些都是複雜的問題。事實上，它們是如此複雜，以至於這個單一的影象在人工智慧學者、工程師和研究人員中引發了激烈的分歧。

在技術層面上，一些專家甚至不確定這是資料集偏見的一個例子。人工智慧藝術家馬里奧·克林格曼（Mario Klingemann）認為，應該歸咎於脈衝選擇演算法本身，而不是資料。克林格曼指出，他能夠使用StyleGAN從同一畫素化的奧巴馬影象生成更多非白色輸出，如下所示：

克林格曼說，這些人臉是用“相同的概念和相同的StyleGAN模型”生成的，但不同的搜尋方法產生的，他說，我們不能僅僅從幾個樣本來判斷演算法。他告訴《邊緣報》說：“可能有數百萬張可能的臉都會縮小到相同的畫素圖案，而且都是同樣‘正確的’。”。

（順便說一句，這也是這樣的工具不太可能用於監視目的的原因。透過這些過程建立的面是虛構的，如上面的例子所示，與輸入的基本事實關係不大。然而，這並不是說巨大的技術缺陷阻止了警方在過去採用技術。）

但不管是什麼原因，演算法的輸出似乎是有偏差的——這是研究人員在工具被廣泛使用之前沒有注意到的。這說明了一種不同的、更普遍的偏見：一種在社會層面上運作的偏見。

黛博拉·拉吉是人工智慧領域的研究人員，他告訴《邊緣》雜誌，這種偏見在人工智慧領域太過典型了。拉吉說：“鑑於有色人種的基本存在，忽視對這種情況的測試是令人震驚的，這可能反映了我們繼續看到的關於誰能夠建立這樣的系統的多樣性的缺乏。”。“有色人種不是異類。我們不是‘邊緣案例’的作者，我們可以忘記。”

一些研究人員似乎只熱衷於解決偏見問題的資料方面，這一事實引發了有關奧巴馬形象的更大爭論。Facebook首席人工智慧科學家Yann LeCun在推特上回應稱“當資料有偏差時，ML系統有偏差，並補充說，這種偏見是一個更嚴重的問題“在一個部署的產品比在學術論文”的含義是：讓我們不要太擔心這個特定的例子。

許多研究人員，包括拉吉在內，對勒坤的框架提出了異議，指出AI中的偏見受到更廣泛的社會不公正和偏見的影響，僅僅使用“正確”的資料並不能處理更大的不公正。

另一些人指出，即使從純技術修復的角度來看，“公平”的資料集也往往不是。例如，準確反映英國人口結構的人臉資料集將以白人為主，因為英國以白人為主。在這些資料上訓練的演算法在白臉上比在非白臉上表現得更好。換句話說，“公平”的資料集仍然可以建立有偏見的系統。（在Twitter上的一篇帖子中，勒坤承認AI偏見有多種原因。）

Raji告訴The Verge，她也對LeCun的建議感到驚訝，LeCun建議研究人員應該比生產商業系統的工程師更少地擔心偏見，這反映了行業最高層缺乏意識。

拉吉說：“Yann LeCun領導著一個工業實驗室，該實驗室以研究許多應用研究問題而聞名，他們經常尋求將這些問題生產出來。”。“我真的不明白，在這個職位上，為什麼有人不承認研究在建立工程部署規範方面的作用。”

當《邊緣》雜誌就這些評論聯絡到勒坤時，他指出，他在Facebook內外幫助建立了許多關注人工智慧公平性和安全性的團體，包括人工智慧方面的合作伙伴關係。他對《邊緣》雜誌說：“我絕對從來沒有，從來沒有說過，甚至暗示過，研究不起作用的事實就是建立規範。”。

然而，許多商業人工智慧系統是直接從研究資料和演算法中構建的，沒有任何種族或性別差異的調整。在研究階段未能解決偏見問題只會使現有問題長期存在。

從這個意義上說，奧巴馬形象的價值不在於它暴露了單一演算法中的單一缺陷；而在於它在直觀的層面上傳達了人工智慧偏見的普遍性。然而，它隱藏的是，偏差問題比任何資料集或演算法都要嚴重得多。這是一個普遍存在的問題，需要的不僅僅是技術修復。

正如一位研究人員Vidushi Marda在Twitter上對該演算法產生的白臉做出的迴應：“如果需要明確說明的話——這不是要求資料集‘多樣化’或效能‘提高準確性’——這是要求對設計、開發、管理和應用程式的機構和個人進行根本性的重新考慮，首先部署這項技術。”

更新，星期三，6月24日：這篇文章已經更新，包括從雅恩樂坤補充意見。