facebook是如何利用人工智慧來打擊covid-19錯誤資訊和發現“可恨的模因”的

Facebook週一釋出了一份新的報告，詳細說明了它如何結合人工智慧和人類事實核查員和版主來執行其社群標準。這份名為《社群標準執行報告》（Community Standards Enforcement report）的報告通常包含了前三到六個月的資料和調查結果，這次主要關注人工智慧，而Facebook的進展更多地依賴於軟體，而不是人，因為這項工作可能會給人類版主帶來極大的損失。...

在COVID-19流感大流行期間，Facebook目前也更多地依賴於這項技術來幫助調節其平臺，這使得Facebook無法使用通常的第三方調節公司，因為這些公司的員工不允許從家用電腦訪問Facebook的敏感資料。Verge週二報道稱，Facebook已經與現任和前任版主達成了一項價值5200萬美元的集體訴訟，以補償他們在工作期間產生的心理健康問題，特別是創傷後應激障礙。《邊緣報》廣泛報道了Facebook聘用來調節其平臺的公司的工作條件。

Facebook表示，它在最新報告中彙編的資料並不包含任何更大的執行趨勢，也不包含在其平臺上的違規行為，因為該流行病在報告期內來得太晚。該公司負責誠信的副總裁蓋伊·羅森（Guy Rosen）在部落格中寫道：“這份報告只包括到2020年3月的資料，因此它沒有反映出我們在流感大流行期間所做改變的全部影響。”。“我們預計，我們將在下一份報告中看到這些變化的影響，甚至可能在以後的報告中看到，我們將對這些變化保持透明。”

考慮到世界現狀，Facebook的報告確實包含了新的資訊，說明該公司是如何利用其人工智慧工具，專門打擊冠狀病毒相關的錯誤資訊和其他形式的平臺濫用，比如Facebook Marketplace上的哄抬價格。

該公司在一組研究科學家和軟體工程師撰寫的另一篇部落格文章中稱：“在4月份，我們在Facebook上釋出了約5000萬條與COVID-19相關的帖子，這些帖子是基於我們獨立的事實調查合作伙伴發表的約7500篇文章。”今天出版。“自3月1日以來，我們已經刪除了250多萬份用於銷售口罩、洗手液、表面消毒溼巾和COVID-19測試包的內容。但這些都是困難的挑戰，我們的工具還遠遠不夠完善。此外，這些挑戰的對抗性意味著這項工作永遠不會完成。”

Facebook表示，它的標籤正在發揮作用：95%的時候，有人被警告某個內容含有錯誤資訊，他會決定無論如何都不看。但事實證明，在其龐大的平臺上生產這些標籤是一項挑戰。首先，Facebook發現，大量的錯誤資訊和仇恨言論現在出現在影象和影片中，而不僅僅是文字或文章連結。

“我們發現，在全球範圍內，Facebook上的仇恨言論有相當一部分出現在照片或影片中，”該公司在另一篇針對仇恨言論的部落格文章中表示，該部落格是關於其最近的適度調查結果和研究的。“與其他內容一樣，仇恨言論也可以是多模態的：例如，模因可以使用文字和影象來攻擊特定的人群。”

該公司承認，這對人工智慧來說是一個更嚴峻的挑戰。由於文字遊戲和語言差異等複雜因素，人工智慧培訓的模型在解析模因影象或影片時不僅比較困難，而且還必須對軟體進行培訓，以便在該內容在Facebook上傳播時找到重複的或只是稍加修改的版本。但這正是Facebook所說的，它透過所謂的SimSearchNet實現了這一目標。SimSearchNet是一項跨公司內多個部門的多年努力，旨在訓練人工智慧模型如何識別原始影象的副本和那些幾乎重複的副本，以及文字行中可能有一個單詞發生了變化。

“一旦獨立的事實核查人員確定影象中含有關於冠狀病毒的誤導性或虛假宣告，SimSearchNet作為我們端到端影象索引和匹配系統的一部分，能夠識別幾乎重複的匹配，以便我們可以應用警告標籤，” 該公司表示。“這個系統在上傳到Instagram和Facebook的每一張圖片上執行，並檢查特定任務的人類管理資料庫。這就造成了每天數十億張影象被檢查，包括針對檢測COVID-19錯誤資訊的資料庫。”

Facebook使用了一個誤導性影象的例子，該影象模仿了一個廣播新聞圖片，上面有一行覆蓋的文字，“COVID-19在廁紙中被發現”。該影象來自一個名為Now8News的已知虛假新聞販子，該圖片後來被Snopes和其他事實核查組織揭穿。但Facebook表示，它必須訓練自己的人工智慧來區分原始影象和修改後的影象，即“COVID-19在廁紙中找不到”

這樣做的目的是幫助減少重複影象的傳播，同時也不會無意中標記真實的帖子或那些不符合錯誤資訊標準的帖子。這在Facebook上是一個大問題，許多出於政治動機的頁面和組織，或者那些僅僅依靠黨派憤怒來獲取資訊的人，都會拍下照片、截圖和其他圖片，並改變它們的含義。一個人工智慧模型知道其中的區別，並且可以將一個標記為錯誤資訊，另一個標記為真實資訊，這是一個有意義的進步，特別是當它可以在未來對任何重複或接近重複的內容做同樣的事，而不必在過程中套牢非冒犯性的影象。

該公司表示：“這些相似性系統要儘可能準確，這一點非常重要，因為一個錯誤可能意味著對實際上沒有違反我們政策的內容採取行動。”。“這一點特別重要，因為事實核查人員發現的每一條錯誤資訊，可能有數千或數百萬份副本。使用人工智慧檢測這些匹配還可以讓我們的事實核查合作伙伴專注於捕捉新的錯誤資訊例項，而不是他們已經看到的內容幾乎相同的變化。”

Facebook還使用了許多與冠狀病毒相關內容相同的技術，改進了仇恨言論的節制。該公司表示：“人工智慧現在主動檢測我們刪除的仇恨言論內容的88.8%，高於上一季度的80.2%。”。“2020年第一季度，我們對960萬條違反仇恨言論政策的內容採取了行動——增加了390萬條。”

Facebook能夠更多地依賴人工智慧，這要歸功於它的模型在理解和解析文字方面的一些進步，無論是出現在帖子和附帶的連結中，還是覆蓋在影象或影片中。

“分享仇恨言論的人經常試圖透過修改內容來逃避檢測。這種敵對行為的範圍從故意拼錯單詞或避免某些短語到修改影象和影片，”該公司說。“當我們改進我們的系統以應對這些挑戰時，把它做好是至關重要的。錯誤地將內容歸類為仇恨言論可能意味著阻止人們表達自己和與他人交往。”Facebook說，所謂的反言，或對仇恨言論的迴應，儘管如此，但通常包含冒犯性內容的片段，是“特別具有挑戰性的分類正確，因為它看起來很像仇恨演說本身。”

Facebook的最新報告包含了來自Instagram的更多資料，包括該平臺刪除了多少欺凌內容，以及有多少內容被上訴和恢復。它將影象匹配技術應用於尋找**和自傷的帖子，提高了Instagram內容在使用者報告之前被刪除的百分比。

2019年最後一個季度，Facebook刪除了500萬條內容，**和自傷執法力度也有所擴大— 是前幾個月的兩倍。一位發言人說，這一激增源於Facebook在10月和11月檢測並刪除了大量非常舊的內容，而到了2020年，隨著Facebook將重點轉向更新的內容，這一數字急劇下降。

Facebook稱其新進展— 特別是去年11月宣佈的一種稱為XLM-R的神經網路— 正在幫助其自動調節系統更好地理解跨多種語言的文字。Facebook說XLM-R允許這樣做“為了有效地訓練更多數量級的資料和更長的時間，” 並將這種學習跨多種語言進行。

但Facebook表示，事實證明，模因是一種彈性很強、難以檢測的仇恨言論傳遞機制，即使有了改進的工具。所以它建立了一個專門的“可恨的模因” 包含10000個示例的資料集，只有同時處理影象和文字並理解兩者之間的關係，才能完全理解影象的含義。

一個例子是一個貧瘠的沙漠影象，上面覆蓋著“看有多少人愛你”。Facebook稱用自動化系統檢測這一點的過程是多模式理解的，用這種複雜程度訓練人工智慧模型是其更前沿的適度研究的一部分。

“為了給研究人員提供一個有明確許可條款的資料集，我們對蓋蒂圖片公司的資產進行了許可。我們與訓練有素的第三方註解者合作，創造出新的模因，類似於在社交媒體網站上分享的現有模因。“註釋者使用蓋蒂圖片公司收集的股票圖片來替換原始的視覺效果，同時仍然保留了語義內容。”

Facebook表示，它正在向研究人員提供資料集，以改進線上檢測此類仇恨言論的技術。它還發起了一項挑戰，為研究人員提供10萬美元的獎金，讓他們建立在資料集上訓練的模型，能夠成功解析這些更微妙的語言形式，而Facebook現在看到的是，它的系統正更主動地刪除更明目張膽的仇恨內容。

美國東部時間5月12日下午3:55更新：增加了關於Facebook與第三方合同版主達成的5200萬美元和解的資訊。

發表於 2021-04-19 07:34
閱讀 ( 49 )
分類：網際網路

你可能感興趣的文章

研究：instagram演算法在助長誤傳

... 2020年8月，Facebook開始刪除含有COVID-19錯誤資訊的帖子。Twitter在一月份透過Birdwatch釋出了社群驅動的節制，TikTok上個月刪除了數千個關於選舉錯誤資訊的影片。 ...

發佈於 2021-03-11 00:52
閲讀 ( 48 )

twitter禁止有關covid-19疫苗的誤導性內容

... Facebook已經加入了阻止有關COVID-19疫苗的虛假宣告傳播的努力。與Twitter一樣，Facebook也將刪除含有免疫接種錯誤資訊的內容。 ...

發佈於 2021-03-29 00:19
閲讀 ( 42 )

facebook不會容忍關於covid-19疫苗的錯誤資訊

Facebook對即將推出的COVID-19疫苗的說法是錯誤的。該平臺現在將刪除任何包含治療錯誤資訊的內容。 ...

發佈於 2021-03-29 05:45
閲讀 ( 49 )

Windows7成為第二流行的作業系統

Facebook對卡農陰謀論的支持者採取了更加堅定的立場。該平臺現在正在刪除Facebook和Instagram上與QAnon有關的頁面、賬戶和群組。 ...

發佈於 2021-03-30 04:31
閲讀 ( 38 )

facebook和twitter對特朗普總統關於covid-19的帖子採取行動

Facebook和Twitter對美國總統唐納德•特朗普（Donald Trump）在Facebook釋出的誤導性帖子和推特迅速採取了行動。特朗普總統的帖子淡化了COVID-19的嚴重性，導致他在Facebook上的帖子被刪除，並導致Twitter標記他的推特。 ...

發佈於 2021-03-30 04:35
閲讀 ( 51 )

twitter建立選舉中心來打擊錯誤資訊

...個致力於防止美國大選誤導性資訊傳播的社交媒體平臺。Facebook還採取措施限制和標註政治廣告。 ...

發佈於 2021-03-30 08:57
閲讀 ( 37 )

facebook試圖阻止covid-19錯誤資訊的傳播

...訊也在不斷傳播。為了阻止有關COVID-19的假新聞的傳播，Facebook已經刪除和/或標記了數百萬條誤導性的帖子。 ...

發佈於 2021-03-30 15:12
閲讀 ( 45 )

twitter將為covid-19疫苗錯誤資訊貼上標籤，並實施打擊系統

...賬戶被鎖定和永久停職。這些新標籤類似於Facebook的反錯誤資訊橫幅或Twitter在流感大流行初期就開始使用的標籤。它們以文字的形式出現在誤導性的推特下面，帶有來自官方來源或推特規則的資訊連結。Twitter計劃最...

發佈於 2021-04-15 23:30
閲讀 ( 40 )

facebook現在將刪除聲稱疫苗導致自閉症的帖子

Facebook正在擴大它將從今天開始從其平臺上刪除的與COVID-19、COVID-19疫苗和一般疫苗相關的虛假宣告。該公司在去年12月開始刪除被揭穿的COVID-19宣告，並在客戶當月與一個含有虛假資訊的帖子互動時通知他們。但現在，有可能被...

發佈於 2021-04-16 08:45
閲讀 ( 41 )

instagram禁止著名的反吸血鬼羅伯特f肯尼迪，但facebook頁面仍然活躍

據《華爾街日報》報道，Facebook旗下的Instagram已經永久性地禁止了著名的反疫苗活動家小羅伯特F肯尼迪（Robert F.Kennedy Jr.）使用Instagram，他在Instagram上擁有超過80萬的追隨者。這項服務的一位發言人說，他的賬戶“因多次分享有...

發佈於 2021-04-16 09:34
閲讀 ( 44 )