你的購物習慣簡直就是百萬分之一

2006年,Netflix向全世界展示了匿名和隱私不是一回事。該公司從使用者那裡釋出了數以百萬計的電影收視率,向任何可以利用這些收視率來構建更好的推薦引擎的人提供現金獎勵。但是當研究人員將現在公開的分數與iMDB的評論進行交叉引用時,他們發現,即使客戶的名字被數字取代,他們也能有效地揭開背後的人的面紗。Netflix最終與一位女士對簿公堂,她擔心這場比賽會暴露出自己的性取向——她在公眾場合輕鬆談論的...

2006年,Netflix向全世界展示了匿名和隱私不是一回事。該公司從使用者那裡釋出了數以百萬計的電影收視率,向任何可以利用這些收視率來構建更好的推薦引擎的人提供現金獎勵。但是當研究人員將現在公開的分數與iMDB的評論進行交叉引用時,他們發現,即使客戶的名字被數字取代,他們也能有效地揭開背後的人的面紗。Netflix最終與一位女士對簿公堂,她擔心這場比賽會暴露出自己的性取向——她在公眾場合輕鬆談論的電影可能會無意中暴露出她從未想過要超越自己的佇列的那些電影。今天,麻省理工學院的研究人員發表了另一篇文章,提醒我們,無論有多少個人細節被剝離,我們的數字足跡都會令人不安地暴露出來。

007Ys3FFgy1gpzozcua1wj30sc0isnf5

如果我們所看的是一個敏感的話題,我們所買的東西就更親密,更能揭示。像Facebook Beacon這樣的程式,旨在向朋友們宣傳使用者最近購買的產品,受到廣泛的抨擊。但是,今天發表在《科學》上的這項研究並不是關於個人分享的。這是基於測試研究人員所稱的“單一性”:如果你知道一個人購物歷史的片段,你可以將它們與大量資料相匹配,從而發現他們購買的其他東西。結果是,這些可能性很大。

與Netflix不同的是,銀行不太可能向公眾釋出數以百萬計的記錄。我們已經用無數其他的方式展示了我們的購買行為——社交網路、百貨公司和廣告商,他們可以用令人毛骨悚然的精確方式將這些線索拼湊在一起。但隨著我們記錄和量化更多的生活,值得思考的是誰可能在觀看,以及他們能找到什麼。據報道,美國****局對信用卡資訊的挖掘方式與對電子郵件和電話後設資料的挖掘方式相同;它已經透過對大量匿名記錄進行電話比對來追蹤嫌疑人。考慮到之前類似的研究,研究人員推測,大多數種類的大型資料庫都會有類似的啟示。”“這裡的研究實際上是關於匿名化(對)大的、高維資料的限制——**資料、信用卡、瀏覽等等,”主要作者Yves Alexandre de Montjoye說你的行為與其他人的行為相比如何,並可能使我們與眾不同?”

三次購買可以給你94%的時間匹配

作者從110萬人三個月的信用卡交易開始,由一家未具名的經合組織國家的未具名銀行提供(主要作者,麻省理工學院的Yves Alexandre de Montjoye,不會透露更多細節)。他們隨機抽取每個人的幾件單品,然後將整件單品放入一個匿名資料庫,刪除姓名或銀行賬號等細節。資料庫只給出了一個範圍內的價格,因為知道有人在星巴克花了整整3.21美元,幾乎可以立即把它們送人。研究人員出於同樣的原因放棄了超高的支付——超過22000美元。

但事實證明,這隻是一個小小的絆腳石。當作者將某人非匿名購買的地點、日期和價格對映到整個資料庫時,通常很容易找到一個單一的、獨特的模式。三分或更多,這幾乎是肯定的。”你在那家咖啡店買了一杯咖啡,你在那家咖啡店買了牛仔褲,然後你又買了一個比薩餅。94%的可能性是你是唯一這樣做的人。把價格一筆勾銷,這些火柴就更難找了。但四次購買後,這一比例又回升到了90%。

德蒙喬伊承認,其他國家或地區可能會看到略有不同的結果;按理說,在一個特定地區使用信用卡的人越多,就越難找到匹配的人。獨身性已經因收入和性別的不同而有所不同——**比**更容易被識別,而富人比窮人更容易被識別。這些差異很可能會引起人們的猜測和成見,但作者說,找出這些差異背後的真正因素超出了本研究的範圍。


即使是最模糊的資料也會建立獨特的模式

不過,總的來說,這種推斷是可能的並不奇怪。德蒙喬伊(De Montjoye)在2012年發表了一篇類似的論文,用**位置跟蹤代替購物。如果你知道有人在四個時間點去過哪裡,那麼在150萬人的資料庫中找到他們其餘動作的幾率是95%。也許更有趣的是,德蒙喬伊認為,讓這種資訊真正匿名幾乎是不可能的。

研究人員還從更粗略的角度研究了相同的記錄,試圖創造出模糊得無法匹配的點。在某種程度上,他們成功了。在最遠的範圍內,他們進行匿名購買,精確到15天內,地理範圍為350家商店,擴大了價格範圍。有了這些變化,只有不到15%的幾率知道有人買了四樣東西能幫你找到它們。需要10個已知點才能得到80%的機會。但這仍然不能保證隱私。

至少,對於希望與“大資料”合作的研究人員和公司來說,de Montjoye希望所有者能夠找到一種方法,儘量減少他們所付出的。他建議允許訪問更抽象的程式碼,而不是原始資訊,將該系統與潘多拉的音樂基因組計劃(Music Genome Project)進行比較。潘多拉的音樂基因組計劃捕捉“獨特的音樂特徵”,在不透露播放列表的情況下展示某人的品味。而在更大的層面上,他希望向人們展示,即使是模糊的細節也能透露出一個人的多少。”我們需要重新考慮匿名化的意義或許至少要意識到風險是什麼。”

  • 發表於 2021-04-28 19:40
  • 閱讀 ( 35 )
  • 分類:網際網路

你可能感興趣的文章

你知道2017年新的網路詐騙嗎?

... 如果你是一個讀這篇文章的賣家,你的意圖可能是誠實的。但這並不意味著收件人是。 ...

  • 發佈於 2021-03-12 01:51
  • 閲讀 ( 43 )

解除安裝亞馬遜助手:這裡有更好的購物方式

... 亞馬遜明確表示,他們隨時都在收集你的瀏覽習慣資訊,無論是在與亞馬遜助理互動時,還是在你沒有互動時。當涉及第三方服務時,你的習慣也可能被他們收集。到目前為止,不可能知道哪些第三方可能參...

  • 發佈於 2021-03-12 04:24
  • 閲讀 ( 49 )

alexa和amazon echo構成隱私風險的7種方式

... 除非你啟用了靜音開關,否則你的回聲總是在聽喚醒詞Alexa。您的裝置在本地處理它聽到的音訊,並在接收到音訊幾秒鐘後刪除正在執行的音訊緩衝區。 ...

  • 發佈於 2021-03-15 08:28
  • 閲讀 ( 50 )

每月與每年:您應該購買哪種amazon prime會員?

...格,沒有一個一刀切的解決方案。這在很大程度上取決於你的網上購物習慣。 ...

  • 發佈於 2021-03-16 06:37
  • 閲讀 ( 62 )

當你在網上感到無聊的時候,要做的8件事

...這樣的影片很棒,因為它們不僅有趣,而且可以擴充套件你的思維,教會你新的東西,甚至幫助你成為一個更有洞察力和同情心的人。看看這些獨特的娛樂YouTube頻道或這些YouTube頻道的自我完善和動機。 ...

  • 發佈於 2021-03-18 08:04
  • 閲讀 ( 53 )

作為產品並不一定是壞事

...體,也有可能是你支付的公司以令人毛骨悚然的方式侵犯你的隱私。當然,現代網路有很多問題,但使用者作為產品並不是主要問題。 成為產品並不是什麼新鮮事 廣告不是網際網路獨有的。幾十年來,電視和廣播都有廣告,...

  • 發佈於 2021-04-06 08:27
  • 閲讀 ( 54 )

如何透過回答快速調查從谷歌獲得免費資金

...期給你提供由幾個簡單問題組成的調查。大多數都是基於你的購物習慣和來自市場研究人員。如果你想知道你的資料將如何被使用,你可以在這裡閱讀Google的FAQ。 你得到的獎勵不會支付你的賬單或任何東西,但每次調查都會在...

  • 發佈於 2021-04-07 04:57
  • 閲讀 ( 30 )

如何關閉亞馬遜的個性化網路廣告

亞馬遜追蹤你的瀏覽歷史,然後用它在網上為你做廣告。不管你是厭倦了看到你剛買的東西的廣告,還是不想讓亞馬遜爬上你的跟頭,有一種方法可以讓你轉向個性化廣告。下面是方法。 亞馬遜使用它所謂的基於興趣的廣告來...

  • 發佈於 2021-04-07 09:43
  • 閲讀 ( 44 )

亞馬遜的掌上閱讀是從雜貨店開始的,但它的規模可能要大得多

...購物者透過手掌掃描支付購物費用。亞馬遜說,透過分析你的手的形狀和面板下靜脈的獨特結構,它的技術可以像面部識別一樣驗證你的身份。 儘管亞馬遜一號最初將只用於支付,但很明顯,這家科技巨頭對這一硬...

  • 發佈於 2021-04-17 11:42
  • 閲讀 ( 36 )

at&t將裁員數千人,關閉250家商店

...的顧客在網上購物,我們將關閉一些零售店,以反映顧客的購物習慣。”。 任何失去工作的員工都將從符合條件的公司獲得遣散費和最多6個月的醫療保健。AT&T還表示,由於COVID的原因,許多零售業員工已經轉為客戶支援人...

  • 發佈於 2021-04-19 03:20
  • 閲讀 ( 39 )
Duke哈哈哈
Duke哈哈哈

0 篇文章

作家榜

  1. admin 0 文章
  2. 孫小欽 0 文章
  3. JVhby0 0 文章
  4. fvpvzrr 0 文章
  5. 0sus8kksc 0 文章
  6. zsfn1903 0 文章
  7. w91395898 0 文章
  8. SuperQueen123 0 文章

相關推薦