苹果公司把他们的声誉押在确保它从你那里收集的数据保持隐私上。怎样?通过使用一种叫做“差异隐私”的东西
苹果这样解释:
Apple is using Differential Privacy technology to help discover the usage patterns of a large number of users without compromising individual privacy. To obscure an individual’s identity, Differential Privacy adds mathematical noise to a **all sample of the individual’s usage pattern. As more people share the same pattern, general patterns begin to emerge, which can inform and enhance the user experience.
差异隐私背后的理念是:任何一个用户的设备,无论是iPhone、iPad还是Mac,在一个更大的聚合数据池(由不同的小图片组成的大图片)中添加了一个计算,都不应该被披露为来源,更不用说他们贡献了什么数据。
苹果并不是唯一一家这样做的公司,谷歌和微软早就开始使用它了。但苹果在其2016年WWDC的主题演讲中对此进行了详细的讨论,从而将其推广开来。
你会问,这和其他匿名数据有何不同?如果你对一个人有足够的了解,匿名数据仍然可以用来推断个人信息。
比如说,黑客可以访问一个匿名数据库,该数据库显示了一家公司的工资单。假设他们也知道员工X正在搬迁到另一个地区。黑客只需在雇员X移动前后查询数据库,就可以轻松推断出他的收入。
为了保护雇员X的敏感信息,Differential Privacy使用数学“噪波”和其他技术更改数据,这样,如果您查询数据库,您将只收到雇员X的大致薪酬(或其他人的薪酬)。
因此,由于所提供的数据和添加到其中的噪音之间的“差异”,他的隐私得到了保护,因此它变得足够模糊,以至于几乎不可能知道您正在查看的数据是否确实是某个特定个人的。
差异隐私是一个相对较新的概念,但其理念是,它可以根据用户提供的数据,为公司提供敏锐的洞察力,而不知道这些数据究竟是怎么说的,也不知道数据来源于谁。
例如,苹果依靠三个组件在Mac或iOS设备上实现差异隐私:散列、子采样和噪声注入。
散列将一个文本字符串转换成一个固定长度的较短值,并将这些键混合成不可逆的随机唯一字符字符串或“散列”。这会隐藏您的数据,因此设备不会以原始形式存储任何数据。
二次抽样意味着苹果不会收集一个人输入的每一个单词,而是只使用一个较小的样本。例如,假设你和一个朋友用表情符号进行了一次长时间的文本对话。而不是收集整个对话,子抽样可能只使用苹果感兴趣的部分,如表情符号。
最后,您的设备注入噪声,将随机数据添加到原始数据集中,以使其更加模糊。这意味着苹果得到的结果被掩盖得如此之小,因此并不十分准确。
所有这些都发生在你的设备上,所以在它被送到云端供苹果分析之前,它已经被缩短、混淆、采样和模糊了。
在很多情况下,苹果可能希望收集数据以改进其应用程序和服务。不过,目前苹果只在四个特定领域使用了差异隐私。
让我们以emojis为例。在iOS10中,苹果在iMessage上引入了新的表情符号替换功能。输入“爱”这个词,你可以用一个心形表情符号来代替它。输入单词“dog”,你就猜到了你可以用一个dog表情符号来代替它。
同样,你的iPhone也可以预测你想要什么样的表情,这样,如果你输入一条信息“我要遛狗”,你的iPhone会很有帮助地推荐狗的表情。
因此,苹果将收集到的所有iMessage数据片段作为一个整体进行检查,并可以从人们键入的内容和上下文中推断出模式。这意味着你的iPhone可以给你更明智的选择,因为它受益于所有其他人正在创建的文本对话,并认为,“这可能是你想要的表情符号。”
差异隐私的缺点是它不能在小样本中提供准确的结果。它的力量在于使特定的数据变得模糊,这样就不能将其归因于任何一个用户。为了让它正常工作,许多用户必须参与进来。
这有点像近距离看位图照片。如果你只看一小部分,你将看不到它是什么,但是当你退一步看整个东西时,图片会变得更清晰,更清晰,即使它不是超高分辨率的。
因此,为了提高emoji的替代性和预测性(除其他外),苹果需要从世界各地收集iPhone和Mac的数据,让它对人们的行为有一个越来越清晰的了解,从而改进其应用程序和服务。它转向所有这些随机的、嘈杂的、众包的数据,并挖掘其中的模式,比如有多少用户在用桃子表情代替“**”
因此,差异隐私的力量依赖于苹果能够检查大量的聚合数据,同时确保它对谁向他们发送这些数据一点也不明智。
不过,如果你仍然不相信差异隐私权对你来说是合适的,那你就走运了。您可以直接从设备的设置中选择退出。
在您的iOS设备上,轻按打开“设置”,然后轻按“隐私”。
在隐私屏幕上,轻触Diagnostics&Usage[诊断和使用]。
最后,在Diagnostics&Usage屏幕上,轻触Don't Send[不要发送]。
在macOS上,打开系统首选项并单击“安全和隐私”。
在安全和隐私首选项中,单击“隐私”选项卡,然后确保未选中“向Apple发送诊断和使用数据”。请注意,您需要单击左下角的锁定图标并输入系统密码,然后才能进行此更改。
显然,区别隐私在理论和应用上都比这个简单的解释要多得多。它的肉和土豆在很大程度上依赖于一些严肃的数学,因此,它可能变得相当沉重和复杂。
不过,希望这能让您了解它的工作原理,让您对收集某些数据的公司更有信心,而不必担心被识别。
...要在基本安装中添加任何内容(除非您真的知道自己在做什么)。恶意扩展和非恶意扩展都可以在您未意识到的情况下显示您的身份。 Tor不能严格执行HTTPS。HTTPS Everywhere扩展试图在每个站点上强制HTTPS支持,虽然...
... 但什么样的隐私缩写词适合你的需求呢?让我们来探讨什么是I2P、Tor和vpn,以及哪一个适合您。 ...
...唯一一款提供安全、注重隐私的互联网体验的浏览器。但什么样的解决方案适合你呢?我们来看看。 ...
...通过添加虚拟专用网(VPN)来增加您的隐私。不确定VPN是什么?了解什么是VPN连接,以及它是如何工作的。 ...
...确实有局限性。今天,我们来看看Tor是如何工作的,它做什么和不做什么,以及如何在使用时保持安全。 ...
... 如果一个潜在的攻击者能够知道你在使用什么操作系统,那么Tor就不能保护你。在操作系统方面,使用Windows不是一个好主意。这是由于其固有的安全缺陷和漏洞。 ...
...是一个被广泛报道和普遍相信的错误。我们解释它到底是什么。 破除关于世外桃源的神话 交换是一种将随机存取存储器(RAM)中的数据写入硬盘上的特殊位置(交换分区或交换文件)以释放RAM的技术。 Linux有一个称为交换值...
...(ISP)跟踪你浏览历史并**你所有数据的新闻。这意味着什么,你怎样才能最好地保护自己? 发生了什么 相关报道:什么是网络中立? 传统上,联邦贸易委员会(FTC)一直负责管理ISP。2015年初,联邦通信委员会(FCC)投票决定...
...在你的控制之下。 苹果还表示,它将使用一种称为“差异隐私”的技术来梳理用户的数据,同时保持匿名。这包括散列、子分段和噪声注入等技术来对自己的数据进行置乱。这使得理论上很难将信息追溯到单个用户,同时仍...
...正在使用“差异隐私”,而不是聚合匿名数据。这到底是什么意思? 其工作原理是通过给每个设备注入无意义的“噪音”或无意义的数据来随机分配本地数据,因此无法追溯到设备的用户。然后,这些信息在苹果服务器上与...