如果近年来众多技术丑闻教会了我们什么,那就是科技公司拥有关于我们所有人的真正可怕数据。除了感觉侵入性之外,这些数据在落入坏人手中时可能是完全危险的。
作为通用数据保护法规(GDPR)的一部分,欧洲对此风险的回应是“访问权”。权利表示,如果要求,任何公司都应该准备好向您提供您的个人数据。他们应该以一种易于您及时阅读的方式提供,并提供足够的背景信息,以便您了解他们如何获得以及如何使用它。我们的想法是,一旦您了解公司掌握的关于您的数据,您就可以使用它来做出有关是否要提供数据的明智决策,并在未经您同意的情况下收集数据时让他们负责。
问题是公司通常可能真的很吝啬实际提供这些数据。毕竟,如果您的服务基本上是“强制同意”(因为Google最近被罚款5000万欧元),那么您可能不希望您的用户轻松查看您收集的个人数据量。
我决定测试在欧盟运营的四家最大的科技公司提供的“访问权限”:苹果,亚马逊,Facebook和谷歌。我发现虽然你可以获得原始数据,但实际上理解它是另一回事,这使得更难以对数据做出明智的决策。
根据英国数据保护监管机构ICO,公司必须根据要求提供所有个人数据 - 定义为与已识别或可识别个人相关的任何数据。必须以“简明,透明,易懂和易于使用的形式,以”常用的电子格式“使用清晰明了的语言”向个人提供信息。这听起来很简单,但四个技术巨头中的每一个都是怎样的?做?
首先,我很容易下载我的数据。谷歌,Facebook和Apple的数据下载服务允许您选择要下载的数据,在各自的网站上很容易找到,数据可以快速到达。同时,不是将其作为在其网站上查找的简单选项,而是通过网站的“联系我们”页面查找隐藏在列表末尾的选项,而不是在您的所有亚马逊数据中获取单个链接。一旦我提出要求,就需要整整30天才能收到下载我的数据的链接(法规规定的限制)。
谷歌的位置跟踪数据特别难以理解
然而,实际上是时候看看我收到的数据了,事情变得一团糟。有些文件标注不明确,而其他文件则以格式存储,这些格式测试了“常用”的限制。实际上,我正在查看的数据并不像应该的那样简单。
谷歌的位置跟踪数据特别难以理解。该公司一直被批评跟踪Android用户,即使他们已经关闭了操作系统中的主要位置跟踪选项。七个欧洲国家的消费者群体向他们的数据安全监管机构提出了有关它的投诉,使用GDPR下载数据应该是一种检查服务没有使用这些技巧来收集比应有的更多数据的方法。这应该是像谷歌这样的公司持有帐户的手段。
但是当你真正查看数据时,这些信息很难查看和理解。我在谷歌的所有位置数据都包含在一个61MB的JSON文件中,用Chrome打开它会显示一系列标记为“timestampMs”,“latitudeE7”,“logitudeE7”的令人眼花缭乱的字段,并估计我是坐着还是坐着某种运输(我假设)。
我不怀疑这是Google与我的帐户关联的所有位置历史信息,但没有上下文,这些数据毫无意义。这是一系列数字,我必须认真努力,甚至开始理解并导入另一个软件来正确解析。如果GDPR的目的是让人们能够更好地控制和理解从中收集哪些数据,那么谷歌下载的这一部分几乎无法提供。如果您想将数据摄取到另一个系统中,JSON非常棒,但如果您想评估Google对您的数据量并做出明智的数据隐私决策,那么JSON就不那么有用了。
谷歌应该更多地努力解释这些数据是什么
当涉及到其他文件时,我甚至不清楚我最初在看什么数据。位于“广告”文件夹中的名为“我的活动”的4GB HTML文件可能会向我显示与Google收集的广告跟踪数据相关的内容,但此处没有注释或元数据来解释它。
到目前为止,这些是整个数据下载中最令人困惑的文件,它们也是最重要的。它们包含潜在广告客户可能会扼杀的各种个人信息,而Google应该更多地努力解释它们是什么。它已经提供了一个索引HTML文件来为您提供数据的概述,那么为什么不在那里包含有关每个文件内容的信息呢?
苹果公司在呈现数据方面表现得比谷歌好,尽管仍存在问题。不过,第一印象非常积极。Apple提供的大部分数据都是文件类型,易于阅读和理解,如CSV,TXT和JPG,只有几个JSON文件可以混淆。
但是一旦你进入这些文件,仍然有很多难以理解的信息。标题为“Apple ID帐户信息”的文件似乎包含11个与我的Apple帐户几乎完全相同的记录,这些记录都是在2014年完全相同的日期创建的,没有解释它们是什么。另一个标题为“应用和服务分析”的CSV文件似乎包含我的每一个App Store搜索的完整列表,但它有很多空单元格,我只注意到它有数据时我看到它6.7MB文件大小。
具有讽刺意味的是,FACEBOOK实际上拥有四种服务中最易理解的数据
尽管能够听取我所有的Alexa请求,但亚马逊在提供数据方面做得更好,尽管这可能只是因为它对我的影响相对较小。在大多数情况下,文件和文件夹都有明确的标签,尽管公司仍然需要做一些工作来更好地标记其电子表格的内容。
具有讽刺意味的是,Facebook实际上拥有四种服务中最易理解的数据。首先,Facebook为您提供的每个文件都是HTML文件。每个都被分类到它自己的清晰标记文件夹,索引文件为您提供每个文档包含的内容的概述。这些文件本身已经清晰地布局和格式化,浏览它们就像在Facebook上浏览页面一样,尽管它们完全存储在您的计算机本地。
看到Facebook存储在你身上的数据量仍然很可怕(而且甚至没有进入人们已经找到他们所有旧电话和短信的记录的情况),但至少你已经知道到底是什么这些信息是,而不是必须根据每个文件的内容进行猜测。
在我的实验结束时,在我联系的四项服务中,我只剩下138GB的数据。我有来自Facebook的1.1GB,来自亚马逊的392MB,以及来自Apple的254MB。虽然谷歌有大量72.5GB的数据供我下载,但这绝对包括我的Google Drive和Google Photos备份,分别为44.3和25.7GB。我的其余Google数据仅为2.5GB。
在试图筛选并理解这一切之后,很明显,如果这些公司想要让我们真正控制我们的数据,那么这些公司以及管理它们的GDPR法规还有很长的路要走。能够下载它是一回事,但使其有用意味着更加努力地确保下载的内容更容易让普通人理解。
至少,这意味着提供更好的索引来告诉您哪些数据包含在哪个文件中,但它也意味着以一种允许他们自己更好地理解的方式组织这些文件的内容。