2019-02-18 07:00:03
美国人2010年人口普查数据中发现潜在的隐私失误

人口普查局的一个内部团队发现,2010年人数超过1亿美国人收集的基本个人信息可以从模糊的数据中重建,但有很多错误,一位顶级机构官员周六透露。

13800万人的年龄,性别,地点,种族和民族可能是脆弱的。然而,到目前为止,只有内部黑客团队发现这些细节存在可能的风险,并且没有任何外部团体已经抓住了将要保密72年的数据,首席科学家John Abowd在一次科学会议上说。

人口普查局现在正在废弃其旧的数据屏蔽技术,以获得Abowd声称的远远优于Google或Apple的最先进方法。

一些前机构负责人担心,由于特朗普政府试图增加一个备受争议的公民身份问题,潜在的隐私问题将增加人们对每10年一次的调查所回避或撒谎的担忧。

最高法院周五宣布将对该提议的问题作出裁决,该问题因政治问题而受到批评,未在该领域进行适当的测试。人口普查计数非常重要,有助于众议院分配席位和分配数十亿美元的联邦资金。

人口普查数据中的80亿条统计数据应该以某种方式混乱,因此公开发布的研究报告不能识别个人超过七十年。根据杜克大学统计学教授Jerome Reiter的说法,2010年,人口普查局通过将类似的家庭信息从一个城市转换到另一个城市来做到这一点。

在内部测试中,Abowd说,官方能够将回答2010年人口普查的45%的人与Facebook等公共和商业数据集中的信息进行匹配。但是这种技术的错误意味着只有5200万人的数据才是完全正确的 - 仅仅超过美国人口的六分之一。

他说2010年的人口普查使用了最好的隐私保护措施,但从那以后,黑客在重建数据方面变得更加熟练。 Abowd说,为了应对他们日益增长的能力,该机构已经彻底改变了2020年的系统,并将提供隐私的“黄金标准”,无论公民身份问题的命运如何。

人们“想知道统计表不会回来并困扰他们,”Abowd在美国科学促进会年会上说。 “我向美国人民保证,他们将拥有他们应得的隐私。”

2010年人口普查的负责人乔治敦大学教务长罗伯特格罗夫斯说,伯爵有适当的隐私,每次人口普查都有所改善。他称赞了新的步骤。

哥伦比亚大学(Columbia University)政策学教授肯尼斯·普瑞维特(Kenneth Prewitt)表示,即使公开披露,年龄和种族等基本信息并不像其他数据泄露那样大。

“存在一种广泛的隐私焦虑,与Facebook和谷歌等有很大关系,”Prewitt说。 “我更担心的是,我的iPhone每天都会跟着我。”

在一份声明中,苹果公司的弗雷德·塞恩斯(Fred Sainz)对这样的隐私问题提出了质疑:“iPhone不会整天关注你 - 苹果公司不知道你在哪里也不关心。而苹果公司并不向公司出售信息。”然而,他指出,消费者可以选择了解其位置的应用。

Abowd说:“2020年的人口普查将是最安全,最受保护的。而且这并不像听起来那么容易。”

杜克大学计算机科学教授Ashwin Machanavajjhala表示,新系统涉及复杂的数学算法,将“噪音”注入数据,使得获取准确信息变得更加困难,并提供“非常有力的隐私保障”。

这会增加隐私,同时降低使用统计数据的研究人员的准确性。可以把它想象成一组旋钮被拨打,而第二组同时被拨下来。

关于2020年官方隐私/准确性设定的决定尚未确定。 Abowd说,政策官员,而不是工程师或科学家,将会这样做。

人口普查局在2018年的一项调查中使用超严格的隐私设置对该系统进行了尝试,该设置虽然与谷歌或苹果不具有直接可比性,但与使用谷歌搜索的数据相比,隐私安全数百甚至数千倍甚至数千倍。 Chrome或Apple的iPhone,Duke的Reiter说。

Prewitt建议公众可能不了解2020年计划中正在进行的额外努力,但会因隐私漏洞的披露而受到惊吓,使人们更不愿意遵守下一次人口普查。

如果政府成功地增加了公民身份问题,“将会有大规模的逃避(人口普查)和一些选择性滥用公民身份的问题,”普瑞维特说。

Prewitt说,是否有人因为它或谎言而避免调查,也不是一个好结果,使得数据不太可用。

格罗夫斯说,技术专家对公民身份问题存在严重问题,因为它尚未在现场进行测试,因为所有人口普查问题通常都是如此。他将其与在进行必要测试之前将新药投放市场进行了比较。

“人口普查等非常微妙的措辞和位置变化可以产生超出我们人类预测的巨大影响,”格罗夫斯说。

猜您喜欢的其它内容