发布时间:2025-10-15 18:10:46    次浏览
富士通实验室有限公司今天宣布,他们开发出了一项独特的新技术,能自动评估个人数据的隐私风险。 日本《个人信息保护法》修正案将于2017年生效,允许向第三方提供已经处理过的个人数据,以防止未经个人同意就进行特定个体的识别或可以向第三方提供去识别数据。在提供去识别数据之前,提供者必须首先确认它符合准则,而且要评估特定个人是否能够被识别出来的风险。如果是日本以外的数据,专家就需要花费许多天进行调查。这就是为什么富士通实验室要开发这项新技术,用于自动评估从个人数据中识别出特定个体的风险。这项技术使得数据能够被快速、安全地被多个组织共享,而且通过不同产业之间的合作,有望提升多个领域的产品和服务质量,以及社会问题的解决方案。有关技术细节已经在7月14-15日于日本山口县召开的日本计算机安全联盟信息处理协会的会议上宣布。开发背景日本《个人信息保护法》修正案将于2017年生效,允许未经个人同意就向第三方提供个人的去识别数据。随着组织内部解决社会问题和启动合作的增加,使得在不同的组织内安全利用数据成为可能,而且有望提升新产品和服务的质量。有很多的方法可以去识别,根据不同的领域和准则,有差异化的去识别方法。例如,如果《个人信息保护法》修正案的准则是关于医疗保健领域的,那么相关数据,如医疗机构的检查结果,将被去识别化并由研究机构或制药企业利用(图1)。为此,富士通实验室开发了名为“K-匿名化”的去识别技术,这项技术要求发布的数据中存在一定数量(至少为k)的在准标识符上不可区分的记录,不能判别出隐私信息所属的具体个体,从而保护了个人隐私。富士通实验室一直在推进这项研究,将该技术应用到医疗保健等领域。问题个人数据供应商必须对去识别化处理的风险有所准备,如对每一个行业来说,这些数据是否满足准则要求,或者去识别数据是否有侵犯隐私权的可能。对数据提供商来说评估具体个体是否有从去识别数据中被识别出来,以及将要采取什么样的措施,这并不容易,之前的评估和确认工作都是留给专家完成,但所需时间很难把握。有报告举了一个例子,日本以外的医疗机构在医学研究方面所用的去识别数据和过程,对它们评估所需的时间超过半年。因此,富士通实验室决定,为了加快具体个体被识别出来的风险评估速度,一项重要的工作是要分析,有哪些属性导致具体个体最容易被识别出来,然后应用相应的去识别方法。从多个属性的组合中识别出一个人是完全有可能的,(例如性别、电话号码、地址)(图2),计算易于识别个体的属性组合工作量非常大,在实际应用中搜索的时间成本很高,加大了这项工作的难度。 关于这项新开发的技术根据数据分布,富士通实验室已经开发了一种新技术,在现实情况中,来自动搜索那些最容易识别出具体个体的属性组合,以及对易于识别的因素进行量化。这将使数据供应商能够快速分析风险,并采取对策。新技术的特点如下:1.有效搜索易识别属性组合的技术富士通实验室开发了一项新技术,通过提取应当被评估的属性,优先选取易于识别个体的属性组合,有效分析个人隐私风险。这个系统的原理就是如果用少数的属性组合就能识别出个体,那么就没有必要进行多属性组合的数据分析,从而减少不必要的分析。例如,一个记录可能仅仅从年龄和职业两个属性就被识别出来,那么很自然地,年龄、职业和永久住址就更能识别出这个个体,因此后面这个属性组合在分析的时候就可以被忽略。通过这种方式,无需计算大量的属性组合,从而提高了分析效率。2. 量化易于识别的个人数据技术富士通实验室开发了搜索易于识别个体的数据属性组合的技术,并将数据属性组合根据识别个体的难易程度进行量化。我们就可以判断哪些属性在去识别方面应该被优先选择出来(图3右)。除了这项技术,富士通实验室还开发了一项技术,如果数据被泄露如何计算潜在的危害,以及确定遵守多种去识别化准则。随着这些技术的发展,用户可以评估隐私风险,并根据这些风险,进行适当的去识别化处理。影响现在利用这项技术,不到三分钟的时间内,可以自动评估10000人的风险数据,包含14个属性。这项技术在数据分布的基础上评估风险,所以它不需要定义属性值的权重。利用这项技术有助于更快,更安全地向第三方提供个人数据,不仅在医疗领域,而且在金融,地方政府,和其他领域都可以应用。这使得不同行业之间能够更安全地进行数据共享,有望提高服务和产品的质量,并通过不同行业的共同合作解决社会问题。富士通实验室计划在一个真实的环境中验证效果,并将其纳入到2017财年的实际实施中。