什么是化名?

假名化是指用参考资料或假名代替可识别的个人的过程。该过程允许组织共享数据,同时保护数据所描述的客户、员工和其他个人的隐私。

化名过程是可逆的。假名指向原始数据集,这意味着有权访问引用表的人可以将每个记录与指定的个人匹配。因此,企业必须在安全的环境中存储假名表。

化名是如何起作用的?

要理解化名,首先必须理解个人数据的构成。

有些例子是显而易见的:姓名、地址、出生日期都与一个特定的人有关。其他的可能就不那么明显了——如果一个大楼管理员跟踪每个人的进出时间,数据中的模式能揭示出主体的身份吗?

欧盟的一般资料保障规例(GDPR)对个人数据的定义如下:

“个人数据”系指与已识别或可识别的自然人(“数据主体”)有关的任何信息;可识别自然人是指可以直接或间接地通过引用一个标识符,例如姓名、识别号码、位置数据、在线标识符,或引用该自然人的身体、生理、基因、精神、经济、文化或社会身份的一个或多个特定因素来识别的人。”

从本质上说,个人数据是任何可以帮助识别特定个人的东西。

假设一家公司的销售数据库记录如下:

名字总| | |地址订单交货日期  --------|----------------|---- ---------|--------------- 亚伦大圣| 1381 | 8371 .98 | 08/01/2020 B巴尔| 56小镇| $ 13938 .22 | | 08/02/2020 C科尔山坡庄园| 9454 .99美元| 07/29/2020

前两个字段显然是个人数据,因为它们标识了特定的数据主体。该组织将需要考虑是否有人可以使用剩余字段来识别主题。如果没有,组织可以处理这部分数据,而不必担心数据保护问题。

这样做意味着将个人数据与非个人数据分离。该组织通过创建两个新表来实现这一点。首先,一个包含个人化名的查找表:

PID | NAME | ADDRESS -----|---------|-------------- 1001 | A Aaron | 1381 Big St 1002 | B Barr | 56 Smalltown 1003 | C Cole | Hillside Manor

这些id允许组织对他们的数据进行匿名,如下所示:

PID总| |订单交货日期  -----|-------------|------------------ 1002 | 1001 | 8371 .98 | 08/01/2020 13938 .22 | 08/02/2020 1003 | 9454 .99美元| 07/29/2020

匿名表格不包含个人数据,这意味着该组织可以自由地与第三方共享,或在没有个人同意的情况下跨司法管辖区转移数据。

如果组织以后需要重建原始数据,它可以将引用表与化名数据结合起来。因此,与其他形式的数据屏蔽不同,匿名化过程是可逆的。

什么时候使用化名?

化名是两种去识别个人数据的方法之一:

  • Pseudonymization:标识符或令牌替换敏感值的可逆过程。
  • 匿名化:永久隐藏敏感值的不可逆过程。这可能涉及到以下几个方面数据屏蔽诸如空格字段、置乱值或用随机生成的值替换字段等技术。

在不需要重新识别数据的情况下,匿名化是最好的。例如,软件测试需要生产数据的代表性版本。万博max手机网页登录组织可以匿名化他们的实时数据,并将其提供给测试人员。

伪名化适用于数据所有者预计他们将来需要重新识别数据的场景。例如,当公司需要将数据传递给第三方进行额外处理时。他们向服务提供者发送匿名版本,然后由该第三方执行必要的操作。当数据所有者获得他们处理过的数据时,他们可以使用引用表来重建完整的数据集。

大多数公司发现,他们必须使用化名来遵守特定的数据隐私法。GDPR和HIPAA是两部对化名进行立法的法律。

一般资料保护规例(GDPR)

GDPR是一项具有全球影响的欧盟法律。处理欧盟公民个人数据的公司必须遵守GDPR,否则将面临制裁,即使它们不在欧盟进行贸易。

GDPR允许使用化名,它定义为“在不使用附加信息的情况下,只要这些附加信息是单独保存的,并受技术和组织措施的约束,以确保不归属于已识别或可识别的个人,就不能再将数据归属于特定数据主体的处理个人数据。”

组织可以自由使用化名,只要他们确保不与组织外部共享参考表。

《健康保险携带与责任法案》

HIPAA适用于处理患者数据的美国医疗保健组织。这项法律确保了患者隐私方面的某些标准,包括对化名的规定。

HIPAA的文本指的是这种数据模糊de-identification。去识别有两种方法:一种是使用统计方法的专家确定方法,另一种是需要删除18个特定标识符的安全港。这些标识符是:r

  • 的名字
  • 地址
  • 电话号码
  • 与个人有关的日期,如出生或死亡的日期
  • 车辆识别
  • 传真号
  • 设备标识符
  • 电子邮件地址
  • url
  • 社会保险号
  • IP地址
  • 医疗记录编号
  • 生物标识符
  • 健康计划受益人编号
  • 可识别的照片
  • 账号
  • 其他唯一识别号码
  • 证书或许可证号码

根据HIPAA,覆盖实体可以用代码或标识符替换这些值。使用假名有两个规则:

  • 代码或标识符不能从底层数据派生。例如,你不能使用某人名字的变位词作为他们的笔名。
  • 该实体不得与任何其他方共享其重新识别方法。这意味着笔名查找表本身被视为个人信息。

术语汇编

数据集成技术的命名法指南。

Baidu
map