首页 >常见问题 > 正文

什么是大数据脱敏?

原创2020-06-12 09:45:0501741

什么是大数据脱敏?

大数据脱敏,又称数据漂白、数据去隐私化或数据变形,是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护,从而在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集。

隐私数据脱敏技术

通常在大数据平台中,数据以结构化的格式存储,每个表有诸多行组成,每行数据有诸多列组成。根据列的数据属性,数据列通常可以分为以下几种类型:

  • 可确切定位某个人的列,称为可识别列,如身份证号,地址以及姓名等。

  • 单列并不能定位个人,但是多列信息可用来潜在的识别某个人,这些列被称为半识别列,如邮编号,生日及性别等。美国的一份研究论文称,仅使用邮编号,生日和性别信息即可识别87%的美国人。

  • 包含用户敏感信息的列,如交易数额,疾病以及收入等。

  • 其他不包含用户敏感信息的列。

隐私数据泄露类型

隐私数据泄露可以分为多种类型,根据不同的类型,通常可以采用不同的隐私数据泄露风险模型来衡量防止隐私数据泄露的风险,以及对应不同的数据脱敏算法对数据进行脱敏。一般来说,隐私数据泄露类型包括:

个人标识泄露。当数据使用人员通过任何方式确认数据表中某条数据属于某个人时,称为个人标识泄露。个人标识泄露最为严重,因为一旦发生个人标识泄露,数据使用人员就可以得到具体个人的敏感信息。

属性泄露,当数据使用人员根据其访问的数据表了解到某个人新的属性信息时,称为属性泄露。个人标识泄露肯定会导致属性泄露,但属性泄露也有可能单独发生。

成员关系泄露。当数据使用人员可以确认某个人的数据存在于数据表中时,称为成员关系泄露。成员关系泄露相对风险较小,个人标识泄露与属性泄露肯定意味着成员关系泄露,但成员关系泄露也有可能单独发生。

推荐教程:《PHP

以上就是什么是大数据脱敏?的详细内容,更多请关注php中文网其它相关文章!

php中文网最新课程二维码

声明:本文原创发布php中文网,转载请注明出处,感谢您的尊重!如有疑问,请联系admin@php.cn处理

  • 相关标签:php 大数据
  • 相关文章

    相关视频


    网友评论

    文明上网理性发言,请遵守 新闻评论服务协议

    我要评论
  • 专题推荐

    推荐视频教程
  • 布尔教育燕十八PHP基础巩固视频教程布尔教育燕十八PHP基础巩固视频教程
  • 韩顺平 2016年 最新PHP基础视频教程韩顺平 2016年 最新PHP基础视频教程
  • 韩顺平 2016年 PHP基础加强视频教程韩顺平 2016年 PHP基础加强视频教程
  • 云知梦PHP基础项目实战视频教程云知梦PHP基础项目实战视频教程
  • 泰牛:2017最新PHP基础视频教程泰牛:2017最新PHP基础视频教程
  • 视频教程分类