下载此文档

大数据隐私保护技术之脱敏技术.doc


文档分类:IT计算机 | 页数:约5页 举报非法文档有奖
1/5
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/5 下载此文档
文档列表 文档介绍
-
. z
大数据隐私保护技术之脱敏技术
数据平安是信息平安的重要一环。当前,对数据平安的防护手段包括对称/非对称加密、产环境中移除看起来很容易,但是在很多方面还是很有挑战的。
首先遇到的问题就是如何识别敏感数据,敏感数据的定义是什么"有哪些依赖"应用程序是十分复杂并且完整的。知道敏感信息在哪并且知道哪些数据参考了这些敏感数据是非常困难的。
敏感信息字段的名称、敏感级别、字段类型、字段长度、赋值规等容在这一过程中明确,用于下面脱敏策略制定的依据。
一旦敏感信息被确认,在保持应用程序完整性的同时进展脱敏的方法就是最重要的了。简单地修改数值可能会中断正在测试,开发或升级的应用程序。例如遮挡客户地址的一局部,可能会使应用程序变得不可用,开发或测试变得不可靠。
脱敏的过程就是一个在平安性和可用性之间平衡的过程。平安性是0%的系统中,数据不需要进展脱敏,数据库中都是原来的数据,可用性当然是100%;平安性是100%的系统中,大概所有的数据全都存一个一样的常量才能实现。
所以需要选择或设计一种既能满足第三方的要求,又能保证平安性的算法就变得特别重要了。
-
. z
选定了敏感数据和要施加的算法,剩下的就是如何实现了,在什么过程中进展脱敏呢"
难题的解决方案

现在有两种方式来识别敏感数据。第一种是通过人工指定,比方通过正则来指定敏感数据的格式,Oracle公司开发的Oracle Data Masking Pack中就使用了这一种方法来指定。
第二种方式就是自动识别了,在文献[2]中,作者给出了基于数据特征学****以及自然语言处理等技术进展敏感数据识别的自动识别方案(没有具体的实现,只提出了模型)。
具体的实现在gayhub上找了一个java实现的工程,chlorine-finder,看了下源码具体原理是通过提前预置的规则来识别一些常见的敏感数据,比方信用卡号,SSN,手机号,电子,IP地址,住址等.

在比拟常见的数据脱敏系统中,算法的选择一般是通过手工指定,像Oracal的数据脱敏包中就预设了关于信用卡的数据选择什么算法进展处理,关于的数据怎么处理,用户也可以进展自定义的配置。
脱敏方法现在有很多种,比方k-匿名,L多样性,数据抑制,数据扰动,差分隐私等。
k-匿名:
匿名化原则是为了解决攻击所造成的隐私泄露问题而提出的。攻击是这样的,一般企业因为*些原因公开的数据都会进展简单的处理,比方删除这一列,但是如果攻击者通过对发布的数据和其他渠道获得的信息进展操作,就可以推理出隐私数据。
-
. z
k-匿名是数据发布时保护私有信息的一种重要方法。 k-匿名技术是1998 年由Samarati和Sweeney提出的 ,它要求发布的数据中存在至少为k的在准标识符上不可区分的记录,使攻击者不能判别出隐私信息所属的具体个体,从而保护了个人隐私, k

大数据隐私保护技术之脱敏技术 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数5
  • 收藏数0 收藏
  • 顶次数0
  • 上传人1006108867
  • 文件大小25 KB
  • 时间2022-01-25