(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210582387.0
(22)申请日 2022.05.26
(71)申请人 方盈金泰科技 (北京) 有限公司
地址 102300 北京市门头沟区石龙西路58
号永定镇政 府办公楼YD169
(72)发明人 王靖午
(74)专利代理 机构 北京棘龙知识产权代理有限
公司 11740
专利代理师 张庆龙
(51)Int.Cl.
G06F 16/22(2019.01)
G06F 16/242(2019.01)
G06F 16/28(2019.01)
G06F 21/62(2013.01)
(54)发明名称
一种支持多用户视图的Hive动态脱敏 方法
(57)摘要
一种支持多用户视图的Hive动态脱敏方法
包括: 基于已有数据表和数据列为不同的用户分
别创建视图, 对视图创建语句中的子语句应用
udf函数; 截获多个数据访问请求者的Hive视图
访问请求并创建多个会话; 每个会话均调用udf
函数, 解析数据访问请求者的用户名和访问的目
标数据; 判断访问的目标数据中是否包含敏感字
段; 若包含则为访问的目标数据进行脱敏并将脱
敏后的数据发送给访问请求者; 若不包含则将原
数据发送给数据访问请求者。 本发 明的方法支持
多个用户同时访问Hive视图, 通过多线 程并发执
行匹配脱敏策略, 提高脱敏效率, 数据访问请求
者获得的数据为脱敏后的数据, 但Hive数据库中
只保存原始数据, 实现了对数据的实时动态脱
敏, 确保返回数据可用而 且安全。
权利要求书1页 说明书3页 附图1页
CN 114996269 A
2022.09.02
CN 114996269 A
1.一种支持多用户视图的Hive动态脱敏 方法, 其特 征在于, 所述方法包括:
基于已有数据表和数据列为不同的用户分别创建视图, 并对视图创建语句中的子语句
应用udf函数;
截获多个数据访问请求者的Hive视图访问请求并创建多个会话, 其中, 会话的个数与
数据访问请求 者的个数相同;
每个会话均调用udf函数, udf函数调用Current_user()接口解析所述数据访问请求者
的用户名和访问的目标 数据, 所述目标 数据中包括表信息及列信息;
根据脱敏策略判断所述数据访问请求者访问的目标数据中是否包含敏感字段; 若包
含, 为所述数据访问请求者访问的目标数据进行脱敏, 并将脱敏后的目标数据发送给所述
数据访问请求 者; 若不包 含, 将原目标 数据发送给 所述数据访问请求 者。
2.如权利要求1所述的一种支持多用户视图的Hive动态脱敏方法, 其特征在于, 多个数
据访问请求 者同时访问视图时, 多 线程并发执 行脱敏。
3.如权利要求1所述的一种支持多用户视图的Hive动态脱敏方法, 其特征在于, 所述脱
敏策略包含数据访问请求者的用户名、 需脱敏的表信息、 列信息及为数据表中每列数据预
置的脱敏算法; 通过读取脱敏策略判断数据访问请求者访问的目标数据是否包含敏感字段
的具体方法为: 判断数据访问请求者的用户名及数据访问请求者访问的目标数据是否包含
在脱敏策略中预置的数据访问请求者的用户名、 需脱 敏的表信息及列信息中, 若包含, 则根
据预置的脱敏算法为数据访问请求者访问的目标数据进行脱敏, 若不包含, 则不执行脱敏
操作。
4.如权利要求1所述的一种支持多用户视图的Hive动态脱敏方法, 其特征在于, 所述视
图创建语句中的子语句为select查询语句。
5.如权利要2所述的一种支持多用户视图的Hive动态脱敏方法, 其特征在于, 多线程并
发执行脱敏策略的具体方法为: 将总量为M的数据访问请求者分为N组, 每个线程为M/N个的
数据访问请求 者执行脱敏策略。
6.如权利要求3所述一种支持多用户视图的Hive动态脱敏方法, 其特征在于, 所述为数
据表中每列数据预置的脱敏算法包括: K ‑匿名算法、 屏 蔽算法、 替换算法、 L ‑多样算法和 差
分隐私算法。权 利 要 求 书 1/1 页
2
CN 114996269 A
2一种支持多用户视图的Hi ve动态脱敏方 法
技术领域:
[0001]本发明涉及信息安全技术领域, 具体涉及一种支持多用户视图的Hive动 态脱敏方
法。
背景技术:
[0002]随着大数据时代的到来, 基于Hadoop平台的数据仓库工具Hive得到广泛应用, 存
储在Hive中的数据资源中往往包含着大量的敏感信息, 因而如何保护敏感数据不被泄露是
现如今亟需解决的难题。 现有的数据脱敏技术一般采用专门的脱敏算法对敏感数据进 行变
形、 屏蔽、 替换、 随机化、 加密, 将敏感数据转化为虚构数据, 隐藏了 真正的隐私信息, 为数据
的安全使用提供了基础保障。 动态脱敏适用于不脱离生产环境, 对敏感数据的查询和调用
结果进行实时脱敏。 动态脱敏能够对生产库返回的数据进行实时脱敏处理, 确保返回数据
可用而安全。 然而Hive视图虽然具有简化用户操作, 将表与表之间的复杂的操作连接和搜
索条件对用户不可见, 增加 一定的数据安全性的作用, 但缺少对查询后的数据防护。 同时,
目前的方法及系统无法解决如下问题: 当前的动态脱敏方法一般是将语句中的敏感字段进
行替换, 从而产生新的sql语句, 但是针对涉及多个表的复杂Hive视图语句不能进行脱敏;
并且动态脱敏 涉及多用户访问, 当多个用户执 行视图查询操作, 不能并发进行脱敏处 理。
发明内容:
[0003]针对以上问题, 本发明设计了一种支持多用户视图的Hive动 态脱敏方法可实现多
个用户访问不同的视图的脱 敏, 即对Hiv e视图查询语句中的子语句应用udf函数(Hiv e自定
义函数), 使得不同的用户访问视图数据能够显示 不同的脱敏效果。
[0004]一种支持多用户视图的Hive动态脱敏 方法包括:
[0005]基于已有数据表和数据列为不同的用户分别创建视图, 并对视图创建语句中的子
语句应用udf函数;
[0006]截获多个数据访问请求者的Hive视图访问请求并创建多个会话, 其中, 会话的个
数与数据访问请求 者的个数相同;
[0007]每个会话均调用udf函数, udf函数调用Current_user()接口解析所述数据访问请
求者的用户名和访问的目标 数据, 所述目标 数据中包括表信息及列信息;
[0008]根据脱敏策略判断所述数据访问请求者访问的目标数据是否包含敏感字段, 一般
的, 所述敏感字段为为手机号、 身份证号等涉及用户个人敏感信息的字段; 若包含, 为所述
数据访问请求者访问的目标数据进行脱敏, 并将脱敏后的目标数据发送 给所述数据访问请
求者; 若不包含, 将所述目标数据发送给所述数据访问请求者; 数据访问请求者进 行Hive视
图访问后获得的数据为脱敏后的数据, 但Hive数据库中保存的数据仍为原始数据, 实现了
对数据的实时动态脱敏, 确保了返回数据可用而且安全。
[0009]优选的, 多个数据访问请求者同时访问视图时, 多线程并发执行脱敏, 通过多线程
并发脱敏操作, 极大程度提升 了数据脱敏的效率。说 明 书 1/3 页
3
CN 114996269 A
3
专利 一种支持多用户视图的Hive动态脱敏方法
安全报告 >
其他 >
文档预览
中文文档
6 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-02-07 20:39:00上传分享