(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 20221072623 6.8
(22)申请日 2022.06.24
(71)申请人 深圳微众信用科技股份有限公司
地址 518000 广东省深圳市南 山区粤海街
道深圳国际软件园一期 8栋202室
(72)发明人 练刚 欧阳张鹏 赵彦晖 耿心伟
曾源
(74)专利代理 机构 广州三环 专利商标代理有限
公司 44202
专利代理师 黄禹强
(51)Int.Cl.
G06F 21/62(2013.01)
(54)发明名称
数据处理方法、 装置及存 储介质
(57)摘要
本申请实施例公开了一种数据处理方法、 装
置及存储介质, 该方法包括: 获取K条征信数据, K
为正整数; 对所述K条征信数据中的每一条征信
数据进行关键字提取, 得到 K组关键字集; 根据所
述K组关键字集确定所述K条征信数据中的每一
条征信数据对应的关键字段, 得到K组关键字段
集每一关键字对应一个关键字段; 根据所述K组
关键字段集对所述K条征信数据进行脱敏处理,
得到脱敏处理后的K条征信数据。 采用本申请实
施例提升征信数据脱敏的智能性。
权利要求书2页 说明书11页 附图3页
CN 115168892 A
2022.10.11
CN 115168892 A
1.一种数据处 理方法, 其特 征在于, 所述方法包括:
获取K条征信数据, K为 正整数;
对所述K条征信数据中的每一条 征信数据进行关键 字提取, 得到K组关键 字集;
根据所述K组关键字集确定所述K条征信数据中的每一条征信数据对应的关键字段, 得
到K组关键 字段集每一关键 字对应一个关键 字段;
根据所述K组关键字段集对所述K条征信数据进行脱敏处理, 得到脱敏处理后的K条征
信数据。
2.根据权利要求1所述的方法, 其特征在于, 所述根据所述K组关键字段集对所述K条征
信数据进行脱敏处 理, 得到脱敏处 理后的K条征信数据, 包括:
根据预设脱敏词汇表格, 确定关键字段集i中需要进行脱敏的至少一个关键字段, 所述
关键字段集i为所述K组关键 字段集中的任一关键 字段集;
对所述至少一个关键 字段进行脱敏处 理, 得到脱敏处 理后的征信数据。
3.根据权利要求2所述的方法, 其特征在于, 所述对所述至少一个关键字段进行脱敏处
理, 得到脱敏处 理后的征信数据, 包括:
获取关键字段a对应的关键字的目标属性信 息, 所述关键字段a为所述至少一个关键字
段中的任一关键 字段;
确定与所述目标属性信息对应的目标脱敏处 理参数;
根据所述目标脱敏处理参数对所述关键字段a进行脱敏处理, 得到脱敏处理后的关键
字段a。
4.根据权利要求3所述的方法, 其特征在于, 所述确定与 所述目标属性信 息对应的目标
脱敏处理参数, 包括:
按照预设的属性信 息与脱敏处理参数之间的映射关系, 确定所述目标属性信 息对应的
参考脱敏处 理参数;
获取用户的目标身份等级;
确定与所述目标身份等级对应的目标调节参数;
根据所述目标调节参数调节所述 参考脱敏处 理参数, 得到所述目标脱敏处 理参数。
5.根据权利要求1所述的方法, 其特征在于, 所述根据所述K组关键字段集对所述K条征
信数据进行脱敏处 理, 得到脱敏处 理后的K条征信数据, 包括:
对所述K组关键 字段集进行分类, 得到P类关键 字段, P为 正整数;
确定所述P类关键 字段中每一类关键 字段的关键 字段数量, 得到P个关键 字段数量;
确定所述P个关键字段数量中关键字段数量大于预设阈值的目标关键字段数量, 获取
所述目标关键 字段数量对应的征信数据, 得到Q条 征信数据, Q 为小于或等于K的正整数;
对所述Q条征信数据进行在线脱敏处理, 以及对所述K条征信数据中除所述Q条征信数
据之外的征信数据进行离线 脱敏处理。
6.根据权利要求1所述的方法, 其特征在于, 所述根据所述K组关键字段集对所述K条征
信数据进行脱敏处 理, 得到脱敏处 理后的K条征信数据, 包括:
确定所述K条征信数据中包括预设关键字的征信数据, 得到X条征信数据, X为小于或等
于K的自然数;
根据所述K组关键字段集对所述X条征信数据进行在线脱敏处理, 以及对所述K条征信权 利 要 求 书 1/2 页
2
CN 115168892 A
2数据中除所述X条征信数据之外的其他征信数据进 行离线脱敏处理, 得到脱敏 处理后的K条
征信数据。
7.根据权利要求1 ‑6任一项所述的方法, 其特 征在于, 所述获取 K条征信数据, 包括:
获取目标用户的目标信用积分;
按照预设的信用积分与征信数据获取参数之间的映射关系, 确定所述目标信用积分对
应的目标 征信数据获取参数;
根据所述目标 征信数据获取参数获取 所述K条征信数据。
8.一种数据处理装置, 其特征在于, 所述装置包括: 获取单元、 提取单元、 确定单元和脱
敏单元, 其中,
所述获取 单元, 用于获取 K条征信数据, K为 正整数;
所述提取单元, 用于对所述K条征信数据中的每一条征信数据进行关键字提取, 得到K
组关键字集;
所述确定单元, 用于根据 所述K组关键字集确定所述K条征信数据中的每一条征信数据
对应的关键 字段, 得到K组关键 字段集每一关键 字对应一个关键 字段;
所述脱敏单元, 用于根据所述K组关键字段集对所述K条征信数据进行脱敏处理, 得到
脱敏处理后的K条征信数据。
9.一种电子设备, 其特征在于, 包括处理器、 存储器, 所述存储器用于存储一个或多个
程序, 并且被配置由所述处理器执行, 所述程序包括用于执行如权利要求 1‑7任一项所述的
方法中的步骤的指令 。
10.一种计算机可读存储介质, 其特征在于, 存储用于电子数据交换的计算机程序, 其
中, 所述计算机程序使得计算机执 行如权利要求1 ‑7任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 115168892 A
3
专利 数据处理方法、装置及存储介质
安全报告 >
其他 >
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-02-07 20:38:24上传分享