(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221072623 6.8 (22)申请日 2022.06.24 (71)申请人 深圳微众信用科技股份有限公司 地址 518000 广东省深圳市南 山区粤海街 道深圳国际软件园一期 8栋202室 (72)发明人 练刚 欧阳张鹏  赵彦晖 耿心伟  曾源  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 黄禹强 (51)Int.Cl. G06F 21/62(2013.01) (54)发明名称 数据处理方法、 装置及存 储介质 (57)摘要 本申请实施例公开了一种数据处理方法、 装 置及存储介质, 该方法包括: 获取K条征信数据, K 为正整数; 对所述K条征信数据中的每一条征信 数据进行关键字提取, 得到 K组关键字集; 根据所 述K组关键字集确定所述K条征信数据中的每一 条征信数据对应的关键字段, 得到K组关键字段 集每一关键字对应一个关键字段; 根据所述K组 关键字段集对所述K条征信数据进行脱敏处理, 得到脱敏处理后的K条征信数据。 采用本申请实 施例提升征信数据脱敏的智能性。 权利要求书2页 说明书11页 附图3页 CN 115168892 A 2022.10.11 CN 115168892 A 1.一种数据处 理方法, 其特 征在于, 所述方法包括: 获取K条征信数据, K为 正整数; 对所述K条征信数据中的每一条 征信数据进行关键 字提取, 得到K组关键 字集; 根据所述K组关键字集确定所述K条征信数据中的每一条征信数据对应的关键字段, 得 到K组关键 字段集每一关键 字对应一个关键 字段; 根据所述K组关键字段集对所述K条征信数据进行脱敏处理, 得到脱敏处理后的K条征 信数据。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述K组关键字段集对所述K条征 信数据进行脱敏处 理, 得到脱敏处 理后的K条征信数据, 包括: 根据预设脱敏词汇表格, 确定关键字段集i中需要进行脱敏的至少一个关键字段, 所述 关键字段集i为所述K组关键 字段集中的任一关键 字段集; 对所述至少一个关键 字段进行脱敏处 理, 得到脱敏处 理后的征信数据。 3.根据权利要求2所述的方法, 其特征在于, 所述对所述至少一个关键字段进行脱敏处 理, 得到脱敏处 理后的征信数据, 包括: 获取关键字段a对应的关键字的目标属性信 息, 所述关键字段a为所述至少一个关键字 段中的任一关键 字段; 确定与所述目标属性信息对应的目标脱敏处 理参数; 根据所述目标脱敏处理参数对所述关键字段a进行脱敏处理, 得到脱敏处理后的关键 字段a。 4.根据权利要求3所述的方法, 其特征在于, 所述确定与 所述目标属性信 息对应的目标 脱敏处理参数, 包括: 按照预设的属性信 息与脱敏处理参数之间的映射关系, 确定所述目标属性信 息对应的 参考脱敏处 理参数; 获取用户的目标身份等级; 确定与所述目标身份等级对应的目标调节参数; 根据所述目标调节参数调节所述 参考脱敏处 理参数, 得到所述目标脱敏处 理参数。 5.根据权利要求1所述的方法, 其特征在于, 所述根据所述K组关键字段集对所述K条征 信数据进行脱敏处 理, 得到脱敏处 理后的K条征信数据, 包括: 对所述K组关键 字段集进行分类, 得到P类关键 字段, P为 正整数; 确定所述P类关键 字段中每一类关键 字段的关键 字段数量, 得到P个关键 字段数量; 确定所述P个关键字段数量中关键字段数量大于预设阈值的目标关键字段数量, 获取 所述目标关键 字段数量对应的征信数据, 得到Q条 征信数据, Q 为小于或等于K的正整数; 对所述Q条征信数据进行在线脱敏处理, 以及对所述K条征信数据中除所述Q条征信数 据之外的征信数据进行离线 脱敏处理。 6.根据权利要求1所述的方法, 其特征在于, 所述根据所述K组关键字段集对所述K条征 信数据进行脱敏处 理, 得到脱敏处 理后的K条征信数据, 包括: 确定所述K条征信数据中包括预设关键字的征信数据, 得到X条征信数据, X为小于或等 于K的自然数; 根据所述K组关键字段集对所述X条征信数据进行在线脱敏处理, 以及对所述K条征信权 利 要 求 书 1/2 页 2 CN 115168892 A 2数据中除所述X条征信数据之外的其他征信数据进 行离线脱敏处理, 得到脱敏 处理后的K条 征信数据。 7.根据权利要求1 ‑6任一项所述的方法, 其特 征在于, 所述获取 K条征信数据, 包括: 获取目标用户的目标信用积分; 按照预设的信用积分与征信数据获取参数之间的映射关系, 确定所述目标信用积分对 应的目标 征信数据获取参数; 根据所述目标 征信数据获取参数获取 所述K条征信数据。 8.一种数据处理装置, 其特征在于, 所述装置包括: 获取单元、 提取单元、 确定单元和脱 敏单元, 其中, 所述获取 单元, 用于获取 K条征信数据, K为 正整数; 所述提取单元, 用于对所述K条征信数据中的每一条征信数据进行关键字提取, 得到K 组关键字集; 所述确定单元, 用于根据 所述K组关键字集确定所述K条征信数据中的每一条征信数据 对应的关键 字段, 得到K组关键 字段集每一关键 字对应一个关键 字段; 所述脱敏单元, 用于根据所述K组关键字段集对所述K条征信数据进行脱敏处理, 得到 脱敏处理后的K条征信数据。 9.一种电子设备, 其特征在于, 包括处理器、 存储器, 所述存储器用于存储一个或多个 程序, 并且被配置由所述处理器执行, 所述程序包括用于执行如权利要求 1‑7任一项所述的 方法中的步骤的指令 。 10.一种计算机可读存储介质, 其特征在于, 存储用于电子数据交换的计算机程序, 其 中, 所述计算机程序使得计算机执 行如权利要求1 ‑7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115168892 A 3

.PDF文档 专利 数据处理方法、装置及存储介质

安全报告 > 其他 > 文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理方法、装置及存储介质 第 1 页 专利 数据处理方法、装置及存储介质 第 2 页 专利 数据处理方法、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生2024-02-07 20:38:24上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。