(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211109214.3 (22)申请日 2022.09.13 (71)申请人 中国银联股份有限公司 地址 200135 上海市浦东 新区含笑路36号 (72)发明人 胡晨 杨宏斌 王栩 邱晨力  白冰 商紫薇 鲍鹏  (74)专利代理 机构 北京东方亿 思知识产权代理 有限责任公司 1 1258 专利代理师 贺琳 (51)Int.Cl. G06F 21/64(2013.01) G06F 21/62(2013.01) G06K 9/62(2022.01) G06Q 10/06(2012.01) G06Q 40/04(2012.01) (54)发明名称 数据保护处 理方法、 装置、 设备及存 储介质 (57)摘要 本申请公开了一种数据保护处理方法、 装 置、 设备及存储介质, 属于 数据处理领域。 该方法 包括: 获取多笔真实业务的业务数据, 按照数据 类别中的数据域从业务数据中提取数据项; 基于 每笔真实业务对应的数据项, 得到初始数据域关 联性结果参数, 初始数据域关联性结果参数表征 业务数据中数据域之间的关联关系; 调用生成器 和判别器基于初始数据域关联性结果参数进行 数据处理迭代, 直至数据处理迭代满足迭代截止 条件, 将配置有判别器在最近一次数据处理迭代 中得到的数据域关联性结果参数的生成器生成 的合成数据选取为用于业务分析的分析基础数 据, 数据域 关联性结果参数表征输入判别器的数 据中的数据域之间的关系。 根据本申请实施例能 够提高数据安全性。 权利要求书2页 说明书13页 附图4页 CN 115391837 A 2022.11.25 CN 115391837 A 1.一种数据保护处 理方法, 其特 征在于, 包括: 获取多笔真实业务的业务数据, 按照数据类别中的数据域从所述业务数据中提取数据 项; 基于每笔真实业务对应的所述数据项, 得到初始数据域关联性结果参数, 所述初始数 据域关联性结果 参数用于表征 所述业务数据中数据域之间的关联关系; 调用生成器和判别器基于所述初始数据域关联性结果参数进行数据处理迭代, 直至数 据处理迭代满足迭代截止条件, 将配置有 所述判别器在最近一次数据处理迭代中得到的数 据域关联性结果参数的所述生成器生成的合成数据选取为用于业务分析的分析基础数据, 所述数据域关联性结果 参数用于表征输入判别器的数据中的数据域之间的关系。 2.根据权利要求1所述的方法, 其特 征在于, 第一次数据处 理迭代包括: 调用所述 生成器根据所述初始数据域关联性结果 参数输出 所述合成数据; 调用判别器根据输入的第一混合数据, 生成所述数据域关联性结果参数, 所述第一混 合数据包括所述 合成数据与多笔真实业 务的业务数据。 3.根据权利要求1所述的方法, 其特 征在于, 第i次数据处 理迭代, 包括: 调用所述生成器根据第i ‑1次数据处理迭代中得到的所述数据域关联性结果参数输出 所述合成数据; 调用判别器根据第 二混合数据生成所述数据域关联性结果参数, 所述第 二混合数据包 括第i次数据处理迭代得到的所述合成数据与第i ‑1次数据处理迭代得到的所述合 成数据, 其中, i为大于1的整数。 4.根据权利要求3所述的方法, 其特征在于, 所述调用判别器根据第 二混合数据生成所 述数据域关联性结果 参数, 包括: 调用所述判别器按照所述数据类别中的数据域从所述第二混合数据中提取 数据项; 调用所述判别器随机组合 提取出的数据项, 得到多个组合数据; 调用所述判别器 基于所述初始数据域关联性结果 参数, 对所述组合数据评分; 在所述组合数据的未满足评分截止条件的情况下, 调用所述判别器再次随机组合提取 出的数据项, 增加所述组合数据, 并对 所述组合数据评 分, 直至所述组合数据满足所述评分 截止条件, 调用所述判别器基于所述组合数据, 生成与所述组合数据中数据项对应的所述 数据域关联性结果 参数。 5.根据权利要求1或4所述的方法, 其特征在于, 所述数据类别包括以下一者或两者以 上: 布尔类型、 数字类型、 分类 类型、 连续字符类型。 6.根据权利要求5所述的方法, 其特 征在于, 还 包括: 在所述数据类别包括所述连续字符类型的情况下, 将所述业务数据或所述第 二混合数 据中属于所述连续字符类型的数据, 按照数据子类别中的数据域拆分, 得到数据项, 所述数 据子类别包括至少一个数据域, 其中, 所述数据子类别包括以下一 者或两者以上: 布尔类型、 数字类型、 分类 类型。 7.根据权利要求 4所述的方法, 其特 征在于, 在所述调用生成器和判别器基于所述初始数据域关联性结果参数进行数据处理迭代 之前, 还包括:权 利 要 求 书 1/2 页 2 CN 115391837 A 2获取业务分析的数据需求信息, 基于所述数据需求信息, 调节所述初始数据域关联性 结果参数, 使所述初始数据域关联性结果 参数趋向于所述数据需求信息表征的数据需求; 在所述调用所述判别器基于所述组合数据, 输出与所述组合数据中数据项对应的所述 数据域关联性结果 参数之后, 还 包括: 获取业务分析的所述数据需求信息, 基于所述数据需求信息, 调节所述数据域关联性 结果参数, 使所述数据域关联性结果 参数趋向于所述数据需求信息表征的数据需求。 8.根据权利要求1所述的方法, 其特 征在于, 所述迭代截止条件 包括: 数据处理迭代的次数达 到预设迭代次数; 和/或, 配置有所述判别器在最近一次数据处理迭代中得到的数据域关联性结果参数的所述 生成器生成的所述 合成数据的质量评估分数高于等于合格评估分数, 其中, 所述质量评估分数基于所述合成数据的统计指标参数、 似然指标参数、 检测指标 参数、 学习效能指标参数、 隐私 指标参数中的一项或两项以上 得到, 所述统计指标参数表征所述合成数据与 所述业务数据的统计特征的相似性, 所述似然 指标参数表征所述合成数据与所述业务数据的似然值, 所述检测指标参数表征所述合成数 据通过回归分类与所述业务数据为一类的可能性, 所述学习效能指标参数表征所述合成数 据作为所述分析基础数据用于业务分析的效果, 所述隐私指标参数表征基于所述合成数据 无法追溯得到真实数据的可能性。 9.根据权利要求 4所述的方法, 其特 征在于, 所述评分截止条件 包括: 评分大于等于目标分数的所述组合数据占所述组合数据的比例高于等于预设比例阈 值; 和/或, 所述组合数据的数量达 到目标数量。 10.一种数据保护处 理装置, 其特 征在于, 包括: 提取模块, 用于获取多笔真实业务的业务数据, 按照数据类别 中的数据域从所述业务 数据中提取 数据项; 计算模块, 用于基于每笔真实业务对应的所述数据项, 得到初始数据域关联性结果参 数, 所述初始数据域关联性结果 参数用于表征 所述业务数据中数据域之间的关联关系; 训练调用模块, 用于调用生成器和判别器基于所述初始数据域关联性结果参数进行数 据处理迭代, 直至数据 处理迭代满足迭代截止条件, 将配置有所述判别器在最近一次数据 处理迭代中得到的数据域关联性结果参数的所述生成器生成的合成数据选取为用于业务 分析的分析基础数据, 所述数据域关联性结果参数用于表征输入判别器的数据中的数据域 之间的关系。 11.一种电子设备, 其特 征在于, 包括: 处 理器以及存 储有计算机程序指令的存 储器; 所述处理器执行所述计算机程序指令时实现如权利要求1至9中任意一项所述的数据 保护处理方法。 12.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机 程序指令, 所述计算机程序指 令被处理器执行时实现如权利要求 1至9中任意一项 所述的数 据保护处 理方法。权 利 要 求 书 2/2 页 3 CN 115391837 A 3

.PDF文档 专利 数据保护处理方法、装置、设备及存储介质

安全报告 > 其他 > 文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据保护处理方法、装置、设备及存储介质 第 1 页 专利 数据保护处理方法、装置、设备及存储介质 第 2 页 专利 数据保护处理方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生2024-02-19 06:34:20上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。