全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111649878.4 (22)申请日 2021.12.3 0 (71)申请人 深圳前海微众 银行股份有限公司 地址 518052 广东省深圳市前海深港合作 区前湾一路1号A栋201室 申请人 香港科技大 学 (72)发明人 李林睿 李元 黎君 莫雪盈  韩海燕 陈雷  (74)专利代理 机构 北京派特恩知识产权代理有 限公司 1 1270 代理人 侯艳华 张颖玲 (51)Int.Cl. G06K 9/62(2022.01) G06Q 40/04(2012.01) (54)发明名称 一种数据处 理方法、 装置、 设备及存 储介质 (57)摘要 本申请公开了一种方法、 装置、 设备及存储 介质, 本申请的方案包括: 获得多个特征组以及 所述多个特征组中每个所述特征 组对应的标签; 所述特征组对应的标签用于表征所述客户是否 存在非法行为; 基于所述多个特征组以及每个所 述特征组对应的标签, 确定候选规则组合集; 基 于所述候选规则组合集, 确定目标规则组合集; 所述目标规则组合集包括P个候选规则组合; 基 于所述目标规则组合集生 成目标分类模 型; 所述 目标分类模型用于根据客户的特征组预测客户 是否存在非法行为, 并解释所述是否存在非法行 为的原因。 本申请的方案在预测客户是否具有非 法行为时, 既具有较高的准确性, 又具有可解释 性。 权利要求书2页 说明书25页 附图5页 CN 114386496 A 2022.04.22 CN 114386496 A 1.一种数据处 理方法, 其特 征在于, 所述方法包括: 获得多个特征组以及所述多个特征组中每个所述特征组对应的标签; 一个所述特征组 包括一个客户的M个特征; 所述特征 组对应的标签用于表征所述客户是否存在非法行为; 所 述M大于或等于2; 基于所述多个特征组以及每个所述特征组对应的标签, 确定候选规则组合集; 所述候 选规则组合集包括O个候选规则组合; 一个所述候选规则组合至少 包括: 标签、 N个特征; 一 个所述候选规则组合表示在客户的特征满足所述N个特征 的情况下, 确定所述客户存在所 述标签表征的行为; 所述O大于或等于2, 所述 N大于或等于2; 基于所述候选规则组合集, 确定目标规则组合集; 所述目标规则组合集包括P个候选规 则组合; 所述P小于或等于所述O; 基于所述目标规则组合集生成目标分类模型; 所述目标分类模型用于根据客户的特征 组预测客户是否存在非法行为, 并解释所述是否存在非法行为的原因。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述多个特征组以及每个所述特 征组对应的标签, 确定候选规则组合 集, 包括: 基于所述多个特征组以及每个所述特征组对应的标签, 得到Q个初始规则组合; 一个所 述初始规则组合至少包括第一特征、 第二特征以及标签; 所述第一特征和所述第二特征关 联; 所述初始规则组合表示在客户的特征满足所述第一特征和所述第二特征 的情况下, 确 定所述客户存在所述标签表征的行为; 所述 Q大于或等于所述O; 针对所述Q个初始规则组合中的每个所述初始规则组合, 计算所述初始规则组合的支 持度和置信度; 将所述Q个初始规则组合中, 支持度和置信度满足第一条件的初始规则组合确定为所 述候选规则组合。 3.根据权利要求1所述的方法, 其特征在于, 所述基于所述候选规则组合集, 确定目标 规则组合 集, 包括: 基于所述候选规则组合集确定至少一个第 一集合; 所述第 一集合为所述候选规则组合 集的子集; 获得目标函数集和目标权重集; 其中, 所述目标函数集包括至少一个目标函数, 所述目 标权重集包括与所述目标函数一 一对应的目标权 重; 基于所述目标函数集和所述目标权重集, 计算所述至少一个第 一集合中每个所述第 一 集合的第一数值; 所述第一数值用于表征 所述第一 集合满足要求的程度; 将所述至少一个第一 集合中, 第一数值 最大的第一 集合确定为所述目标规则组合 集。 4.根据权利要求3所述的方法, 其特征在于, 所目标函数集包括解释性函数; 所述解释 性函数包括下述至少一项: 第一子函数、 第二子函数、 第三子函数以及第四子函数; 所述第一子函数用于限定所述目标规则组合集中包括的目标规则组合的条数; 其中, 所述条数越小, 表征满足要求的程度越高; 所述第二子函数用于限定所述目标规则组合集中包括的每个目标规则的长度; 其中, 所述长度越小, 表征满足要求的程度越高; 所述第三子函数用于限定所述目标规则组合集中包括的规则组合之间同时命中的客 户数量; 其中, 所述 客户数量越小, 表征满足要求的程度越高;权 利 要 求 书 1/2 页 2 CN 114386496 A 2所述第四子函数用于限定所述目标规则组合集中包括的规则组合之间同时命中的规 则数量; 其中, 所述 规则数量越小, 表征满足要求的程度越高。 5.根据权利要求3所述的方法, 其特征在于, 所述目标函数集包括指标性函数; 所述指 标性函数包括下述至少一项: 第五子函数、 第六子函数、 以及第七子函数; 所述第五子函数用于限定所述目标分类模型的精确率; 其中, 所述精确率越大, 表征满 足要求的程度越高; 所述第六子函数用于限定所述目标分类模型的召回率; 其中, 所述召回率越小, 表征满 足要求的程度越高; 所述第七子函数用于限定所述目标分类模型的准确率; 其中, 所述准确率越大, 表征满 足要求的程度越高。 6.根据权利要求3所述的方法, 其特征在于, 所述目标函数集包括专家规则函数; 所述 专家规则函数包括下述至少一项: 第八子函数以及第九子函数; 所述第八子函数用于限定所述目标规则组合 集与专家规则集之间的第一相似度; 所述第九子函数用于限定所述目标规则组合集与专家规则集之间的第 二相似度; 所述 第二相似度与所述第一相似度不同。 7.根据权利要求3所述的方法, 其特 征在于, 获得 所述目标权 重集, 包括: 针对所述目标函数集, 配置多组初始权重集; 一组所述初始权重集包括与所述目标函 数一一对应的初始权 重; 针对所述多组初始权重集中的每组所述初始权重集, 生成一个初始分类模型, 得到多 个初始分类模型; 计算所述多个分类模型中每个所述初始分类模型的分数; 所述分数用于表征所述初始 分类模型的真实度; 将所述多个初始分类模型中, 分数最高的所述初始分类模型对应的一组所述初始权重 集, 作为所述目标权 重集。 8.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取第一 客户的特 征组; 所述第一 客户为任一 客户; 将所述第一客户的特征组输入至所述目标分类模型, 通过所述目标分类模型判断所述 第一客户的特 征组是否命中所述目标规则组合 集; 若命中所述目标规则组合集中的第 一规则组合, 则确定所述第 一客户存在所述第 一规 则组合对应的标签表征的行为, 且将所述第一 规则组合作为存在所述行为的解释原因。 9.一种电子设备, 包括存储器和 处理器, 所述存储器存储有可在处理器上运行的计算 机程序, 所述处 理器执行所述程序时实现权利要求1至8任一项所述的数据处 理方法。 10.一种存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被处理器执行 时, 实现权利要求1至8任一项所述的数据处 理方法。权 利 要 求 书 2/2 页 3 CN 114386496 A 3

.PDF文档 专利 一种数据处理方法、装置、设备及存储介质

文档预览
中文文档 33 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共33页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据处理方法、装置、设备及存储介质 第 1 页 专利 一种数据处理方法、装置、设备及存储介质 第 2 页 专利 一种数据处理方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 04:42:42上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。