全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111679757.4 (22)申请日 2021.12.31 (71)申请人 中和农信项目管理有限公司 地址 100000 北京市怀柔区开 放路113号南 三层302室 (72)发明人 吴杨 向彪 赵占胜  (74)专利代理 机构 深圳中一联合知识产权代理 有限公司 4 4414 代理人 张良 (51)Int.Cl. G06K 9/62(2022.01) G06Q 40/02(2012.01) (54)发明名称 显著标签生成方法、 设备及存 储介质 (57)摘要 本发明公开了一种显著标签生 成方法、 设备 及存储介质, 包括: 获取目标业务场景下的样本 数据; 提取所述样本数据中的多个连续特征值, 采用特征分箱聚类模型对多个所述连续特征值 进行分箱处理, 得到多个所述连续特征值对应的 最优分箱策略, 以及, 所述连续特征值在最优分 箱策略下分箱得到的各个标签客群的重要度排 序结果; 根据所述重要度排序结果提取显著标 签。 本发明通过特征分箱聚类模型, 对连续特征 值进行迭代分箱操作, 得到连续特征值的最优分 箱策略, 同时客观量化分箱得到的标签客群的重 要程度, 提取显著标签, 能够为风控策略的生成 提供依据, 提高风控的效率与准确性。 权利要求书2页 说明书9页 附图3页 CN 114429178 A 2022.05.03 CN 114429178 A 1.一种显著标签生成方法, 其特 征在于, 所述方法包括: 获取目标业 务场景下的样本数据; 提取所述样本数据中的多个连续特 征值; 采用特征分箱聚类模型对多个所述连续特征值进行分箱 处理, 得到多个所述连续特征 值对应的最优分箱策略, 以及, 所述连续特征值在最优分箱策略下分箱得到的各个标签客 群的重要度排序结果; 根据所述重要度排序结果 提取显著标签。 2.根据权利要求1所述的风险标签处理方法, 其特征在于, 所述采用特征分箱聚类模型 对多个所述连续特 征值进行分箱处 理, 包括: 遍历每个所述连续特征值, 针对每个所述连续特征值, 进行N次模拟分箱, 在每次模拟 分箱中, 计算当前模拟分箱策略对应的差异分布 值; 根据N次模拟分箱的差异分布值确定该 连续特征值对应的最优分箱策略, 以及, 该连续特征值在所述最优分箱策略下分箱得到的 各个标签客群的重要度排序结果; 遍历结束后, 得到每个所述连续特征值对应的最优分箱策略, 以及, 标签客群的重要度 排序结果。 3.根据权利要求2所述的风险标签处理方法, 其特征在于, 在提取所述样本数据中的多 个连续特 征值之前, 所述方法还包括: 获取目标业务场景对应的风险模型, 利用所述风险模型对所述样本 数据进行 预测, 得到第一预测结果; 所述在每次模拟分箱中, 计算当前模拟分箱策略对应的差异分布值, 包括: 假设当前模拟分箱策略将连续特征值A分为M个标签客群, 对M个所述所述标签客群分 别进行掩码处理, 得到连续特征值A对应的M个掩码特征值; 利用M个掩码特征值分别替换所 述样本数据中的连续特 征值A, 得到 M个掩码样本; 利用所述风险模型对M个掩码样本进行预测, 得到M个掩码预测结果, 分别计算M个所述 掩码预测结果与所述第一预测结果的差异值, 根据M个所述掩码预测结果的差异值生成所 述当前模拟分箱策略对应的差异分布值。 4.根据权利要求3所述的风险标签处理方法, 其特征在于, 通过以下方法确定该连续特 征值在所述 最优分箱策略下分箱得到的各个标签客群的重要度排序结果, 包括: 获取该连续特征值在所述最优分箱策略下分箱得到的各个标签客群的差异值, 基于各 个标签客群的差异值, 进行由小到大的排序, 得到各个标签客群的重要度排序结果。 5.根据权利要求1 ‑4任一所述的风险标签处理方法, 其特征在于, 基于K ‑means算法建 立所述特 征分箱聚类模型。 6.根据权利要求1 ‑4任一所述的风险标签处理方法, 其特征在于, 所述获取目标业务场 景下的样本数据, 包括: 对目标业务场景下的用户进行用户画像, 基于原始用户画像数据生产 所述目标业务场 景下的样本数据。 7.根据权利要求6所述的风险标签处理方法, 其特征在于, 所述目标业务场景, 包括: 违 规违禁监测业 务场景、 投资理财 金融业务场景、 借贷业 务场景、 保险业 务场景。 8.一种显著标签生成装置, 其特 征在于, 所述装置包括:权 利 要 求 书 1/2 页 2 CN 114429178 A 2获取模块, 用于获取目标业 务场景下的样本数据; 解析模块, 用于提取 所述样本数据中的多个连续特 征值; 计算模块, 用于采用特征分箱聚类模型对多个所述连续特征值进行分箱处理, 得到多 个所述连续特征值对应的最优分箱策略, 以及, 所述连续特征值在最优分箱策略下分箱得 到的各个标签客群的重要度排序结果; 生成模块, 根据所述重要度排序结果 提取显著标签。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 一个或多个处 理器; 存储器, 用于存储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器 执行时, 使得 所述一个或多个处 理器实现如权利要求1 ‑7任一所述的显著标签生成方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被 处理器执行时实现如权利要求1 ‑7任一所述的显著标签生成方法。权 利 要 求 书 2/2 页 3 CN 114429178 A 3

.PDF文档 专利 显著标签生成方法、设备及存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 显著标签生成方法、设备及存储介质 第 1 页 专利 显著标签生成方法、设备及存储介质 第 2 页 专利 显著标签生成方法、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:45:24上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。