全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111547826.6 (22)申请日 2021.12.16 (71)申请人 上海冰鉴信息科技有限公司 地址 200000 上海市浦东 新区自由贸易试 验区商城路618号四层B207室 (72)发明人 顾凌云 周轩 王妍 乔韵如  (74)专利代理 机构 成都顶峰专利事务所(普通 合伙) 51224 代理人 陈秋霞 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06Q 40/02(2012.01) G06K 9/62(2022.01) (54)发明名称 用户风险预测模 型处理方法、 装置及电子设 备 (57)摘要 本申请提供一种用户风险预测模型处理方 法、 装置及电子设备, 通过训练至少三种预测模 型对未通过审批的用户样本进行分类预测, 以获 得对应的样 本标签, 并根据预测获得样本标签对 未通过审 批的用户样本进行扩充, 然后使用通过 审批的用户样本和未通过审批的用户样本一起 训练用户风险预测模型。 如此, 可 以使用户风险 预测模型在训练时使用的用户样本和实际使用 时的处理的用户样本分布一致, 从而提高所述用 户风险预测模型的预测准确性。 权利要求书3页 说明书10页 附图3页 CN 114239964 A 2022.03.25 CN 114239964 A 1.一种用户风险预测模型处 理方法, 其特 征在于, 所述方法包括: 获取多个通过审批的第 一样本和未通过审批的第 二样本, 所述第 一样本包括多个正样 本和多个负样本, 所述正样本为非风险用户的用户样本, 所述负样本为风险用户的用户样 本, 所述第二样本包括不具有样本标签的用户样本; 每个所述用户样本指示用户特征信息 的多个特 征项; 从所述第一样本中确定训练样本集及测试样本集; 通过所述训练样本集训练获得至少三种不同的预测模型, 并通过所述测试样本集获得 所述至少三种不同的预测模型的模型评价指标值; 通过所述至少三种不同的预测模型对所述第 二样本进行分类预测, 获得所述至少三种 不同的预测模型 得出的所述第二样本的预测结果; 根据所述至少三种不同的预测模型的预测结果及所述至少三种不同的预测模型的模 型评价指标值, 确定所述第二样本为负 样本的第一目标概 率; 复制所述第二样本获得第三样本, 将所述第二样本的样本标签设置负样本, 并将所述 第二样本的权重因子设置为所述第一目标概率, 将所述第三样本的样本标签设置为正样 本, 并将所述第三样本的权重因子设置为第二目标概率, 其中, 所述第二 目标概率等于1减 所述第一目标概 率; 根据所述第一样本、 第二样本及第三样本训练预设的用户风险预测模型, 获得训练完 成后所述用户风险预测模型。 2.根据权利要求1所述的方法, 其特征在于, 所述通过所述训练样本集训练获得至少三 种不同的预测模型, 并通过所述测试样本集 获得所述至少三种不同的预测模型的模型评价 指标值的步骤, 包括: 通过所述训练样本集对预设的逻辑 回归模型进行训练; 使用训练后的所述逻辑回归模 型对所述测试样本集进行分类预测, 根据预测结果及所述测试样本集的样本标签获得第一 模型评价指标值; 通过所述训练样本集对预设的xgboost模型进行训练; 使用训练后的所述xgboost模型 对所述测试样本集进 行分类预测, 根据预测结果及所述测试样本集的样本标签获得第二模 型评价指标值; 通过所述训练样本集构建高斯混合模型, 使用所述高斯混合模型对所述测试样本集进 行分类预测, 根据预测结果及所述测试样本集的样本标签获得第三模型评价指标值; 所述通过所述至少三种不同的预测模型对所述第 二样本进行分类预测, 获得所述至少 三种不同的预测模型 得出的所述第二样本的预测结果的步骤, 包括: 通过训练后的所述逻辑 回归模型对所述第 二样本进行分类预测, 获得所述第 二样本为 负样本的第一预测概率, 通过训练后的所述xgboost模 型对所述第二样 本进行分类预测, 获 得所述第二样本为负样本的第二预测概率, 通过所述高斯混合模型对所述第二样本进 行分 类预测, 获得 所述第二样本为负 样本的第三预测概 率; 所述根据所述至少三种不同的预测模型的预测结果及所述至少三种不同的预测模型 的模型评价指标值, 确定所述第二样本为负 样本的第一目标概 率的步骤, 包括: 根据所述第一模型评价指标值、 所述第一预测概率、 所述第 二模型评价指标值、 所述第 二预测概率、 所述第三模型评价指标值及所述第三预测概率计算 获得所述第二样本为负样权 利 要 求 书 1/3 页 2 CN 114239964 A 2本的第一目标概 率。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述第一模型评价指标值、 所述 第一预测概率、 所述第二模 型评价指标值、 所述第二预测概率、 所述第三模型评价指标值及 所述第三预测概 率计算获得 所述第二样本为负 样本的第一目标概 率的步骤, 包括: 通过下述公式计算所述第二样本为负 样本的第一目标概 率p: 其中, ks1为所述第一模型评价指标值, ks2为所述第二模型评价指标值, ks3为所述第 三模型评价指标值, prob1为所述第一预测概率, prob2为所述第二预测概率, prob3为所述 第三预测概 率。 4.根据权利要求2所述的方法, 其特征在于, 所述通过所述训练样本集构建高斯混合模 型的步骤, 包括: 获取所述训练样本集中负 样本的在所述训练样本集中的第一占比; 通过所述高斯混合模型对所述训练样本集进行聚类处 理, 其中, 聚类 类别数量 为2; 计算2个所述类别 中负样本的第二占比, 将所述第二占比小于所述第一占比的类别确 定为正样本类别, 将所述第二占比大于所述第一占比的类别确定为负 样本类别。 5.一种用户风险预测模型处 理装置, 其特 征在于, 所述装置包括: 数据获取模块, 用于获取多个通过审批的第一样本和未通过审批的第二样本, 所述第 一样本包括多个正样本和多个负样本, 所述正样本为非风险用户的用户样本, 所述负样本 为风险用户的用户样本, 所述第二样本包括不具有样本标签的用户样本; 每个所述用户样 本指示用户特 征信息的多个特 征项; 数据拆分模块, 用于从所述第一样本中确定训练样本集及测试样本集; 第一模型训练模块, 用于通过所述训练样本集训练获得至少三种不同的预测模型, 并 通过所述测试样本集获得 所述至少三种不同的预测模型的模型评价指标值; 预测模块, 用于通过所述至少三种不同的预测模型对所述第二样本进行分类预测, 获 得所述至少三种不同的预测模型 得出的所述第二样本的预测结果; 数据综合模块, 用于根据所述至少三种不同的预测模型的预测结果及所述至少三种不 同的预测模型的模型评价指标值, 确定所述第二样本为负 样本的第一目标概 率; 样本扩展模块, 用于复制所述第二样本获得第三样本, 将所述第二样本的样本标签设 置负样本, 并将所述第二样本的权重因子设置为所述第一 目标概率, 将所述第三样本的样 本标签设置为正样本, 并将所述第三样本的权重因子 设置为第二目标概率, 其中, 所述第二 目标概率等于1减所述第一目标概 率; 第二模型训练模块, 用于根据所述第一样本、 第二样本及第三样本对预设的用户风险 预测模型, 获得训练完成后所述用户风险预测模型。 6.根据权利要求5所述的用户风险预测模型处 理装置, 其特 征在于, 所述第一模型训练模块具体用于通过所述训练样本集对预设的逻辑回归模型进行训权 利 要 求 书 2/3 页 3 CN 114239964 A 3

.PDF文档 专利 用户风险预测模型处理方法、装置及电子设备

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用户风险预测模型处理方法、装置及电子设备 第 1 页 专利 用户风险预测模型处理方法、装置及电子设备 第 2 页 专利 用户风险预测模型处理方法、装置及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:44:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。