全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210289053.4 (22)申请日 2022.03.22 (71)申请人 四川省自然资源科 学研究院 (四川 省生产力促进中心) 地址 610000 四川省成 都市一环路南2段24 号 (72)发明人 岳钧 李开恒 王正宁 周钊聿  周乐瑶  (74)专利代理 机构 北京天奇智新知识产权代理 有限公司 1 1340 专利代理师 许驰 (51)Int.Cl. G06Q 40/02(2012.01) G06Q 40/06(2012.01) G06Q 10/04(2012.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 用于互联网金融风控的违约预测方法 (57)摘要 本发明公开了用于互联网金融风控的违约 预测方法, 涉及金融风控领域, 包括S1构建违约 预测模型和 伪标签生成模 型; S2获取训练数据集 D, 并将其分为有标签数据集DL和无标签数据集 S3有标签数据集DL导入违约预测模 型生成预 测结果; S4预测结果导入伪标签生成模 型生成伪 标签数据集P; S5有标签数据集DL和伪标签数据 集P导入违约预测模型进行训练优化, 得到最优 预测模型; S6待预测数据导入最优预测模型获得 违约预测结果; 同时利用了有标签数据和无标签 数据, 并利用不同的基础模型同时进行训练优 化, 实现协 同训练改进的目的, 不同的基础模型 相互学习 、 相互反馈, 提高预测模型的准确性。 权利要求书2页 说明书3页 附图3页 CN 114581218 A 2022.06.03 CN 114581218 A 1.用于互联网金融风控的违约预测方法, 其特 征在于, 包括: S1、 构建违约预测模型和伪标签生成模型; S2、 获取训练数据集D, 并将其分为有标签数据集DL和无标签数据集 S3、 有标签数据集DL导入违约预测模型生成预测结果; S4、 预测结果 导入伪标签生成模型生成伪标签数据集P; S5、 有标签数据集DL和伪标签数据集P导入违约预测模型进行训练优化, 得到最优预测 模型; S6、 待预测数据导入最优预测模型获得违约预测结果。 2.根据权利要求1所述的用于互联网金融风控的违约预测方法, 其特征在于, 违约预测 模型包括 N个基础模型Φi(i=0, 1, ..., N‑1), 伪标签生成模型为神经网络模型。 3.根据权利要求2所述的用于互联网金融风控的违约预测方法, 其特征在于, 在S3中, 有标签数据集DL导入违约预测模型获得每 个基础模型的预测结果predΦi=Φi(x)。 4.根据权利要求2所述的用于互联网金融风控的违约预测方法, 其特征在于, 在S4中, 每个基础模型的预测结果输入伪标签生成模型输出预测结果, 伪标签生成模型的预测结果 作为无标签数据集 的标签形成伪标签数据集P, 5.根据权利要求2所述的用于互联网金融风控的违约预测方法, 其特征在于, 在S5中, 包括: S51、 有标签数据集DL和伪标签数据集P作为训练集D1与D2, S52、 训练集D1与D2分别导入两个当前基础模型m1和m2获得预测结果V1和V2, S53、 判断两个当前基础模型是否为最优模型, 若是, 进入S6; 反之, 则更新训练集D1与 D2, 并返回S52。 6.根据权利要求5所述的用于互联网金融风控的违约预测方法, 其特征在于, 在S53中, 包括: ①使用AUC(Are a under the Curve of ROC)作为评价指 标, 计算当前单个基础模型的 AUC值并记为vΦi, 并储存AUC值, 判断当前基础模型m1和m2是否为最优模型组合, 若是, 则当 前基础模型作为 最优预测模型, 并进入S6, 反 之进入②; ②计算每个基础模型的误差∈i优化基础模型, 误差服从零均 值方差为 且 协方差为 的多维正态分布, 所有模型的平均误差为 误差的平 方的期 望为 权 利 要 求 书 1/2 页 2 CN 114581218 A 2③预测结果V1和V2分别更新训练集D2与D1, 令优化后的基础模型作为当前基础模型, 再 返回S52。 7.根据权利要求2所述的用于互联网金融风控的违约预测方法, 其特征在于, 在 ①中, 当ζt>ζi(i=t‑1, t‑2, t‑3)时, 则当前基础模型不 是最优模型, 反之则当前基础模型为最优 模型, ζt为当前AUC值。 8.根据权利要求1所述的用于互联网金融风控的违约预测方法, 其特征在于, 在S6中, 待预测数据分别导入两个最优预测模型, 并获得预测结果ym1和ym2, 两个最优预测模型的 AUC值分别为vm1和vm2, 计算违约预测结果, 表示 为 9.根据权利要求5所述的用于互联网金融风控的违约预测方法, 其特征在于, 违约预测 模型包括3个基础模型分别为XGBoost、 LightGBM和CatBoost; 基础模型m1和m2分别为 XGBoost和LightGBM。 10.根据权利要求2所述的用于互联网金融风控的违约预测方法, 其特征在于, 伪标签 生成模型从输入到 输出依次为全连接层、 Dropout层、 全连接层和Sigmo id层。权 利 要 求 书 2/2 页 3 CN 114581218 A 3

.PDF文档 专利 用于互联网金融风控的违约预测方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于互联网金融风控的违约预测方法 第 1 页 专利 用于互联网金融风控的违约预测方法 第 2 页 专利 用于互联网金融风控的违约预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:04:01上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。