全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210435592.4 (22)申请日 2022.04.24 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 刘恒  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 王蕊 臧建明 (51)Int.Cl. G06Q 40/02(2012.01) G06F 17/18(2006.01) G06K 9/62(2022.01) (54)发明名称 模型训练方法、 不良贷款的预测方法及相关 装置 (57)摘要 本申请提供一种模型训练方法、 不良贷款的 预测方法及相关装置, 可应用于人工智 能领域。 该方法包括: 获取第一自变量集合, 第一自变量 集合是根据历史贷款客户的数据确定的, 第一自 变量集合包括N个自变量, N为大于1的整数; 采用 秩和检验法和逐步回归法对第一自变量集合进 行降维, 得到第二自变量集合, 第二自变量集合 为第一自变量集合的子集; 通过主成分分析法, 从第二自变量集合中确定第三自变量集合, 第三 自变量集合为第二自变量集合的子集; 基于第三 自变量集合中每项自变量的显著性, 通过逐步回 归法对预测模 型进行训练。 本申请的方法有利于 提高预测模型的处 理效率。 权利要求书3页 说明书13页 附图2页 CN 114677213 A 2022.06.28 CN 114677213 A 1.一种模型训练方法, 其特 征在于, 包括: 获取第一自变量集合, 所述第一自变量集合是根据历史贷款客户的数据确定的, 所述 第一自变量 集合包括N个自变量, N 为大于1的整数; 采用秩和检验法和逐步回归法对所述第一自变量集合进行降维, 得到第二自变量集 合, 所述第二自变量 集合为所述第一自变量 集合的子集; 通过主成分分析法, 从所述第二自变量集合中确定第三自变量集合, 所述第三自变量 集合为所述第二自变量 集合的子集; 基于所述第 三自变量集合中每项自变量的显著性, 通过逐步 回归法对预测模型进行训 练。 2.根据权利要求1所述的方法, 其特征在于, 所述第 一自变量集合包括如下一个或多个 维度的自变量: 客户基本信息、 客户资产负债信息、 客户历史 交易数据和客户信用信息; 其中, 所述客户基本信息维度的自变量包括如下一项或多项: 性别、 年龄、 教育程度、 行 业类别; 所述客户资产负债信息维度的自变量包括如下一项或多项: 存款金额、 理财金额、 负债总额、 资产总额; 所述客户历史交易数据维度 的自变量包括如下一项或多项: 代发工 资、 社保、 公积金、 信用卡消费记录、 借记卡消费记录; 所述客户信用信息维度的自变量包括 如下一项或多 项: 个人贷款历史还款记录、 个人信用卡还款记录、 征信黑名单 标志。 3.根据权利要求1或2所述的方法, 其特征在于, 所述采用秩和检验法和逐步回归法对 所述第一自变量 集合进行降维, 得到第二自变量 集合, 包括: 采用所述秩和检验法, 确定所述第一自变量 集合中每项自变量的显著性水平; 从所述第一自变量集合中确定显著性水平低于预设门限的第四自变量集合, 所述第四 自变量集合包括所述第一自变量 集合中的部分或全部自变量; 采用所述逐步回归法, 根据 预设入选门限、 预设退出门限以及预设迭代次数, 从所述第 四自变量 集合中确定所述第二自变量 集合。 4.根据权利要求2所述的方法, 其特征在于, 所述基于所述第 三自变量集合中每项自变 量的显著性, 通过 逐步回归法对预测模型进行训练, 包括: 将所述第三自变量集合输入至所述预测模型, 采用逐步 回归法对所述预测模型进行训 练, 直至构建所述预测模型的所有自变量全部通过显著性检验。 5.根据权利要求4所述的方法, 其特征在于, 所述将所述第 三自变量集合输入至所述预 测模型, 采用逐步回归法对所述预测模型进行训练, 包括: 依次将所述第 三自变量集合中的每个自变量输入至所述预测模型, 并基于每一次输入 的自变量对所述预测模型进行训练, 直至将所述第三自变量集合中的所有自变量输入至所 述预测模型, 并基于所述第三自变量 集合中的所有自变量对所述预测模型进行训练; 其中, 基于每一次输入的自变量对所述预测模型进行训练包括: 利用偏回归平方和对 保留在所述预测模型的一个 或多个自变量的显著 性进行检验, 以从所述第三自变量集合中 删除不具有显著性的自变量。 6.根据权利要求1所述的方法, 其特征在于, 所述历史贷款客户包括违约 客户和未违约 客户, 所述历史贷款 客户的数据包括M个自变量的数据, M≥N, M为整数; 所述获取第一自变量 集合, 包括: 根据所述历史贷款客户的数据, 确定所述违约 客户和所述未违约 客户的第 一自变量的权 利 要 求 书 1/3 页 2 CN 114677213 A 2数据分布差异; 所述第一自变量 为所述M个自变量中的任意 一个; 基于所述数据分布差异, 确定是否将所述第 一自变量作为所述第 一自变量集合中的自 变量。 7.一种不良贷款的预测方法, 其特 征在于, 包括: 获取待预测客户的数据; 将所述待预测客户的数据输入至预训练的预测模型, 得到所述待预测客户的不良贷款 预测结果; 其中, 所述预测模型通过如下步骤训练得到: 获取第一自变量集合, 所述第一自变量集合是根据历史贷款客户的数据确定的, 所述 第一自变量 集合包括N个自变量, N 为大于1的整数; 采用秩和检验法和逐步回归法对所述第一自变量集合进行降维, 得到第二自变量集 合, 所述第二自变量 集合为所述第一自变量 集合的子集; 通过主成分分析法, 从所述第二自变量集合中确定第三自变量集合, 所述第三自变量 集合为所述第二自变量 集合的子集; 基于所述第 三自变量集合中每项自变量的显著性, 通过逐步 回归法对预测模型进行训 练, 得到所述预测模型。 8.一种模型训练装置, 其特 征在于, 包括: 获取模块, 用于获取第一自变量集合, 所述第一自变量集合是根据历史贷款客户的数 据确定的, 所述第一自变量 集合包括N个自变量, N 为大于1的整数; 处理模块, 用于采用秩和检验法和逐步回归法对所述第一自变量集合进行降维, 得到 第二自变量 集合, 所述第二自变量 集合为所述第一自变量 集合的子集; 所述处理模块还用于: 通过主成分分析法, 从所述第二自变量集合中确定第三自变量 集合, 所述第三自变量 集合为所述第二自变量 集合的子集; 所述处理模块还用于: 基于所述第三自变量集合中每项自变量的显著性, 通过逐步回 归法对预测模型进行训练。 9.一种不良贷款的预测装置, 其特 征在于, 包括: 获取模块, 用于获取待预测客户的数据; 处理模块, 用于将所述获取待预测客户的数据输入至预训练的预测模型, 得到所述待 预测客户的不良贷款预测结果; 其中, 所述预测模型的训练包括: 获取第一自变量集合, 所述第一自变量集合是根据历史贷款客户的数据确定的, 所述 第一自变量 集合包括N个自变量, N 为大于1的整数; 采用秩和检验法和逐步回归法对所述第一自变量集合进行降维, 得到第二自变量集 合, 所述第二自变量 集合为所述第一自变量 集合的子集; 通过主成分分析法, 从所述第二自变量集合中确定第三自变量集合, 所述第三自变量 集合为所述第二自变量 集合的子集; 基于所述第 三自变量集合中每项自变量的显著性, 通过逐步 回归法对预测模型进行训 练, 得到所述预测模型。 10.一种模型训练装置, 其特征在于, 包括: 处理器, 以及与所述处理器通信连接的存储 器; 所述存储器存储计算机执 行指令;权 利 要 求 书 2/3 页 3 CN 114677213 A 3

.PDF文档 专利 模型训练方法、不良贷款的预测方法及相关装置

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、不良贷款的预测方法及相关装置 第 1 页 专利 模型训练方法、不良贷款的预测方法及相关装置 第 2 页 专利 模型训练方法、不良贷款的预测方法及相关装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:03:56上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。