全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111327341.6 (22)申请日 2021.11.10 (71)申请人 中国建设银行股份有限公司 地址 100033 北京市西城区金融大街25号 (72)发明人 雷文烨  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 代理人 单冠飞 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 40/02(2012.01) G06N 20/00(2019.01) G06N 3/08(2006.01) (54)发明名称 一种客户贷款收益 率等级预测方法及系统 (57)摘要 本公开提出一种客户贷款收益率等级预测 方法及系统, 方法包括: 获取历史放款客户的客 户数据; 基于所述历史放款客户的客户数据建立 建模样本, 并计算历史放款客户的客户贷款收益 率等级, 基于所述建模样本和所述历史放款客户 的客户贷款收益率等级, 利用机器学习算法进行 拟合训练, 以建立客户贷款收益率等级预测模 型; 获取无额度客户的客户数据, 并根据所述无 额度客户的客户数据, 利用所述客户贷款收益率 等级预测模型预测所述无额度客户的客户贷款 收益率等级。 本公开的方法可以预测客户贷款收 益率等级且 预测准确度较高, 同时确保了银行的 贷款收益。 权利要求书4页 说明书9页 附图2页 CN 114154682 A 2022.03.08 CN 114154682 A 1.一种客户贷款收益 率等级预测方法, 其特 征在于, 所述方法包括: 获取历史放 款客户的客户数据; 基于所述历史放款客户的客户数据建立建模样本, 并计算历史放款客户的客户贷款收 益率等级, 基于所述建模样本和所述历史放款客户的客户贷款收益率等级, 利用机器学习 算法进行拟合训练, 以建立 客户贷款收益 率等级预测模型; 获取无额度客户的客户数据, 并根据所述无额度客户的客户数据, 利用所述客户贷款 收益率等级预测模型 预测所述无额度客户的客户贷款收益 率等级。 2.根据权利要求1所述的客户贷款收益率等级预测方法, 其特征在于, 所述获取历史放 款客户的客户数据, 包括: 获取历史放 款且到期后未逾期或逾期在预设时间内的客户数据。 3.根据权利要求1所述的客户贷款收益率等级预测方法, 所述基于所述历史放款客户 的客户数据建立建模样本, 包括: 对所述历史放 款客户的客户数据进行关联、 整合及清洗处 理, 得到有效数据集; 根据所述有 效数据集, 通过特征衍生得到适用于客户贷款收益率等级预测模型的衍生 特征; 对衍生特征进行特征筛选; 对筛选后的特 征进行预处理, 将预处 理后的特 征作为建模样本 。 4.根据权利要求3所述的客户贷款收益率等级预测方法, 其特征在于, 所述有效数据集 至少包括: 企业主的数据信息和企业的数据信息; 其中, 企业主的数据信息包括: 企业主的基础信 息、 信用卡信 息、 贷款信息及 资产信息; 企业主的数据信息包括: 企业的基础信息、 交易信息、 及负债信息 。 5.根据权利要求3所述的客户贷款收益率等级预测方法, 其特征在于, 所述根据 所述有 效数据集, 通过 特征衍生得到适用于客户贷款收益 率等级预测模型的衍 生特征, 包括: 对所述有效数据集进行透传处理、 统计聚合处理及特征交叉处理以进行特征衍生, 形 成所述衍生特征。 6.根据权利要求5所述的客户贷款收益 率等级预测方法, 其特 征在于, 所述透传处理包括: 对于有效数据集中属于数值型变量的数据且所述数据仅对应一个 数据值, 直接进行透传作为衍生特征; 对于有效数据集中属于分类型变量的数据进行类型 合并后透传为 衍生特征; 所述统计聚合处理包括: 对于有效数据集中的流水数据或明细类型的数据, 划分不同 的时间窗口并计算每个窗口内的统计变量, 以衍生出新的特征; 对于有效数据集中属于分 类型变量的数据, 计算所述分类型变量的数据对应类型 的出现次数及种类, 以衍生出新的 特征; 所述特征交叉处理包括: 将所述有效数据集中的不同类型的数据进行多维交叉以衍生 出新的特 征。 7.根据权利要求3所述的客户贷款收益率等级预测方法, 其特征在于, 所述对衍生特征 进行特征筛选, 包括: 对衍生特征进行预设筛选处理、 相关性筛选处理、 缺失值筛选处理、 单值率筛选处理及 取值过多情况筛 选处理, 得到筛选后的特 征。权 利 要 求 书 1/4 页 2 CN 114154682 A 28.根据权利要求7 所述的客户贷款收益 率等级预测方法, 其特 征在于, 所述预设筛选处理包括: 利用信息值IV分析各个衍生特征对于客户贷款收益率等级的 预测能力, 剔除预测能力低于第一阈值的特征, 其中, 所述预测能力用于表示所述衍生特征 对于客户贷款收益 率等级的影响程度; 所述相关性筛选包括: 计算各个衍生特征之间相关性, 将相关性大于第二阈值的两个 衍生特征中与客户贷款收益 率等级的相关性较高的衍 生特征保留; 所述缺失值筛选处理包括: 计算各个衍生特征的数据缺失率, 剔除数据缺失率大于第 三阈值的衍 生特征; 所述单值率筛选处理包括: 计算离散型衍生特征的取值情况, 剔除取值唯一的离散型 衍生特征; 所述取值过多情况筛选处理包括: 计算离散型衍生变量特征的取值情况, 剔除取值个 数超过第四阈值的离 散型衍生特征。 9.根据权利要求3所述的客户贷款收益率等级预测方法, 其特征在于, 对筛选后的特征 进行预处理, 包括: 对筛选后的特 征进行异常值处 理及缺失值 填充处理, 得到预处 理后的特 征。 10.根据权利要求9所述的客户贷款收益 率等级预测方法, 其特 征在于, 所述异常值处理包括: 将超出业务规定范围的衍生特征的取值确定为异常值, 并对所 述异常值进行修改; 所述缺失值填充处理包括: 对属于离散型变量的衍生特征的取值的缺失值利用默认字 符串进行填充, 对属于连续型变量的衍 生特征的取值的缺失值用特定 字符串进行填充。 11.根据权利要求1所述的客户贷款收益率等级预测方法, 其特征在于, 所述计算历史 放款客户的客户贷款收益 率等级, 包括: 计算所述历史放款客户的客户潜在收益率; 客户潜在收益率=(客户利息+罚息)/(授 信额度×贷款期限 ×利率); 基于所述 客户潜在收益 率确定客户贷款收益 率等级; 其中, 当客户潜在收益 率≤第一预设值, 确定客户贷款收益 率等级为高; 当第一阈值<客户潜在收益 率≤第二预设值, 确定客户贷款收益 率等级为中; 当客户潜在收益 率>第二预设值, 确定客户贷款收益 率等级为低。 12.根据权利要求1所述的客户贷款收益率等级预测方法, 其特征在于, 所述基于所述 建模样本和所述历史放款客户的客户贷款收益率等级, 利用机器学习算法进行拟合训练, 以建立客户贷款收益 率等级预测模型, 包括: 基于所述建模样本和所述历史放款客户的客户贷款收益率等级, 利用LightGBM算法进 行拟合训练, 以建立 客户贷款收益 率等级预测模型。 13.一种客户贷款收益 率等级预测系统, 其特 征在于, 所述系统包括: 获取模块, 用于获取历史放 款客户的客户数据; 建立模块, 用于基于所述历史放款客户的客户数据建立建模样本, 并计算历史放款客 户的客户贷款收益率等级, 基于所述建模样本和所述历史放款客户的客户贷款收益率等 级, 利用机器学习算法进行拟合训练, 以建立 客户贷款收益 率等级预测模型; 预测模块, 用于获取无额度客户的客户数据, 并根据所述无额度客户的客户数据, 利用权 利 要 求 书 2/4 页 3 CN 114154682 A 3

.PDF文档 专利 一种客户贷款收益率等级预测方法及系统

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种客户贷款收益率等级预测方法及系统 第 1 页 专利 一种客户贷款收益率等级预测方法及系统 第 2 页 专利 一种客户贷款收益率等级预测方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:00:04上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。