全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111488387.6 (22)申请日 2021.12.07 (71)申请人 百维金科 (上海) 信息科技有限公司 地址 200433 上海市杨 浦区翔殷路16 5号B 区206-10室 (72)发明人 江远强  (74)专利代理 机构 上海中外企专利代理事务所 (特殊普通 合伙) 31387 代理人 孙益青 (51)Int.Cl. G06Q 40/02(2012.01) G06Q 10/04(2012.01) (54)发明名称 一种贷款授信额度确定的方法、 及其电子设 备和存储介质 (57)摘要 本申请涉及一种贷款授信额度确定的方法、 及其电子设备和存储介质, 其方法包括: 步骤S1: 获取与待授信用户相关的原始数据; 步骤S2: 从 所述原始数据中通过特征学习提取多个衍生特 征, 通过所述多个衍生特征建立用户画像体系; 步骤S3: 对所述原始数据和所述多个衍生特征进 行数据预处理, 将所述原始数据和所述衍生特征 分为训练集和验证集, 且所述训练集和所述验证 集中的数据个数比例为7:3; 步骤S4: 构建 XGBoost树集成预测模型; 步骤S5: 优化XGBoost 树集成预测模型超参数; 步骤S6: 确定目标客户 的授信额度区间, 确定客户的最终权重, 并给出 客户的最终额度; 步骤S7: 对验证用户进行授信 额度预测; 以及步骤S8: 对授信未动支客户进行 营销, 促进授信客户动支。 权利要求书3页 说明书11页 附图1页 CN 114140230 A 2022.03.04 CN 114140230 A 1.一种贷款授信额度确定的方法, 其特 征在于: 包括: 步骤S1: 获取与待授信用户相关的原始数据, 并通过Oracle数据库, 按照用户的年龄、 性别、 职业和贷款记录的类别, 对所述原 始数据进行分类, 并标记类别标签; 步骤S2: 从所述原 始数据中通过 特征学习提取多个衍 生特征; 步骤S3: 对所述原 始数据和所述多个衍 生特征进行数据预处 理; 步骤S4: 构建XGBo ost树集成预测模型; 步骤S5: 优化XGBo ost树集成预测模型的超参数; 步骤S6: 确定目标客户的授信额度区间, 以确定客户的最终权重, 并给出客户的最终额 度; 以及 步骤S7: 对 验证用户进行授信额度预测。 2.根据权利要求1所述的贷款授信额度确定的方法, 其特征在于, 在步骤S1中的所述原 始数据包括用户的属性数据、 行为数据和信用数据, 且所述原始数据来自于外部数据和/或 内部数据。 3.根据权利要求1所述的贷款授信额度确定的方法, 其特征在于, 在步骤S2中的所述衍 生特征是指对已授信用户的相关数据进行特征学习得到的具有业务含义的特征, 且所述特 征学习包括a)数据的统计聚合; b)根据时间序列衍生、 特征交叉以及透传获得多个衍生特 征; 以及c)根据信用卡贷款数据, 结合时间特 征性, 构造出近1年申请信用卡数和贷款笔 数。 4.根据权利要求1所述的贷款授信额度确定的方法, 其特征在于, 在步骤S3 中的所述预 处理包括数据异常值的处理、 缺失值的处理、 对数变换、 离散型变量的编 码和连续型变量的 分箱。 5.根据权利要求1所述的贷款授信额度确定的方法, 其特 征在于, 步骤S4包括: 步骤S4.1: 通过公式(1)对所述训练集中的训练样本建立目标函数, 所述目标函数由损 失函数和正则化项构成, 公式(1): 其中, Obj表示第t次迭代的目 标函数、 n表示样 品总数、 l表示损失函数、 y^i(t-1)表示第t‑1次的预测值、 ft(xi)是第t次对 样本打分的分值、 Ω(fi)表示正则化项; 步骤S4.2: 使用泰勒多项式通过公式(2)简化公式(1), 得到步骤S4.1中的所述目标函 数的近似目标函数, 公式(2): 其中, gi是一阶导数、 hi是二阶导数、 gi和hi分别表示第i个样本下损失函数的一阶偏导数与二阶偏导数, 步骤S4.3: 得到XGBo ost树集成预测模型的计算公式(3), 首先, 定义Ij={i|q(xi)=j}为XGBoost树集成预测模型中叶子j的样本集合, 然后, 将 其代入公式(2)中, 在去掉常数项后, 得到XGBoost树集成预测模型的计算公式(3): 其中, Obj(t)是wj的一元二次方程、 T和w分别 表示第k棵回归树的叶子数量和叶子权重、 γ和λ分别表示是叶子数量T和权重w的惩罚系权 利 要 求 书 1/3 页 2 CN 114140230 A 2数、 gi和hi分别表示l 的一阶导数和二阶导数、 Ij为每个叶子节点上的样本集 合、 wj2为每个叶子节点分数的L2模平方; 以及 步骤S4.4: 通过公式(4)和公式(5)求得叶子j的最优权 重以及目标函数的最优值, 公式(4) 公式(5) 6.根据权利要求5所述的贷款授信额度确定的方法, 其特征在于, 步骤S4.1中的公式 (1) 为 由 计 算 正 则 化 项 Ω 的 公 式 (1 .1) 代 入 公 式 (1 .2) 中而得, 其中, 在公式(1.1)中, yi和y^i(t-1)为已知项、 ft表示 第t棵树模型、 yi表示样本的真实标签、 表示模型的预测标签; 在公式(1.2)中, T表示叶 子结点的个数、 ω表示每棵树的叶子节点的分数组成的集合、 ||w||2表示L2正则化, 以使模 型达到最佳效果、 γ表示复杂度参数、 λ表示叶子权重w的惩罚系数、 γ和 λ的取值决定了模 型复杂程度。 7.根据权利要求1所述的贷款授信额度确定的方法, 其特征在于, 步骤S5 中的所述超参 数包括: 决策树的数量n_estimators和每棵树的最大深度max_depth、 学习率learning_ rate、 行的采样率colsample_bytree、 列子采样率colsample_bylevel、 孩子节点中最小的 样本权重和min_child_weight。 8.根据权利要求7所述的贷款授信额度确定的方法, 其特征在于, 在步骤S5中, 采用贝 叶斯算法通过公式(6) 优化XGBoost树集成预测模型超参数, 其中, h表示 所有的超参数取值范围、 L(h)表 示预测模 型在超参数 组合h下的损失函数、 h*表 示最优的超 参数组合, 所述贝叶斯 算法的实现步骤为: 步骤S5.1: 在超参数定义域H中随机生成少量超参数组合[hi], 将每一种组合hi输入到 训练好的XGbo ost模型中计算对应的损失函数值 li, 以此构建初始数据集D=[hi,li]; 步骤S5.2: 在数据集D上训练一个成熟的概率回归模型M, 则损失函数l的概率密度函数 可表示为p(l|M,D); 步骤S5.3: 通过当前损失函数l的概率密度 函数p(l|M,D)定义一个获得函数S来替代损 失函数l, 通过最小化获得函数S来产生 新的一组超参数组合hi; 以及 步骤S5.4: 计算新产生的超参数组合hi对应 的损失函数值li, 并将新样本(hi,li)加入 到数据集D上, 重复步骤S5.2和步骤S5.3直到达到迭代次数限制T, 将最终的超参数组合hT 作为最优的超参数组合h *。 9.一种电子设备, 其特征在于, 包括: 存储器和 处理器, 所述处理器和所述存储器电连 接, 所述存储器用于存储程序, 且所述处理器调用存储于所述存储器中的程序, 以执行如权 利要求1‑8中任一项所述的方法。 10.一种计算机可读存储介质, 其特征在于, 其上存储有计算机程序, 所述计算机程序权 利 要 求 书 2/3 页 3 CN 114140230 A 3

.PDF文档 专利 一种贷款授信额度确定的方法、及其电子设备和存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种贷款授信额度确定的方法、及其电子设备和存储介质 第 1 页 专利 一种贷款授信额度确定的方法、及其电子设备和存储介质 第 2 页 专利 一种贷款授信额度确定的方法、及其电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:43:01上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。