全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211023231.5 (22)申请日 2022.08.25 (71)申请人 天元大数据信用管理有限公司 地址 250100 山东省济南市高新区浪潮路 1036号浪潮科技园S01楼 23层 (72)发明人 王利鑫 李仰允 崔乐乐 徐宏伟  (74)专利代理 机构 济南信达专利事务所有限公 司 37100 专利代理师 姜丽洁 (51)Int.Cl. G06Q 40/02(2012.01) G06F 16/25(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06N 5/00(2006.01) G06N 20/20(2019.01) (54)发明名称 一种企业信用评分方法及装置 (57)摘要 本发明涉及企业信用评 分领域, 具体提供了 一种企业信用评分方法, 具有如下步骤: S1、 数据 汇聚融合建立标准数据仓库; S2、 筛选企业信用 评估指标; S3、 特征工程形成信用评估入模指标; S4、 深度学习模型建立; S5、 深度学习模型训练; S6、 入模特征重要性评估; S7、 企业评分形成。 与 现有技术相比, 本发明构建了相对准确的企业信 用评分模型运用深度学习技术对客户高维特征 进行深入挖掘分析客户潜在风险, 让信贷审批服 务更加高效快捷。 权利要求书2页 说明书6页 附图1页 CN 115330526 A 2022.11.11 CN 115330526 A 1.一种企业信用评分方法, 其特 征在于, 具有如下步骤: S1、 数据汇聚融合建立标准数据仓库; S2、 筛选企业信用评估指标; S3、 特征工程形成信用评估 入模指标; S4、 深度学习模型建立; S5、 深度学习模型训练; S6、 入模特征重要性评估; S7、 企业评分形成。 2.根据权利要求1所述的一种企业信用评分方法, 其特征在于, 在步骤S1中, 首先建立 统一的数据标准规范对入库的多源数据进 行规范化管理; 其次, 通过ETL数据治理工具进 行 多源数据的治理加工, 互联网数据存储 数据定期拉取, 实时接口数据通过内存进 行处理, 结 合批流处 理模式对数据进行 数据加工处 理、 数据标准 化、 指标计算和轻 特征挖掘; 最后, 三方多源数据通过横 纵向数据融合, 融合汇聚到统一的数据仓库中, 数据仓库存 储多源数据融合之后的标准库数据、 加工所 得指标库和特 征库。 3.根据权利要求1或2所述的一种企业信用评分方法, 其特征在于, 在步骤S2中, 基于建 立的企业多源数据标准库, 建立覆盖三级层次的企业标准库, 基于标准库建立企业信用评 估指标体系, 其中三级指标为通过数据库表格抽取 的具体的企业信用评估指标; 二级指标 是基于三级指标基础之上融入业 务知识归类整理的企业信用评估指标类别; 一级指标为评估企业信用风险最终确定的评估维度, 一级指标维度会用于企业画像的 雷达图展示中, 用以评估企业在各个细分维度上的信用风险情况。 4.根据权利要求3所述的一种企业信用评分方法, 其特征在于, 在步骤S3中, 首先进行 探索性数据分析, 探索性数据分析主要包括对训练样本及海选指标进行简单 的描述统计, 经过对数据进行简单 的统计分析之后, 对特定指标数据进行数据切分, 对数据的动态变化 情况、 某一特定条件 下的取值情况进 行深入的剖析; 通过绘制单变量的直方图曲线、 单变量 与目标变量的关系曲线对 入模样例指标进行 可视化分析。 5.根据权利要求4所述的一种企业信用评分方法, 其特征在于, 在步骤S3中, 然后进行 数据清洗, 采用RandomForest随机森林 方法对训练样本中的缺失指标进行填充, 首先统计特征中存在缺失值的特征和不存在缺失值的特征列表, 缺失特征中每一个缺 失指标分别选做目标函数, 特征变量和目标变量的非缺失值作为训练样例, 用来训练 RandomForest模 型, 训练好的随机森 林模型输出保存, 用于预测缺失特征的缺失值。 经过数 据清洗、 缺失值填充的训练样例 进行Z‑Score标准化处理, 形成标准化后的训练向量, 待神 经网络结构确立后输入神经网络进行模型训练。 6.根据权利要求5所述的一种企业信用评分方法, 其特征在于, 在步骤S4中, 首先, 确定 神经网络结构, 再确定 激活函数, 最后确定 权重搜索策略。 7.根据权利要求6所述的一种企业信用评分方法, 其特征在于, 在步骤S5中, 深度学习 网络的训练常采用tensorflow和ker as的开源包来进行深度学习模型的训练, 训练过程中 通过绘制模型学习曲线来展示模型训练过程中损失函数、 训练样例准确 率、 测试样例准确 率伴随模型迭代过程的变化情况, 用来判断模型的收敛情况。 8.根据权利要求7所述的一种企业信用评分方法, 其特征在于, 在步骤S6中, 深度学习权 利 要 求 书 1/2 页 2 CN 115330526 A 2网络建设过程中会通过选用输入扰动特征 的重要性来评估入模指标的重要性, 对数据X 的 每一个特征, 进 行打乱, 然后对新的X输入网络得到预测值, 计算损失函数, 作为该特征的重 要性分数; 针对入模特征运用输入扰动特征的重要性来评估入模指标的重要性之后, 入模特征按 照扰动特征重要性从高到低排列, 依 次选择不同的阈值来筛选入模特征, 针对筛选后的特 征运用已确定的深度学习网络结构进 行多次模型的训练, 最 终通过深度学习模型的训练效 果确定最终的入 模特征, 最终确定最优的深度学习网络模型并输出模型保存。 9.根据权利要求8所述的一种企业信用评分方法, 其特征在于, 在步骤S7中, 标准的评 分卡转换方法有两种, 一是基于WOE转换的方法, 通过WOE值及逻辑回归模型预测所得特征 的系数进行 特征分值的计算; 二是基于模型预测所得的企业违约概率, 根据违约概率进行标准分值的转换, 深度学 习网络预测企业的违约概率, 通过标准评 分卡转换方法将企业预测所得的企业违约概率转 换成企业的标准评分; 最后, 通过正态检验方法对训练样本的整体评分分布进行检验, 针对评分分布不符合 正态分布的评分结果 通过分值调整、 分值 转换进行分布调整。 10.一种企业信用评分装置, 其特 征在于, 包括: 至少一个存 储器和至少一个处 理器; 所述至少一个存 储器, 用于存 储机器可读程序; 所述至少一个处理器, 用于调用所述机器可读程序, 执行权利要求1至9中任一所述的 方法。权 利 要 求 书 2/2 页 3 CN 115330526 A 3

PDF文档 专利 一种企业信用评分方法及装置

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种企业信用评分方法及装置 第 1 页 专利 一种企业信用评分方法及装置 第 2 页 专利 一种企业信用评分方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:01:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。