全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210044242.5 (22)申请日 2022.01.14 (71)申请人 中国建设银行股份有限公司 地址 100033 北京市西城区金融大街25号 (72)发明人 陈尚志 朱祖恩 陈浩欣 魏晓聪  邱馥  (74)专利代理 机构 北京三友知识产权代理有限 公司 11127 代理人 周永君 董骁毅 (51)Int.Cl. G06Q 40/02(2012.01) G06F 16/36(2019.01) (54)发明名称 一种基于知识图谱的贷款风险识别方法及 装置 (57)摘要 本发明提供一种基于知识图谱的贷款风险 识别方法及装置, 涉及金融信息服务技术领域, 所述方法包括: 从贷款客户知识图谱中获取目标 客户作为头实体的各个第一三元 组数据; 根据各 个第一三元 组数据, 获得每个第一三元组数据对 应的向量; 根据每个第一三元 组数据对应的向量 以及风险预测模 型, 获得每个第一三元组数据中 尾实体对应的客户的风险预测结果。 所述装置用 于执行上述方法。 本发明实施例提供的基于知识 图谱的贷款风险识别方法及装置, 提高了贷款风 险识别的效率。 权利要求书4页 说明书14页 附图8页 CN 114387088 A 2022.04.22 CN 114387088 A 1.一种基于知识图谱的贷款 风险识别方法, 其特 征在于, 包括: 从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据; 其中, 所述 目标客户为 风险客户, 所述贷款 客户知识图谱是 预先建立的; 根据各个第一 三元组数据, 获得每 个第一三元组数据对应的向量; 根据每个第 一三元组数据对应的向量以及风险预测模型, 获得每个第 一三元组数据中 尾实体对应的客户的风险预测结果; 其中, 所述风险预测模型是基于三元组风险训练数据 以及对应的标签训练获得的。 2.根据权利要求1所述的方法, 其特征在于, 所述根据各个第一三元组数据, 获得每个 第一三元组数据对应的向量包括: 根据每个第一三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属 性信息以及向量映射模型, 获得每个第一三元组数据的头实体对应的向量和尾实体对应的 向量; 其中, 所述向量映射模型 是基于实体的风险相关属性信息和对应的标签训练获得的; 根据每个第 一三元组数据的头实体对应的向量和尾实体对应的向量、 每个第 一三元组 数据包括的头实体和尾实体的关系以及关系向量映射模型, 获得每个第一三元组数据的头 实体和尾实体关系对应的向量; 其中, 所述关系向量映射模型是基于实体关系训练数据以 及对应的标签训练获得的; 根据每个第一三元组数据的头实体对应的向量和尾实体对应的向量以及头实体和尾 实体关系对应的向量, 获得每 个第一三元组数据对应的向量。 3.根据权利要求2所述的方法, 其特征在于, 基于实体的风险相关属性信 息和对应的标 签训练获得向量映射模型的步骤 包括: 从贷款客户知识图谱中获取第 一预设数量个实体的风险相关属性信 息, 并获取所述第 一预设数量个实体中每 个实体的公司类型作为对应的标签; 根据第一初始模型、 所述第一预设数量个实体的风险相关属性信息以及对应的标签, 训练获得 所述向量映射模型。 4.根据权利要求2所述的方法, 其特征在于, 基于实体关系训练数据以及对应的标签训 练获得关系向量映射模型的步骤 包括: 从贷款客户知识图谱中获取第四预设数量的关系训练三元组数据; 根据每个关系训练三元组数据包括的头实体的风险相关属性信息和尾实体的风险相 关属性信息以及向量映射模型, 获得每个关系训练三元组数据的头实体对应的向量和尾实 体对应的向量; 获取每个关系训练三元组数据的头实体和尾实体关系以及对应的标签, 并将各个关系 训练三元组数据的头实体对应的向量、 尾实体对应的向量、 头实体和尾实体关系以及对应 的标签作为实体关系训练数据; 根据第二初始模型、 所述第 四预设数量的关系训练三元组数据的头实体对应的向量、 尾实体对应的向量、 头实体和尾实体关系以及对应的标签, 训练获得所述关系向量映射模 型。 5.根据权利要求1所述的方法, 其特征在于, 基于三元组风险训练数据以及对应的标签 训练获得风险预测模型的步骤 包括: 从贷款客户知识图谱中抽取第 二预设数量的三元组数据作为三元组风险训练数据, 并权 利 要 求 书 1/4 页 2 CN 114387088 A 2获取每个三元组数据中尾实体对应的风险等级作为每 个三元组数据对应的标签; 根据所述三元组风险训练数据包括的每个三元组数据包括的头实体的风险相关属性 信息和尾实体的风险相关属性信息以及向量映射模型, 获得所述三元组风险训练数据中每 个三元组数据的头实体对应的向量和尾实体对应的向量; 根据所述三元组风险训练数据中每个三元组数据的头实体对应的向量和尾实体对应 的向量以及头实体和尾实体关系对应的向量, 获得所述三元组风险训练数据中每个三元组 数据对应的向量; 根据第二初始模型、 所述三元组风险训练数据中每个三元组数据对应的向量以及对应 的标签, 训练获得 所述风险预测模型。 6.根据权利要求1所述的方法, 其特征在于, 预先建立所述贷款客户知识图谱的步骤包 括: 基于初始三元组数据构建初始贷款客户知识图谱; 其中, 所述初始三元组数据是通过 贷款相关数据抽取获得的; 对所述初始贷款 客户知识图谱进行共指消解, 获得 所述贷款 客户知识图谱。 7.根据权利要求1至6任一项所述的方法, 其特征在于, 确定所述目标客户为风险客户 的步骤包括: 从贷款客户知识图谱中获取所述目标客户作为头实体并且具有资金流向关系的各个 第二三元组数据; 根据所述目标客户的各个第二 三元组数据, 获得 所述目标客户的子图特 征; 根据所述目标客户的子图特征以及资金流向异常检测模型, 获得所述目标客户的资金 流向检测结果; 其中, 所述资金流向异常检测模型是基于资金流向异常检测训练数据以及 对应的标签训练获得的; 若获知所述目标客户的资金流向检测结果为资金流向异常, 则确定所述目标客户为风 险客户。 8.根据权利要求7所述的方法, 其特征在于, 基于资金流向异常检测训练数据以及对应 的标签训练获得 所述资金流向异常检测模型的步骤 包括: 从贷款客户知识图谱中获取 具有资金流向关系的各个三元组数据; 根据具有资金流向关系的各个三元组数据中的各个头实体构造第三预设数量的子图 特征, 作为所述资金流向异常检测训练数据, 并获得所述第三预设数量的子图特征中每个 子图特征对应的标签; 根据第三初始模型、 所述资金流向异常检测训练数据包括的各个子图特征以及对应的 标签, 训练获得 所述资金流向异常检测模型。 9.一种基于知识图谱的贷款 风险识别装置, 其特 征在于, 包括: 第一获取模块, 用于从贷款客户知识图谱中获取目标客户作为头实体的各个第 一三元 组数据; 其中, 所述目标客户为 风险客户, 所述贷款 客户知识图谱是 预先建立的; 第一获得模块, 用于根据各个第一 三元组数据, 获得每 个第一三元组数据对应的向量; 预测模块, 用于根据每个第一三元组数据对应的向量以及风险预测模型, 获得每个第 一三元组数据中尾实体对应的客户的风险预测结果; 其中, 所述风险预测模型是基于三元 组风险训练数据以及对应的标签训练获得的。权 利 要 求 书 2/4 页 3 CN 114387088 A 3

.PDF文档 专利 一种基于知识图谱的贷款风险识别方法及装置

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的贷款风险识别方法及装置 第 1 页 专利 一种基于知识图谱的贷款风险识别方法及装置 第 2 页 专利 一种基于知识图谱的贷款风险识别方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:53:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。