全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210509617.0 (22)申请日 2022.05.11 (71)申请人 蚂蚁区块链科技 (上海) 有限公司 地址 200010 上海市黄浦区外马路618号8 层803室 (72)发明人 张宇豪 齐翔  (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 专利代理师 孙欣欣 周良玉 (51)Int.Cl. G06Q 10/06(2012.01) G06Q 40/02(2012.01) G06K 9/62(2022.01) (54)发明名称 训练风控 模型的方法和装置 (57)摘要 本说明书实施例提供一种训练风控模型的 方法和装置, 该风控模型有待提供给目标机构 使 用, 方法由训练方执行, 包括: 从目标机构获取目 标样本集, 包括多个第一样本, 第一样本对应于 目标机构的业务对象; 遍历目标策略库中的各个 风控策略, 确定出目标样本集中的各个第一样本 均满足的至少一个风控策略构成的策略集合; 风 控策略对业务对象的至少一项属性特征进行了 约束; 对训练方自有的风险样 本库包括的样本进 行筛选, 选择出满足策略集合中的风控策略的若 干个第二样 本构成场景模拟样 本集; 第二样本来 自于训练方采集的业务对象信息, 且 具有风险标 签; 利用场景模拟样本集训练风控模型。 能够提 升训练方得到的风控模型针对机构样本的预测 效果。 权利要求书3页 说明书9页 附图2页 CN 114819695 A 2022.07.29 CN 114819695 A 1.一种训练风控模型的方法, 所述风控模型有待提供给目标机构使用, 所述方法由训 练方执行, 包括: 从所述目标机构获取目标样本集, 所述目标样本集包括多个第一样本, 所述第一样本 对应于所述目标机构的业 务对象; 遍历目标策略库中的各个风控策略, 确定出所述目标样本集中的各个第 一样本均满足 的至少一个风控策略构成的策略集合; 所述风控策略对业务对象的至少一项属性特征进 行 了约束; 对所述训练方自有的风险样本库包括的样本进行筛选, 选择出满足所述策略集合中的 风控策略的若干个第二样本构成场景模拟样本集; 所述第二样本来自于训练方采集的业务 对象信息, 且具有风险标签; 利用所述场景模拟 样本集训练所述 风控模型。 2.如权利要求1所述的方法, 其中, 所述风险标签用于指示业务对象的风险等级, 不同 的风险等级代 表业务对象具有的风险高低的差异。 3.如权利要求1所述的方法, 其中, 所述业务对象包括企业实体, 所述至少一项属性特 征包括以下若干: 企业注 册时长、 企业主信息、 企业所在地区、 企业所在行业。 4.如权利要求1所述的方法, 其中, 所述利用所述场景模拟样本集, 训练所述风控模型, 包括: 利用所述场景模拟 样本集, 对所述 风控模型进行第一阶段训练; 确定所述场景模拟样本集中各个第二样本针对第一阶段训练后的风控模型的样本梯 度, 并对各个样本梯度进行分箱得到若干个梯度分箱, 计算每 个梯度分箱的梯度密度; 在第二阶段训练中, 针对任意第二样本, 根据该第二样本的预测损 失以及其样本梯度 对应的梯度密度, 确定该第二样本的样本损失; 根据各个第二样本的样本损失, 更新所述风 控模型。 5.如权利要求4所述的方法, 其中, 所述利用所述场景模拟样本集, 对所述风控模型进 行第一阶段训练, 包括: 针对任意第二样本, 将该第二样本对应于各项属性特征的特征数据输入所述风控模 型, 通过所述风控模型输出 该第二样本的风控分数; 根据该风控分数和该第二样本的风险标签, 利用第一损 失函数, 计算该第二样本的预 测损失; 根据各个第二样本的预测损失, 利用梯度 下降法, 以最小化总预测损失为目标, 调整所 述风控模型的模型参数。 6.如权利要求4所述的方法, 其中, 所述根据各个第二样本的样本损 失, 更新所述风控 模型, 包括: 根据各个第二样本的样本损失, 利用梯度 下降法, 以最小化总样本损失为目标, 调整所 述风控模型的模型参数。 7.如权利要求4所述的方法, 其中, 第 二样本的样本损失与该第 二样本的预测损失正相 关, 且与其样本梯度对应的梯度密度负相关。 8.如权利要求4所述的方法, 其中, 所述第 一阶段训练包括利用所述场景模拟样本集重 复进行N次训练, N的取值为预先设定的数值; 所述第二阶段训练包括利用所述场景模拟样权 利 要 求 书 1/3 页 2 CN 114819695 A 2本集重复进行M次训练, M的取值由模型参数收敛而决定 。 9.如权利要求1所述的方法, 其中, 所述方法还 包括: 将训练后的所述风控模型发送给所述目标机构, 以使所述目标机构利用本方具有的第 三样本的对应于各项属性特 征的特征数据和所述 风控模型, 确定该第三样本的风险等级。 10.一种训练风控模型的装置, 所述风控模型有待提供给目标机构使用, 所述装置设置 于训练方, 包括: 获取单元, 用于从所述目标机构获取目标样本集, 所述目标样本集包括多个第 一样本, 所述第一样本对应于所述目标机构的业 务对象; 确定单元, 用于遍历 目标策略库中的各个风控策略, 确定出所述获取单元获取的目标 样本集中的各个第一样本均满足的至少一个风控策略构成的策略集合; 所述风控策略对业 务对象的至少一项属性特 征进行了约束; 选择单元, 用于对所述训练方自有的风险样本库包括的样本进行筛选, 选择出满足所 述确定单元确定出的策略集合中的风控策略的若干个第二样本构成场景模拟样本集; 所述 第二样本来自于训练方采集的业 务对象信息, 且具有风险标签; 训练单元, 用于利用所述选择 单元选择出的场景模拟 样本集训练所述 风控模型。 11.如权利要求10所述的装置, 其中, 所述风险标签用于指示业务对象的风险等级, 不 同的风险等级代 表业务对象具有的风险高低的差异。 12.如权利要求10所述的装置, 其中, 所述业务对象包括企业实体, 所述至少一项属性 特征包括以下若干: 企业注 册时长、 企业主信息、 企业所在地区、 企业所在行业。 13.如权利要求10所述的装置, 其中, 所述训练单 元包括: 第一训练子单 元, 用于利用所述场景模拟 样本集, 对所述 风控模型进行第一阶段训练; 密度计算子单元, 用于确定所述场景模拟样本集中各个第 二样本针对所述第 一训练子 单元得到的第一阶段训练后的风控模型的样本梯度, 并对各个样本梯度进 行分箱得到若干 个梯度分箱, 计算每 个梯度分箱的梯度密度; 第二训练子单元, 用于在第 二阶段训练中, 针对任意第 二样本, 根据 该第二样本的预测 损失以及所述密度计算子单元得到的其样本梯度对应的梯度密度, 确定该第二样本的样本 损失; 根据各个第二样本的样本损失, 更新所述 风控模型。 14.如权利要求13所述的装置, 其中, 所述第一训练子单 元包括: 预测模块, 用于针对任意第二样本, 将该第二样本对应于各项属性特征的特征数据输 入所述风控模型, 通过 所述风控模型输出 该第二样本的风控分数; 计算模块, 用于根据所述预测模块得到的该风控分数和该第二样本的风险标签, 利用 第一损失函数, 计算该第二样本的预测损失; 参数调整模块, 用于根据所述计算模块得到的各个第二样本的预测损 失, 利用梯度下 降法, 以最小化总预测损失为目标, 调整所述 风控模型的模型参数。 15.如权利要求13所述的装置, 其中, 所述第二训练子单元, 具体用于根据各个第二样 本的样本损失, 利用梯度下降法, 以最小化总样本损失为目标, 调整 所述风控模 型的模型参 数。 16.如权利要求13所述的装置, 其中, 第 二样本的样本损失与 该第二样本的预测损失正 相关, 且与其样本梯度对应的梯度密度负相关。权 利 要 求 书 2/3 页 3 CN 114819695 A 3

.PDF文档 专利 训练风控模型的方法和装置

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 训练风控模型的方法和装置 第 1 页 专利 训练风控模型的方法和装置 第 2 页 专利 训练风控模型的方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:04:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。