专利 训练风控模型的方法和装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210509617.0 (22)申请日 2022.05.11 (71)申请人蚂蚁区块链科技（上海）有限公司地址 200010 上海市黄浦区外马路618号8 层803室 (72)发明人张宇豪　齐翔　 (74)专利代理机构北京亿腾知识产权代理事务所(普通合伙) 11309 专利代理师孙欣欣　周良玉 (51)Int.Cl. G06Q 10/06(2012.01) G06Q 40/02(2012.01) G06K 9/62(2022.01) (54)发明名称训练风控模型的方法和装置 (57)摘要本说明书实施例提供一种训练风控模型的方法和装置，该风控模型有待提供给目标机构使用，方法由训练方执行，包括：从目标机构获取目标样本集，包括多个第一样本，第一样本对应于目标机构的业务对象；遍历目标策略库中的各个风控策略，确定出目标样本集中的各个第一样本均满足的至少一个风控策略构成的策略集合；风控策略对业务对象的至少一项属性特征进行了约束；对训练方自有的风险样本库包括的样本进行筛选，选择出满足策略集合中的风控策略的若干个第二样本构成场景模拟样本集；第二样本来自于训练方采集的业务对象信息，且具有风险标签；利用场景模拟样本集训练风控模型。能够提升训练方得到的风控模型针对机构样本的预测效果。权利要求书3页说明书9页附图2页 CN 114819695 A 2022.07.29 CN 114819695 A 1.一种训练风控模型的方法，所述风控模型有待提供给目标机构使用，所述方法由训练方执行，包括：从所述目标机构获取目标样本集，所述目标样本集包括多个第一样本，所述第一样本对应于所述目标机构的业务对象；遍历目标策略库中的各个风控策略，确定出所述目标样本集中的各个第一样本均满足的至少一个风控策略构成的策略集合；所述风控策略对业务对象的至少一项属性特征进行了约束；对所述训练方自有的风险样本库包括的样本进行筛选，选择出满足所述策略集合中的风控策略的若干个第二样本构成场景模拟样本集；所述第二样本来自于训练方采集的业务对象信息，且具有风险标签；利用所述场景模拟样本集训练所述风控模型。 2.如权利要求1所述的方法，其中，所述风险标签用于指示业务对象的风险等级，不同的风险等级代表业务对象具有的风险高低的差异。 3.如权利要求1所述的方法，其中，所述业务对象包括企业实体，所述至少一项属性特征包括以下若干：企业注册时长、企业主信息、企业所在地区、企业所在行业。 4.如权利要求1所述的方法，其中，所述利用所述场景模拟样本集，训练所述风控模型，包括：利用所述场景模拟样本集，对所述风控模型进行第一阶段训练；确定所述场景模拟样本集中各个第二样本针对第一阶段训练后的风控模型的样本梯度，并对各个样本梯度进行分箱得到若干个梯度分箱，计算每个梯度分箱的梯度密度；在第二阶段训练中，针对任意第二样本，根据该第二样本的预测损失以及其样本梯度对应的梯度密度，确定该第二样本的样本损失；根据各个第二样本的样本损失，更新所述风控模型。 5.如权利要求4所述的方法，其中，所述利用所述场景模拟样本集，对所述风控模型进行第一阶段训练，包括：针对任意第二样本，将该第二样本对应于各项属性特征的特征数据输入所述风控模型，通过所述风控模型输出该第二样本的风控分数；根据该风控分数和该第二样本的风险标签，利用第一损失函数，计算该第二样本的预测损失；根据各个第二样本的预测损失，利用梯度下降法，以最小化总预测损失为目标，调整所述风控模型的模型参数。 6.如权利要求4所述的方法，其中，所述根据各个第二样本的样本损失，更新所述风控模型，包括：根据各个第二样本的样本损失，利用梯度下降法，以最小化总样本损失为目标，调整所述风控模型的模型参数。 7.如权利要求4所述的方法，其中，第二样本的样本损失与该第二样本的预测损失正相关，且与其样本梯度对应的梯度密度负相关。 8.如权利要求4所述的方法，其中，所述第一阶段训练包括利用所述场景模拟样本集重复进行N次训练， N的取值为预先设定的数值；所述第二阶段训练包括利用所述场景模拟样权　利　要　求　书 1/3 页 2 CN 114819695 A 2本集重复进行M次训练， M的取值由模型参数收敛而决定。 9.如权利要求1所述的方法，其中，所述方法还包括：将训练后的所述风控模型发送给所述目标机构，以使所述目标机构利用本方具有的第三样本的对应于各项属性特征的特征数据和所述风控模型，确定该第三样本的风险等级。 10.一种训练风控模型的装置，所述风控模型有待提供给目标机构使用，所述装置设置于训练方，包括：获取单元，用于从所述目标机构获取目标样本集，所述目标样本集包括多个第一样本，所述第一样本对应于所述目标机构的业务对象；确定单元，用于遍历目标策略库中的各个风控策略，确定出所述获取单元获取的目标样本集中的各个第一样本均满足的至少一个风控策略构成的策略集合；所述风控策略对业务对象的至少一项属性特征进行了约束；选择单元，用于对所述训练方自有的风险样本库包括的样本进行筛选，选择出满足所述确定单元确定出的策略集合中的风控策略的若干个第二样本构成场景模拟样本集；所述第二样本来自于训练方采集的业务对象信息，且具有风险标签；训练单元，用于利用所述选择单元选择出的场景模拟样本集训练所述风控模型。 11.如权利要求10所述的装置，其中，所述风险标签用于指示业务对象的风险等级，不同的风险等级代表业务对象具有的风险高低的差异。 12.如权利要求10所述的装置，其中，所述业务对象包括企业实体，所述至少一项属性特征包括以下若干：企业注册时长、企业主信息、企业所在地区、企业所在行业。 13.如权利要求10所述的装置，其中，所述训练单元包括：第一训练子单元，用于利用所述场景模拟样本集，对所述风控模型进行第一阶段训练；密度计算子单元，用于确定所述场景模拟样本集中各个第二样本针对所述第一训练子单元得到的第一阶段训练后的风控模型的样本梯度，并对各个样本梯度进行分箱得到若干个梯度分箱，计算每个梯度分箱的梯度密度；第二训练子单元，用于在第二阶段训练中，针对任意第二样本，根据该第二样本的预测损失以及所述密度计算子单元得到的其样本梯度对应的梯度密度，确定该第二样本的样本损失；根据各个第二样本的样本损失，更新所述风控模型。 14.如权利要求13所述的装置，其中，所述第一训练子单元包括：预测模块，用于针对任意第二样本，将该第二样本对应于各项属性特征的特征数据输入所述风控模型，通过所述风控模型输出该第二样本的风控分数；计算模块，用于根据所述预测模块得到的该风控分数和该第二样本的风险标签，利用第一损失函数，计算该第二样本的预测损失；参数调整模块，用于根据所述计算模块得到的各个第二样本的预测损失，利用梯度下降法，以最小化总预测损失为目标，调整所述风控模型的模型参数。 15.如权利要求13所述的装置，其中，所述第二训练子单元，具体用于根据各个第二样本的样本损失，利用梯度下降法，以最小化总样本损失为目标，调整所述风控模型的模型参数。 16.如权利要求13所述的装置，其中，第二样本的样本损失与该第二样本的预测损失正相关，且与其样本梯度对应的梯度密度负相关。权　利　要　求　书 2/3 页 3 CN 114819695 A 3

专利 训练风控模型的方法和装置

专利训练风控模型的方法和装置