专利用户风险预测模型处理方法、装置及电子设备

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111547826.6 (22)申请日 2021.12.16 (71)申请人上海冰鉴信息科技有限公司地址 200000 上海市浦东新区自由贸易试验区商城路618号四层B207室 (72)发明人顾凌云　周轩　王妍　乔韵如　 (74)专利代理机构成都顶峰专利事务所(普通合伙) 51224 代理人陈秋霞 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06Q 40/02(2012.01) G06K 9/62(2022.01) (54)发明名称用户风险预测模型处理方法、装置及电子设备 (57)摘要本申请提供一种用户风险预测模型处理方法、装置及电子设备，通过训练至少三种预测模型对未通过审批的用户样本进行分类预测，以获得对应的样本标签，并根据预测获得样本标签对未通过审批的用户样本进行扩充，然后使用通过审批的用户样本和未通过审批的用户样本一起训练用户风险预测模型。如此，可以使用户风险预测模型在训练时使用的用户样本和实际使用时的处理的用户样本分布一致，从而提高所述用户风险预测模型的预测准确性。权利要求书3页说明书10页附图3页 CN 114239964 A 2022.03.25 CN 114239964 A 1.一种用户风险预测模型处理方法，其特征在于，所述方法包括：获取多个通过审批的第一样本和未通过审批的第二样本，所述第一样本包括多个正样本和多个负样本，所述正样本为非风险用户的用户样本，所述负样本为风险用户的用户样本，所述第二样本包括不具有样本标签的用户样本；每个所述用户样本指示用户特征信息的多个特征项；从所述第一样本中确定训练样本集及测试样本集；通过所述训练样本集训练获得至少三种不同的预测模型，并通过所述测试样本集获得所述至少三种不同的预测模型的模型评价指标值；通过所述至少三种不同的预测模型对所述第二样本进行分类预测，获得所述至少三种不同的预测模型得出的所述第二样本的预测结果；根据所述至少三种不同的预测模型的预测结果及所述至少三种不同的预测模型的模型评价指标值，确定所述第二样本为负样本的第一目标概率；复制所述第二样本获得第三样本，将所述第二样本的样本标签设置负样本，并将所述第二样本的权重因子设置为所述第一目标概率，将所述第三样本的样本标签设置为正样本，并将所述第三样本的权重因子设置为第二目标概率，其中，所述第二目标概率等于1减所述第一目标概率；根据所述第一样本、第二样本及第三样本训练预设的用户风险预测模型，获得训练完成后所述用户风险预测模型。 2.根据权利要求1所述的方法，其特征在于，所述通过所述训练样本集训练获得至少三种不同的预测模型，并通过所述测试样本集获得所述至少三种不同的预测模型的模型评价指标值的步骤，包括：通过所述训练样本集对预设的逻辑回归模型进行训练；使用训练后的所述逻辑回归模型对所述测试样本集进行分类预测，根据预测结果及所述测试样本集的样本标签获得第一模型评价指标值；通过所述训练样本集对预设的xgboost模型进行训练；使用训练后的所述xgboost模型对所述测试样本集进行分类预测，根据预测结果及所述测试样本集的样本标签获得第二模型评价指标值；通过所述训练样本集构建高斯混合模型，使用所述高斯混合模型对所述测试样本集进行分类预测，根据预测结果及所述测试样本集的样本标签获得第三模型评价指标值；所述通过所述至少三种不同的预测模型对所述第二样本进行分类预测，获得所述至少三种不同的预测模型得出的所述第二样本的预测结果的步骤，包括：通过训练后的所述逻辑回归模型对所述第二样本进行分类预测，获得所述第二样本为负样本的第一预测概率，通过训练后的所述xgboost模型对所述第二样本进行分类预测，获得所述第二样本为负样本的第二预测概率，通过所述高斯混合模型对所述第二样本进行分类预测，获得所述第二样本为负样本的第三预测概率；所述根据所述至少三种不同的预测模型的预测结果及所述至少三种不同的预测模型的模型评价指标值，确定所述第二样本为负样本的第一目标概率的步骤，包括：根据所述第一模型评价指标值、所述第一预测概率、所述第二模型评价指标值、所述第二预测概率、所述第三模型评价指标值及所述第三预测概率计算获得所述第二样本为负样权　利　要　求　书 1/3 页 2 CN 114239964 A 2本的第一目标概率。 3.根据权利要求2所述的方法，其特征在于，所述根据所述第一模型评价指标值、所述第一预测概率、所述第二模型评价指标值、所述第二预测概率、所述第三模型评价指标值及所述第三预测概率计算获得所述第二样本为负样本的第一目标概率的步骤，包括：通过下述公式计算所述第二样本为负样本的第一目标概率p：其中， ks1为所述第一模型评价指标值， ks2为所述第二模型评价指标值， ks3为所述第三模型评价指标值， prob1为所述第一预测概率， prob2为所述第二预测概率， prob3为所述第三预测概率。 4.根据权利要求2所述的方法，其特征在于，所述通过所述训练样本集构建高斯混合模型的步骤，包括：获取所述训练样本集中负样本的在所述训练样本集中的第一占比；通过所述高斯混合模型对所述训练样本集进行聚类处理，其中，聚类类别数量为2；计算2个所述类别中负样本的第二占比，将所述第二占比小于所述第一占比的类别确定为正样本类别，将所述第二占比大于所述第一占比的类别确定为负样本类别。 5.一种用户风险预测模型处理装置，其特征在于，所述装置包括：数据获取模块，用于获取多个通过审批的第一样本和未通过审批的第二样本，所述第一样本包括多个正样本和多个负样本，所述正样本为非风险用户的用户样本，所述负样本为风险用户的用户样本，所述第二样本包括不具有样本标签的用户样本；每个所述用户样本指示用户特征信息的多个特征项；数据拆分模块，用于从所述第一样本中确定训练样本集及测试样本集；第一模型训练模块，用于通过所述训练样本集训练获得至少三种不同的预测模型，并通过所述测试样本集获得所述至少三种不同的预测模型的模型评价指标值；预测模块，用于通过所述至少三种不同的预测模型对所述第二样本进行分类预测，获得所述至少三种不同的预测模型得出的所述第二样本的预测结果；数据综合模块，用于根据所述至少三种不同的预测模型的预测结果及所述至少三种不同的预测模型的模型评价指标值，确定所述第二样本为负样本的第一目标概率；样本扩展模块，用于复制所述第二样本获得第三样本，将所述第二样本的样本标签设置负样本，并将所述第二样本的权重因子设置为所述第一目标概率，将所述第三样本的样本标签设置为正样本，并将所述第三样本的权重因子设置为第二目标概率，其中，所述第二目标概率等于1减所述第一目标概率；第二模型训练模块，用于根据所述第一样本、第二样本及第三样本对预设的用户风险预测模型，获得训练完成后所述用户风险预测模型。 6.根据权利要求5所述的用户风险预测模型处理装置，其特征在于，所述第一模型训练模块具体用于通过所述训练样本集对预设的逻辑回归模型进行训权　利　要　求　书 2/3 页 3 CN 114239964 A 3

专利 用户风险预测模型处理方法、装置及电子设备

专利用户风险预测模型处理方法、装置及电子设备