全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111545315.0 (22)申请日 2021.12.16 (71)申请人 上海冰鉴信息科技有限公司 地址 200000 上海市浦东 新区自由贸易试 验区商城路618号四层B207室 (72)发明人 顾凌云 周轩 乔韵如 王震宇  陶帅  (74)专利代理 机构 成都顶峰专利事务所(普通 合伙) 51224 代理人 陈秋霞 (51)Int.Cl. G06Q 10/06(2012.01) G06Q 10/04(2012.01) G06Q 40/02(2012.01) (54)发明名称 用户筛选方法、 装置及电子设备 (57)摘要 本申请提供一种用户筛选方法、 装置及电子 设备, 通过只保留判断能力强的第一预设规则, 将部分规则后置, 保留更多的初始建模样本, 提 升模型效果, 并针对模型对样本的预测值, 将样 本划分为高、 中、 低三种用户集合, 针对不同分层 的样本区别设置规则引擎, 提高了决策引擎整体 的可靠性。 权利要求书5页 说明书11页 附图2页 CN 114240148 A 2022.03.25 CN 114240148 A 1.一种用户筛 选方法, 其特 征在于, 所述方法包括: 获取第一待处理用户集合, 所述第一待处理用户集合包括多个待处理用户, 每个所述 待处理用户包括用户信息; 根据第一预设规则及各所述待处理用户的用户信 息, 对所述第 一待处理用户集合进行 筛选, 获得第二待处 理用户集 合; 使用训练好的第 一预测模型对所述第 二待处理用户集合进行处理, 获得所述各第 二待 处理用户集合中各待处理用户的用户分值, 其中, 所述用户分值越高, 表征该待处理用户被 预测为正样本的概 率越低; 所述 正样本为被预测为会产生借贷逾期的用户; 获取预设的第一分数阈值和第二分数阈值, 所述第一分数阈值小于所述第二分数阈 值; 根据所述第一分数阈值、 所述第二分数阈值及所述第一预测模型得出的用户分值, 将 所述第二待处理用户集合划分为低分待处理用户集合、 中分待处理用户集合及高分待处理 用户集合; 分别使用训练好的第 二预测模型和第 三预测模型, 对所述高分待处理用户集合和所述 中分待处理用户集合进行 处理, 获得所述高分待处理用户集合和所述中分待处理用户集合 的用户分值; 根据所述第 二预测模型和所述第 三预测模型对应的筛选分数阈值, 从所述高分待处理 用户集合和所述中分待处理用户集合中筛选出用户分值满足条件的待处理用户样本作为 准入用户。 2.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取第一训练样本集合, 所述第一训练样本集合包括多个训练样本, 每个所述训练样 本包括用户数据及用户还款逾期标签; 根据所述第一预设规则对所述第一训练样本集 合进行筛 选, 获得第二训练样本集 合; 将所述第二训练样本集合中具有逾期记录的用户样本作为正样本标签, 将没有逾期记 录的用户样本作为负 样本标签, 对第一预测模型进行训练; 通过训练后的第 一预测模型对所述第 二训练样本集合进行处理, 获得所述各第 二训练 样本集合中各训练样本的第一用户分值, 其中, 所述第一用户分值越高, 表征该训练样 本被 预测为正样本的概 率越低; 获取预设的第一分数阈值和第二分数阈值, 所述第一分数阈值小于所述第二分数阈 值; 根据所述第一分数阈值、 所述第二分数阈值及所述第一用户分值, 将所述第二训练样 本集合划分为低分样本用户集 合、 中分样本用户集 合及高分样本用户集 合; 针对所述高分样本用户集合, 将具有逾期记录的用户样本作为正样本标签, 将没有逾 期记录的用户样本作为负 样本标签, 对第二预测模型进行训练; 通过训练后的第 二预测模型对所述高分样本用户集合进行处理, 获得所述各高分样本 用户集合中各训练样本的第二用户分值, 其中, 所述第二用户分值越高, 表征该训练样 本被 预测为正样本的概 率越低; 针对所述中分样本用户集合, 将具有逾期记录的用户样本作为正样本标签, 将没有逾 期记录的用户样本作为负 样本标签, 对第三预测模型进行训练;权 利 要 求 书 1/5 页 2 CN 114240148 A 2通过训练后的第 三预测模型对所述中分样本用户集合进行处理, 获得所述各中分样本 用户集合中各训练样本的第三用户分值, 其中, 所述第三用户分值越高, 表征该训练样 本被 预测为正样本的概 率越低; 获取预设正样本比例, 将所述第 二预测模型从所述高分样本用户集合中得出的最高的 第二用户分值作为第三分数阈值, 将所述第三预测模型从所述中分样本用户集合中得出的 最高的第三用户分值作为第四分数阈值; 逐渐降低所述第 三分数阈值, 若在所述第 三分数阈值降至所述第 二预测模型从所述高 分样本用户集合中得出 的最低的第二用户分值之前, 所述高分样本用户集合中, 所述第二 用户分值大于所述第三分数阈值且具有正样本标签的用户样本数量与所述第二用户分值 大于所述第三分数阈值的用户样本数量之比达到所述预设正样本比例, 则将当前的第三分 数阈值作为所述第二预测模型的筛选分数阈值, 将所述第四分数阈值作为所述第三预测模 型的筛选分数阈值; 若所述第三分数阈值降至所述第二预测模型从所述高分样本用户集合中得出的最低 的第二用户分值时, 所述高分样本用户集合中, 所述第二用户分值大于所述第三分数阈值 且具有正样本标签的用户样本数量与所述第二用户分值大于所述第三分数阈值的用户样 本数量之比未达到所述预设正样本比例, 则将当前的所述第三分数阈值作为所述第二预测 模型的筛选分数阈值, 并逐渐降低所述第四分数阈值, 并计算所述第二用户分值大于所述 第三分数阈值且具有正样本标签的用户样本数量与所述第三用户分值大于所述第四分数 阈值且具有正样本标签的用户样本数量的第一和值, 计算所述第二用户分值大于所述第三 分数阈值的用户样本数量与所述第三用户分值大于所述第四分数阈值的用户样本数量的 第二和值, 直至所述第一和 值与所述第二和值之比达到所述预设正样本比例, 将所述第四 分数阈值作为所述第三预测模型的筛 选分数阈值。 3.根据权利要求2所述的方法, 其特征在于, 在所述根据所述第一分数阈值、 所述第二 分数阈值及所述第一用户分值, 将所述第二训练样本集合划分为低分样本用户集合、 中分 样本用户集 合及高分样本用户集 合的步骤之后, 所述方法还 包括: 根据第二预设规则及各所述待处理用户的用户信 息, 对所述高分样本用户集合进行筛 选, 获得筛 选后的高分样本用户集 合; 根据第三预设规则及各所述待处理用户的用户信 息, 对所述中分样本用户集合进行筛 选, 获得筛 选后的中分样本用户集 合。 4.根据权利要求2所述的方法, 其特征在于, 所述将所述第 二训练样本集合中具有逾期 记录的用户样本作为正样本标签, 将没有逾期记录的用户样本作为负样本标签, 对第一预 测模型进行训练的步骤, 包括: 将所述第二训练样本集 合划分为第二训练集 合和第二测试集 合; 将具有逾期记录的用户样本作为正样本标签, 将没有逾期记录的用户样本作为负样本 标签, 使用所述第二训练集合对所述第一预测模型进行训练, 并使用所述第二测试集合对 训练后的所述第一预测模型进 行测试, 直至所述第一预测模型的在所述第二训练样本集合 上计算得到的AUC或KS的数值最高, 且所述第一预测模型在所述第二训练集合和所述第二 测试集合上得出的AUC或KS的数值之差在设定数值范围内。 5.根据权利要求2所述的方法, 其特征在于, 所述针对所述高分样本用户集合, 将具有权 利 要 求 书 2/5 页 3 CN 114240148 A 3

.PDF文档 专利 用户筛选方法、装置及电子设备

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用户筛选方法、装置及电子设备 第 1 页 专利 用户筛选方法、装置及电子设备 第 2 页 专利 用户筛选方法、装置及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:44:23上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。