全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211264457.4 (22)申请日 2022.10.17 (71)申请人 上海冰鉴信息科技有限公司 地址 200000 上海市浦东 新区自由贸易试 验区商城路618号四层B207室 (72)发明人 顾凌云 张涛 魏玉民 叶杨  (74)专利代理 机构 成都顶峰专利事务所(普通 合伙) 51224 专利代理师 杨国瑞 (51)Int.Cl. G06K 9/62(2022.01) G06Q 40/00(2012.01) (54)发明名称 用户画像生成方法、 装置及计算机设备 (57)摘要 本发明公开了用户画像生 成方法、 装置及计 算机设备, 涉及金融领域, 本发明提供一种用户 画像生成方法, 包括: 获取目标用户的用户数据, 所述用户数据包括所述目标用户的交易数据; 基 于直方图算法对 所述用户数据进行分箱处理, 得 到分箱数据; 将所述分箱数据输入 预先训练得到 用户画像生成模块中的由多个回归树组成的树 模型, 得到预测特征; 将所述预测特征输入所述 用户画像生成模块中的逻辑回归模 型, 得到对应 所述目标用户的用户标签, 以生成至少能够表征 用户信用信息的用户画像。 如此, 相比传统人工 分箱操作, 本实施例效率更高并且避免了人工操 作的偶然性, 并且, 能够挖掘特征的非线性 关系, 有效地解决了特 征选择和特 征交叉的问题。 权利要求书2页 说明书10页 附图5页 CN 115329909 A 2022.11.11 CN 115329909 A 1.一种用户画像生成方法, 其特 征在于, 包括: 获取目标用户的用户数据, 所述用户数据包括所述目标用户的交易数据; 基于直方图算法对所述用户数据进行分箱处 理, 得到分箱数据; 将所述分箱数据输入预先训练得到的用户画像生成模块中的由多个回归树组成的树 模型, 得到预测特 征; 将所述预测特征输入所述用户画像生成模块中的逻辑 回归模型, 得到对应所述目标用 户的用户标签, 以生成至少能够表征用户信用信息的用户画像。 2.根据权利要求1所述的方法, 其特征在于, 所述将所述分箱数据输入预先训练得到用 户画像生成模块中的 由多个回归树组成的树模型, 得到预测特 征包括: 将所述分箱数据分别 输入所述树模型中的各个回归树, 得到对应每一所述 回归树的预 测子特征; 对所述预测子特 征进行组合编码, 得到组合编码特 征作为所述预测特 征。 3.根据权利要求2所述的方法, 其特征在于, 所述多个回归树中的每一 回归树中包括一 个或多个预测节点; 对所述预测子特 征进行组合编码, 得到组合编码特 征作为所述预测特 征包括: 根据每一回归树中的各个预测节点的预测值, 进行独热编码得到所述组合编码特 征。 4.根据权利要求1 ‑3任一项所述的方法, 其特 征在于, 所述方法包括: 对目标用户对应的原始用户数据进行预处理操作, 得到预处理后的第一用户数据, 其 中, 所述预处 理操作包括重复值处 理、 缺失值处 理和异常值处 理中的一 者或多者; 对所述第一用户数据进行特征衍生以及特征工程, 得到所述目标用户的用户数据, 其 中, 所述特征衍生以及特征工程包括数据汇总处理、 数据 统计处理和数字标签编码处理中 的一者或多者。 5.根据权利要求1所述的方法, 其特征在于, 所述用户画像生成模块是根据以下方式训 练得到的: 获取样本数据集, 所述样本数据集包括样本用户数据, 以及与所述样本用户数据对应 的预先标注的样本用户标签; 基于直方图算法对所述样本用户数据进行分箱处 理, 得到样本分箱数据; 根据所述样本分箱数据以及所述样本用户标签, 构建所述 树模型; 将所述样本分箱数据输入所述 树模型, 得到样本预测特 征; 根据所述样本预测特征以及所述样本用户标签, 构建所述逻辑回归模型, 得到训练完 成的用户画像生成模块。 6.根据权利要求5所述的方法, 其特征在于, 所述根据所述样本分箱数据以及所述样本 用户标签, 构建所述 树模型包括: 根据第一样本分箱数据以及与所述第 一样本分箱数据对应的第 一样本用户标签, 构建 所述树模型中的第一回归树, 并确定所述第一回归树的第一残差; 根据所述样本分箱数据以及所述样本用户标签, 以及所述第 一残差, 进行多轮迭代, 构 建所述树模型中的其 他回归树, 得到所述 树模型。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述样本分箱数据以及所述样本 用户标签, 以及所述第一残差, 进 行多轮迭代, 构建所述树模 型中的其他回归树得到所述树权 利 要 求 书 1/2 页 2 CN 115329909 A 2模型包括: 重复根据 下一迭代周期对应的第 二样本分箱数据、 所述第 二样本分箱数据对应的第 二 样本用户标签以及上一迭代周期对应的回归树的残差, 构建得到下一迭代周期的回归树的 步骤; 在满足预设停止迭代条件的情况 下停止迭代, 得到所述 树模型。 8.根据权利要求7 所述的方法, 其特 征在于, 所述方法包括: 在所述树模型中的回归树的数量达到预设数量阈值的情况下, 确定满足所述预设停止 迭代条件; 和/或, 在当前迭代周期的回归树的残差小于或等于预设残差 阈值的情况下, 确定满足所述预 设停止迭代条件。 9.一种用户画像生成装置, 其特 征在于, 包括: 获取模块, 用于获取目标用户的用户数据, 所述用户数据包括所述目标用户的交易数 据; 分箱模块, 用于基于直方图算法对所述用户数据进行分箱处 理, 得到分箱数据; 预测模块, 用于将所述分箱数据输入预先训练得到用户画像生成模块中的由多个回归 树组成的树模型, 得到预测特 征; 生成模块, 用于将所述预测特征输入所述用户画像生成模块中的逻辑回归模型, 得到 对应所述目标用户的用户标签, 以生成至少能够表征用户信用信息的用户画像。 10.一种计算机设备, 其特征在于, 所述计算机设备包括处理器及存储有计算机指令的 非易失性存储器, 所述计算机指 令被所述处理器执行时, 所述计算机 设备执行权利要求 1‑8 中任意一项所述的用户画像生成方法。权 利 要 求 书 2/2 页 3 CN 115329909 A 3

.PDF文档 专利 用户画像生成方法、装置及计算机设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用户画像生成方法、装置及计算机设备 第 1 页 专利 用户画像生成方法、装置及计算机设备 第 2 页 专利 用户画像生成方法、装置及计算机设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:44:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。