全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211158675.X (22)申请日 2022.09.22 (71)申请人 浙江网商银行股份有限公司 地址 310012 浙江省杭州市西湖区古 荡街 道西溪路556号阿里中心D幢9层、 E幢 3-8层 (72)发明人 陶学文 李少帅 王斌锋 刘爽  刘小雷 马琼旭  (74)专利代理 机构 北京智信禾专利代理有限公 司 11637 专利代理师 金鹏 (51)Int.Cl. G06F 16/9535(2019.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 用户表征模 型的训练方法、 用户表征方法及 装置 (57)摘要 本说明书实施例提供用户表征模型的训练 方法、 用户表征方法及装置, 其中所述用户表征 模型的训练方法包括: 获取多个用户的样本行为 序列, 其中, 任一用户的样本行为序列包括该用 户在不同时间的行为描述信息; 根据述用户的样 本行为序列, 利用预设机器学习网络, 获得各所 述用户在不同时间的用户表征, 并计算同一用户 在不同时间的用户表征间的第一相似度、 以及不 同用户的用户表征间的第二相似度; 基于第一相 似度和第二相似度, 对预设机器学习网络进行训 练, 直至达到训练停止条件, 获得用户表征模型。 通过该种方式训练得到的用户表征模型效果更 好, 确定的用户表征能够更加准确合理地表征用 户属性。 权利要求书3页 说明书20页 附图5页 CN 115510318 A 2022.12.23 CN 115510318 A 1.一种用户表征模型的训练方法, 包括: 获取多个用户的样本行为序列, 其中, 任一用户的样本行为序列包括该用户在不同时 间的行为描述信息; 根据各所述用户的样本行为序列, 利用预设机器学习 网络, 获得各所述用户在不同时 间的用户表征, 并计算同一用户在不同时间的用户表征间的第一相似度、 以及不同用户的 用户表征间的第二相似度; 基于所述第一相似度和第二相似度, 对所述预设机器学习 网络进行训练, 直至达到训 练停止条件, 获得用户表征模型。 2.根据权利要求1所述的方法, 所述根据各所述用户的样本行为序列, 利用预设机器学 习网络, 获得 各所述用户在不同时间的用户表征, 包括: 利用预设机器学习 网络, 基于第一用户的样本行为序列中的各行为描述信息, 获得所 述第一用户对应的行为表征序列, 其中, 所述第一用户是 所述多个用户中的任一个; 根据所述行为表征序列, 确定所述第一用户在不同时间的用户表征。 3.根据权利要求2所述的方法, 在所述根据 所述行为表征序列, 确定所述第 一用户在不 同时间的用户表征之后, 还 包括: 对所述第一用户在预设时间段内对应的用户表征进行融合, 得到所述第 一用户在所述 预设时间段的用户表征。 4.根据权利要求2所述的方法, 所述预设机器学习网络包括特征提取层; 所述利用预设 机器学习网络, 基于第一用户的样本行为序列中的各行为描述信息, 获得所述第一用户对 应的行为表征序列, 包括: 利用所述特征提取层, 对第一用户的样本行为序列中的各行为描述信息进行特征提 取, 获得所述第一用户对应的初始行为表征序列, 其中, 所述初始行为表征序列中包括各行 为描述信息对应的初始行为表征; 确定第一行为描述信 息与第二行为描述信 息间的时间间隔, 获得所述 时间间隔的时间 表征, 其中, 所述第一行为描述信息是所述样 本行为序列中的任一个, 所述第二行为描述信 息是所述样本行为序列中与所述第一行为描述信息时间相邻的一个; 对所述时间表征和所述第 一行为描述信 息对应的初始行为表征进行融合, 获得所述第 一行为描述信息对应的行为表征; 基于各行为描述信息对应的行为表征, 获得 所述第一用户对应的行为表征序列。 5.根据权利要求4所述的方法, 所述利用所述特征提取层, 对第 一用户的样本行为序列 中的各行为描述信息进行 特征提取, 获得 所述第一用户对应的初始行为表征序列, 包括: 提取所述第一行为描述信息中的数字 字符; 对所述数字字符进行离散化处理, 得到所述数字字符的初始表征, 并对非数字字符进 行编码, 得到所述非数字 字符的初始 表征; 基于所述数字字符和非数字字符的初始表征, 确定所述第 一行为描述信 息对应的初始 行为表征; 基于各行为描述信 息对应的初始行为表征, 获得所述第 一用户对应的初始行为表征序 列。 6.根据权利要求3 ‑5中任一项所述的方法, 所述对所述第一用户在预设时间段内对应权 利 要 求 书 1/3 页 2 CN 115510318 A 2的用户表征进行融合, 得到所述第一用户在所述预设时间段的用户表征, 包括: 对所述第一用户在预设时间段内对应的用户表征进行自注意力计算, 得到所述第 一用 户在所述预设时间段的用户表征。 7.根据权利要求6所述的方法, 所述第一用户在预设时间段内对应的用户表征符合预 设分布规律; 所述对所述第一用户在预设时间段内对应的用户表征进行自注意力计算, 得 到所述第一用户在所述预设时间段的用户表征, 包括: 将所述第一用户在预设时间段内对应的用户表征映射至所述预设分布规律对应的目 标数据空间, 得到所述第一用户在预设时间段内对应的各增强用户表征; 对所述第一用户在预设时间段内对应的各增强用户表征进行自注意力计算, 得到所述 第一用户在所述预设时间段的用户表征。 8.根据权利要求1 ‑5中任一项所述的方法, 所述计算同一用户在不同时间的用户表征 间的第一相似度、 以及不同用户的用户表征间的第二相似度, 包括: 根据第一用户在任两个不同时间的用户表征, 计算所述第 一用户在时间维度的第 一用 户表征差信息, 获得第一相似度, 其中, 所述第一用户为所述多个用户中的任一个; 根据各所述用户的用户表征, 计算所述第 一用户与其他各用户在空间维度的第 二用户 表征差信息, 获得第二相似度; 所述基于所述第一相似度和第二相似度, 对所述预设机器学习网络进行训练, 包括: 基于所述第一相似度与所述第二相似度的比值, 计算损失值; 基于所述损失值对所述预设机器学习网络进行训练。 9.一种用户表征 方法, 包括: 获取目标用户的行为描述信息; 将所述行为描述信 息输入用户表征模型, 获得所述目标用户的用户表征, 其中, 所述用 户表征模型通过 上述权利要求1 ‑8任一项所述的方法训练得到 。 10.根据权利要求9所述的方法, 在所述将所述行为描述信息输入用户表征模型, 获得 所述目标用户的用户表征之后, 还 包括: 将所述目标用户的用户表征输入目标任务模型, 得到针对所述目标用户的任务处理结 果。 11.一种用户表征模型的训练装置, 包括: 第一获取模块, 被配置为获取多个用户的样本行为序列, 其中, 任一用户的样本行为序 列包括该用户在不同时间的行为描述信息; 计算模块, 被配置为根据 各所述用户的样本行为序列, 利用预设机器学习网络, 获得各 所述用户在不同时间的用户表征, 并计算同一用户在不同时间的用户表征间的第一相似 度、 以及不同用户的用户表征间的第二相似度; 训练模块, 被配置为基于所述第一相似度和第二相似度, 对所述预设机器学习 网络进 行训练, 直至 达到训练停止条件, 获得用户表征模型。 12.一种用户表征装置, 包括: 第二获取模块, 被 配置为获取目标用户的行为描述信息; 获得模块, 被配置为将所述行为描述信息输入用户表征模型, 获得所述目标用户的用 户表征, 其中, 所述用户表征模型通过 上述权利要求1 ‑8任一项所述的方法训练得到 。权 利 要 求 书 2/3 页 3 CN 115510318 A 3

.PDF文档 专利 用户表征模型的训练方法、用户表征方法及装置

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用户表征模型的训练方法、用户表征方法及装置 第 1 页 专利 用户表征模型的训练方法、用户表征方法及装置 第 2 页 专利 用户表征模型的训练方法、用户表征方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:13:57上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。