专利用户表征模型的训练方法、用户表征方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211158675.X (22)申请日 2022.09.22 (71)申请人浙江网商银行股份有限公司地址 310012 浙江省杭州市西湖区古荡街道西溪路556号阿里中心D幢9层、 E幢 3-8层 (72)发明人陶学文　李少帅　王斌锋　刘爽　刘小雷　马琼旭　 (74)专利代理机构北京智信禾专利代理有限公司 11637 专利代理师金鹏 (51)Int.Cl. G06F 16/9535(2019.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称用户表征模型的训练方法、用户表征方法及装置 (57)摘要本说明书实施例提供用户表征模型的训练方法、用户表征方法及装置，其中所述用户表征模型的训练方法包括：获取多个用户的样本行为序列，其中，任一用户的样本行为序列包括该用户在不同时间的行为描述信息；根据述用户的样本行为序列，利用预设机器学习网络，获得各所述用户在不同时间的用户表征，并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度；基于第一相似度和第二相似度，对预设机器学习网络进行训练，直至达到训练停止条件，获得用户表征模型。通过该种方式训练得到的用户表征模型效果更好，确定的用户表征能够更加准确合理地表征用户属性。权利要求书3页说明书20页附图5页 CN 115510318 A 2022.12.23 CN 115510318 A 1.一种用户表征模型的训练方法，包括：获取多个用户的样本行为序列，其中，任一用户的样本行为序列包括该用户在不同时间的行为描述信息；根据各所述用户的样本行为序列，利用预设机器学习网络，获得各所述用户在不同时间的用户表征，并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度；基于所述第一相似度和第二相似度，对所述预设机器学习网络进行训练，直至达到训练停止条件，获得用户表征模型。 2.根据权利要求1所述的方法，所述根据各所述用户的样本行为序列，利用预设机器学习网络，获得各所述用户在不同时间的用户表征，包括：利用预设机器学习网络，基于第一用户的样本行为序列中的各行为描述信息，获得所述第一用户对应的行为表征序列，其中，所述第一用户是所述多个用户中的任一个；根据所述行为表征序列，确定所述第一用户在不同时间的用户表征。 3.根据权利要求2所述的方法，在所述根据所述行为表征序列，确定所述第一用户在不同时间的用户表征之后，还包括：对所述第一用户在预设时间段内对应的用户表征进行融合，得到所述第一用户在所述预设时间段的用户表征。 4.根据权利要求2所述的方法，所述预设机器学习网络包括特征提取层；所述利用预设机器学习网络，基于第一用户的样本行为序列中的各行为描述信息，获得所述第一用户对应的行为表征序列，包括：利用所述特征提取层，对第一用户的样本行为序列中的各行为描述信息进行特征提取，获得所述第一用户对应的初始行为表征序列，其中，所述初始行为表征序列中包括各行为描述信息对应的初始行为表征；确定第一行为描述信息与第二行为描述信息间的时间间隔，获得所述时间间隔的时间表征，其中，所述第一行为描述信息是所述样本行为序列中的任一个，所述第二行为描述信息是所述样本行为序列中与所述第一行为描述信息时间相邻的一个；对所述时间表征和所述第一行为描述信息对应的初始行为表征进行融合，获得所述第一行为描述信息对应的行为表征；基于各行为描述信息对应的行为表征，获得所述第一用户对应的行为表征序列。 5.根据权利要求4所述的方法，所述利用所述特征提取层，对第一用户的样本行为序列中的各行为描述信息进行特征提取，获得所述第一用户对应的初始行为表征序列，包括：提取所述第一行为描述信息中的数字字符；对所述数字字符进行离散化处理，得到所述数字字符的初始表征，并对非数字字符进行编码，得到所述非数字字符的初始表征；基于所述数字字符和非数字字符的初始表征，确定所述第一行为描述信息对应的初始行为表征；基于各行为描述信息对应的初始行为表征，获得所述第一用户对应的初始行为表征序列。 6.根据权利要求3 ‑5中任一项所述的方法，所述对所述第一用户在预设时间段内对应权　利　要　求　书 1/3 页 2 CN 115510318 A 2的用户表征进行融合，得到所述第一用户在所述预设时间段的用户表征，包括：对所述第一用户在预设时间段内对应的用户表征进行自注意力计算，得到所述第一用户在所述预设时间段的用户表征。 7.根据权利要求6所述的方法，所述第一用户在预设时间段内对应的用户表征符合预设分布规律；所述对所述第一用户在预设时间段内对应的用户表征进行自注意力计算，得到所述第一用户在所述预设时间段的用户表征，包括：将所述第一用户在预设时间段内对应的用户表征映射至所述预设分布规律对应的目标数据空间，得到所述第一用户在预设时间段内对应的各增强用户表征；对所述第一用户在预设时间段内对应的各增强用户表征进行自注意力计算，得到所述第一用户在所述预设时间段的用户表征。 8.根据权利要求1 ‑5中任一项所述的方法，所述计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度，包括：根据第一用户在任两个不同时间的用户表征，计算所述第一用户在时间维度的第一用户表征差信息，获得第一相似度，其中，所述第一用户为所述多个用户中的任一个；根据各所述用户的用户表征，计算所述第一用户与其他各用户在空间维度的第二用户表征差信息，获得第二相似度；所述基于所述第一相似度和第二相似度，对所述预设机器学习网络进行训练，包括：基于所述第一相似度与所述第二相似度的比值，计算损失值；基于所述损失值对所述预设机器学习网络进行训练。 9.一种用户表征方法，包括：获取目标用户的行为描述信息；将所述行为描述信息输入用户表征模型，获得所述目标用户的用户表征，其中，所述用户表征模型通过上述权利要求1 ‑8任一项所述的方法训练得到。 10.根据权利要求9所述的方法，在所述将所述行为描述信息输入用户表征模型，获得所述目标用户的用户表征之后，还包括：将所述目标用户的用户表征输入目标任务模型，得到针对所述目标用户的任务处理结果。 11.一种用户表征模型的训练装置，包括：第一获取模块，被配置为获取多个用户的样本行为序列，其中，任一用户的样本行为序列包括该用户在不同时间的行为描述信息；计算模块，被配置为根据各所述用户的样本行为序列，利用预设机器学习网络，获得各所述用户在不同时间的用户表征，并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度；训练模块，被配置为基于所述第一相似度和第二相似度，对所述预设机器学习网络进行训练，直至达到训练停止条件，获得用户表征模型。 12.一种用户表征装置，包括：第二获取模块，被配置为获取目标用户的行为描述信息；获得模块，被配置为将所述行为描述信息输入用户表征模型，获得所述目标用户的用户表征，其中，所述用户表征模型通过上述权利要求1 ‑8任一项所述的方法训练得到。权　利　要　求　书 2/3 页 3 CN 115510318 A 3

专利 用户表征模型的训练方法、用户表征方法及装置

专利用户表征模型的训练方法、用户表征方法及装置