专利评论归因模型训练方法、装置、电子设备及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211200560.2 (22)申请日 2022.09.29 (71)申请人平安科技（深圳）有限公司地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼 (72)发明人于佳玉　 (74)专利代理机构深圳市沃德知识产权代理事务所(普通合伙) 44347 专利代理师高杰　于志光 (51)Int.Cl. G06N 20/00(2019.01) G06F 40/284(2020.01) G06F 40/242(2020.01) (54)发明名称评论归因模型训练方法、装置、电子设备及介质 (57)摘要本发明涉及自然语言领域，揭露一种评论归因模型训练方法、装置、电子设备及存储介质，所述方法包括：获取历史归因标签集合及用户评论，对用户评论进行归因总结，得到用户评论的目标归因标签；利用评论归因模型对用户评论及标归因标签进行编码，并对编码后的用户评论及标归因标签进行平均池化，得到降维评论向量及降维标签向量；计算降维评论向量与降维标签向量的相似度，并计算相似度的损失值；根据损失值调整历史归因标签集合，并返回对用户评论进行归因总结，得到用户评论的目标归因标签步骤，直至损失值小于预设阈值，得到训练完成的评论归因模型。本发明可以提高评论归因模型的精准度，并减少了模型训练过程中的资源消耗。权利要求书3页说明书11页附图4页 CN 115438803 A 2022.12.06 CN 115438803 A 1.一种评论归因模型训练方法，其特征在于，所述方法包括：获取历史归因标签集合及用户评论，对所述用户评论进行归因总结，得到所述用户评论的目标归因标签；利用预设的评论归因模型对所述用户评论及所述目标归因标签进行编码，得到评论编码向量及标签编码向量，并对所述评论编码向量及所述标签编码向量进行平均池化，得到降维评论向量及降维标签向量；计算所述降维评论向量与所述降维标签向量的相似度，利用预设的损失函数计算所述相似度的损失值；根据所述损失值调整所述历史归因标签集合，并返回所述获取历史归因标签集合及用户评论，对所述用户评论进行归因总结，得到所述用户评论的目标归因标签步骤，对所述评论归因模型进行迭代更新，直至所述损失值小于预设阈值，得到训练完成的评论归因模型。 2.如权利要求1所述的评论归因模型训练方法，其特征在于，所述对所述用户评论进行归因总结，得到所述用户评论的目标归因标签，包括：对所述用户评论进行文本分词，得到用户分词评论；识别所述用户分词评论中词组的词性，并提取所述用户分词评论中词性为名词的词组作为首部关键词；将所述用户分词评论中词性为形容词的词组与预设的近似词组词典进行匹配，得到尾部关键词；拼接所述首部关键词及所述尾部关键词，得到目标归因标签。 3.如权利要求1所述的评论归因模型训练方法，其特征在于，所述利用预设的评论归因模型对所述用户评论及所述目标归因标签进行编码，得到评论编码向量及标签编码向量，包括：分别提取所述用户评论及所述目标归因标签的评论特征向量及标签特征向量；利用预设的评论归因模型中的编码器分别对所述评论特征向量及所述标签特征向量进行位置索引编码，得到评论位置编码向量及标签位置编码向量；分别将所述评论位置编码向量及所述标签位置编码向量与所述评论特征向量及所述标签特征向量进行组合，得到评论编码向量及标签编码向量。 4.如权利要求1所述的评论归因模型训练方法，其特征在于，所述对所述评论编码向量及所述标签编码向量进行平均池化，得到降维评论向量及降维标签向量，包括：利用预设的卷积核，分别对所述评论编码向量及所述标签编码向量进行计算，得到评论向量及降维标签向量；分别对所述评论向量及所述降维标签向量进行平均区域划分，并取区域内所有向量数值之和的平均值代替所述区域内的向量数值，得到降维评论向量及降维标签向量。 5.如权利要求1所述的评论归因模型训练方法，其特征在于，所述利用预设的损失函数计算所述相似度的损失值，包括：根据预设阈值，将所述相似度的数值分为高相似度值及低相似度值；根据所述高相似度值及所述低相似度值，利用下述损失函数计算所述相似度的损失值 L：权　利　要　求　书 1/3 页 2 CN 115438803 A 2其中， Si,z表示高相似度值， Si,j表示低相似度值， i表示第i条用户评论， Ipos表示与第i 条用户评论拥有高相似度的目标归因标签集合， Ineg表示第i条用户评论拥有低相似度的目标归因标签集合， z表示Ipos目标归因标签集合中任意一个目标归因标签， j表示Ineg目标归因标签集合中任意一个目标归因标签， N表示用户评论的数量。 6.如权利要求1所述的评论归因模型训练方法，其特征在于，所述计算所述降维评论向量与所述降维标签向量的相似度，包括：将所述降维评论向量及所述降维标签向量映射至同一预设向量空间，得到同空间降维评论向量及同空间降维标签向量；利用下述公式计算所述同空间降维评论向量及所述同空间降维标签向量的相似度S： S＝X×YT 其中， X表示任意同空间降维评论向量， Y表示任意同空间降维标签向量， T表示转置矩阵。 7.如权利要求1所述的评论归因模型训练方法，其特征在于，所述根据所述损失值调整所述历史归因标签集合，包括：对所述历史归因标签集合进行编码，得到初始标签向量；利用向量距离计算公式计算所述初始标签向量与所述降维标签向量的距离；判断所述距离是否小于预设距离阈值；当所述距离不小于所述预设距离阈值时，根据所述损失值调整所述历史归因标签集合；当所述距离小于所述预设距离阈值时，判定所述评论归因模型产生过拟合，并返回所述获取历史归因标签集合及用户评论，对所述用户评论进行归因总结，得到所述用户评论的目标归因标签步骤。 8.一种评论归因模型训练装置，其特征在于，所述装置包括：用户评论归因模块，用于获取历史归因标签集合及用户评论，对所述用户评论进行归因总结，得到所述用户评论的目标归因标签；模型损失值计算模块，用于利用预设的评论归因模型对所述用户评论及所述目标归因标签进行编码，得到评论编码向量及标签编码向量，并对所述评论编码向量及所述标签编码向量进行平均池化，得到降维评论向量及降维标签向量，计算所述降维评论向量与所述降维标签向量的相似度，利用预设的损失函数计算所述相似度的损失值；模型迭代模块，用于根据所述损失值调整所述历史归因标签集合，并返回所述获取历史归因标签集合及用户评论，对所述用户评论进行归因总结，得到所述用户评论的目标归因标签步骤，对所述评论归因模型进行迭代更新，直至所述损失值小于预设阈值，得到训练完成的评论归因模型。 9.一种电子设备，其特征在于，所述电子设备包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，权　利　要　求　书 2/3 页 3 CN 115438803 A 3

专利 评论归因模型训练方法、装置、电子设备及介质

专利评论归因模型训练方法、装置、电子设备及介质