全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211200560.2 (22)申请日 2022.09.29 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 于佳玉  (74)专利代理 机构 深圳市沃德知识产权代理事 务所(普通 合伙) 44347 专利代理师 高杰 于志光 (51)Int.Cl. G06N 20/00(2019.01) G06F 40/284(2020.01) G06F 40/242(2020.01) (54)发明名称 评论归因模型训练方法、 装置、 电子设备及 介质 (57)摘要 本发明涉及自然语 言领域, 揭露一种评论归 因模型训练方法、 装置、 电子设备及存储介质, 所 述方法包括: 获取历史归因标签集合及用户评 论, 对用户评论进行归因总结, 得到用户评论的 目标归因标签; 利用评论归因模 型对用户评论及 标归因标签进行编码, 并对编码后的用户评论及 标归因标签进行平均池化, 得到降维评论向量及 降维标签向量; 计算降维评论向量与降维标签向 量的相似度, 并计算相似度的损失值; 根据损失 值调整历史归因标签集合, 并返回对用户评论进 行归因总结, 得到用户评论的目标归因标签步 骤, 直至损失值小于预设阈值, 得到训练完成的 评论归因模 型。 本发明可以提高评论归因模型的 精准度, 并减少了模型训练过程中的资源消耗。 权利要求书3页 说明书11页 附图4页 CN 115438803 A 2022.12.06 CN 115438803 A 1.一种评论归因模型训练方法, 其特 征在于, 所述方法包括: 获取历史归因标签集合及用户评论, 对所述用户评论进行归因总结, 得到所述用户评 论的目标归因标签; 利用预设的评论归因模型对所述用户评论及所述目标归因标签进行编码, 得到评论编 码向量及标签编码向量, 并对所述评论编码向量及所述标签编码向量进行平均池化, 得到 降维评论向量及降维标签向量; 计算所述降维评论向量与 所述降维标签向量的相似度, 利用预设的损失函数计算所述 相似度的损失值; 根据所述损失值调 整所述历史归因标签集合, 并返回所述获取历史归因标签集合及用 户评论, 对所述用户评论进行归因总结, 得到所述用户评论的目标归因标签步骤, 对所述评 论归因模型进行迭代更新, 直至所述损失值小于预设阈值, 得到训练完成的评论归因模型。 2.如权利要求1所述的评论归因模型训练方法, 其特征在于, 所述对所述用户评论进行 归因总结, 得到所述用户评论的目标归因标签, 包括: 对所述用户评论进行文本分词, 得到用户分词评论; 识别所述用户分词评论中词组 的词性, 并提取所述用户分词评论中词性为名词的词组 作为首部关键词; 将所述用户分词评论中词性为形容词的词组与 预设的近似词组词典进行匹配, 得到尾 部关键词; 拼接所述首部关键词及所述尾部关键词, 得到目标归因标签。 3.如权利要求1所述的评论归因模型训练方法, 其特征在于, 所述利用预设的评论归因 模型对所述用户评论及所述 目标归因标签进行编码, 得到评论编码向量及标签编码向量, 包括: 分别提取 所述用户评论及所述目标归因标签的评论特 征向量及标签特 征向量; 利用预设的评论归因模型中的编码器分别对所述评论特征向量及所述标签特征向量 进行位置索引编码, 得到 评论位置编码向量及标签位置编码向量; 分别将所述评论位置编码向量及所述标签位置编码向量与所述评论特征向量及所述 标签特征向量进行组合, 得到 评论编码向量及标签编码向量。 4.如权利要求1所述的评论归因模型训练方法, 其特征在于, 所述对所述评论编码向量 及所述标签编码向量进行平均池化, 得到降维评论向量及降维标签向量, 包括: 利用预设的卷积核, 分别对所述评论编码向量及所述标签编码向量进行计算, 得到评 论向量及降维标签向量; 分别对所述评论向量及所述降维标签向量进行平均区域划分, 并取区域内所有向量数 值之和的平均值代替所述区域内的向量数值, 得到降维评论向量及降维标签向量。 5.如权利要求1所述的评论归因模型训练方法, 其特征在于, 所述利用预设的损失函数 计算所述相似度的损失值, 包括: 根据预设阈值, 将所述相似度的数值分为高相似度值及低相似度值; 根据所述高相似度值及所述低相似度值, 利用下述损失函数计算所述相似度的损失值 L:权 利 要 求 书 1/3 页 2 CN 115438803 A 2其中, Si,z表示高相似度值, Si,j表示低相似度值, i表示第i条用户评论, Ipos表示与第i 条用户评论拥有高相似度的目标归因标签集合, Ineg表示第i条用户评论拥有低相似度的目 标归因标签集合, z表示Ipos目标归因标签集合中任意一个目标归因标签, j表示Ineg目标归 因标签集 合中任意 一个目标归因标签, N表示用户评论的数量。 6.如权利要求1所述的评论归因模型训练方法, 其特征在于, 所述计算所述降维评论向 量与所述降维标签向量的相似度, 包括: 将所述降维评论向量及所述降维标签向量映射至同一预设 向量空间, 得到同空间降维 评论向量及同空间降维标签向量; 利用下述公式计算所述同空间降维评论向量及所述同空间降维标签向量的相似度S: S=X×YT 其中, X表示任意同空间降维评论向量, Y表示任意同空间降维标签向量, T表示转置矩 阵。 7.如权利要求1所述的评论归因模型训练方法, 其特征在于, 所述根据 所述损失值调整 所述历史归因标签集 合, 包括: 对所述历史归因标签集 合进行编码, 得到初始标签向量; 利用向量距离计算公式计算所述初始标签向量与所述降维标签向量的距离; 判断所述距离是否小于预设距离阈值; 当所述距离不小于所述预设距离阈值时, 根据所述损失值调整所述历史归因标签集 合; 当所述距离小于所述预设距离阈值时, 判定所述评论归因模型产生过拟合, 并返回所 述获取历史归因标签集合及用户评论, 对所述用户评论进行归因总 结, 得到所述用户评论 的目标归因标签步骤。 8.一种评论归因模型训练装置, 其特 征在于, 所述装置包括: 用户评论归因模块, 用于获取历史归因标签集合及用户评论, 对所述用户评论进行归 因总结, 得到所述用户评论的目标归因标签; 模型损失值计算模块, 用于利用预设的评论归因模型对所述用户评论及所述目标归因 标签进行编码, 得到评论编码向量及标签编码向量, 并对所述评论编码向量及所述标签编 码向量进行平均池化, 得到降维评论向量及降维标签向量, 计算所述降维评论向量与所述 降维标签向量的相似度, 利用预设的损失函数计算所述相似度的损失值; 模型迭代模块, 用于根据所述损 失值调整所述历史归因标签集合, 并返回所述获取历 史归因标签集合及用户评论, 对所述用户评论进行归因总 结, 得到所述用户评论的目标归 因标签步骤, 对所述评论归因模 型进行迭代更新, 直至所述损失值小于预设阈值, 得到训练 完成的评论归因模型。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及, 与所述至少一个处 理器通信连接的存 储器; 其中,权 利 要 求 书 2/3 页 3 CN 115438803 A 3

.PDF文档 专利 评论归因模型训练方法、装置、电子设备及介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 评论归因模型训练方法、装置、电子设备及介质 第 1 页 专利 评论归因模型训练方法、装置、电子设备及介质 第 2 页 专利 评论归因模型训练方法、装置、电子设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:14:21上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。