全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211049425.2 (22)申请日 2022.08.30 (71)申请人 海尔优家智能科技 (北京) 有限公司 地址 100086 北京市海淀区知春路10 6号太 平洋国际大厦6层6 01-606室 申请人 青岛海尔科技有限公司   海尔智家 股份有限公司 (72)发明人 邵星阳 于全刚  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 张东梅 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/211(2020.01) G06F 40/30(2020.01)G06K 9/62(2022.01) (54)发明名称 一种评论文本情感分析方法及 装置、 存储介 质及电子设备 (57)摘要 本申请提供了一种评论文本情感分析方法 及装置、 存储介质及电子设备, 由于评论文本中 每个子句所属的主题与该子句的语义信息和该 子句的上下文子句的语义信息有关, 从而根据评 论文本包括的每个子句的语义信息及每个子句 的上下文子句的语义信息, 可以准确识别出评论 文本包括的每个子句所属的主题。 并且, 评论文 本中子句的情感倾向与评论文本对应的产业相 关, 同一子句在不同的主题下的情感倾向不同, 以及连续的子句可能属于同一主题, 从而在识别 评论文本包括的每个子句的主题, 并将位置相邻 且属于同一主题的子句划分为同一组合后, 基于 每个组合所属的主题, 利用产业类别对应的情感 分析模型对组合中每个子句进行情感分析, 从而 提高了情感分析的准确度。 权利要求书2页 说明书10页 附图3页 CN 115391538 A 2022.11.25 CN 115391538 A 1.一种评论文本情感分析 方法, 其特 征在于, 包括: 获取待进行情感分析的评论文本, 以及所述评论文本对应的产业类别; 所述评论文本 包括至少一个子句; 识别所述评论文本包括的每个子句所属的主题; 所述子句所属的主题为所述子句所属 的类别; 按照所述评论文本包括的每个子句的位置顺序和所属的主题, 将所述评论文本包括的 各个子句划分为连续的多个组合; 每个组合包括一个子句或多个位置连续且所属主题相同 的子句, 位置相邻的组合所属的主题不同; 基于每个组合所属的主题, 利用目标情感分析模型, 对每个组合包括的每个子句进行 情感分析, 得到每个组合包括的每个子句的情感倾向; 其中, 所述目标情感分析模型为预先 构建的多个情感分析模型中与所述产业类别对应的情感分析模型。 2.根据权利要求1所述的方法, 其特征在于, 所述目标情感分析模型包括与 所述产业类 别对应的句法语义解析模型和深度模型, 所述基于每个组合所属的主题, 利用目标情感分 析模型, 对每个组合包括的每个子句进行情感分析, 得到每个组合包括的每个子句的情感 倾向, 包括: 基于每个组合所属的主题, 利用与所述产业类别对应的句法语义解析模型, 对每个组 合包括的每个子句进行句法语义解析, 得到每个组合包括的每个子句的句法语义解析结 果; 针对每个组合包括的每个子句, 若所述子句的句法语义解析结果中包括所述子句所属 的属性, 以及所属属性的情感倾向, 则将所属属性的情感倾向作为所述子句的情感倾向, 若 所述子句的句法语义解析结果中不包括所述子句所属的属 性和/或所属属 性的情感倾向, 则利用与所述产业类别对应的深度模型, 对所述子句进行情感分析, 得到所述子句的情感 倾向; 所述子句所属的属性为, 该子句所属的主题包括的各个属性中的一个, 所述主题包括 的属性为所述主题的下一级类别。 3.根据权利要求2所述的方法, 其特征在于, 所述与所述产业类别对应的深度模型包括 与所述产业类别对应向量表征模型和分类模型, 所述利用对所述产业类别对应的深度模 型, 对所述子句进行情感分析, 得到所述子句的情感倾向, 包括: 将所述子句输入至与所述产业类别对应的向量表征模型, 得到所述子句的语义句向 量; 利用与所述产业类别对应的分类模型, 对所述子句的语义句向量进行情感分析, 得到 所述子句的情感倾向。 4.根据权利要求1所述的方法, 其特征在于, 所述识别所述评论文本包括的每个子句所 属的主题, 包括: 根据所述评论文本包括的每个子句的语义信 息及每个子句的上下文子句的语义信 息, 识别每个子句所属的主题。 5.根据权利要求4所述的方法, 其特征在于, 所述根据所述评论文本包括的每个子句的 语义信息及每 个子句的上 下文子句的语义信息, 识别每 个子句所属的主题, 包括: 针对所述评论文本包括的每个子句, 将所述子句的语义信息, 所述子句的语义信息和 所述子句的上文子句的语义信息, 所述子句的语义信息和所述子句的下文子句的语义信息权 利 要 求 书 1/2 页 2 CN 115391538 A 2分别输入至预先构建的主题识别模型中, 得到三个输出结果, 从三个输出结果中选取数值 最大的概率所对应的主题作为所述子句所属的主题; 其中, 每个输出结果包括识别为每个 预设的主题的概 率。 6.一种评论文本情感分析装置, 其特 征在于, 包括: 获取单元, 用于获取待进行情 感分析的评论文本, 以及所述评论文本对应的产业类别; 所述评论文本包括至少一个子句; 识别单元, 用于识别所述评论文本包括的每个子句所属的主题; 所述子句所属的主题 为所述子句所属的类别; 划分单元, 用于按照所述评论文本包括的每个子句的位置顺序和所属的主题, 将所述 评论文本包括的各个子句划分为连续的多个组合; 每个组合包括一个子句或多个位置连续 且所属主题相同的子句, 位置相邻的组合所属的主题不同; 情感分析单元, 用于基于每个组合所属的主题, 利用目标情 感分析模型, 对每个组合包 括的每个子句进行情感分析, 得到每个组合包括的每个子句的情感倾向; 其中, 所述目标情 感分析模型为预 先构建的多个情感分析模型中与所述产业类别对应的情感分析模型。 7.根据权利要求6所述的装置, 其特征在于, 所述目标情感分析模型包括与 所述产业类 别对应的句法语义 解析模型和深度模型, 所述情感分析模型, 包括: 第一情感分析子单元, 用于基于每个组合所属的主题, 利用与所述产业类别对应的句 法语义解析模型, 对每个组合包括的每个子句进行句法语义解析, 得到每个组合包括的每 个子句的句法语义 解析结果; 第二情感分析子单元, 用于分析针对每个组合包括的每个子句, 若所述子句的句法语 义解析结果中包括所述子句所属的属 性, 以及所属属 性的情感倾向, 则将所属属 性的情感 倾向作为所述子句的情感倾向, 若所述子句的句法语义解析结果中不包括所述子句所属的 属性和/或所属属性的情感倾向, 则利用与所述产业类别对应的深度模型, 对所述子句进 行 情感分析, 得到所述子句的情感倾向; 所述子句所属的属性为, 该子句所属的主题包括的各 个属性中的一个, 所述主题包括的属性 为所述主题的下一级类别。 8.根据权利要求7所述的装置, 其特征在于, 所述与所述产业类别对应的深度模型包括 与所述产业类别对应向量表征模型和分类模型, 所述第二情感分析子单元在利用对所述产 业类别对应的深度模型, 对所述子句进行情感分析, 得到所述子句的情感倾向时, 具体用 于: 将所述子句输入至与所述产业类别对应的向量表征模型, 得到所述子句的语义句向 量; 利用与所述产业类别对应的分类模型, 对所述子句的语义句向量进行情感分析, 得到 所述子句的情感倾向。 9.一种存储介质, 其特征在于, 所述存储介质存储有指令集, 其中, 所述指令集被处理 器执行时实现如权利要求1 ‑5任意一项所述的评论文本情感分析 方法。 10.一种电子设备, 其特 征在于, 包括: 存储器, 用于存 储至少一组指令集; 处理器, 用于执行所述存储器中存储的指令集, 通过执行所述指令集实现如权利要求 1‑5任意一项所述的评论文本情感分析 方法。权 利 要 求 书 2/2 页 3 CN 115391538 A 3

PDF文档 专利 一种评论文本情感分析方法及装置、存储介质及电子设备

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种评论文本情感分析方法及装置、存储介质及电子设备 第 1 页 专利 一种评论文本情感分析方法及装置、存储介质及电子设备 第 2 页 专利 一种评论文本情感分析方法及装置、存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:00上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。