全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210935734.3 (22)申请日 2022.08.04 (71)申请人 华南师范大学 地址 528225 广东省佛山市南海区狮山 南 海软件园华 南师范大学软件学院 (72)发明人 曾碧卿 冯灵聪 周斯颖  (74)专利代理 机构 广州骏思知识产权代理有限 公司 44425 专利代理师 张金龙 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/284(2020.01) G06F 40/211(2020.01) G06F 40/126(2020.01) G06N 3/04(2006.01) (54)发明名称 一种方面级情感三元 组提取方法、 装置及计 算机设备 (57)摘要 本发明涉及一种方面级情感三元组提取方 法、 装置及计算机设备。 本发明所述的一种方面 级情感三元 组提取方法包括以下步骤, 获取输入 的语句, 对其进行编码, 得到所述语句中的单词 的上下文表 示, 构建区间级别的词性标注信息和 成分句法信息, 使得模型能够 充分学习区间文本 内部单词的语义联系信息进而得到区间特征表 示; 通过图神经网络和依存句法关系, 并融合区 间特征表 示, 提取方面术语和意见术语 之间的语 义交互信息, 得到方面 ‑术语特征表示; 再完成情 感极性的判断, 完成情感三元组的提取。 本发明 所述的一种方面级情感三元 组提取方法、 装置及 计算机设备, 具有能学习内部的语义信息以及术 语之间的交互信息, 提高方面级情感三元组提取 准确度的优点。 权利要求书3页 说明书11页 附图3页 CN 115270814 A 2022.11.01 CN 115270814 A 1.一种方面级情感三元组提取 方法, 其特 征在于, 包括以下步骤: 获取输入的语句, 对其进行编码, 得到所述语句中单词的上 下文表示; 根据所述单词的上下文表示, 构建区间级别的词性表示和语义构成表示; 根据所述词 性表示和所述语义构成表示, 结合上 下文单词表示得到区间特 征表示; 将所述区间特 征表示输入到多层感知机, 提取 得到方面 术语和意见术语; 将所述单词的上下文表示和预处理 的依存关系矩阵输入至注意力图神经网络, 获得单 词级别的依存句法关系表示; 通过注意力机制给每一个所述单词级别的依存句法关系分配 权重, 获得区间级别的依存句法关系表示; 将方面术语的区间特征、 方面术语对应的区间级 别的依存句法关系表示、 意见术语的区间特征、 意见术语对应的区间级别的依存句法关系 表示、 以及一个可训练的宽度嵌入矩阵拼接获得 方面‑意见表示; 将所述方面意见 ‑表示输入到多层感知机, 提取情 感极性, 结合提取的所述方面术语与 所述意见术语, 完成所述情感三元组的提取。 2.根据权利要求1所述的一种方面级情感三元组提取方法, 其特征在于, 根据 所述单词 的上下文表示, 构建区间级别的词性表示和语义构成表示的方法包括: 根据所述单词的上 下文表示, 枚举所有可能的区间span; spana,b={sa,sa+1,…,si,…,sb}, 其中a代表第a个单词, b代 表第b个单词, 且b>=a; 对所述单词的上下文表示进行词性标注, 将词性标注区间映射成词性嵌入矩阵 通过所述自注意力机制为每个单词的成分路径标签分配权重, 通 过如下公式得到区间级别的词性特 征表示pa,b; 其中 为缩放因子, σ 为激活函数, Wp1、 Wp2、 Wp3均为可学习的矩阵。 根据所述单词的上下文表示构建成分句法树, 统计每个单词的成分路径, 并映射成成 分路径嵌入矩阵 通过所述自注意力机制为每个单词的成分 路径标签分配权 重, 通过如下公式得到单词级别的语义构成表示 其中 为缩放因子, σ 为激活函数, Wp1、 Wp2、 Wp3均为可学习的矩阵。 通过自注意力 机制为区间中的每一个单词分配权重, 通过如下公式得到区间级别的语 义构成表示ca,b; 权 利 要 求 书 1/3 页 2 CN 115270814 A 2其中 为缩放因子, σ 为激活函数, Wp1、 Wp2、 Wp3均为可学习的矩阵。 3.根据权利要求2所述的一种方面级情感三元组提取方法, 其特征在于, 根据 所述词性 表示和所述语义构成表示, 融合上 下文单词表示得到区间特 征表示的方法包括: 根据所述区间级别的词性表示pa,b和所述区间级别的语义构成表示ca,b, 使用多层感知 机作为聚合器, 通过如下公式得到区间级别的词性 ‑成分句法表示 ka,b; 其中σ 为激活函数, 代表拼接操作, MLPs代表多层感知机(Multi ‑Layer perceptron, MLP)。 通过拼接获得区间特 征表示sa,b; 其中 为上下文表示的第a、 b个单词, fwidth(a,b)代表可以训练的宽度嵌入矩阵。 4.根据权利要求3所述的一种方面级情感三元组提取方法, 其特征在于, 将所述 区间特 征表示输入到多层感知机, 提取得到方面术语和意见术语; 提取所述方面术语和意见术语 的方法为: P(m|sa,b)=σ(MLPm(sa,b)) 其中σ 为激活函数, 类别m∈{方面 术语,意见术语,无效}, MLPm代表多层感知机 。 5.根据权利要求4所述的一种方面级情感三元组提取方法, 其特征在于, 选取概率排名 前50%的区间作为 候选的方面 术语和意见术语。 6.根据权利要求1 ‑5所述的一种方面级情感三元组提取方法, 其特征在于, 将所述单词 的上下文表示并结合预 处理的依存关系矩阵输入至注意力图神经网络, 获得单词级别的依 存句法关系表示; 是通过如下步骤完成的: 将每种依存类别映射成相应的类别嵌入矩阵 通过所述注意力机制为单词之间的联系分配权 重 其中 和 分别为xi和xj的中间变量, 它 们通过以下公式计算得到; 根据相应的权 重 获得单词级别的依存句法表示 其中, σ 为激活函数, W(l), b(l)为可学习的矩阵。 7.根据权利要求6所述的一种方面级情感三元组提取方法, 其特征在于, 通过注意力 机权 利 要 求 书 2/3 页 3 CN 115270814 A 3

PDF文档 专利 一种方面级情感三元组提取方法、装置及计算机设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种方面级情感三元组提取方法、装置及计算机设备 第 1 页 专利 一种方面级情感三元组提取方法、装置及计算机设备 第 2 页 专利 一种方面级情感三元组提取方法、装置及计算机设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。