(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210935734.3
(22)申请日 2022.08.04
(71)申请人 华南师范大学
地址 528225 广东省佛山市南海区狮山 南
海软件园华 南师范大学软件学院
(72)发明人 曾碧卿 冯灵聪 周斯颖
(74)专利代理 机构 广州骏思知识产权代理有限
公司 44425
专利代理师 张金龙
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/284(2020.01)
G06F 40/211(2020.01)
G06F 40/126(2020.01)
G06N 3/04(2006.01)
(54)发明名称
一种方面级情感三元 组提取方法、 装置及计
算机设备
(57)摘要
本发明涉及一种方面级情感三元组提取方
法、 装置及计算机设备。 本发明所述的一种方面
级情感三元 组提取方法包括以下步骤, 获取输入
的语句, 对其进行编码, 得到所述语句中的单词
的上下文表 示, 构建区间级别的词性标注信息和
成分句法信息, 使得模型能够 充分学习区间文本
内部单词的语义联系信息进而得到区间特征表
示; 通过图神经网络和依存句法关系, 并融合区
间特征表 示, 提取方面术语和意见术语 之间的语
义交互信息, 得到方面 ‑术语特征表示; 再完成情
感极性的判断, 完成情感三元组的提取。 本发明
所述的一种方面级情感三元 组提取方法、 装置及
计算机设备, 具有能学习内部的语义信息以及术
语之间的交互信息, 提高方面级情感三元组提取
准确度的优点。
权利要求书3页 说明书11页 附图3页
CN 115270814 A
2022.11.01
CN 115270814 A
1.一种方面级情感三元组提取 方法, 其特 征在于, 包括以下步骤:
获取输入的语句, 对其进行编码, 得到所述语句中单词的上 下文表示;
根据所述单词的上下文表示, 构建区间级别的词性表示和语义构成表示; 根据所述词
性表示和所述语义构成表示, 结合上 下文单词表示得到区间特 征表示;
将所述区间特 征表示输入到多层感知机, 提取 得到方面 术语和意见术语;
将所述单词的上下文表示和预处理 的依存关系矩阵输入至注意力图神经网络, 获得单
词级别的依存句法关系表示; 通过注意力机制给每一个所述单词级别的依存句法关系分配
权重, 获得区间级别的依存句法关系表示; 将方面术语的区间特征、 方面术语对应的区间级
别的依存句法关系表示、 意见术语的区间特征、 意见术语对应的区间级别的依存句法关系
表示、 以及一个可训练的宽度嵌入矩阵拼接获得 方面‑意见表示;
将所述方面意见 ‑表示输入到多层感知机, 提取情 感极性, 结合提取的所述方面术语与
所述意见术语, 完成所述情感三元组的提取。
2.根据权利要求1所述的一种方面级情感三元组提取方法, 其特征在于, 根据 所述单词
的上下文表示, 构建区间级别的词性表示和语义构成表示的方法包括:
根据所述单词的上 下文表示, 枚举所有可能的区间span;
spana,b={sa,sa+1,…,si,…,sb}, 其中a代表第a个单词, b代 表第b个单词, 且b>=a;
对所述单词的上下文表示进行词性标注, 将词性标注区间映射成词性嵌入矩阵
通过所述自注意力机制为每个单词的成分路径标签分配权重, 通
过如下公式得到区间级别的词性特 征表示pa,b;
其中
为缩放因子, σ 为激活函数, Wp1、 Wp2、 Wp3均为可学习的矩阵。
根据所述单词的上下文表示构建成分句法树, 统计每个单词的成分路径, 并映射成成
分路径嵌入矩阵
通过所述自注意力机制为每个单词的成分
路径标签分配权 重, 通过如下公式得到单词级别的语义构成表示
其中
为缩放因子, σ 为激活函数, Wp1、 Wp2、 Wp3均为可学习的矩阵。
通过自注意力 机制为区间中的每一个单词分配权重, 通过如下公式得到区间级别的语
义构成表示ca,b;
权 利 要 求 书 1/3 页
2
CN 115270814 A
2其中
为缩放因子, σ 为激活函数, Wp1、 Wp2、 Wp3均为可学习的矩阵。
3.根据权利要求2所述的一种方面级情感三元组提取方法, 其特征在于, 根据 所述词性
表示和所述语义构成表示, 融合上 下文单词表示得到区间特 征表示的方法包括:
根据所述区间级别的词性表示pa,b和所述区间级别的语义构成表示ca,b, 使用多层感知
机作为聚合器, 通过如下公式得到区间级别的词性 ‑成分句法表示 ka,b;
其中σ 为激活函数,
代表拼接操作, MLPs代表多层感知机(Multi ‑Layer perceptron,
MLP)。
通过拼接获得区间特 征表示sa,b;
其中
为上下文表示的第a、 b个单词, fwidth(a,b)代表可以训练的宽度嵌入矩阵。
4.根据权利要求3所述的一种方面级情感三元组提取方法, 其特征在于, 将所述 区间特
征表示输入到多层感知机, 提取得到方面术语和意见术语; 提取所述方面术语和意见术语
的方法为:
P(m|sa,b)=σ(MLPm(sa,b))
其中σ 为激活函数, 类别m∈{方面 术语,意见术语,无效}, MLPm代表多层感知机 。
5.根据权利要求4所述的一种方面级情感三元组提取方法, 其特征在于, 选取概率排名
前50%的区间作为 候选的方面 术语和意见术语。
6.根据权利要求1 ‑5所述的一种方面级情感三元组提取方法, 其特征在于, 将所述单词
的上下文表示并结合预 处理的依存关系矩阵输入至注意力图神经网络, 获得单词级别的依
存句法关系表示; 是通过如下步骤完成的:
将每种依存类别映射成相应的类别嵌入矩阵
通过所述注意力机制为单词之间的联系分配权 重
其中
和
分别为xi和xj的中间变量, 它 们通过以下公式计算得到;
根据相应的权 重
获得单词级别的依存句法表示
其中, σ 为激活函数, W(l),
b(l)为可学习的矩阵。
7.根据权利要求6所述的一种方面级情感三元组提取方法, 其特征在于, 通过注意力 机权 利 要 求 书 2/3 页
3
CN 115270814 A
3
专利 一种方面级情感三元组提取方法、装置及计算机设备
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:14:18上传分享