全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211034115.3 (22)申请日 2022.08.26 (71)申请人 重庆交通大 学 地址 400074 重庆市南岸区学府大道6 6号 (72)发明人 李韧 任浩 杨建喜 蒋仕新  王笛 刘新龙 张廷萍  (74)专利代理 机构 重庆博凯知识产权代理有限 公司 50212 专利代理师 黄河 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) G06F 40/295(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) (54)发明名称 面向桥梁检测领域文本的少样本关系分类 装置及分类方法 (57)摘要 本发明涉及关系分类技术领域, 具体涉及面 向桥梁检测领域文本的少样本关系分类装置及 分类方法, 该装置包括上下文特征提取模块、 实 体特征提取模块和关系分类模块; 上下文特征提 取模块包括样本编码器和双向编码网络, 样本编 码器用于将桥梁检测的句子编码为向量形式, 得 到句子编码向量; 双向编码网络用于对句子进行 前向和后向的编码, 将两个方向的编码结果进行 拼接得到句子的上下文特征信息; 实体特征提取 模块用于从句子编码向量中抽取实体编码向量, 并将其转化为实体特征向量。 相比于当前神经网 络少样本关系分类方法, 本发明能够在少样本的 前提下更好地对桥梁检测领域文本包含的不同 关系类型进行分类 。 权利要求书2页 说明书7页 附图1页 CN 115391535 A 2022.11.25 CN 115391535 A 1.面向桥梁检测领域文本的少样本关系分类装置, 其特征在于: 包括上下文特征提取 模块、 实体特 征提取模块和关系分类模块; 上下文特征提取模块包括样本编码器和双向编码网络; 样本编码器用于将桥梁检测的 句子编码为向量形式, 得到句 子的编码向量; 双向编码网络用于对句 子进行前向和后向的 编码以获取上下文的长期依赖特征信息和文本的反向建模特征信息, 并将两个方向的编码 结果进行拼接得到句子的上下文 特征向量; 实体特征提取模块用于从句子编码向量中抽取 实体的编码信息, 通过变换得到实体的特征向量; 关系分类模块用于根据融合上下文特征 向量和实体特 征向量得到的句子信息特 征向量进行关系分类。 2.如权利要求1所述面向桥梁检测领域文本的少 样本关系分类装置, 其特征在于: 所述 样本编码器为预训练语 言模型RoBERTa; 将RoBERTa最后一个隐藏层输出的向量作为句子的 编码向量表示。 3.如权利要求2所述面向桥梁检测领域文本的少 样本关系分类装置, 其特征在于: 所述 双向编码网络为双向长短时记忆网络BiLSTM; 将BiLSTM前向最后一个时刻的隐层向量与 BiLSTM后向的最后一个时刻的隐层向量 拼接, 得到句子的上 下文特征向量。 4.如权利要求3所述面向桥梁检测领域文本的少 样本关系分类装置, 其特征在于: 所述 关系分类模块主 要结构为原型网络Prototypical  Networks。 5.如权利要求4所述面向桥梁检测领域文本的少 样本关系分类装置, 其特征在于: 所述 从句子编 码向量中抽取实体特征向量具体包括: 找到实体在句子中的位置得到实体的编码 信息, 经过激活函数和全连接层得到实体特 征向量。 6.如权利要求1所述面向桥梁检测领域文本的少 样本关系分类装置, 其特征在于: 对面 向桥梁检测领域文本的少样本 关系分类方法进 行训练时, 损失函数为交叉熵损失函数和类 间损失函数; 其中, 类间损失函数定义为每个类别原型之 间的距离的相反数; 所述类别原型 的特征向量为该类别的所有关系实例特 征向量的均值。 7.面向桥梁检测领域文本的少样本关系分类方法, 其特征在于, 使用权利要求1 ‑6任一 项所述的面向桥梁检测领域文本的少样本关系分类装置, 该 方法包括以下步骤: S1、 使用样本编码器将桥梁检测的句子编码为向量形式, 得到句子编码向量; S2、 通过双向编码网络对句子进行前向和后向的编码以获取上下文的长期依赖特征信 息和文本的反向建模特征信息, 并将两个方向的编 码结果进 行拼接得到句子的上下文 特征 向量; S3、 通过实体特征提取模块从从句子编码向量中抽取实体的编码信息, 通过变换得到 实体的特征向量; 并将实体特征向量与对应的句子的上下文特征向量进行融合, 得到句 子 用于分类的信息特 征向量; S4、 使用关系分类模块 根据句子的信息特 征向量进行关系分类。 8.如权利要求7所述的面向桥梁检测领域文本的少样本关系分类方法, 其特征在于: S1 中, 所述样本编码器为预训练语言模型RoBERTa; 将RoBERTa最后一个隐藏层输出的隐藏状 态作为句子编码向量的编码特 征表示。 9.如权利要求8所述的面向桥梁检测领域文本的少样本关系分类方法, 其特征在于: S2 中, 所述双向编码网络为双向长短时记忆网络BiLSTM; 将BiLSTM前向最后一个时刻的隐层 向量与BiLSTM后向的最后一个时刻的 隐层状态向量拼接, 得到句子最 终的上下文 特征向量权 利 要 求 书 1/2 页 2 CN 115391535 A 2表示。 10.如权利要求9所述的面向桥梁检测领域文本的少样本关系分类方法, 其特征在于: S4中, 所述关系分类模块 为原型网络Prototypical  Networks。权 利 要 求 书 2/2 页 3 CN 115391535 A 3

PDF文档 专利 面向桥梁检测领域文本的少样本关系分类装置及分类方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 面向桥梁检测领域文本的少样本关系分类装置及分类方法 第 1 页 专利 面向桥梁检测领域文本的少样本关系分类装置及分类方法 第 2 页 专利 面向桥梁检测领域文本的少样本关系分类装置及分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。