全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210361753.X (22)申请日 2022.04.07 (71)申请人 北京捷通 华声科技股份有限公司 地址 100193 北京市海淀区东北旺西路8号 9号楼3层2区318 (72)发明人 陈志优 李健 陈明 武卫东  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 专利代理师 苏培华 (51)Int.Cl. G06F 40/289(2020.01) G06F 40/295(2020.01) G06F 40/216(2020.01) G06F 40/30(2020.01) G06N 3/02(2006.01) (54)发明名称 一种事件要素抽取方法、 装置、 电子设备及 存储介质 (57)摘要 本发明是关于一种事件要素抽取方法、 装 置、 电子设备及存储介质, 包括: 对事件文本 数据 进行处理, 得到多目标联合学习模型; 基于多目 标联合学习模 型对触发词进行抽取, 得到触发词 要素和触发词的位置信息; 根据触发词的位置信 息, 基于多目标联合学习模型对主动实体进行抽 取, 得到主动实体要素、 被动实体要素 以及事件 值要素; 根据触发词要素、 主动实体要素、 被动实 体要素以及事件值要素生 成事件要素, 本发明通 过使用识别触发词后抽取实体信息的方式进行 案情要素抽取, 使用神经网络进行触发词抽取, 相对于词库匹配, 可 以明显的降低误识别, 降低 错误累计, 提高整体识别效果。 权利要求书2页 说明书9页 附图2页 CN 115329761 A 2022.11.11 CN 115329761 A 1.一种事 件要素抽取 方法, 其特 征在于, 所述方法包括: 对事件文本数据进行处 理, 得到多目标 联合学习模型; 基于所述多目标联合学习模型对触发词 进行抽取, 得到触发词要素和触发词的位置信 息; 根据所述触发词的位置信息, 基于所述多目标联合学习模型对主动实体、 被动实体以 及事件值进行抽取, 得到主动实体要素、 被动实体要素以及事 件值要素; 根据所述触发词要素、 所述主动实体要素、 所述被动实体要素以及事件值要素生成事 件要素。 2.根据权利要求1所述的方法, 其特征在于, 所述对事件文本数据进行处理, 得到多目 标联合学习模型, 包括: 获取所述事件文本数据, 从所述事 件文本数据中筛 选出所述触发词; 对所述事件文本数据和所述触发词进行预处理, 得到得到所述触发词在所述事件文本 数据中的位置信息以及事 件文本数据标签; 根据预设的同一预训练语言模型对所述位置信息以及所述事件文本数据标签进行语 义信息训练, 得到所述多目标 联合学习模型。 3.根据权利要求2所述的方法, 其特征在于, 所述对所述事件文本数据和所述触发词进 行预处理, 得到得到所述触发词在所述事件文本数据中的位置信息以及事件文本数据标签 包括: 对所述触发词和事件文本数据进行序列 标注, 得到所述触发词在所述事件文本数据中 的位置信息以及事件文本数据标签, 其中, 所述位置信息包括触发词的初始位置信息和末 端位置信息, 所述事 件文本数据标签包括主动实体标签、 被动实体标签和事 件值标签。 4.根据权利要求2所述的方法, 其特征在于, 所述根据预设的同一预训练语言模型对所 述位置信息以及所述事件文本数据标签进 行语义信息训练, 得到所述多目标联合学习模型 包括: 将所述触发词位置信息中的所述初始位置信息和所述末端位置信息输入语义向量模 型得到对应的语义向量, 将两个所述语义向量进行拼接处 理, 得到条件语义信息; 将所述条件语义信 息加入事件文本数据的初始语义信 息中, 结合预设的同一预训练语 言模型对所述位置信息以及所述事件文本数据标签进 行语义信息训练, 得到所述多目标联 合学习模型。 5.一种事 件要素抽取装置, 其特 征在于, 所述装置包括: 处理模块, 用于对 事件文本数据进行处 理, 得到多目标 联合学习模型; 第一抽取模块, 基于所述多目标联合学习模型对触发词进行抽取, 得到触发词要素和 触发词的位置信息; 第二抽取模块, 用于根据所述触发词的位置信息, 基于所述多目标联合学习模型对主 动实体、 被动实体 以及事件值进行抽取, 得到主动实体要素、 被动实体要素以及事件值要 素; 生成模块, 用于根据 所述触发词要素、 所述主动实体要素、 所述被动实体要素以及事件 值要素生成事 件要素。 6.根据权利要求5所述的装置, 其特 征在于, 所述处 理模块包括:权 利 要 求 书 1/2 页 2 CN 115329761 A 2筛选单元, 用于获取 所述事件文本数据, 从所述事 件文本数据中筛 选出所述触发词; 预处理单元, 用于对所述事件文本数据和所述触发词进行预处理, 得到得到所述触发 词在所述事 件文本数据中的位置信息以及事 件文本数据标签; 训练单元, 用于根据 预设的同一预训练语言模型对所述位置信 息以及所述事件文本数 据标签进行语义信息训练, 得到所述多目标 联合学习模型。 7.根据权利要求6所述的装置, 其特 征在于, 所述预处 理单元包括: 标注子单元, 用于对所述触发词和事件文本数据进行序列标注, 得到所述触发词在所 述事件文本数据中的位置信息以及事件文本数据标签, 其中, 所述位置信息包括触发词的 初始位置信息和末端位置信息, 所述事件文本数据标签包括主动实体标签、 被动实体标签 和事件值标签。 8.根据权利要求6所述的装置, 其特 征在于, 所述训练单 元包括: 拼接子单元, 用于将所述触发词位置信 息中的所述初始位置信 息和所述末端位置信 息 输入语义向量模型得到对应的语义向量, 将两个所述语义向量进行拼接处理, 得到条件语 义信息; 结合子单元, 用于将所述条件语义信息加入事件文本数据的初始语义信息中, 结合预 设的同一预训练语言模型对所述位置信息以及所述事件文本数据标签进 行语义信息训练, 得到所述多目标 联合学习模型。 9.一种电子设备, 其特 征在于, 包括: 处理器; 用于存储处理器可执行指令的存 储器; 其中, 所述处理器被配置为执行所述指令, 以实现如权利要求1至4中任一项所述的事 件要素抽取 方法。 10.一种计算机可读存储介质, 当所述存储介质中的指令由移动终端的处理器执行时, 使得移动终端能够执 行如权利要求1至4中任一项所述的事 件要素抽取 方法。权 利 要 求 书 2/2 页 3 CN 115329761 A 3

.PDF文档 专利 一种事件要素抽取方法、装置、电子设备及存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种事件要素抽取方法、装置、电子设备及存储介质 第 1 页 专利 一种事件要素抽取方法、装置、电子设备及存储介质 第 2 页 专利 一种事件要素抽取方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:44:19上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。