专利一种事件要素抽取方法、装置、电子设备及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210361753.X (22)申请日 2022.04.07 (71)申请人北京捷通华声科技股份有限公司地址 100193 北京市海淀区东北旺西路8号 9号楼3层2区318 (72)发明人陈志优　李健　陈明　武卫东　 (74)专利代理机构北京润泽恒知识产权代理有限公司 1 1319 专利代理师苏培华 (51)Int.Cl. G06F 40/289(2020.01) G06F 40/295(2020.01) G06F 40/216(2020.01) G06F 40/30(2020.01) G06N 3/02(2006.01) (54)发明名称一种事件要素抽取方法、装置、电子设备及存储介质 (57)摘要本发明是关于一种事件要素抽取方法、装置、电子设备及存储介质，包括：对事件文本数据进行处理，得到多目标联合学习模型；基于多目标联合学习模型对触发词进行抽取，得到触发词要素和触发词的位置信息；根据触发词的位置信息，基于多目标联合学习模型对主动实体进行抽取，得到主动实体要素、被动实体要素以及事件值要素；根据触发词要素、主动实体要素、被动实体要素以及事件值要素生成事件要素，本发明通过使用识别触发词后抽取实体信息的方式进行案情要素抽取，使用神经网络进行触发词抽取，相对于词库匹配，可以明显的降低误识别，降低错误累计，提高整体识别效果。权利要求书2页说明书9页附图2页 CN 115329761 A 2022.11.11 CN 115329761 A 1.一种事件要素抽取方法，其特征在于，所述方法包括：对事件文本数据进行处理，得到多目标联合学习模型；基于所述多目标联合学习模型对触发词进行抽取，得到触发词要素和触发词的位置信息；根据所述触发词的位置信息，基于所述多目标联合学习模型对主动实体、被动实体以及事件值进行抽取，得到主动实体要素、被动实体要素以及事件值要素；根据所述触发词要素、所述主动实体要素、所述被动实体要素以及事件值要素生成事件要素。 2.根据权利要求1所述的方法，其特征在于，所述对事件文本数据进行处理，得到多目标联合学习模型，包括：获取所述事件文本数据，从所述事件文本数据中筛选出所述触发词；对所述事件文本数据和所述触发词进行预处理，得到得到所述触发词在所述事件文本数据中的位置信息以及事件文本数据标签；根据预设的同一预训练语言模型对所述位置信息以及所述事件文本数据标签进行语义信息训练，得到所述多目标联合学习模型。 3.根据权利要求2所述的方法，其特征在于，所述对所述事件文本数据和所述触发词进行预处理，得到得到所述触发词在所述事件文本数据中的位置信息以及事件文本数据标签包括：对所述触发词和事件文本数据进行序列标注，得到所述触发词在所述事件文本数据中的位置信息以及事件文本数据标签，其中，所述位置信息包括触发词的初始位置信息和末端位置信息，所述事件文本数据标签包括主动实体标签、被动实体标签和事件值标签。 4.根据权利要求2所述的方法，其特征在于，所述根据预设的同一预训练语言模型对所述位置信息以及所述事件文本数据标签进行语义信息训练，得到所述多目标联合学习模型包括：将所述触发词位置信息中的所述初始位置信息和所述末端位置信息输入语义向量模型得到对应的语义向量，将两个所述语义向量进行拼接处理，得到条件语义信息；将所述条件语义信息加入事件文本数据的初始语义信息中，结合预设的同一预训练语言模型对所述位置信息以及所述事件文本数据标签进行语义信息训练，得到所述多目标联合学习模型。 5.一种事件要素抽取装置，其特征在于，所述装置包括：处理模块，用于对事件文本数据进行处理，得到多目标联合学习模型；第一抽取模块，基于所述多目标联合学习模型对触发词进行抽取，得到触发词要素和触发词的位置信息；第二抽取模块，用于根据所述触发词的位置信息，基于所述多目标联合学习模型对主动实体、被动实体以及事件值进行抽取，得到主动实体要素、被动实体要素以及事件值要素；生成模块，用于根据所述触发词要素、所述主动实体要素、所述被动实体要素以及事件值要素生成事件要素。 6.根据权利要求5所述的装置，其特征在于，所述处理模块包括：权　利　要　求　书 1/2 页 2 CN 115329761 A 2筛选单元，用于获取所述事件文本数据，从所述事件文本数据中筛选出所述触发词；预处理单元，用于对所述事件文本数据和所述触发词进行预处理，得到得到所述触发词在所述事件文本数据中的位置信息以及事件文本数据标签；训练单元，用于根据预设的同一预训练语言模型对所述位置信息以及所述事件文本数据标签进行语义信息训练，得到所述多目标联合学习模型。 7.根据权利要求6所述的装置，其特征在于，所述预处理单元包括：标注子单元，用于对所述触发词和事件文本数据进行序列标注，得到所述触发词在所述事件文本数据中的位置信息以及事件文本数据标签，其中，所述位置信息包括触发词的初始位置信息和末端位置信息，所述事件文本数据标签包括主动实体标签、被动实体标签和事件值标签。 8.根据权利要求6所述的装置，其特征在于，所述训练单元包括：拼接子单元，用于将所述触发词位置信息中的所述初始位置信息和所述末端位置信息输入语义向量模型得到对应的语义向量，将两个所述语义向量进行拼接处理，得到条件语义信息；结合子单元，用于将所述条件语义信息加入事件文本数据的初始语义信息中，结合预设的同一预训练语言模型对所述位置信息以及所述事件文本数据标签进行语义信息训练，得到所述多目标联合学习模型。 9.一种电子设备，其特征在于，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如权利要求1至4中任一项所述的事件要素抽取方法。 10.一种计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行如权利要求1至4中任一项所述的事件要素抽取方法。权　利　要　求　书 2/2 页 3 CN 115329761 A 3

专利 一种事件要素抽取方法、装置、电子设备及存储介质

专利一种事件要素抽取方法、装置、电子设备及存储介质