全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210954341.7 (22)申请日 2022.08.10 (71)申请人 西南民族大 学 地址 610041 四川省成 都市武侯区一环路 南四段16号 (72)发明人 郑俊辉  (74)专利代理 机构 北京正华智诚专利代理事务 所(普通合伙) 11870 专利代理师 李林合 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 一种基于层次化信息交互的文档级事件检 测方法 (57)摘要 本发明公开了一种基于层次化信息交互的 文档级事件检测方法获取高度概括的摘要信息; 使用预训练的句子特征抽取器提取每个句子的 特征表示, 得到细粒度的句子级信息; 为每种事 件类型生 成特征表示, 以先验知识引导事件检测 分类器进行事件检测; 进行维度统一以对齐句子 的特征表 示与摘要信息的特征表 示, 并加入句子 特征与摘要特征的联合表示, 获得底层的句子特 征、 高层的摘要特征与二者的联合表示; 将层次 化的特征与每种事件类型的特征表示共同输入 事件检测器中, 预测该文档所涵盖的事件类型。 本发明解决了文档级事件检测任务中文本上下 文长度受限以及缺乏有利的方法以解决单文档 多事件的问题, 从而使文档级事件检测更加具有 准确性及可解释性。 权利要求书2页 说明书6页 附图3页 CN 115292494 A 2022.11.04 CN 115292494 A 1.一种基于层次化信息交 互的文档级事 件检测方法, 包 含以下步骤: 步骤1: 使用摘要特征编码器获取文档的摘要信息的特征表示, 得到高度概括的摘要信 息; 步骤2: 使用预训练 的句子特征抽取器提取每个句子的特征表示, 得到细粒度的句子级 信息; 步骤3: 为每种事件类型生成特征表示, 以先验知识引导事件检测分类器进行事件检 测; 步骤4: 利用信息融合机制进行维度统, 以对齐句子的特征表示与摘要信息的特征表 示, 加入句子特征与摘要 特征的联合表示, 获得底层的句子特征、 高层的摘要 特征与二者的 联合表示; 步骤5: 将层次化的特征与每种事件类型的特征表示共同输入事件检测器 中, 预测该文 档所涵盖的事 件类型。 2.根据权利要求1所述的基于层次化信 息交互的文档级事件检测方法, 其特征在于, 步 骤1中包含以下步骤: 步骤1.1: 对输入文档d进行分句预处 理操作, 得到含有NS个句子的文档 d={s1, s2,…, sNS}, 每个句子表示 为 其中, Nw表示句子中字的数目, dw为字的词向量维度。 步骤1.2: 使用mT5模型作为文本摘要抽 取器, 利用mt5模型提取文档的摘要句, 其过程 如下所示: d′=mT5(d) D=Resize(d ′)其中, 表示文本摘要抽取器所生成的摘要句, 表示 对摘要句对 应的矩阵进行维度变换后得到的新 特征表示, Mw为摘要句中子的个数, dw为字的 词向量维度。 3.根据权利要求1所述的基于层次化信 息交互的文档级事件检测方法, 其特征在于, 步 骤2具体为: 使用BERT作为句子级编码器, 得到句子si的上下文表示ci, 过程如下 所示: ci=Bert(si) 其中, 表示得到的句子si的特征表示。 4.根据权利要求1所述的基于层次化信 息交互的文档级事件检测方法, 其特征在于, 步 骤3具体为: 为每种事件类型生成随机的特征矩阵Eα, 得到一个二维矩阵, 其中α表示第α种 事件类型, 具体为: 根据均匀分布随机生成初始二维矩阵eα, 将该二维矩阵送至全连接神经 网络中, 得到每种事 件类型对应的特 征矩阵Eα: eα~U(0, 1) Eα=Wa*eα 其中, 表示随机生成的二 维矩阵, m、 n为二维矩阵的维度, 表示全 连接神经网络的参数矩阵。权 利 要 求 书 1/2 页 2 CN 115292494 A 25.根据权利要求1所述的基于层次化信 息交互的文档级事件检测方法, 其特征在于, 步 骤4中包含以下步骤: 步骤4.1: 根据步骤2中的句子得到的句子si的特征表示, 得到的所有句子表示 经 过池化操作计算, 将所有句子的特 征矩阵变换为单个向量c: 其中, 表示所有句子的特 征; 步骤4.2: 对步骤1得到的摘要句对应的特征表示 和步骤4.1得到的所有句子的 特征向量 作哈达玛积得到两者的联合表示, 将摘要句的特征表示和所有句子的特 征向量及其联合表示进行拼接, 得到拼接的联合表示: g=D⊙c 其中,⊙表示哈达玛积运算, 表示向量拼接操作, h表示摘要句的特征表示和所有句子 的特征向量的联合表示, h表示 拼接的联合表示。 6.根据权利要求1所述的基于层次化信 息交互的文档级事件检测方法, 其特征在于, 步 骤5中包含以下步骤: 步骤5.1: 对步骤4.2中得到拼接的联合表示h与事件的先验信息, 经过全连接神经网络 将其映射到事件类型子表示空间上, 通过sigmoid激活函数得到其涵盖任意一种事件类型 的概率 p=sigmo id(FNN(h)) 其中, FNN表示全连接神经网络 。 步骤5.2: 重复进行步骤5.1的二分类任务进行标签分类, 对预测结果使用二分类的交 叉熵损失函数计算 其损失值: p=Multi_label(sigmo id(FNN(h))) lossEF=BinaryCros sEntropy(label, pred) 其中, j表示具体任务涵盖的事 件类型的数目。权 利 要 求 书 2/2 页 3 CN 115292494 A 3

PDF文档 专利 一种基于层次化信息交互的文档级事件检测方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于层次化信息交互的文档级事件检测方法 第 1 页 专利 一种基于层次化信息交互的文档级事件检测方法 第 2 页 专利 一种基于层次化信息交互的文档级事件检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。