全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211245739.X (22)申请日 2022.10.12 (71)申请人 中国人民解 放军国防科技大 学 地址 410073 湖南省长 沙市开福区德雅路 109号 (72)发明人 王懋 韦晖 刘丽华 吴继冰  肖开明 朱汉卿 杨皓宇  (74)专利代理 机构 长沙大珂知识产权代理事务 所(普通合伙) 4323 6 专利代理师 伍志祥 (51)Int.Cl. G06F 16/35(2019.01) G06N 3/04(2006.01) G06F 40/295(2020.01) G06F 40/30(2020.01)G06K 9/62(2022.01) (54)发明名称 图神经网络事件检测模型的鲁棒性分析方 法 (57)摘要 本发明公开了图神经网络事件检测模型的 鲁棒性分析方法, 包括: 通过通用文本变换和亚 种群变换将原始文本数据转换为对抗数据, 将词 向量化为 并输入 Bi‑LSTM网络中, 对输入序列进行句法依存分析, 得到句法依存图; 将句法依存图中的边嵌入向量 空间, 得到一个边表示张量; 将每个节点的表示 变换到dg维后, 每层中每个节点的向量通过边表 示张量聚合邻居节点更新; 将各个节点的最终表 示输入全 连接网络, 计算所有事件类型的概率分 布, 将概率最大的事件标签作为分类结果并输 出。 本发明在存在对抗数据时性能优于现有模 型。 权利要求书3页 说明书13页 附图3页 CN 115329088 A 2022.11.11 CN 115329088 A 1.图神经网络事 件检测模型的鲁棒 性分析方法, 其特 征在于, 包括以下步骤: 获取原始文本数据; 通过通用文本变换和亚种群变换, 将原始文本数据转换为对抗数据, 将对抗数据作为 输入序列 , 其中 为第i个token的向量, n为序列中to ken的数量; 将 向量化为 , 其中 和 分别表示 的词嵌入 向量和实体 类型嵌入向量, dw、de分别是所述词嵌入向量和实体 类型嵌入向量的维度; 将 输入隐藏层维度为 dl /2的Bi‑LSTM网络中, 分别为 的正向隐层状态和反向隐层状态, 用 来表示 每个token的 ; 同时对输入序列进行句法依存分析, 即将单词作为节点, 依存关系作为边, 得到句法依存图; 将句法依存图中的边嵌入向量空间, 得到一个边表示张量; 将每个节点的表示变换到dg维后, 作为EE‑GCN神 经网络中第1层的输入状态, 层 中每个节点的向量通过边表示 张量聚合邻居节点更 新, L为EE‑GCN神经网络的层数; 将各个节点的最终表示 输入全连接网络, 使用Softmax函数计算所有事件类型的概 率分布, 将概率最大 的事件标签作为分类结果并输出, 使用有偏损失函数来增强事件标签 对训练过程的影响。 2.根据权利要求1所述的图神经网络事件检测模型的鲁棒性分析方法, 其特征在于, 层 中每个节点的向量 通过边表示张量聚合邻居节点更新, 层 l的输出状态如下: 分别是第 l层中各个通道的节点表示, p是通道数; 具体而言, 聚合是在边表示张量中逐通道进行的, 如下 所示: 其中, Pool表示平均池化操作, 用于压缩所有通道的信息, 是一个可学 习的参数, 是ReLU激活函数。 3.根据权利要求2所述的图神经网络事件检测模型的鲁棒性分析方法, 其特征在于, 层 中各边的向量更新如下 所示: 其中, 是一个可学习的参数, 表示连接操作, 是第l层中第i权 利 要 求 书 1/3 页 2 CN 115329088 A 2个节点的表示, 是第l层中第j个节点的表示, n是节点数量。 4.根据权利要求1所述的图神经网络事件检测模型的鲁棒性分析方法, 其特征在于, 所 述使用Softmax函数计算所有事 件类型的概 率分布的公式如下: 其中, 为各个节点的最终表示, 将最终表示 映射为在各个事件类型上的特征 得分,bC是偏置项。 5.根据权利要求4所述的图神经网络事件检测模型的鲁棒性分析方法, 其特征在于, 所 述有偏损失函数如下: 其中,NS是句子个数, ni是句子si的单词个数, 是单词的真实事件标签; 若单词的事件 类型是‘O’则I(O)等于1, 否则等于0; 是大于1的权重系数, 是使损失函数值最小时的估 计值。 6.根据权利要求1所述的图神经网络事件检测模型的鲁棒性分析方法, 其特征在于, 所 述通用文本变换包括K eyboard、 Ocr、 Spel lingError、 Tense、 Typos、 SwapSyn和EntTypos。 7.根据权利要求1所述的图神经网络事件检测模型的鲁棒性分析方法, 其特征在于, 选 择Length ‑subpopulation来基于文本长度对原始数据进行过滤, 以生成亚种群, 并选择 GPT‑2语言模型的Perplexity函数或算法来筛选原始数据, 以生成亚种群, 其公式如下所 示: 其中 是GPT‑2语言模型生成文本序列 的概率。 8.根据权利要求3所述的图神经网络事件检测模型的鲁棒性分析方法, 其特征在于, 引 入多阶距离表示方法, 以捕捉长距离词之间的关联, 增强触发词上下文感知能力, 并使用基 于注意力权重的边表 示更新方法, 在引入多阶距离的情况下更好地在边更新中区分不同类 型边的重要性。 9.根据权利要求8所述的图神经网络事件检测模型的鲁棒性分析方法, 其特征在于, 所 述多阶距离表示方法将所有距离为2和3的边的标签分别设置为 “distance: 2 ”和 “distance: 3 ”, 只有这些边的嵌入向量 参与后续节点更新和边更新的计算。 10.根据权利要求8所述的图神经网络事件检测模型的鲁棒性分析方法, 其特征在于, 所述基于注意力权重的边表示更新方法, 将 每个边的向量表示根据边两端节点计算的权重 分数进行 更新, 其在数 学上的定义如下:权 利 要 求 书 2/3 页 3 CN 115329088 A 3

PDF文档 专利 图神经网络事件检测模型的鲁棒性分析方法

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图神经网络事件检测模型的鲁棒性分析方法 第 1 页 专利 图神经网络事件检测模型的鲁棒性分析方法 第 2 页 专利 图神经网络事件检测模型的鲁棒性分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:38上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。