全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210949264.6 (22)申请日 2022.08.09 (71)申请人 大连理工大 学 地址 116024 辽宁省大连市甘井 子区凌工 路2号 (72)发明人 于硕 黄华飞 夏锋  (74)专利代理 机构 辽宁鸿文知识产权代理有限 公司 21102 专利代理师 许明章 王海波 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/901(2019.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06Q 50/00(2012.01) (54)发明名称 一种基于模体的异构图神经网络假新闻检 测算法 (57)摘要 本发明属于假新闻检测领域, 提供了一种基 于模体的异构图神经网络假新闻检测算法。 首 先, 将社交媒体的原始数据构建成新闻异构图; 其次, 将所有类型的节点映射到相同的特征空 间, 并根据每个异构模体类型分别提取实例; 接 着, 利用实例级注意机制将同类型的所有模体实 例聚合到相应的新闻节点中以捕获关键实例信 息; 然后, 针对不同类型的异构 模体, 使用语义级 注意力机制自适应地聚合不同的新闻语义嵌入; 最后, 将新闻的表示用于下游的假新闻检测任 务。 本发明考虑了社交平台中大量存在的异构高 阶模式, 通过两层注意力机制, 学习到了高效的 新闻节点表示, 并提高了假 新闻检测的效果。 权利要求书3页 说明书8页 附图1页 CN 115269853 A 2022.11.01 CN 115269853 A 1.一种基于模体的异构图神经网络假新闻检测算法, 其特征在于, 该假新闻检测算法, 首先进行数据预 处理, 将来自社 交媒体的原始数据构建成新闻异构图; 其次, 将所有类型的 节点映射到相同的特征空间, 并根据每个异构模体类型分别提取相应实例; 接着, 利用实例 级注意机制将同类型的所有异构模体实例聚合到相应的新闻节点中以捕获关键实例信息; 然后, 针对不同类型 的异构模体实例, 利用语义级注意力机制自适应地聚合不同的新闻语 义嵌入; 最后, 将新闻的表示用于下游的假新闻检测任务, 输出新闻的分类的预测结果, 并 持续优化到最优的模型; 步骤如下: 步骤(1): 数据预处 理, 将社交媒体的原 始数据构建成新闻异构图; 1)从来自社交平台的原始数据中, 抽取3种节点类型: 用户U, 新闻N, 出版商P; 和2种异 构的二元关系: 用户 ‑转发‑新闻U‑N, 出版商‑发布‑新闻P‑N; 2)根据节点和关系, 构建 的新闻异构图 其中, 为节点集合, ε为边 集合, 为节点类型集合, 为边/关系类型集合; 节点v的初始属性为 为节点的类型, dA为该类型节点的属性的维度; 步骤(2): 将所有类型的节点映射到相同的特征空间, 并根据新闻数据提取出3个三阶 异构模体: U ‑N‑U, 多个用户共同转发同一篇新闻, 用户 ‑新闻‑用户; N‑U‑N, 一个用户转发多 篇新闻, 新闻 ‑用户‑新闻; 和N ‑P‑N, 一个出版商发布多篇新闻, 新闻 ‑出版商‑新闻; 分别提 取相应的模体实例; 1)使用一层的MLP将不同类型的节点 转换到相同的特 征空间中: 其中, σ(·)代表非线性函数, 使用ReLU(x)=max{0,x}作为该函数, 和 为可训练的权 重矩阵和偏置向量, dh为特征空间的维度; 2)根据新闻异构图的二阶异构关系, 提取出的三种类型的三阶异构模体, 分别为U ‑N‑ U、 用户‑新闻‑用户, N‑U‑N、 新闻‑用户‑新闻和N‑P‑N、 新闻‑出版商‑新闻; 之后抽取模体实 例, 对于节点v, 抽取类型为 的异构模体实例的集合为 即包含节点v并符合 类型m定义的异构模体的集合; 然后将抽取出来的异构模体实例中包含的节点特征进行拼 接, 对于 的第k个异构模体实例, 得到该异构模体实例的嵌入 节点特征拼接的操 作如下: 其中, (ins_ 1,ins_2, …,ins_n)为 第k个异构模体实例的节点ID, 实例中节点类 型可以不同, CONCAT()为 拼接操作; 步骤(3): 利用注意力机制将相同类型的所有异构模体实例聚合到相应新闻节点中, 得 到节点对于模体的语义表示; 1)应用一层MLP计算节点v相关的每个实例即同属于类型m的异构模体实例的注意力分 数, 然后对其进行归一 化, 计算过程如下: 权 利 要 求 书 1/3 页 2 CN 115269853 A 2其中, 为双曲正切函数, 为可训练的矩阵, 和 为可训练的向量, 为与节点v相关的类型m的异构模体实 例数量; 2)将注意力分数视为权重, 并对实例嵌入进行加权求和, 并得到节点v关于类型m的异 构模体实例的新闻表示, 具体 计算如下: 其中 为非线性激活函数, a=0.02, 为节点v的第k 个异构模体实例的嵌入; 步骤(4): 针对不同类型的异构模体, 自适应地聚合 不同的新闻语义嵌入; 1)通过注意力机制评估每种异构模体的贡献; 语义级注意力计算过程如下: 其中, 为可训练的权重矩阵, 和 为可训练的权重向 量, 为节点的数量, 可衡量类型m的异构模体实例在假新闻检测任务中的 重要性; 2)利用注意力分数, 自适应加权求和与节点v相关的所有语义表示: 其中 为异构模体实例类型的数量; 步骤(5): 输出新闻的分类的预测结果, 并持续优化到最优的模型; 1)对于假新闻检测, 用一层MLP将其转换为下游任务表示, 节点v的下游任务表示计算 如下: zv=σ(hvWz+bz) 其中, 为可训练的权 重矩阵, 为可训练的偏置向量; 2)通过Softmax变换, 从下游任务表示中获得预测的软标签, 节点v的预测软标签计算 如下: 3)通过交叉熵损失进行训练优化模型参数, 直到假 新闻检测模型收敛到最优;权 利 要 求 书 2/3 页 3 CN 115269853 A 3

PDF文档 专利 一种基于模体的异构图神经网络假新闻检测算法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于模体的异构图神经网络假新闻检测算法 第 1 页 专利 一种基于模体的异构图神经网络假新闻检测算法 第 2 页 专利 一种基于模体的异构图神经网络假新闻检测算法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。