全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211165514.3 (22)申请日 2022.09.23 (71)申请人 河南师范大学 地址 453007 河南省新乡市牧野区建 设东 路46号 (72)发明人 朱贺 刘琦  (74)专利代理 机构 新乡市平 原智汇知识产权代 理事务所(普通 合伙) 41139 专利代理师 路飞 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/951(2019.01) G06N 3/04(2006.01) G06Q 50/00(2012.01) (54)发明名称 一种基于信息对抗学习的社交网络谣言检 测方法 (57)摘要 本发明公开了一种基于信息对抗学习的社 交网络谣言检测方法, 该方法借助于舆情信息流 的分离, 分别将舆情信息源和回复评论信息映射 到高维词表 示空间和句子表示空间, 再通过信息 对抗网络中生成器以及鉴别器的竞争优化机制, 实现了在现实情形中广泛存在不实情感表达和 虚假评论背景下的谣言检测, 从而在降低模型对 于噪声敏感性的同时, 有效提高了谣 言识别的准 确度。 权利要求书3页 说明书6页 附图1页 CN 115481250 A 2022.12.16 CN 115481250 A 1.一种基于信息对抗学习的社交网络谣言检测方法, 其特征在于: 确定待分析舆情信 息所属平台的相关API参数, 爬取舆情数据并做细粒度的结构化预 处理; 然后分离舆情信息 流, 将舆情信息发布源和回复评论信息分别映射到高维度的词表示以及句 子表示空间; 再 通过构建基于双向门循环神经网络构建的对抗学习生成器, 从回复评论数据中提取时序特 征, 生成对抗信息; 接着利用基于卷积神经网络搭建的鉴别器, 对舆情信息发布源和生 成对 抗信息进行鉴别, 输出可用于鉴别谣言的特征变量; 最后借助于前馈神经网络以及有针对 性设计的优化方法, 驱动模型持续的提高谣言鉴别准确性。 2.根据权利要求1所述的基于信息对抗学习的社交网络谣言检测方法, 其特征在于具 体步骤为: 步骤1)确定待检测的社交网络舆情来源, 利用相 关社交网络提供的API接口爬取网络 舆情数据, 并对得到的原 始舆情数据进行 结构化预处 理; 步骤2)分离舆情信息流, 得到舆情信息发布源以及对应的回复评论数据, 分别采用词 嵌入以及句子嵌入方法将舆情信息发布源和回复评论数据映射到高维词表示空间和句子 表示空间, 作为后续数据分析的基础; 步骤3)提取相关舆情回复评论数据的发布时间, 并以之为依据建立舆情反应信息流, 以双向门循环神经网络Bi ‑GRU为基础建立对抗网络的生 成器模块, 分别提取舆情反应信息 流在顺时序方向及逆时序方向的传播特征, 并加以融合, 从而得到全维度的时序特征表现, 再进一步采用反卷积方法, 将 融合得到的在句 子表示空间的特征变量投影到词表示空间, 生成对抗信息; 步骤4)以三个平行放置的深度卷积神经网络CNN为基础搭建对抗网络的鉴别器模块, 将生成器生成的对抗信息以及高维词空间映射得到的舆情源信息输入到鉴别器模块, 分别 分析二元语法、 三元语法和四元语 法中的语义关系, 再使用Max ‑pooling方法提取最强相关 特征作为舆情鉴别的依据; 步骤5)分析鉴别器输出的特征变量, 将其中的舆情类别指示变量输入到前馈神经网络 中, 配以Softmax函数将前馈神经网络的输出映射到谣言鉴别的概率空间, 定义兼顾对抗网 络进化及鉴别精度的损失函数, 并以之最小化为优化 目标, 持续调整网络重点的可学习权 重参数。 3.根据权利要求2所述的基于信息对抗学习的社交网络谣言检测方法, 其特征在于步 骤1)的具体过程如下: Step1:确定社交平台提供API接口的相关参数, 选择支持的编程语言爬取原始舆情数 据; Step2:删除舆情数据中的完全重复评论、 无意义转发、 空白推文以及话题标签等无效 数据; Step3:对舆情数据中的表情图片及情感表达符号进行 具象化的文字对应; Step4:对社交网络舆情数据中涉及的中文信息进行分词处理, 再对中、 英文信息进行 去停用词操作。 4.根据权利要求2所述的一种基于信息对抗学习的社交网络谣言检测方法, 其特征在 于步骤2)的具体过程如下: Step1:从舆情信息流中分离出 各舆情事 件的信息发布源及对应的回复评论数据;权 利 要 求 书 1/3 页 2 CN 115481250 A 2Step2:基于SOTA算法, 利用Word  Embedding将舆情事件源信息映射到高维词表示空 间; Step3:以S entence Embedding方法为基础, 将回复评论数据映射到具有语义关联的高 维句子表示空间, 同时保持与源信息的对应关系。 5.根据权利要求2所述的基于信息对抗学习的社交网络谣言检测方法, 其特征在于步 骤3)的具体过程如下: Step1:提取从舆情事件分离出的回复评论数据, 依据其时间依赖关系建立回复评论数 据舆情信息流; Step2:基于顺时序方向上的依赖关系, 将映射后的高维句子空间表示的回复评论数据 依次输入到门循环神经网络GRU, 提取正向的积累时序特 征, 通过下述方法计算: 其中, h'n是正向当前时刻的积累时序特征, Wz,Wr和 是可学习网络权重参数, h'n‑1是 上一个时刻的积累时序特征, 是当前时刻积累时序特征的备选状态, 和 分别代表更 新门及重 置门的当前时刻状态, 表示逐乘操作, σ( ·)代表Sigmoid函数; Step3:将高维句子空间表示的回复评论数据按逆时序关系依次排列, 输入门循环神经 网络GRU, 得到逆时序特 征的积累表示h'n'; Step4:融合 正时序及逆时序的积累特 征表示, 到全维度的时序特 征表现hn; Step5:借助于反卷积方法, 将 全维度的时序特征表现hn投影到词表示空间, 其计算方法 如下: 其中, 即是生成对抗信息, hpad代表对hn进行Zero Pad操作的矩阵, f为反卷积核。 6.根据权利要求2所述的基于信息对抗学习的社交网络谣言检测方法, 其特征在于步 骤4)的具体过程如下: Step1:平行放置三个卷积神经网络CNN, 设置卷积核的首维度分别为2,3,4, 从而提取 分析二元语法、 三元语法和四元语法中的语义关系; Step2:分别将生成的高维词 空间表示的对抗信息和舆情源信息输入平行放置的三个 卷积神经网络 CNN, 并使用Max ‑pooling方法提取最强相关特 征; Step3:连接并融合从二元语法、 三元语法和四元语法关系中提取的最强相 关特征, 作 为鉴别器进行舆情类别判定的依据。 7.根据权利要求2所述的基于信息对抗学习的社交网络谣言检测方法, 其特征在于步 骤5)的具体过程如下: Step1:以鉴别器的输出作为输入, 建立多层前馈神经网络, 其网络各层输入及输出的 计算公式如下:权 利 要 求 书 2/3 页 3 CN 115481250 A 3

.PDF文档 专利 一种基于信息对抗学习的社交网络谣言检测方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于信息对抗学习的社交网络谣言检测方法 第 1 页 专利 一种基于信息对抗学习的社交网络谣言检测方法 第 2 页 专利 一种基于信息对抗学习的社交网络谣言检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:10:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。