(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211308614.7
(22)申请日 2022.10.25
(71)申请人 中国科学院软件研究所
地址 100190 北京市海淀区中关村南四街 4
号
(72)发明人 王逸之 杨翊 陈辉 朱嘉奇
王宏安
(74)专利代理 机构 北京市万慧达律师事务所
11111
专利代理师 刘锋
(51)Int.Cl.
G06F 40/169(2020.01)
G06F 40/242(2020.01)
G06F 40/30(2020.01)
G06F 16/958(2019.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
网络论坛的用户发文说服力预测方法、 装
置、 设备和介质
(57)摘要
本公开涉及用 于网络论坛的用户发文说服
力预测方法、 装置、 计算机设备和存储介质。 用于
网络论坛的用户发文说服力预测方法包括: 进行
数据采集; 进行用户特征提取; 进行文本特征提
取; 进行各类节点信息聚合, 获得节点嵌入向量;
进行说服力预测。 根据本公开, 可 以对论坛中帖
子的直接评论进行是否具有说服力的预测, 能够
在线上的商品营销、 品牌公关和舆论引导等领域
提供帮助。
权利要求书3页 说明书12页 附图3页
CN 115481609 A
2022.12.16
CN 115481609 A
1.一种用于网络论坛的用户发文说服力预测方法, 其特 征在于, 包括:
进行数据采集, 所述数据采集包括从论坛中获取用户数据;
进行用户特 征提取;
进行文本特 征提取, 所述文本特 征提取包括对帖子和评论的文本特 征进行提取;
进行各类节点信息聚合, 所述各类节点信息聚合包括异构节点、 边构建的异构图神经
网络, 所述异构节点的类型包括用户、 评论、 帖子, 所述边包括帖子、 评论、 用户间相互关系
形成的边, 获得聚合各类节点信息的节点嵌入向量;
进行说服力预测, 所述说服力预测包括利用所述节点嵌入向量作为输入, 预测评论节
点与帖子节点之间的说服关系。
2.一种用于网络论坛的用户发文说服力预测方法, 其特 征在于, 包括:
进行数据采集, 所述数据采集包括从论坛中获取用户数据;
进行用户特 征提取,所述用户特 征提取包括获得用户心理特 征;
进行文本特 征提取, 所述文本特 征提取包括对帖子和评论的文本特 征进行提取;
进行说服力预测, 所述说服力预测包括利用用户特征、 文本特征作为输入, 预测评论与
帖子之间的说服关系。
3.根据权利要求1中任一项所述的用于网络论坛的用户发文说服力预测方法, 其特征
在于, 所述进行各类节点信息聚合包括: 在包含所述异构图神经网络的模型中计算不同类
型的节点信息聚合权 重, 按照对应权 重进行各类节点信息的聚合得到聚合后的节点信息;
所述计算不同类型的节点信息聚合权重包括利用注意力机制计算不同类型的节点信
息聚合权 重;
所述节点嵌入向量中的节点信息包括用户特征、 文本语义特征、 文本说服特征、 评论与
帖子节点关系。
4.根据权利要求1 ‑2中任一项所述的用于网络论坛的用户发文说服力预测方法, 其特
征在于, 所述获取用户数据包括从论坛中获取用户发文以及相关用户的历史发文;
所述用户特 征提取包括获得用户心理特 征;
所述用户特征提取包括获取该用户在网络论坛上的历史发贴、 评论的文本数据, 并对
文本数据进行处理获得用户特征, 输出包含用户人格、 心理分析和兴趣爱好的用户特征向
量;
所述对文本数据进行处理, 包括利用基于LIWC文本内容词典和大五人格文本分析模型
进行处理。
5.根据权利要求1 ‑2中任一项所述的用于网络论坛的用户发文说服力预测方法, 其特
征在于, 所述对帖子和评论的文本特征进行提取包括文本语义特征提取、 文本说服特征提
取;
所述对帖子和评论的文本特 征进行提取包括文本主题特 征提取;
所述文本语义特征提取包括利用Bert双向编码变换表示文本预训练模型对文本数据
进行向量化处理, 获得语义信息嵌入向量Xw; 所述文本说服特征提取包括提取文本中与说
服相关的词语特 征, 计算文本说服特 征向量Xp;
所述文本主题特 征提取包括 提取文本中的主题特 征向量Xt。
6.根据权利要求1所述的用于网络论坛的用户发文说服力预测方法, 其特 征在于,权 利 要 求 书 1/3 页
2
CN 115481609 A
2所述异构图为异构图G, 异构图G定义如下:
G={V,E,φ, ψ}, 其中V为节点 集合, E为边集合,φ为节点属性 集合, ψ为边属性集合;
每个节点v属于类型φ(v):
是节点类型集合, 包含
用户、
评论、
帖子;
定义每个边e属于类型 ψ(e):
是边类型集合, 包含用户 ‑帖子、 用户 ‑评论、 帖
子‑评论的关系集;
所述节点类型集 合,
包含
主题;
所述边类型集 合,
包含用户‑主题、 评论 ‑主题的关系集;
所述说服力预测包括 通过如下公式计算说服 概率:
定义节点 k是否说服对应的Fp(k)节点的概 率为Predk;
定义评论节点 k对应的Post帖子类型的节点j关系表示:
j=Fp(k),φ(j)∈Posts, φ(k)∈Com ments
Predk计算公式:
φ(k)∈Com ments,φ(j)∈Posts。
7.根据权利要求1、 3中任一项所述的用于网络论坛的用户发文说服力预测方法, 其特
征在于,
所述异构节点的类型包括用户、 评论、 帖子、 主题;
所述边包括帖子、 评论、 用户、 主题间相互关系形成的边。
8.一种用于网络论坛的用户发文说服力预测装置, 其特 征在于, 所述装置包括:
数据采集模块, 用于进行 数据采集, 所述数据采集包括从论坛中获取用户数据;
用户特征提取模块, 用于进行用户特 征提取;
文本特征提取模块, 用于进行文本特征提取, 所述文本特征提取包括对帖子和评论的
文本特征进行提取;
节点信息聚合模块, 用于进行各类节点信息聚合, 所述各类节点信息聚合包括异构节
点、 边构建的异构图神经网络, 所述异构节点的类型包括用户、 评论、 帖子, 所述边包括帖
子、 评论、 用户间相互关系形成的边, 获得包 含节点信息的节点嵌入向量;
说服力预测模块, 用于进行说服力预测, 所述说服力预测包括利用所述节点嵌入向量
作为输入, 预测评论节点与帖子节点之间的说服关系。
9.一种用于网络论坛的用户发文说服力预测装置, 其特 征在于, 所述装置包括:
数据采集模块, 用于进行 数据采集, 所述数据采集包括从论坛中获取用户数据;
用户特征提取模块, 用于进行用户特征提取,所述用户特征提取包括获得用户心理特
征;
文本特征提取模块, 用于进行文本特征提取, 所述文本特征提取包括对帖子和评论的
文本特征进行提取;
说服力预测模块, 用于进行说服力预测, 所述说服力预测包括利用用户特征、 文本特征
作为输入, 预测评论与帖子之间的说服关系。
10.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计权 利 要 求 书 2/3 页
3
CN 115481609 A
3
专利 网络论坛的用户发文说服力预测方法、装置、设备和介质
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:13上传分享