全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210270510.5 (22)申请日 2022.03.18 (71)申请人 太原理工大 学 地址 030024 山西省太原市迎泽西大街79 号 (72)发明人 陈泽华 陈雨民 吕传建 闫一帆  (74)专利代理 机构 太原晋科知识产权代理事务 所(特殊普通 合伙) 14110 专利代理师 任林芳 (51)Int.Cl. G06F 40/258(2020.01) G06F 40/30(2020.01) G06F 16/9535(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 融合标题摘要语义关系的学术文献推荐方 法 (57)摘要 本发明属于学术文 献推荐领域, 具体是一种 融合标题摘要语义关系的学术文献推荐方法。 解 决了现有学术文献推荐 方法存在的冷启动, 数据 稀疏性问题, 包括以下步骤, S100: 采集用户 ‑文 献交互数据并进行数据预处理; S200: 搭建结合 文本与隐反馈信息的学术文献推荐网络; S300: 将预处理后的数据集输入文 献推荐网络, 使用损 失函数对文献推荐网络进行训练, 并保存训练好 的网络模型及参数; S400: 使用训练好的网络计 算每位用户对其它所有未交互过的文献的喜好 分数, 根据喜好分数对文献进行排序, 选取前N篇 文献推荐给用户。 本发明有效保证学术文献推荐 效果。 权利要求书2页 说明书6页 附图2页 CN 114626369 A 2022.06.14 CN 114626369 A 1.一种融合标题摘要语义关系的学术文献推荐方法, 其特 征在于: 包括以下步骤, S100: 采集用户 ‑文献交互数据并进行 数据预处 理; S200: 搭建结合文本与隐反馈信息的学术文献推荐网络, 文献推荐网络首先通过预训 练BERT模 型获得标题摘要中单词的向量表 示, 接着通过标题摘要注意力机制捕获标题摘要 之间语义关系获得更好的文献向量表示, 最后结合去掉项目嵌入模块的NCF模型 处理用户 ‑ 文献交互信息实现文献推荐; S300: 将预处理后的数据集输入文献推荐网络, 使用损失函数对文献推荐网络进行训 练, 并保存训练好的网络模型及参数; S400: 使用训练好的网络计算每位用户对其它所有未交互过的文献的喜好分数, 根据 喜好分数对文献进行排序, 选取 前N篇推荐给用户。 2.根据权利要求1所述的融合标题摘要语义关系的学术文献推荐方法, 其特征在于: 所 述的步骤S100中, 用户 ‑文献交互数据为某 位用户历史上是否收藏、 浏览、 点击过某 篇文献, 是则存在交互对, 否则不存在, 具体包括每个用户历史上交互过 的文献以及对应文献的标 题摘要文本。 3.根据权利要求2所述的融合标题摘要语义关系的文献推荐方法, 其特征在于: 所述的 步骤S100中, 数据预处理包括数据集的清洗和负采样, 其中数据集的清洗包括合并重复文 章、 移除无效文章、 去除收藏少于10篇论文的用户; 负采样为对每对交互按比例随机选取几 对不存在的交 互。 4.根据权利要求1所述的融合标题摘要语义关系的文献推荐方法, 其特征在于: 所述的 步骤S200中, S201、 将文献标题摘要文本传入预训练BERT模型, 可以依次获得文献标题、 摘 要中单词 的向量表示; S202、 通过标题摘要注意力机制捕捉标题摘要之间语义关系获得更好的文献向量表 示; S203、 将S202中获得的文献向量表示 赋值给去掉项目嵌入模块的NCF模型的GMF   Item Vec和MLP  Item Vec, 作为  GMF文献向量表示和MLP文献向量表示, 接着, 通过广义矩 阵分解与多层感知机两个模块分别处理用户 ‑文献交互信息并融合得到用户对文献的喜好 分数。 5.根据权利要求4所述的融合标题摘要语义关系的文献推荐方法, 其特征在于: 所述的 步骤S202的具体过程 为: 1) 计算摘要句子中单词与标题中单词的相关性分数 , 与 为模型自主学习的权重参数, 表示摘要第 个句子中的第 个单词, 权 利 要 求 书 1/2 页 2 CN 114626369 A 2为标题; 2) 对相关性分数进行归一 化, 得到摘要中每 个单词的重要性权 重 , ; 3) 使用一层双向GRU网络对摘要中单词的向量表示进行编码, 以捕捉摘要句子中单词 之间的语义关系, 得到每个单词的隐藏状态 , 加权聚集摘要句子中每个单词隐藏状态 得到摘要句子向量表示 , ; 4) 将标题中单词的向量表示依次通过一层单向G RU网络获得标题向量表示 , 将标题看 作摘要的总结句, 使用标题向量表 示初始化另一个一层单向GRU网络的全局记忆, 将摘要句 子向量表示依次输入该GRU网络, 得到文献向量表示 。 6.根据权利要求1所述的融合标题摘要语义关系的文献推荐方法, 其特征在于: 所述的 步骤S300中, 使用对数损失函数作为损失函数: ; 其中, 为预测喜好分数, 表示正样 本集, 表示负样本集; 对于用户 ‑文献交互数据, 为1表示用户 可能对文献 感兴 趣, 为0说明用户 对文献 不感兴趣或者用户 根本没见 过文献 。权 利 要 求 书 2/2 页 3 CN 114626369 A 3

.PDF文档 专利 融合标题摘要语义关系的学术文献推荐方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 融合标题摘要语义关系的学术文献推荐方法 第 1 页 专利 融合标题摘要语义关系的学术文献推荐方法 第 2 页 专利 融合标题摘要语义关系的学术文献推荐方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:52:12上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。