全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210150860.8 (22)申请日 2022.02.18 (71)申请人 北京邮电大 学 地址 100876 北京市海淀区西土城路10号 (72)发明人 吴岳辛 范春晓 张建明 秦爽  (74)专利代理 机构 北京市商 泰律师事务所 11255 专利代理师 邹芳德 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/635(2019.01) G06F 16/9535(2019.01) (54)发明名称 一种面向知识感知推荐的知识图谱构建方 法 (57)摘要 本发明公开了一种面向知识感知推荐的知 识图谱构建方法, 本发明利用开源知识库链接数 据集KB4Rec, 将推荐数据集中的项目与开放领域 知识图谱中的实体进行链接, 并根据映射关系从 开放领域知识图谱中迭代抽取三元组, 经过实体 筛选、 关系筛选等处理, 构建一个面向知识感知 推荐的联系增强的知识图谱。 本发 明解决了通用 的知识图谱构建方法工作量大、 私人知识库无法 获取的问题, 使推荐系统能够利用大型开源知识 图谱中的知识来提升推荐效果。 本发 明通过人工 筛选关系类型、 过滤低频 实体以及交互密度控制 等手段, 解决了知识图谱关系质量差、 三元组不 够丰富、 推荐数据的交互密度低等问题, 保证了 知识图谱中的项目属性与用户交 互信息的质量。 权利要求书1页 说明书7页 附图1页 CN 114925207 A 2022.08.19 CN 114925207 A 1.一种面向知识感知推荐的知识图谱构建方法, 其特 征在于包括以下步骤: 步骤1), 通过推荐数据集获取用户交 互数据; 步骤2), 从步骤1)中的原始推荐数据集采样获得子数据集, 再经过以下三个步骤获得 用于构建知识图谱的二元评分数据集: 步骤2.1), K ‑core提取: 仅保留交 互记录大于K的用户及项目; 步骤2.2), 交 互密度控制: 使交 互密度在人为控制的范围内; 步骤2.3), 评分二元化: 通过人为设置评分阈值的方式将原始数据二元化, 若原始评分 大于等于阈值, 则二元评分为1, 否则为0; 步骤3), 由二元评分数据集中提取 出项目集; 步骤4), 利用开源知识库链接数据集KB4Rec, 将推荐数据集中的项目与开放领域知识 图谱中的实体进行链接, 实现项目 ‑实体之间的映射; 步骤5), 根据步骤4)得出的映射关系从开放领域知识图谱Freebase中, 以项 目实体作 为初始种子集迭代地抽取三元组; 步骤6), 经过人工筛选有效关系、 低频实体过滤处理, 构建了一个面向知识感知推荐的 联系增强的知识图谱。 2.根据权利要求1所述的一种面向知识感知推荐的知识图谱构建方法, 其特征在于, 所 述的步骤1)中, 所述的推荐数据集为包含电影、 音乐、 电商三个不同推荐领域的常用数据 集。 3.根据权利要求2所述的一种面向知识感知推荐的知识图谱构建方法, 其特征在于, 所 述的步骤1)中, 所述的电影领域的数据集为Movielens ‑20M数据集, 所述的音乐领域的数据 集为Last.fm‑1b数据集, 所述的电商领域的数据集 为Amazon‑Book数据集。 4.根据权利要求1所述的一种面向知识感知推荐的知识图谱构建方法, 其特征在于, 所 述的步骤5)中, 抽取三元组的步骤为: 步骤5.1), 从二元评分数据集中提取项目集; 步骤5.2), 将项目集中的项目与通用知识图谱中的实体进行链接; 步骤5.3), 根据项目 ‑实体链接关系, 使用项目集作 为种子集从开放领域知识图谱中抽 取三元组, 构成子图; 步骤5.4), 提取子图中的实体集作为新的种子集, 从开放领域知识图谱中继续抽取三 元组以扩充子图; 步骤5.5), 根据K ‑core原则过 滤低频实体相关的三元组, 构成联系增强的知识图谱。权 利 要 求 书 1/1 页 2 CN 114925207 A 2一种面向知识感知推荐的知识图谱构建 方法 技术领域 [0001]本申请涉及计算机技术领域, 尤其涉及一种面向知识感知 推荐的知识图谱构建方 法。 背景技术 [0002]近几十年, 随着互联网的快速发展, 互联 网上的数据成倍增长, 过大的信息量引起 信息超载问题, 用户很难从海量数据中轻松挑选出他们感兴趣的内容。 为了解决信息超载 问题, 改善用户体验, 推荐系统已被应用于各种在线应用的场景, 如: 音乐推荐、 电影推荐、 新闻推荐、 在线购物等。 可以说, 几乎所有提供内容的互联网服务都涉及到推荐系统的应 用。 [0003]推荐算法是推荐系统的核心部分, 根据推荐算法原理的不 同, 推荐系统主要分为 三种: 基于协同过 滤的推荐系统、 基于内容的推荐系统和混合型推荐系统。 [0004]1)基于协同过滤的推荐系统: 主要利用交互数据中的用户或项目的相似性对用户 偏好进行建模。 [0005]2)基于内容的推荐系统: 通过内容分析抽取项目的特 征用于计算相似度。 [0006]其中, 基于协同过 滤的推荐系统由于不需要人工提取 特征, 因而获得广泛应用。 [0007]尽管协同过滤算法在实际应用与学术研究领域都取得了诸多成果, 但仍然面临一 些挑战, 如: 数据稀疏性、 冷启动问题。 为了解决这些问题, 混合型推荐系统被提出, 它在协 同过滤的基础上引入 “边信息”, 从而同时利用交互层与内容层的相似性, 结合以上两种推 荐系统的优势。 近年来, 混合型推荐系统已经探索了多种类型的边信息, 如: 项目属性、 项目 评论以及用户的社交网络等。 [0008]随着知识图谱在信息检索、 知识问答、 人工智能等多个领域的广泛应用, 将知识图 谱作为边信息引入推荐系统的方法逐渐 成为研究热点。 这种方法不仅可以缓解上述诸多问 题, 提升推荐系统的准确 性, 还可以为推荐的项目提供推荐解释, 实现可解释推荐服务, 增 强用户对推荐 结果的认可度。 这类利用知识图谱中的信息进 行用户偏好建模的混合型推荐 系统, 被称为知识感知推荐系统。 [0009]知识感知推荐系统需要深入挖掘、 利用知识图谱中的项目相关信息来建模用户偏 好, 知识图谱本身的质量很大程度上决定了推荐系统的推荐性能。 因此, 在知识感知推荐系 统的实现过程中, 一个 关键的问题就是数据问题, 即如何获取丰富的、 结构化的项目相关知 识信息构建一个高质量的知识图谱。 根据数据来源的不同, 现有的知识感知推荐系统使用 的知识图谱主要通过三种途径构建: 一是使用原始推荐数据集中的边信息(通常仅包含少 量有用信息); 二是使用非开源的私人知识库, 如微软的Satori; 三是利用推荐服务平 台的 非公开项目数据。 经过广泛调研, 目前尚未发现一种面向知识感知推荐的通用的知识图谱 构建方法。 [0010]现有技术一的技术方案 [0011]与本发明相关的现有技术一即知识图谱。 知识图谱是一种异构信息网络, 其中的说 明 书 1/7 页 3 CN 114925207 A 3

.PDF文档 专利 一种面向知识感知推荐的知识图谱构建方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向知识感知推荐的知识图谱构建方法 第 1 页 专利 一种面向知识感知推荐的知识图谱构建方法 第 2 页 专利 一种面向知识感知推荐的知识图谱构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:55:41上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。