(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210329811.0
(22)申请日 2022.03.31
(71)申请人 东北大学秦皇岛分校
地址 066004 河北省秦皇岛市经济技 术开
发区泰山路143号
(72)发明人 邢烨 吕艳霞 刘杰民
(74)专利代理 机构 沈阳东大知识产权代理有限
公司 21109
专利代理师 李在川
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/9535(2019.01)
(54)发明名称
一种基于传播的知识图谱推荐方法
(57)摘要
本发明提供一种基于传播的知识图谱推荐
方法, 涉及推荐系统技术领域。 由双端知识传播
模块、 循环注意力嵌入模块、 推荐预测模块以及
推荐解释模块组成。 双端知识传播模块包括双端
传播和双向知识传播, 双端传播进行用户和物品
信息的知识映射, 双向知识传播是将用户和物品
的信息在知识图谱上进行传播更新; 循环注意力
嵌入模块采用基于循环神经网络的注 意力机制,
学习实体迭代更新过程中邻居实体的权重; 推荐
预测模块通过聚合知识传播后得到的多层向量
表示更新用户和物品嵌入向量, 并采用内积操作
得到最终的预测交互概率; 推荐解释模块通过融
合用户—物品交互图和知识图谱, 挖掘目标用户
到推荐结果之间的潜在联系, 并以图结构的形式
给出解释结果。
权利要求书4页 说明书9页 附图3页
CN 114637863 A
2022.06.17
CN 114637863 A
1.一种基于传播的知识图谱推荐方法, 其特 征在于, 具体包括以下步骤:
步骤1: 对目标用户和参与推荐的物品信 息在知识图谱上进行双端知识传播; 双端知识
传播包括双端传播和双向知识传播; 得到用户和物品l跳邻居实体集;
步骤2: 采用循环 注意力嵌入聚合传播过程中l跳邻居实体集的信息;
步骤3: 对目标用户u和参与推荐的物品v的交 互概率进行预测;
步骤4: 对上述三个步骤得到的推荐结果进行解释; 为了增加对推荐结果的理解, 提出
一种针对推荐结果的图形化的直观后解释方法;
步骤5: 对步骤1 ‑步骤3推荐过程进行训练优化; 训练结束后, 执行步骤1 ‑步骤3对目标
用户进行推荐。
2.根据权利要求1所述的一种基于传播的知识图谱推荐方法, 其特征在于, 所述步骤1
具体为:
步骤1.1: 对目标用户和参与推荐的物品信息进行双端传播;
对于用户u来说, 从其历史交互数据中找到该用户曾经交互过得物品v, 然后物品v与知
识图谱中实体e之间进行映射, 获得用户u知识传播的初始实体集; 同时对于物品v, 直接将
物品v与知识图谱中的实体e进行映射匹配, 将实体e作为物品v知识传播的初始实体集; 其
中用户u和物品v的初始实体集定义如下:
其中, yuv=1表示用户u和物品v之间存在交 互; A表示表示物品和实体之间的映射 集合;
步骤1.2: 对用户和物品的初始实体集进行双向知识传播;
知识图谱G在形式上被表示为{(h,r,t)|h,t∈ε,r∈R}三元组的形式, 其中h代表三元
组的头实体, r表示三元组的关系, t表示三元组的尾实体, ε和R分别表示知识图谱G 的实体
集和关系集; 采用双向知识传播的思想对用户u和物品v的初始实体集进行知识传播, 获得
初始实体集的l跳邻居实体集; 借此来挖掘知识图谱中含有的高阶语义信息, 帮助提高推荐
的精度; 将用户u和物品v的l跳邻居实体集定义如下:
其中l表示从初始实体集向外传播的距离, 下角标w表示用户u和物品v的统一占位符;
在l跳邻居实体集的定义基础上, 给定用户u和物品v的l跳传播 集如下:
其中r'表示关系r的反向。
3.根据权利要求1所述的一种基于传播的知识图谱推荐方法, 其特征在于, 所述步骤2
具体为:
知识图谱G表示为{(h,r,t)|h,t∈ε,r∈R}, 其中每一个三元组描述了头实体h和尾实
体t存在着关系r 这一事实; 知识图谱中每一个三元组的头实体和尾实体的相关性决定于它
们之间的关系;
步骤2.1: 设(h,r,t)是l跳传播集的第k个三元组, 考虑某一头实体, 其相关尾实体的循权 利 要 求 书 1/4 页
2
CN 114637863 A
2环注意力嵌入定义如下:
对于当前三元组而言,
是头实体的嵌入向量, rk是关系的嵌入向量,
是尾实体的嵌
入向量, 同时
作为注意力权重控制实体信息传播过程中的衰减; 该循环注意力机制
定义如下:
zk=tanh(Wzxk+Whh0+bz)
fk=σ(Wfxk+Whh0+bf)
ik=σ(Wixk+Whh0+bi)
ok=σ(Woxk+Whh0+bo)
ck=fk⊙c0+ik⊙zk
其中h0, c0表示随机初始化的隐藏状态, Wz, Wi, Wf, Wo, Wh表示可训练的权重矩阵, 同时bz,
bi, bf和bo表示偏差; ik, ok和fk分别表示输入、 输出和遗忘门; σ 表示Sigmoid激活函数, ⊙是
向量的元 素级乘积;
步骤2.2: 采用softmax函数来对用户u和物品v的l跳传播集中的三元组的权重进行归
一化处理:
其中, (h',r',t')表示当前传播集中任意一个三 元组,
和r'k分别表示三 元组(h',r',
t')中头实体和关系的嵌入向量表示;
步骤2.3: 通过上述步骤1以及步骤2.1和2.2, 得到用户u和物品v的l跳实体信息表示,
其定义如下:
其中, w表 示用户u和物品v的统一占位符,
表示用户u和物品v在第l层传播集三元组
的个数; l层即l跳;
步骤2.4: 对于最终的用户和物品的向量表示, 还需要将知识传播的起点即初始实体向
量表示纳 入最终的用户和物品多层向量表示集; 用户u和物品v的初始实体向量表示定义如
下:
权 利 要 求 书 2/4 页
3
CN 114637863 A
3
专利 一种基于传播的知识图谱推荐方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:51:53上传分享