全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210213438.2 (22)申请日 2022.03.04 (71)申请人 中国人民大 学 地址 100872 北京市海淀区中关村大街59 号 (72)发明人 杜玮 许伟 江冠燃 周季蕾  (74)专利代理 机构 北京纪凯知识产权代理有限 公司 11245 专利代理师 孙楠 (51)Int.Cl. G06F 16/335(2019.01) G06F 16/36(2019.01) G06F 16/38(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06Q 50/20(2012.01) (54)发明名称 一种基于知识图谱的在线课推荐方法及系 统 (57)摘要 本发明涉及一种基于知识图谱的在线课推 荐方法及系统, 其包括: 根据在线课程的信息和 特征, 提取实体构建在线课程知识图谱; 将知识 图谱中的三元组输入到表示学习模型中进行特 征学习, 得出实体和关系向量; 提取用户的历史 修读记录并与课程库相对应, 获得用户课程 ‑序 列数据; 使用深度学习模型transformer   encoder部分学习加入时间信息的历史记录, 训 练用户画像; 将用户画像与目标课程向量拼接, 获得维度扩展的新向量, 输入到DNN网络, 训练学 习模型; 根据训练后的学习模型输出的点击概 率, 为用户生成推荐列表。 本发明能更好地捕获 用户的时间学习兴趣, 根据目标用户的连续选课 行为向目标用户推荐课程; 可广泛在知识图谱和 深度学习领域中应用。 权利要求书3页 说明书11页 附图4页 CN 114722182 A 2022.07.08 CN 114722182 A 1.一种基于知识图谱的在线课推荐方法, 其特 征在于, 包括: 根据在线课程的信息和特 征, 提取实体构建在线课程知识图谱; 将所述知识图谱中的三元组输入到表示学习 模型中进行特征学习, 得出实体和关系向 量; 提取用户的历史修读记录, 并与课程库相对应, 获得用户课程 ‑序列数据; 对每个用户, 使用深度学习模型transformer  encoder部分学习加入时间信息的历史 记录, 训练用户画像, 以刻画用户的喜好; 将用户画像与目标课程向量拼接, 获得维度扩展的新向量, 输入到DNN网络, 训练学习 模型; 根据训练后的所述学习模型输出的点击概 率, 为用户生成推荐列表。 2.如权利要求1所述基于知识图谱的在线课推荐方法, 其特征在于, 所述根据在线课程 的信息和特 征, 提取实体构建在线课程知识图谱, 包括: 根据用户的历史学习记录和课程相关的特 征, 提取实体和关系; 将提取的实体和关系进行编号, 将实体e从0开始编号到n, 将关系r也从0开始编号; 通过关系r关联头实体eh和尾实体et, 将编号构成三元组<eh,r,et>。 3.如权利要求1所述基于知识图谱的在线课推荐方法, 其特征在于, 所述将所述知识图 谱中的三元组输入到表示学习模型中进行 特征学习, 得出实体和关系向量, 包括: 基于负采样方法训练所述学习模型, 对于正例三元组<eh,r,et>通过更换头尾结点得 到负例三元组<eh',r,et′>; 初始化所述学习模型的参数, 包括映射矩阵和节点关系表示向量; 基于正例三元组和负例三元组的学习, 最大化负例三元组头尾节点的距离, 最小化正 例三元组头尾节点的距离, 根据损失函优化模型, 不断更新参数, 直到损失函数停止下降, 学习模型收敛, 学习模型输出实体和关系的表示向量。 4.如权利要求1所述基于知识图谱的在线课推荐方法, 其特征在于, 所述使用深度 学习 模型transformer  encoder部分学习加入时间信息的历史记录, 训练用户画像, 包括: 统计用户历史记录的最大长度、 最小长度和平均长度, 选择固定长度作为maxlen为基 准分割历史学习记录, 若用户历史记录不足maxlen则补0, 并加上正无穷数; 对用户历史序列进行顺序和时间编码, 使课程表示向量中包含知识图谱的信 息和用户 行为信息; 使用多头注意力机制对历史序列训练权重, 将维度d拆分成为h份, 每一份的维度为d/ h, 每一份向量包 含了不同的信息; 多头注意力层的输出送到归一化和残差连接层进行处理, 特征包含残差连接和归一 化, 相当于在输出向量中加入输入向量; 输出进入前馈神经网络Feed  Forward Neural Network层经过两层激 活函数做全连接 维度变换; 前馈神经网络的输出 再次输入残差连接与归一 化; 用户历史序列经过transformer的学习后, 输出经过学习后的课程向量序列, 将表示向 量相加作为用户画像的向量表示。 5.如权利要求4所述基于知识图谱的在线课推荐方法, 其特征在于, 所述对用户历史序权 利 要 求 书 1/3 页 2 CN 114722182 A 2列进行顺序和时间编码, 包括: 对每位用户, 每一条记录进行编号, 按照课程学习顺序编码为k=[0, 1, 2..., n], 序 号i 代表用户加入平台后学习的第i门课; 使用注册课程时间间隔进一步捕捉用户行为包含的信息, 计算每一门注册时间ti与注 册第一门课程t0的时间间隔Δt0i; 对时间间隔Δt0i做minmax标准化, 将Δt0i缩放到0‑kmax之间, kmax代表用户历史记录的 长度, 缩放后的时间 间隔表示 为t(vk); 将位置信息和时间信息加 和, 得到最终编码顺序信息TPos(vk)=k+t(vk); 使用sin和cos周期函数, 扩展 TPos(vk)维度与课程向量表示的维度相同; 将TPos(vk)输入到对应课程的向量表示中, 使课程表示向量中包含知识图谱的信息和 用户行为信息 。 6.如权利要求1所述基于知识图谱的在线课推荐方法, 其特征在于, 所述将用户画像与 目标课程向量 拼接, 获得维度扩展的新向量, 输入到DN N网络, 训练学习模型, 包括: 经过DNN网络做全连接变换, 使用梯度下降方法迭代更新权重, 利用若干个权重系数矩 阵W, 偏倚向量b来和输入值向量x进行线性运算和 激活运算, 从输入层开始, 一层层的向后 计算, 一直到运算到输出层, 得到输出结果值, DNN输出的数据范围设置为0 ‑1, 表示预测推 荐分数; 将用户集合划分为训练集和测试集, 将训练集输入到学习模型中学习, 直到学习模型 收敛。 7.如权利要求1所述基于知识图谱的在线课推荐方法, 其特征在于, 所述根据训练后的 所述学习模型输出的点击概 率, 为用户生成推荐列表, 包括: 采用测试数据的用户集输入训练好的学习 模型中, 课程候选集合为除输入模型学习外 的全部课程, 以模拟真实场景; 在候选集中的每一个候选物品, 都和用户历史记录组合进行学习模型学习, 输出点击 概率; 对所有物品的点击概率值从高到低进行排序, 选择排序后的前K个物品作为推荐结果, 输出物品的id编号; 重复上述过程, 直到 输出所有用户的推荐列表。 8.一种基于知识图谱的在线课推荐系统, 其特 征在于, 包括: 提取模块, 根据在线课程的信息和特 征, 提取实体构建在线课程知识图谱; 特征学习模块, 将所述知识图谱中的三元组输入到表示学习模型中进行特征学习, 得 出实体和关系向量; 数据获取模块, 提取用户的历史修读记录, 并与课程库相对应, 获得用户课程 ‑序列数 据; 处理模块, 对每个用户, 使用深度学习模型transformer  encoder部分学习加入时间信 息的历史记录, 训练用户画像, 以刻画用户的喜好; 训练模块, 将用户画像与目标课程向量拼接, 获得维度扩展的新向量, 输入到DNN网络, 训练学习模型; 推荐列表生成模块, 根据训练后的所述学习模型输出的点击概率, 为用户生成推荐列权 利 要 求 书 2/3 页 3 CN 114722182 A 3

.PDF文档 专利 一种基于知识图谱的在线课推荐方法及系统

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的在线课推荐方法及系统 第 1 页 专利 一种基于知识图谱的在线课推荐方法及系统 第 2 页 专利 一种基于知识图谱的在线课推荐方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:52:54上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。