全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210044332.4 (22)申请日 2022.01.14 (71)申请人 重庆邮电大 学 地址 400065 重庆市南岸区南 山街道崇文 路2号 (72)发明人 吴涛 马红玉 冯柏淋 姜丰  游小琳  (74)专利代理 机构 重庆辉腾律师事务所 5 0215 代理人 卢胜斌 (51)Int.Cl. G06F 16/36(2019.01) G06V 10/75(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01)G06N 5/02(2006.01) (54)发明名称 一种基于特征提取的知识图谱关系预测方 法 (57)摘要 本发明属于知识图谱补 全领域, 具体涉及一 种基于特征提取的知识图谱关系预测方法; 该方 法包括: 获取原始数据; 根据原始数据构建初始 知识图谱和待预测三元组; 采用训练好的邻居编 码器对待预测三元组进行处理, 得到关系正确的 三元组; 根据关系正确的三元 组补全初始知 识图 谱, 得到完整的知识图谱; 本发明结合特征提取 与相似度计算机制, 解决了传统知识图谱关系预 测方法需要大量数据支撑的问题, 采用少样本数 据可较准确的对知识图谱进行关系预测, 可获得 更加准确的知识图谱, 同时提升了少样本关系预 测方法的性能和计算效率, 具有广阔的应用前 景。 权利要求书3页 说明书8页 附图3页 CN 114385831 A 2022.04.22 CN 114385831 A 1.一种基于特征提取的知识图谱关系预测方法, 其特征在于, 包括: 获取原始数据; 根 据原始数据构建初始知识图谱和待预测三元组; 采用训练好的邻居编 码器对待预测三元组 进行处理, 得到 关系正确的三元组; 根据关系正确的三元组补 全初始知识图谱, 得到完整的 知识图谱; 对邻居编码器进行训练的过程包括: S1: 获取正确的知识图谱; 对知识图谱进行 预处理, 得到知识图谱的嵌入表示; S2: 在知识图谱中随机抽取K个三元组并将K个三元组作为支持集, 将剩下的三元组作 为正样本查询集; 其中, 三元组是包 含头实体、 关系实体和尾实体的管理单 元; S3: 对正样本查询集中三元组的尾实体进行替换, 得到负 样本查询集; S4: 对知识图谱中所有实体的邻居实体进行抽样, 得到每 个实体的所有邻居实体; S5: 采用邻居编码器对每 个实体的邻居实体进行 特征提取, 得到每 个实体的邻居特 征; S6: 将每个实体的邻居特 征和对应实体进行融合, 得到更新后的实体; S7: 将支持集与查询集中三元组的头实体和尾实体进行拼接, 得到支持实体对和查询 实体对; 其中, 查询集包括 正样本查询集和负 样本查询集; S8: 根据支持实体对和查询实体对计算支持实体对与查询实体对的相似度; S9: 根据支持实体对与正样本查询实体对的相似度和支持实体对与负样本查询实体对 的相似度计算损失函数, 根据损失函数调整邻居编 码器参数, 当损失函数最小时, 得到训练 好的邻居编码器。 2.根据权利要求1所述的一种基于特征提取的知识图谱关系预测方法, 其特征在于, 采 用训练好的邻居编 码器对待预测三元组进 行处理包括: 获取待预测三元组中实体的邻居实 体; 采用训练好的邻居编码器对每个实体的邻居实体进行特征提取, 得到每个实体的邻居 特征; 将每个实体的邻居 特征和对应实体进 行融合, 得到更新后的实体; 将初始知识图谱三 元组与待 预测三元组的头实体和尾实体均进 行拼接, 得到初始知识图谱实体对和待预测实 体对; 根据初始知识图谱实体对和待 预测实体对计算初始知识图谱实体对和待预测实体对 的相似度; 根据初始知识图谱实体对和待 预测实体对的相似度计算每个待 预测实体对的得 分, 将得分最高的待预测实体对为关系正确的三元组。 3.根据权利要求2所述的一种基于特征提取的知识图谱关系预测方法, 其特征在于, 计 算每个待预测实体对的得分公式为: 其中, similar_score表示得分, gj(s,q)表示待预测实体对与第j个初始知识图谱实体 对的相似度, s表示初始知识图谱实体对, q表示待预测实体对, K表示初始知识图谱实体对 的个数。 4.根据权利要求1或2所述的一种基于特征提取的知识图谱关系预测方法, 其特征在 于, 采用邻居编码器对每个实体的邻居实体进行特征提取包括: 采用不同尺寸的卷积核对 邻居实体进行特征提取, 得到不同尺度的特征映射; 将不同尺度的特征映射进行最大池化 操作, 得到每种特征映射的最大池化结果; 将 每种特征映射的最大池化结果进 行拼接, 并将 拼接后的最大池化结果输入到全连接层, 得到邻居特 征。 5.根据权利要求4所述的一种基于特征提取的知识图谱关系预测方法, 其特征在于, 得权 利 要 求 书 1/3 页 2 CN 114385831 A 2到的特征映射为: 其中, Xi表示计算得到的第i个特征, f()表示非线性函数, Wp表示尺寸为p的卷积核, Ei:i+l‑1表示第i行元素到第i+l ‑1行元素的邻居矩阵, Wp(a,c)Ei:i+l‑1(i+a,c)表示对邻居矩 阵做卷积, l表示卷积核的长度, d表示卷积核的宽度。 6.根据权利要求4所述的一种基于特征提取的知识图谱关系预测方法, 其特征在于, 得 到的邻居特 征为: 其中, M表示第一参数矩阵, b表示偏置量, m表示尺寸不同的卷积核 的种类数, Z表示拼 接后的最大池化结果, h表示每种卷积核的个数。 7.根据权利要求1或2所述的一种基于特征提取的知识图谱关系预测方法, 其特征在 于, 将每个实体的邻居特 征和对应实体进行融合的公式为: e′=σ(W1·Y+W2·e) 其中, e′表示更新后的实体, e表示原实体, σ()表示激活函数, W1表示第二参数矩阵, W2 表示第三 参数矩阵, Y表示邻居特 征。 8.根据权利要求1所述的一种基于特征提取的知识图谱关系预测方法, 其特征在于, 计 算支持实体对与查询实体对的相似度包括: 根据支持实体对和查询实体对计算支持实体对 与查询实体对的余弦相似度; 根据支持实体对和查询实体对计算支持实体对与查询实体对 的欧式距离; 根据支持实体对和查询实体对计算支持实体对与查询实体对的点乘值; 根据 余弦相似度、 欧式距离和点乘值计算支持实体对和查询实体对的相似度。 9.根据权利要求8所述的一种基于特征提取的知识图谱关系预测方法, 其特征在于, 计 算支持实体对和查询实体对的相似度的公式为: g(sr,qr)=α cos( θ )+β dist(sr,qr)+γd(sr,qr) d(sr,qr)=sr·qr 权 利 要 求 书 2/3 页 3 CN 114385831 A 3

.PDF文档 专利 一种基于特征提取的知识图谱关系预测方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于特征提取的知识图谱关系预测方法 第 1 页 专利 一种基于特征提取的知识图谱关系预测方法 第 2 页 专利 一种基于特征提取的知识图谱关系预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:52:36上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。