全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210222332.9 (22)申请日 2022.03.07 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 巢林林 王太峰 褚崴  (74)专利代理 机构 成都七星天知识产权代理有 限公司 5125 3 专利代理师 袁春晓 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/901(2019.01) (54)发明名称 一种知识图谱的表示学习方法和系统 (57)摘要 本说明书涉及图数据处理领域, 特别涉及一 种知识图谱的表示学习方法和系统。 该方法包括 进行一轮或多轮迭代更新, 以获得知识图谱中节 点和/或边的向量表示, 其中一轮迭代更新包括: 基于所述知识图谱中的一个或多个三元组, 获取 一个或多个正样本; 基于知识图谱中不存在的一 个或多个三元组, 获取一个或多个负样本; 基于 各样本中的向量表示确定各样 本对应的预测值; 确定损失函数值, 所述损失函数值反映各样本对 应的预测值与其标签值的差异; 调整样本中节点 的第一向量表 示、 边的向量表 示以及所述字典矩 阵中的元素, 以减小各样本对应的预测值与其标 签值的差异。 权利要求书2页 说明书9页 附图3页 CN 114610899 A 2022.06.10 CN 114610899 A 1.一种知识图谱的表示学习方法, 所述方法包括进行一轮或多轮迭代更新, 以获得知 识图谱中节点和/或边的向量表示, 其中一轮迭代更新包括: 基于所述知识图谱中的一个或多个三元组, 获取一个或多个正样本; 基于知识图谱中 不存在的一个或多个三元组, 获取一个或多个负样本; 其中, 三元 组包括两个节点以及节 点 之间的边, 所述正样本和所述负样本分别包括对应三元组中的节点的向量表示以及边的向 量表示, 且节点的向量表示基于节点的第一向量表示以及字典矩阵生成, 以使得各节点的 向量表示能够共享所述字典矩阵; 基于各样本中的向量表示确定各样本对应的预测值; 调整样本中节点的第一向量表示、 边的向量表示以及所述字典矩阵中的元素, 以减小 各样本对应的预测值与其标签值的差异。 2.如权利要求1所述的方法, 所述知识图谱中不存在的一个或多个三元组是指三元组 中的节点和边都来自所述知识图谱, 但是三 者的组合并不在所述知识图谱中。 3.如权利要求1所述的方法, 所述调整样本中节点的第 一向量表示、 边的向量表示以及 所述字典矩阵中的元 素, 以减小各样本对应的预测值与其标签值的差异, 包括: 确定损失函数值; 所述损失函数值包括第一部分以及第 二部分, 其中, 第 一部分反映各 样本对应的预测值与其标签值的差异, 第二部 分为基于节点的第一向量表示计算得到的正 则化约束; 调整样本中节点的第一向量表示、 边的向量表示以及所述字典矩阵中的元素, 以减小 所述损失函数值。 4.如权利要求3所述的方法, 所述第二部分反映各样本中节点的第一向量表示的元素 的和值。 5.如权利要求1或4所述的方法, 所述基于各样本中的向量表示确定各样本对应的预测 值, 包括, 对于任一样本: 利用表示学习算法处理该样本 中各节点的向量表示以及边的向量表示, 得到该样本的 分值; 所述分值越小, 反映该样本为 正样本的概 率越大。 6.如权利要求5所述的方法, 所述表示学习算法包括: 将样本中第一节点的向量表示与边的向量表示 求和, 得到和向量; 计算所述和向量与第二节点的向量表示的相似度, 基于所述相似度确定为所述分值。 7.如权利要求6所述的方法, 所述分值与所述和向量与第二节点的向量表示之间的距 离正相关; 所述第一部分为各正样本的分值和减去各负 样本的分值和。 8.如权利要求6所述的方法, 第一节点 为源节点, 第二节点 为目的节点。 9.如权利要求1所述的方法, 还包括调整字典矩阵中元素的数量, 并重新进行所述一轮 或多轮迭代更新, 以获得知识图谱中节点和/或边的另一套向量表示。 10.如权利要求1所述的方法, 所述其中一轮迭代更新为第一轮迭代更新时, 节点的第 一向量表示、 边的向量表示以及字典矩阵均为随机初始化得到 。 11.一种知识图谱的表示学习系统, 所述系统用于进行一轮或多轮迭代更新, 以获得知 识图谱中节点和/或边的向量表示, 在其中一轮迭代更新中: 正样本获取模块, 用于基于所述知识图谱中的一个或多个三元组, 获取一个或多个正 样本;权 利 要 求 书 1/2 页 2 CN 114610899 A 2负样本获取模块, 用于基于知识图谱中不存在的一个或多个三元组, 获取一个或多个 负样本; 其中, 三元组包括两个节点以及节点之间的边, 所述正样本和所述负样本分别包括对 应三元组中的节点的向量表示以及边的向量表示, 且节点的向量表示基于节点的第一向量 表示以及字典矩阵生成, 以使得 各节点的向量表示能够共享所述字典矩阵; 预测值确定模块, 用于基于各样本中的向量表示确定各样本对应的预测值; 调整模块, 用于调整样本中节点的第一向量表示、 边的向量表示以及所述字典矩阵中 的元素, 以减小各样本对应的预测值与其标签值的差异。 12.一种知识图谱的表示学习装置, 包括处理器, 其特征在于, 所述处理器用于执行如 权利要求1~10任一项所述的知识图谱的表示学习方法。 13.一种计算机可读存储介质, 所述存储介质存储计算机指令, 当计算机读取存储介质 中的计算机指令后, 计算机执 行如权利要求1~10任一项所述的知识图谱的表示学习方法。权 利 要 求 书 2/2 页 3 CN 114610899 A 3

.PDF文档 专利 一种知识图谱的表示学习方法和系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种知识图谱的表示学习方法和系统 第 1 页 专利 一种知识图谱的表示学习方法和系统 第 2 页 专利 一种知识图谱的表示学习方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:54:49上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。