(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210406181.2
(22)申请日 2022.04.18
(71)申请人 中国人民解 放军国防科技大 学
地址 410073 湖南省长 沙市开福区德雅路
109号
(72)发明人 邓劲生 乔凤才 赵涛 宋省身
常春喜 刘静 喻庭昌
(74)专利代理 机构 长沙国科天河知识产权代理
有限公司 432 25
专利代理师 唐品利
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 40/295(2020.01)
G06Q 50/26(2012.01)
(54)发明名称
基于QR分解的时序知识图谱补全 方法、 装置
及电子设备
(57)摘要
本申请涉及一种基于QR分解的时序知识图
谱补全方法、 装置及电子设备。 所述方法获取时
序知识图谱中的头实体、 关系、 尾实体、 时间戳的
初始嵌入表示, 该初始嵌入表示是复数形式; 将
时间戳的初始嵌入表示的实部和虚部分别采用
Gram‑Schmidt正交化进行QR分解, 得到时间戳的
实部和虚部对应的两个正交矩阵, 并根据该两个
正交矩阵对头实体、 关系和尾实体的初始嵌入表
示进行融合, 得到头实体、 关系和尾实体的融合
时间嵌入表 示, 根据该融合时间嵌入表示计算待
补全时序知识图谱中知 识的分数, 并通过分数预
测待补全时序知识图谱中的缺失内容, 完成时序
知识图谱补全。 该方法能够准确、 快速的构造动
态的知识图谱, 具有更好的实用意 义。
权利要求书3页 说明书9页 附图3页
CN 114691890 A
2022.07.01
CN 114691890 A
1.一种基于QR分解的时序知识图谱补全方法, 其特 征在于, 所述方法包括:
获取时序知识图谱中的头实体、 关系、 尾实体、 时间戳的初始嵌入表示, 所述初始嵌入
表示是用复数表示的, 包括实部和虚部;
对时间戳的初始嵌入表示的实部和虚部采用Gram ‑Schmidt正交化进行QR分解, 得到时
间戳的初始嵌入表示的实部和虚部对应的实部正交矩阵和虚部正交矩阵;
将所述实部正交矩阵和所述虚部正交矩阵分别与头实体、 关系以及尾实体的初始嵌入
表示进行融合, 得到 头实体、 关系以及尾实体的融合时间嵌入表示;
根据头实体、 关系和尾实体的融合时间嵌入表示以及预定的打分函数, 计算待补全时
序知识图谱中知识的分数, 并根据分数和预设损失函数预测待补全时序知识图谱中的缺 失
内容, 完成时序知识图谱补全。
2.根据权利要求1所述的方法, 其特征在于, 所述初始嵌入表示是用复数表示的, 包括
实部和虚部;
获取时序知识图谱中的头实体、 关系 、 尾实体、 时间戳的初始嵌入表示, 包括:
对时序知识图谱中的头实体、 关系、 尾实体、 时间戳使用随机初始化, 得到头实体、 关
系、 尾实体、 时间戳的初始嵌入表示;
将头实体和尾实体归为实体, 生成一个实体的初始嵌入矩阵, 记为E| ε|×k, 生成一个关系
的初始嵌入矩阵, 记为
生成一个时间戳的初始嵌入矩阵, 记为
其中k为三个
初始嵌入矩阵的维数, | ε|,
和
分别为实体、 关系和时间戳的个数。
3.根据权利要求1所述的方法, 其特 征在于, 所述时间戳的初始嵌入表示 为:
eτ=eτ_real+eτ_imgi
其中, eτ为时间戳 的初始嵌入表示, eτ_real为时间戳 的初始嵌入表示 的实部, eτ_img为时
间戳的初始嵌入表示的虚部, i 为虚数单位;
对时间戳的初始嵌入表示的实部和虚部采用Gram ‑Schmidt正交化进行QR分解, 得到时
间戳的初始嵌入表示的实部和虚部对应的实部正交矩阵和虚部正交矩阵, 包括:
将时间戳的初始嵌入表示的实部采用Gram ‑Schmidt正交化进行QR分解, 得到时间戳的
初始嵌入表示的实部正交矩阵; 实部QR分解的表达式为:
eτ_real=Qτ_realRτ_real
其中, Qτ_real为时间戳 的初始嵌入表示的实部正交矩阵, Rτ_real时间戳的初始嵌入表示
的实部R矩阵;
将时间戳的初始嵌入表示的虚部采用Gram ‑Schmidt正交化进行QR分解, 得到时间戳的
初始嵌入表示的虚部正交矩阵; 虚部QR分解的表达式为:
eτ_img=Qτ_imgRτ_img
其中, Qτ_img为时间戳的初始嵌入表示的虚部正交矩阵, Rτ_img时间戳的初始嵌入表示的
虚部正交矩阵的虚部R矩阵。
4.根据权利要求1所述的方法, 其特征在于, 将所述实部正交矩阵和所述虚部正交矩阵
分别与头实体、 关系以及尾实体的初始嵌入表示进 行融合, 得到头实体、 关系以及尾实体的
融合时间嵌入表示, 包括:
将所述实部正交矩阵和所述虚部正交矩阵分别作为实部和 虚部, 构成关于时间戳的正权 利 要 求 书 1/3 页
2
CN 114691890 A
2交矩阵; 关于时间戳的正交矩阵的表达式为:
Qτ=Qτ_real+Qτ_imgi
其中, Qτ为关于时间戳 的正交矩阵, Qτ_real为实部正交矩阵, Qτ_img为虚部正交矩阵, i为
虚数单位;
将关于时间戳的正交矩阵分别与头实体、 关系以及尾实体的初始嵌入表示相乘, 得到
头实体、 关系以及尾实体的融合时间嵌入表示。
5.根据权利要求1所述的方法, 其特征在于, 根据头实体、 关系和尾实体的融合时间嵌
入表示以及预定的打分函数, 计算待补全时序知识图谱中知识的分数, 并根据分数和预设
损失函数 预测待补全时序知识图谱中的缺失内容, 完成时序知识图谱补全, 包括:
获取包括多个有效三元组的测试集, 所述 三元组包括: 头实体、 关系 、 尾实体;
将所有三元组的头实体、 和尾实体构成实体集;
将每一个三元组的头实体或尾实体替换为实体集中除本三元组自身包含的头实体或
尾实体以外的实体, 得到损坏三元组, 并将所有损坏三元组与知识图谱现有的三元组进行
比较, 并删除已经存在于知识图谱中的损坏三元组, 将剩余的损坏三元组 组成负例的集 合;
根据预设的打分函数计算有效三元组和损坏三元组 的分数, 并将分数按从小到大的顺
序排列;
根据分数、 预设损 失函数以及预定的评估指标, 预测待补全时序知识图谱中的缺失内
容, 完成时序知识图谱补全。
6.根据权利要求5所述的方法, 其特征在于根据预设的打分函数计算有效三元组和损
坏三元组的分数, 并将分数按从小到大的顺序排列, 步骤中的预设的打 分函数为:
其中, f(h,r,t)为 分数、 hτ为头实体的融合时间嵌入表示, rτ为头实体hτ和尾实体tτ的关
系,
为尾实体tτ的共轭, τ 为时间戳, | | ||1/2为求取L1或L2范 数。
7.根据权利要求6所述的方法, 其特征在于, 根据分数、 预设损 失函数以及预定的评估
指标, 预测待补 全时序知识图谱中的缺失 内容, 完成时序知识图谱补 全, 步骤中预定的评估
指标为是知识图谱的损失达 到预定阈值; 预设损失函数为:
其中, T+是所有有效三元组组成的集合, T‑是T+的负例的集合, f(h,r,t)为有效三元组
的分数, f(h ′,r,t′)为损坏三元组的分数, h和h ′为头实体, t和t ′为尾实体, r为关系, γ>0
为间隔超参数,[]+为max(0, γ+f(h,r,t) ‑f(h′,r,t′))操作。
8.一种基于QR分解的时序知识图谱补全 装置, 其特 征在于, 所述装置包括:
初始嵌入表示获取模块, 用于获取时序知识图谱中的头实体、 关系、 尾实体、 时间戳的
初始嵌入表示, 所述初始嵌入表示是用复数表示的, 包括实部和虚部;
对时间戳的初始嵌入表示的QR分解模块, 用于对时间戳的初始嵌入表示的实部和虚部
采用Gram ‑Schmidt正交化进行QR分解, 得到时间戳的初始嵌入表示的实部和虚部对应的实
部正交矩阵和虚部正交矩阵;
融合时间嵌入表示确定模块, 用于将所述实部正交矩阵和所述虚部正交矩阵分别与头权 利 要 求 书 2/3 页
3
CN 114691890 A
3
专利 基于QR分解的时序知识图谱补全方法、装置及电子设备
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:56:32上传分享