(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210022171.9
(22)申请日 2022.01.10
(71)申请人 桂林电子科技大 学
地址 541004 广西壮 族自治区桂林市七 星
区金鸡路1号
(72)发明人 李凤英 黎家鹏 董荣胜 常亮
(74)专利代理 机构 桂林市持衡专利商标事务所
有限公司 45107
专利代理师 陈跃琳
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 40/189(2020.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种联合实体关系表示的知识图谱融合方
法
(57)摘要
本发明公开一种联合实体关系表示的知识
图谱融合方法, 利用构建的初始实体向量表示、
对齐实体对正样本集合、 对齐实体对负样本集
合、 关系的初始关系向量表示、 对齐关系对正样
本集合、 以及对齐 关系负样本集合来对实体的向
量表示进行训练, 进而实现实体对齐, 并基于对
齐的实体来进行知识图谱的融合。 无监督的方法
避免了手工标注的巨大开销; 通过引入关系对齐
的方法学习知识图谱中的关系信息, 充分利用实
体间的关系, 辅助于学习到更加准确的实体向量
表示, 缓解了知识图谱异构性带来的影响, 从而
提高知识图谱实体对齐, 以及知识图谱融合的效
果。
权利要求书2页 说明书7页 附图2页
CN 114519107 A
2022.05.20
CN 114519107 A
1.一种联合实体关系表示的知识图谱融合方法, 其特 征是, 包括步骤如下:
步骤1、 对2个待融合的知识图谱的所有实体向量进行初始化, 得到初始实体向量表示;
步骤2、 利用2个待融合的知识图谱中已确定对齐的实体作为对齐实体对, 并利用对齐
实体对即实体正样本构建对齐实体对正样本集 合;
步骤3、 先基于初始实体向量表示, 采用最邻 近采样获得对齐实体对正样本集合中的每
个实体的负实体; 再将对齐实体对正样本集合的每个对齐实体对的一个实体替换为另一个
实体的负实体, 得到负对齐实体对; 后利用所有负对齐实体对即实体负样本构建对齐实体
对负样本集合;
步骤4、 对2个待融合的知识图谱的所有关系进行初始化, 得到初始关系向量表示;
步骤5、 先基于初始关系向量表示计算一个待融合的知识图谱中各个关系与另一个待
融合的知识图谱中各个关系的距离; 再遍历一个待融合的知识图谱中的每个关系即当前关
系, 找出另一个待融合的知识图谱中与当前关系距离最近且没有 出现在之前的对齐关系对
中的关系, 若当前关系与所找出 的关系的距离小于设定的关系阈值时, 则将当前关系与所
找出的关系形成对齐关系对; 后利用对齐关系对即关系正样本构建对齐关系对正样本集
合;
步骤6、 先基于初始关系向量表示, 采用最邻 近采样获得对齐关系对正样本集合中的每
个关系的负关系; 再将对齐关系对正样本集合的每个对齐关系对的一个关系替换为另一个
关系的负关系, 得到负对齐关系对; 后利用所有负对齐关系对即关系负样本构建对齐关系
负样本集合;
步骤7、 将2个待融合的知识图谱的所有实体的初始实体向量表示、 对齐实体对正样本
集合、 对齐实体对负样本集合、 2个待融合的知识图谱的所有关系的初始关系向量表示、 对
齐关系对正样本集合、 以及对齐关系负样本集合同时送入到带有高速门的图卷积网络中;
在高速门的图卷积网络中, 使用基于最大间隔函数的目标函数对所有实体的实体向量表示
进行训练, 使实体正样本和关系正样本的距离尽可能小, 实体负样本和关系负样本距离尽
可能大, 得到所有实体的最终 实体向量表示;
步骤8、 先基于最终实体向量表示计算一个待融合的知识图谱中各个实体与另一个待
融合的知识图谱中各个实体的距离; 再遍历一个待融合的知识图谱中的每个实体即当前实
体, 找出另一个待融合的知识图谱中与当前实体距离最近且没有 出现在之前的最 终对齐实
体对中的实体, 若当前实体与所找出 的实体的距离小于设定的实体阈值时, 则将当前实体
与所找出的实体形成最终对齐实体对;
步骤9、 第一待融合的知识图谱的三元组的头实体与第二待融合的知识图谱的三元组
的头实体为最终对齐实体对时, 则将以第一待融合的知识图谱的三元组的头实体为头实
体, 第二待融合的知识图谱的三元组的关系为关系, 第二待融合的知识图谱的三元组的尾
实体为尾实体的三元 组加入到第一待融合的知识图谱中, 以此将第二待融合的知识图谱合
并到第一待融合的知识图谱。
2.根据权利要求1所述的一种联合实体关系表示的知识图谱融合方法, 其特征是, 步骤
1中, 使用GL ove模型中预 先训练好的单词向量 来对实体向量进行初始化。
3.根据权利要求1所述的一种联合实体关系表示的知识图谱融合方法, 其特征是, 步骤
4中, 关系r的初始关系向量表示 为:权 利 要 求 书 1/2 页
2
CN 114519107 A
2其中, concat代表拼接操作; n表示2个待融合的知识图谱中与关系 r相连的头实体的数
量, m表示2个待融合的知识图谱中与关系r相连的尾实体的数量; fih表示与关系r相连的第i
个头实体在2个待融合的知识图谱中出现的次数, fit表示与关系r相连的第i个尾实体在2个
待融合的知识 图谱中出现的次数;
表示与关系r相连的第i个头实体的初始实体向量表
示,
表示与关系r相连的第i个 尾实体的初始实体向量表示。
4.根据权利要求1所述的一种联合实体关系表示的知识图谱融合方法, 其特征是, 步骤
7中, 基于最大间隔函数的目标函数Lall为:
Lall=Le+α Lr
式中, α表示设定的超参数, Le表示实体对齐的目标函数, Lr表示关系对齐的目标函数;
max{0, d(p,q) ‑d(p',q')+γe}表示取0与d(p,q) ‑d(p',q')+γe中的较大值; γe表示设定的
实体边缘超参数; d(p,q)表示实体正样本(p,q)的距离, d(p',q')表示实体负样本(p',q')
的距离; (p,q)表 示实体正样 本, (p',q')表 示实体负样 本; L表示对齐实体对正样本集合, L'
表示对齐实体对负样本集合; max{0, d(k,l) ‑d(k',l')+γr}表示取0与d(k,l) ‑d(k',l')+
γr中的较大值; γr表示设定的关系边缘超参数; d(k,l)表示关系正样本(k,l)的距离, d
(k',l')表示 关系负样本(k',l')的距离; (k,l)表示关系正样本, (k',l')表示关系负样本;
Lr表示对齐关系对正样本集 合, Lr'表示对齐关系负 样本集合。
5.根据权利要求1所述的一种联合实体关系表示的知识图谱融合方法, 其特征是, 使用
L1范数计算2个实体之间的距离, 使用L1范 数计算2个关系之间的距离 。权 利 要 求 书 2/2 页
3
CN 114519107 A
3
专利 一种联合实体关系表示的知识图谱融合方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:55:00上传分享