专利一种联合实体关系表示的知识图谱融合方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210022171.9 (22)申请日 2022.01.10 (71)申请人桂林电子科技大学地址 541004 广西壮族自治区桂林市七星区金鸡路1号 (72)发明人李凤英　黎家鹏　董荣胜　常亮　 (74)专利代理机构桂林市持衡专利商标事务所有限公司 45107 专利代理师陈跃琳 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/189(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种联合实体关系表示的知识图谱融合方法 (57)摘要本发明公开一种联合实体关系表示的知识图谱融合方法，利用构建的初始实体向量表示、对齐实体对正样本集合、对齐实体对负样本集合、关系的初始关系向量表示、对齐关系对正样本集合、以及对齐关系负样本集合来对实体的向量表示进行训练，进而实现实体对齐，并基于对齐的实体来进行知识图谱的融合。无监督的方法避免了手工标注的巨大开销；通过引入关系对齐的方法学习知识图谱中的关系信息，充分利用实体间的关系，辅助于学习到更加准确的实体向量表示，缓解了知识图谱异构性带来的影响，从而提高知识图谱实体对齐，以及知识图谱融合的效果。权利要求书2页说明书7页附图2页 CN 114519107 A 2022.05.20 CN 114519107 A 1.一种联合实体关系表示的知识图谱融合方法，其特征是，包括步骤如下：步骤1、对2个待融合的知识图谱的所有实体向量进行初始化，得到初始实体向量表示；步骤2、利用2个待融合的知识图谱中已确定对齐的实体作为对齐实体对，并利用对齐实体对即实体正样本构建对齐实体对正样本集合；步骤3、先基于初始实体向量表示，采用最邻近采样获得对齐实体对正样本集合中的每个实体的负实体；再将对齐实体对正样本集合的每个对齐实体对的一个实体替换为另一个实体的负实体，得到负对齐实体对；后利用所有负对齐实体对即实体负样本构建对齐实体对负样本集合；步骤4、对2个待融合的知识图谱的所有关系进行初始化，得到初始关系向量表示；步骤5、先基于初始关系向量表示计算一个待融合的知识图谱中各个关系与另一个待融合的知识图谱中各个关系的距离；再遍历一个待融合的知识图谱中的每个关系即当前关系，找出另一个待融合的知识图谱中与当前关系距离最近且没有出现在之前的对齐关系对中的关系，若当前关系与所找出的关系的距离小于设定的关系阈值时，则将当前关系与所找出的关系形成对齐关系对；后利用对齐关系对即关系正样本构建对齐关系对正样本集合；步骤6、先基于初始关系向量表示，采用最邻近采样获得对齐关系对正样本集合中的每个关系的负关系；再将对齐关系对正样本集合的每个对齐关系对的一个关系替换为另一个关系的负关系，得到负对齐关系对；后利用所有负对齐关系对即关系负样本构建对齐关系负样本集合；步骤7、将2个待融合的知识图谱的所有实体的初始实体向量表示、对齐实体对正样本集合、对齐实体对负样本集合、 2个待融合的知识图谱的所有关系的初始关系向量表示、对齐关系对正样本集合、以及对齐关系负样本集合同时送入到带有高速门的图卷积网络中；在高速门的图卷积网络中，使用基于最大间隔函数的目标函数对所有实体的实体向量表示进行训练，使实体正样本和关系正样本的距离尽可能小，实体负样本和关系负样本距离尽可能大，得到所有实体的最终实体向量表示；步骤8、先基于最终实体向量表示计算一个待融合的知识图谱中各个实体与另一个待融合的知识图谱中各个实体的距离；再遍历一个待融合的知识图谱中的每个实体即当前实体，找出另一个待融合的知识图谱中与当前实体距离最近且没有出现在之前的最终对齐实体对中的实体，若当前实体与所找出的实体的距离小于设定的实体阈值时，则将当前实体与所找出的实体形成最终对齐实体对；步骤9、第一待融合的知识图谱的三元组的头实体与第二待融合的知识图谱的三元组的头实体为最终对齐实体对时，则将以第一待融合的知识图谱的三元组的头实体为头实体，第二待融合的知识图谱的三元组的关系为关系，第二待融合的知识图谱的三元组的尾实体为尾实体的三元组加入到第一待融合的知识图谱中，以此将第二待融合的知识图谱合并到第一待融合的知识图谱。 2.根据权利要求1所述的一种联合实体关系表示的知识图谱融合方法，其特征是，步骤 1中，使用GL ove模型中预先训练好的单词向量来对实体向量进行初始化。 3.根据权利要求1所述的一种联合实体关系表示的知识图谱融合方法，其特征是，步骤 4中，关系r的初始关系向量表示为：权　利　要　求　书 1/2 页 2 CN 114519107 A 2其中， concat代表拼接操作； n表示2个待融合的知识图谱中与关系 r相连的头实体的数量， m表示2个待融合的知识图谱中与关系r相连的尾实体的数量； fih表示与关系r相连的第i 个头实体在2个待融合的知识图谱中出现的次数， fit表示与关系r相连的第i个尾实体在2个待融合的知识图谱中出现的次数；表示与关系r相连的第i个头实体的初始实体向量表示，表示与关系r相连的第i个尾实体的初始实体向量表示。 4.根据权利要求1所述的一种联合实体关系表示的知识图谱融合方法，其特征是，步骤 7中，基于最大间隔函数的目标函数Lall为： Lall＝Le+α Lr 式中， α表示设定的超参数， Le表示实体对齐的目标函数， Lr表示关系对齐的目标函数； max{0， d(p,q) ‑d(p',q')+γe}表示取0与d(p,q) ‑d(p',q')+γe中的较大值； γe表示设定的实体边缘超参数； d(p,q)表示实体正样本(p,q)的距离， d(p',q')表示实体负样本(p',q') 的距离； (p,q)表示实体正样本， (p',q')表示实体负样本； L表示对齐实体对正样本集合， L' 表示对齐实体对负样本集合； max{0， d(k,l) ‑d(k',l')+γr}表示取0与d(k,l) ‑d(k',l')+ γr中的较大值； γr表示设定的关系边缘超参数； d(k,l)表示关系正样本(k,l)的距离， d (k',l')表示关系负样本(k',l')的距离； (k,l)表示关系正样本， (k',l')表示关系负样本； Lr表示对齐关系对正样本集合， Lr'表示对齐关系负样本集合。 5.根据权利要求1所述的一种联合实体关系表示的知识图谱融合方法，其特征是，使用 L1范数计算2个实体之间的距离，使用L1范数计算2个关系之间的距离。权　利　要　求　书 2/2 页 3 CN 114519107 A 3

专利 一种联合实体关系表示的知识图谱融合方法

专利一种联合实体关系表示的知识图谱融合方法