专利一种基于多信息聚合的图卷积网络实体对齐方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210137390.1 (22)申请日 2022.02.15 (71)申请人南京航空航天大学地址 210016 江苏省南京市秦淮区御道街 29号 (72)发明人胡文轩　马宗民　 (74)专利代理机构南京瑞弘专利商标事务所 (普通合伙) 32249 专利代理师张宁馨 (51)Int.Cl. G06F 16/36(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种基于多信息聚合的图卷积网络实体对齐方法 (57)摘要本发明公开了一种基于多信息聚合的图卷积网络实体对齐方法，首先将知识图谱的实体数据进行语义初始化向量转换，然后将实体的初始化向量输入到实体表示学习框架中，在表示学习框架中，对实体向量分别利用RDGCN模型、 GAT模型、 GCN模型对实体在知识图谱中的关系特征信息、远距离结构特征信息、邻接结构特征信息进行提取，然后通过多门控机制将特征信息进行聚合得到实体表示向量，最后将其用于实体对齐中相似度计算，完成实体对齐操作；本发明多特征角度对实体进行表示学习，并通过门控机制对特征信息进行聚合，使得学习得到的实体表示向量中特征信息的丰富，向量表示实体的精度较高。权利要求书2页说明书6页附图2页 CN 114676261 A 2022.06.28 CN 114676261 A 1.一种基于多信息聚合的图卷积网络实体对齐方法，其特征在于，包括以下步骤：步骤S1、生成知识图谱数据的实体语义初始化向量；将输入的知识图谱数据根据实体的语义生成对应的实体语义初始化向量；步骤S2、将实体语义初始化向量分别输入至实体关系特征学习模块和实体结构特征学习模块进行学习；所述实体关系特征学习模块对实体在知识图谱中的关系特征进行提取和学习；构造实体关系对偶图，实现关系特征建模；通过构建的关系图和原始的实体图进行交互，得到实体关系特征表示向量；所述实体结构特征学习模块分别对实体在知识图谱中的邻接结构特征和远距离邻居结构进行提取和学习；分别获取实体邻接结构特征和实体远距离结构特征，基于Res gate 门控机制进行特征向量的聚合，获得实体结构特征表示向量；步骤S3、实体多特征聚合；基于步骤S2中获取的实体结构特征表示向量和实体关系特征表示向量，通过highway 门控机制，实现特征向量的聚合，获取实体特征表示向量；步骤S4、基于实体特征表示向量进行实体对齐；计算实体之间的向量距离作为实体之间的相似度；选择与待对齐实体向量距离最近的实体进行对齐操作。 2.根据权利要求1所述的一种基于多信息聚合的图卷积网络实体对齐方法，其特征在于，所述步骤S1中生成实体语义初始化向量具体方法包括：步骤S1.1、将实体的名称语言翻译为对应的英语单词；步骤S1.2、根据转换好语言的实体，在glove.840B.300d单词向量库中寻找对应的训练好的语义向量；步骤S1.3、将所有对应的语义向量构成矩阵，作为包含实体语义特征信息的初始化输入。 3.根据权利要求1所述的一种基于多信息聚合的图卷积网络实体对齐方法，其特征在于，所述步骤S2中对实体结构特征进行提取和学习，主要包括：步骤S2.1、生成知识图谱实体邻接矩阵和二阶邻居矩阵；步骤S2.2、在每一层结构特征学习过程中，将实体表示向量以及图谱实体的邻接矩阵输入GCN模型，提取邻接结构特征信息，对中心实体的一阶邻居节点进行结构信息学习；步骤S2.3、将实体表示向量以及图谱实体的二阶邻居矩阵输入GAT模型，提取二阶邻居结构特征信息，对中心实体的二阶邻居节点进行结构特征学习；步骤S2.4、基于Res gate门控机制，将GCN模型学习结果和GAR模型学习结果进行特征向量聚合，获得实体结构特征表示向量。 4.根据权利要求3所述的一种基于多信息聚合的图卷积网络实体对齐方法，其特征在于， Res gate门控机制的融合特征信息公式如下： hi＝σ( σ W2( σ(W1hi1+b))+hi2) 其中W1、 W2分别表示可学习的参数矩阵； σ 表示激活函数； hi表示整合完成后的实体i的特征表示向量； hi1、 hi2分别表示两类模型学习得到的实体特征表示。 5.根据权利要求3所述的一种基于多信息聚合的图卷积网络实体对齐方法，其特征在权　利　要　求　书 1/2 页 2 CN 114676261 A 2于，所述步骤S2中对实体关系特征进行提取和学习，主要包括：将实体表示向量放入RD GCN模型中对实体的关系特征进行建模和学习，在现有RD GCN模型的基础上构造实体关系对偶图，实现关系特征的建模；在学习过程中通过构建的实体关系对偶图与原始的实体图进行交互，得到实体关系特征表示向量。 6.根据权利要求5所述的基于多信息聚合的图卷积网络实体对齐方法，其特征在于，将获得的实体结构特征表示向量和实体关系特征表示向量通过highway门控机制进行特征向量聚合，具体地， highway门控机制的融合特征信息公式如下： hi＝gate(hi2)·hi1+(1‑gate(hi2))hi2 gate(h)＝sigmo id(Wh+b) 其中hi表示两类特征表示在门控机制整合后得到的实体i的表示向量； hi1、 hi2分别表示模型1和模型2从不同的特征方面分别学习得到的实体特征表示； gate(h)为门控系数，用于控制两类特征信息向量的聚合。 7.根据权利要求1所述的基于多信息聚合的图卷积网络实体对齐方法，其特征在于，所述步骤S4中，基于获得的实体特征表示向量，计算实体特征表示向量间的曼哈顿距离，作为实体之间的相似度，实体i、 j的向量表示之间的距离计算公式表示为： dij＝||hi‑hj|| 选择与待对齐实体向量距离最近的实体进行对齐操作。权　利　要　求　书 2/2 页 3 CN 114676261 A 3

专利 一种基于多信息聚合的图卷积网络实体对齐方法

专利一种基于多信息聚合的图卷积网络实体对齐方法