全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210137390.1 (22)申请日 2022.02.15 (71)申请人 南京航空航天大 学 地址 210016 江苏省南京市秦淮区御道街 29号 (72)发明人 胡文轩 马宗民  (74)专利代理 机构 南京瑞弘专利商标事务所 (普通合伙) 32249 专利代理师 张宁馨 (51)Int.Cl. G06F 16/36(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于多信息聚合的图卷积网络实体对 齐方法 (57)摘要 本发明公开了一种基于多信息聚合的图卷 积网络实体对齐方法, 首先将知识图谱的实体数 据进行语义初始化向量转换, 然后将实体的初始 化向量输入到实体表示学习框架中, 在表示学习 框架中, 对实体向量分别利用RDGCN模型、 GAT模 型、 GCN模型对实体在知识图谱中的关系特征信 息、 远距离结构特征信息、 邻接结构特征信息进 行提取, 然后通过多门控机制将特征信息进行聚 合得到实体表 示向量, 最后将其用于实体对齐中 相似度计算, 完成实体对齐操作; 本发明多特征 角度对实体进行表示学习, 并通过门控机制对特 征信息进行聚合, 使 得学习得到的实体表示向量 中特征信息的丰富, 向量表示实体的精度较高。 权利要求书2页 说明书6页 附图2页 CN 114676261 A 2022.06.28 CN 114676261 A 1.一种基于多信息聚合的图卷积网络实体对齐方法, 其特 征在于, 包括以下步骤: 步骤S1、 生成知识图谱数据的实体 语义初始化向量; 将输入的知识图谱数据根据实体的语义 生成对应的实体 语义初始化向量; 步骤S2、 将实体语义初始化向量分别输入至实体关系特征学习 模块和实体结构特征学 习模块进行 学习; 所述实体关系特征学习 模块对实体在知识图谱中的关系特征进行提取和学习; 构造实 体关系对偶图, 实现关系特征建模; 通过构建的关系图和原始的实体图进 行交互, 得到实体 关系特征表示向量; 所述实体结构特征学习模块分别对实体在知识图谱中的邻接结构特征和远距离邻居 结构进行提取和学习; 分别获取实体邻接结构特征和实体远距离结构特征, 基于Res  gate 门控机制进行 特征向量的聚合, 获得实体结构特 征表示向量; 步骤S3、 实体多特 征聚合; 基于步骤S2中获取的实体结构特征表示向量和实体关系特征表示向量, 通过highway 门控机制, 实现特 征向量的聚合, 获取实体特 征表示向量; 步骤S4、 基于实体特 征表示向量进行实体对齐; 计算实体之间的向量距离作为实体之间的相似度; 选择与待对齐实体向量距离最近的 实体进行对齐操作。 2.根据权利要求1所述的一种基于多信息聚合的图卷积网络实体对齐方法, 其特征在 于, 所述步骤S1中生成实体 语义初始化向量具体方法包括: 步骤S1.1、 将实体的名称语言翻译为对应的英语单词; 步骤S1.2、 根据转换好语言的实体, 在glove.840B.300d单词向量库中寻找对应的训练 好的语义向量; 步骤S1.3、 将所有对应的语义向量构成矩阵, 作为包含实体语义特征信息的初始化输 入。 3.根据权利要求1所述的一种基于多信息聚合的图卷积网络实体对齐方法, 其特征在 于, 所述步骤S2中对实体结构特 征进行提取和学习, 主 要包括: 步骤S2.1、 生成知识图谱实体邻接矩阵和二阶邻居矩阵; 步骤S2.2、 在每一层结构特征学习过程中, 将实体表示向量以及图谱实体的邻接矩阵 输入GCN模型, 提取邻接结构特 征信息, 对中心实体的一阶邻居节点进行 结构信息学习; 步骤S2.3、 将实体表示向量以及图谱实体的二阶邻居矩阵输入GAT模型, 提取二阶邻居 结构特征信息, 对中心实体的二阶邻居节点进行 结构特征学习; 步骤S2.4、 基于Res  gate门控机制, 将GCN模型学习结果和GAR模型学习结果进行特征 向量聚合, 获得实体结构特 征表示向量。 4.根据权利要求3所述的一种基于多信息聚合的图卷积网络实体对齐方法, 其特征在 于, Res gate门控机制的融合特 征信息公式如下: hi=σ( σ W2( σ(W1hi1+b))+hi2) 其中W1、 W2分别表示可学习的参数矩阵; σ 表示激活函数; hi表示整合完成后的实体i的 特征表示向量; hi1、 hi2分别表示两类模型 学习得到的实体特 征表示。 5.根据权利要求3所述的一种基于多信息聚合的图卷积网络实体对齐方法, 其特征在权 利 要 求 书 1/2 页 2 CN 114676261 A 2于, 所述步骤S2中对实体关系特 征进行提取和学习, 主 要包括: 将实体表示向量放入RD GCN模型中对实体的关系特征进行建模和学习, 在现有RD GCN模 型的基础上构造实体关系对偶图, 实现关系 特征的建模; 在学习过程中通过构建的实体关 系对偶图与原 始的实体图进行交 互, 得到实体关系特 征表示向量。 6.根据权利要求5所述的基于多信 息聚合的图卷积网络实体对齐方法, 其特征在于, 将 获得的实体结构特征表示向量和实体 关系特征表示向量通过highway门控机制进 行特征向 量聚合, 具体地, highway门控机制的融合特 征信息公式如下: hi=gate(hi2)·hi1+(1‑gate(hi2))hi2 gate(h)=sigmo id(Wh+b) 其中hi表示两类特征表示在门控机制整合后得到的实体i的表示向量; hi1、 hi2分别表示 模型1和模 型2从不同的特征方面分别学习得到的实体特征表 示; gate(h)为门控系数, 用于 控制两类特 征信息向量的聚合。 7.根据权利要求1所述的基于多信 息聚合的图卷积网络实体对齐方法, 其特征在于, 所 述步骤S4中, 基于获得的实体特征表示向量, 计算 实体特征表示向量间的曼哈顿距离, 作为 实体之间的相似度, 实体i、 j的向量表示之间的距离计算公式表示 为: dij=||hi‑hj|| 选择与待对齐实体向量距离最近的实体进行对齐操作。权 利 要 求 书 2/2 页 3 CN 114676261 A 3

.PDF文档 专利 一种基于多信息聚合的图卷积网络实体对齐方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多信息聚合的图卷积网络实体对齐方法 第 1 页 专利 一种基于多信息聚合的图卷积网络实体对齐方法 第 2 页 专利 一种基于多信息聚合的图卷积网络实体对齐方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:52:16上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。