全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210503221.5 (22)申请日 2022.05.10 (65)同一申请的已公布的文献号 申请公布号 CN 114818700 A (43)申请公布日 2022.07.29 (73)专利权人 东南大学 地址 210096 江苏省南京市玄武区四牌楼 2 号 (72)发明人 汪鹏 邹仕艺  (74)专利代理 机构 南京众联专利代理有限公司 32206 专利代理师 蒋昱 (51)Int.Cl. G06F 40/289(2020.01) G06F 40/295(2020.01)G06F 40/30(2020.01) G06N 3/04(2006.01) 审查员 陆丹 (54)发明名称 一种基于成对连通图和图神经网络的本体 概念匹配方法 (57)摘要 一种基于成对连通图和图神经网络的本体 概念匹配方法。 首先, 构造源本体和目标本体的 成对连通图, 其节点为概念对, 边对应属性对; 然 后, 学习成对连通图的节点嵌入, 用于预测本体 中的匹配关系; 进而, 为获得理想的嵌入 结果, 采 用卷积神经网络从概念对的属性中自动提取相 似性特征; 接着, 使用图神经网络来传播相似性 特征并得到概念对的最终嵌入。 最后, 根据学习 得到的概念对嵌入结果, 通用分类模 型预测得到 概念匹配结果。 本发明技术方案能够解决了本体 异构中的概念匹配问题, 易实现、 精度高、 效果 好。 权利要求书4页 说明书10页 附图4页 CN 114818700 B 2022.09.23 CN 114818700 B 1.一种基于成对连通图和图神经网络的本体概念匹配方法, 其特征在于: 该方法包括 如下步骤: 1) 生成源本体和目标本体的成对连通图: 对于读取的源本体和目标本体按照成对连通图生成规则进行配对, 其节点为概念对, 边对应属性对; 步骤1)具体为: 首先, 分别读取源本体和目标本体的概念及其子概念集 合; 其次, 将每一个源本体概念 和目标本体中的概念    形成一个概念对节点    , 同时组合 概念的所有子概念和 的所有子概念形成若干概念 对节点; 最后, 让已经配对的概念与其子概念相互组合的若干概念对节点连接, 对于源本体    和目标本体 , 且 , 则 则 是由  的三元组组成, 其中 分别代表节点集合、 边集合和边类 型集合, 中的每个元素对应于 和 之间的本体对, 中的每个 元素对应于一个关 系对, 每条边的构建方法如下: 其中, 分别代表源本体和目标本体中父概念,   分别代表 的子概念, 代表 的关系, 代表  的关系; 2) 对生成的成对连通图进行简化和分块 化处理: 分别计算概念对中两个概念的概念名和属性的初始化向量表示, 采用传播强条件删减 成对连通图中的无用节点, 判断成对连通图结构特 征, 并进行图的序列化分块; 步骤2)中计算初始向量的方法包括 三种, 具体如下: (1) 生成一组概念的字符级n元模型  作为集合代表; (2) 将本体的属性视为文本字符串, 并为每个本体的所有属性生成字符级 的n元模型, 然后将所有的n元模型合并成一个集 合, 作为本体的代 表, 计算公式为: 其中   是概念或者属性的第   个单词,  为 的 , 指的是连续出现的 个单词; 是在前 到前 个单词出现的情况下, 第 个单词是 的概率,  是含有 单词序列的个数;权 利 要 求 书 1/4 页 2 CN 114818700 B 2对于一个概念或者属性, N ‑grams的数量   由如下公式计算: 其中,   为给定句子    中的单词数; (3) 为了给相似性计算和传播提供更好的初始相似性种子, 这些初始种子由其他匹配 方法选择和生成; 步骤2)中传播强条件的内容具体如下: 给出两个三元组    , 让   分 别表示  的相应相似性, 由第一步初始化向量 表示计算 余弦相似度获取, 具体公式如下: 只有 满足相应条件时, 相似性才能被传播; 步骤2)中传播强条件只有 满足以下三个条件时, 相似性才能被传播 (1) 在 中, 至少有两个相似性必须 大于阈值   ; (2) 如果 包括本体语言基元, 那么 的相关位置就应该是   的对应位置必须是相 同的基元; (3)  最多只有一个本体 语言原语; 步骤2)中判断成对连通图结构特 征, 并进行图的序列化分块, 具体过程如下: 第一步, 检查成对连通图是否存在闭环, 若存在则删除闭环中相似度最低的节点避免 出现闭环, 若不存在, 则进入第二 步; 第二步, 检查顶层节点个数即根节点个数, 判定是否超过1, 若未超过1则判定该图结构 为有根树进入第四步, 否则判定为无根 树结构进入第三 步; 第三步, 无根树向有根树转化, 采用基于浅层字符串相似度匹配方式对顶层概念对进 行融合, 如下公式: 其中   分别表示字符串   和字符串 的下标, 下标从1开始; 第四步, 对树 通过深度优先搜索进行节点序列化;权 利 要 求 书 2/4 页 3 CN 114818700 B 3

.PDF文档 专利 一种基于成对连通图和图神经网络的本体概念匹配方法

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于成对连通图和图神经网络的本体概念匹配方法 第 1 页 专利 一种基于成对连通图和图神经网络的本体概念匹配方法 第 2 页 专利 一种基于成对连通图和图神经网络的本体概念匹配方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:45:25上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。