全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210410226.3 (22)申请日 2022.04.19 (71)申请人 国家电网有限公司大 数据中心 地址 100052 北京市西城区骡马市大街18 号中再中心 (72)发明人 沈亮 周春雷 陈翔 张鹏宇  王洁 胡锡双 李雨霏 葛鑫亮  任小伟 杨诗语  (74)专利代理 机构 北京汇知杰知识产权代理有 限公司 1 1587 专利代理师 李洁 魏文浩 (51)Int.Cl. G06F 16/36(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种面向SG- CIM模型的实体对齐方法 (57)摘要 本发明提供了一种面向SG ‑CIM模型的实体 对齐方法, 包括: 对SG ‑CIM模型中不同模型表知 识图谱的三元组, 进行规范化处理, 生成一组关 系三元组和一组属性三元组; 将规范化处理后的 关系三元 组进行结构表示学习, 将规范化处理后 的属性三元组进行属性表示学习, 并且, 使用属 性表示学习得到的实体向量, 将结构表示学习得 到的实体向量, 转移到相同的向量空间中, 进行 联合学习; 经过联合学习后, 通过计算不同模型 表知识图谱实体向量相似度, 对不同模型表知识 图谱实体进行对齐。 本发明能很好解决国家电网 SG‑CIM公共数据模型中模型表实体之间的错位 不一致问题。 权利要求书2页 说明书9页 附图1页 CN 114911946 A 2022.08.16 CN 114911946 A 1.一种面向SG ‑CIM模型的实体对齐方法, 其特 征在于, 所述方法包括如下 方法步骤: 步骤一, 对SG ‑CIM模型中不同模型表知识图谱的三元组, 进行规范化处理, 生成一组关 系三元组和一组属性 三元组; 步骤二, 将规范化处理后的关系三元组进行结构表示学习, 将规范化处理后的属性三 元组进行属性表示学习, 并且, 使用属性表示学习得到的实体向量, 将结构表示学习得到的实体向量, 转移到相同的 向量空间中, 进行 联合学习; 步骤三, 经过联合学习后, 通过计算不同模型表知识图谱实体向量相似度, 对不同模型 表知识图谱实体进行对齐。 2.根据权利要求1所述的方法, 其特征在于, 所述步骤一中, 抽取SG ‑CIM模型中的至少 两个模型表知识图谱的三元组, 根据抽取的至少两个模型表的三元组 的第二维文本数据的相似度, 将所述至少两个模 型表知识图谱合并成一个知识图谱, 抽取合并后的知识图谱的三元组, 并分割成一组关系三元组和一组属性 三元组。 3.根据权利要求2所述的方法, 其特征在于, 将抽取的不同模型表知识图谱的三元组 的 第二维文本数据编辑距离, 当距离大于预设阈值时, 将对应的第二 维文本数据统一命名, 使 不同模型表知识图谱合并成一个知识图谱。 4.根据权利要求1所述的方法, 其特征在于, 所述步骤二中, 结构表示学习的目标函数 通过下式表述: 其中, tr是有效关系三元组, Tr是有效关系三元组的集合, t ’r是被破坏的关系三元组, T’r是被破坏的关系三元组的集合, γ是训练后得到的数值, α 是一个权重, fr()是将关系值 编码为矢量的组合函数, count(r)是关系r出现的次数, |T|是合并后的知识图谱中的三元 组总数。 5.根据权利要求1所述的方法, 其特征在于, 所述步骤二中, 属性表示学习的目标函数 通过下式表述: 其中, ta是有效属性三元组, Ta是有效属性三元组的集合, t ’a是被破坏的关系三元组, T’a是被破坏的属性三元组的集合, γ是训练后得到的数值, α 是一个权重, fa()是将属性值 编码为矢量的组合函数, count(a)是属性a出现的次数, |T|是合并后的知识图谱中的三元 组总数。 6.根据权利要求5所述的方法, 其特征在于, 将属性值编码为矢量的组合函数fa()包权 利 要 求 书 1/2 页 2 CN 114911946 A 2括: fa(a)=c1+|c2+c3+...+ct, 其中, a是属性 值的一个字符序列, a={c1,c2,c 3,...,ct}。 7.根据权利要求5所述的方法, 其特征在于, 将属性值编码为矢量的组合函数fa()包 括: fa(a)=flstm(c1, c2, c3, ..., ct), 其中, a是属性值的一个字符序列, a={c1,c2,c3,...,ct}, flstm()是基于LSTM的合成 函数。 8.根据权利要求5所述的方法, 其特征在于, 将属性值编码为矢量的组合函数fa()包 括: 其中, a是属性值的一个字符序列, a={c1,c2,c3,...,ct}, N表示在ngram组合中使用 的n的最大值, t是属性 值的长度。 9.根据权利要求1所述的方法, 其特征在于, 所述步骤二中, 联合学习的目标函数通过 下式表述: J=JSE+JCE+JSIM, 其中, JSE结构表示学习的目标函数, JCE属性表示学习的目标函数, JSIM为使用属性表示 学习得到的实体向量将结构表示学习得到的实体向量转移到相同的向量空间的目标函数, G1为第一模型表知识图谱, G2为第二模型表知识图谱, h为实体, hce为经过属性表示学习得 到的实体向量, hse为经过结构学习得到的实体向量。 10.根据权利要求1所述的方法, 其特征在于, 所述步骤三中, 不同模型表知识图谱实体 向量的相似度通过如下 方式计算: 其中, 实体h1∈G1表示实体h1是第一模型表知 识图谱G1中的实体, 实体h2∈G2表示实体h2 是第二模 型表知识图谱G2中的实体, hmap表示第二模 型表知识图谱G2中所有与实体h1相似的 实体的集 合。权 利 要 求 书 2/2 页 3 CN 114911946 A 3

.PDF文档 专利 一种面向SG-CIM模型的实体对齐方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向SG-CIM模型的实体对齐方法 第 1 页 专利 一种面向SG-CIM模型的实体对齐方法 第 2 页 专利 一种面向SG-CIM模型的实体对齐方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:55:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。