全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210250454.9 (22)申请日 2022.03.15 (65)同一申请的已公布的文献号 申请公布号 CN 114357198 A (43)申请公布日 2022.04.15 (73)专利权人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 桂正科 何雨潇 高率荏 梁磊  张喜  (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 专利代理师 陈霁 周良玉 (51)Int.Cl. G06F 16/36(2019.01)G06F 16/33(2019.01) (56)对比文件 CN 113792159 A,2021.12.14 CN 1081972 90 A,2018.0 6.22 CN 113641766 A,2021.1 1.12 CN 113886605 A,2022.01.04 CN 112434169 A,2021.0 3.02 CN 106777274 A,2017.0 5.31 US 2020097601 A1,2020.0 3.26 WO 2021254 457 A1,2021.12.23 苏佳等.基 于多源数据融合的Java代码知识 图谱构建方法研究. 《智能计算机与应用》 .2020, (第05期), 审查员 李文静 (54)发明名称 一种针对多个知识图谱的实体融合方法及 装置 (57)摘要 本说明书实施例提供了一种针对多个知识 图谱的实体融合方法及装置。 该方法及装置可以 从多个父类知识图谱融合得到子类知识图谱。 父 类知识图谱包含若干种实体类型的实体节点 以 及表示实体节 点之间关系的连接边。 在方法执行 时, 确定待融合的第一类实体节点, 获取多个父 类知识图谱分别对应的数据文件和用于实体融 合的配置信息, 这些数据即为子类知识图谱的数 据。 数据文件包含若干个第一类实体节点的关系 数据, 配置信息中包含的指定关系类型, 是从对 应的父类知识 图谱中第一类实体节点的关系数 据具有的关系类型中选择的。 当接收到针对子类 知识图谱中第一类实体节点的查询请求时, 利用 多个数据文件和配置信息, 确定第一类实体节点 融合后的关系数据。 权利要求书3页 说明书15页 附图3页 CN 114357198 B 2022.06.28 CN 114357198 B 1.一种针对多个知识图谱的实体融合方法, 用于从多个父类知识图谱融合得到子类知 识图谱, 任意一个父类知识图谱包含若干种实体类型 的实体节点, 以及表示实体节点之间 关系的连接边; 所述方法包括: 确定待融合的第一类实体节点; 获取多个父类知识图谱分别对应的数据文件, 任意一个数据文件包含: 若干个第一类 实体节点的关系数据; 所述关系数据具有 若干种关系类型; 获取用于实体融合的配置信息, 其中包含: 多组指定关系类型; 任意一组指定关系类 型, 是从对应的父类知识图谱中第一类实体节点的关系数据具有的关系类型中选择的; 将多个数据文件和所述配置信 息确定为所述子类知识图谱的数据; 所述子类知识图谱 用于响应于针对所述第一类实体节点的查询请求, 提供所述多个数据文件和所述配置信 息, 以确定所述第一类实体节点融合后的关系数据。 2.根据权利要求1所述的方法, 所述方法还 包括: 当接收到针对所述子类知识图谱中第 一类实体节点的查询 请求时, 利用所述多个数据 文件和所述配置信息, 确定所述第一类实体节点融合后的关系数据。 3.根据权利要求2所述的方法, 所述确定所述第一类实体节点融合后的关系数据的步 骤, 包括: 从所述多个数据文件中分别获取 所述第一类实体节点的关系数据; 基于所述配置信息, 从获取的关系数据中筛 选出具有所述指定关系类型的关系数据; 利用筛选出的关系数据, 确定所述第一类实体节点融合后的关系数据。 4.根据权利要求3所述的方法, 所述多个数据文件中的若干个第 一类实体节点, 分别按 照预设的标识顺序排列。 5.根据权利要求4所述的方法, 所述从所述多个数据文件中分别获取所述第一类实体 节点的关系数据的步骤, 包括: 利用所述多个数据文件中分别设置的游标, 分别从所述多个数据文件中读取具有相同 标识的第一类实体节点的关系数据; 所述利用筛选出的关系数据, 确定所述第一类实体节点融合后的关系数据的步骤, 包 括: 利用筛选出的关系数据, 确定具有相同标识的第一类实体节点融合后的关系数据。 6.根据权利要求3所述的方法, 所述利用筛选出的关系数据, 确定所述第 一类实体节点 融合后的关系数据的步骤, 包括: 对筛选出的关系数据进行去重, 将去重后的关系数据确定为所述第 一类实体节点融合 后的关系数据。 7.根据权利要求3所述的方法, 任意一个父类知识图谱还包括第一类实体节点与其他 实体节点之间的关系属性; 数据文件中的关系数据包 含: 关系属性的属性 值; 所述配置信 息还包含: 多组指定关系属性; 任意一组指定关系属性, 是从对应的父类知 识图谱中第一类实体节点的、 具有指定关系类型的关系数据包 含的关系属性中选择的; 所述利用筛选出的关系数据, 确定所述第一类实体节点融合后的关系数据的步骤, 包 括: 基于所述配置信息, 从筛 选出的关系数据中对应筛 选出所述指定关系属性的属性 值;权 利 要 求 书 1/3 页 2 CN 114357198 B 2利用筛选出的属性 值, 确定所述第一类实体节点融合后的关系数据。 8.根据权利要求2所述的方法, 任意一个父类知识图谱还包括第一类实体节点的实体 属性; 任意 一个数据文件 还包含: 若干个第一类实体节点的若干个实体属性的属性 值; 所述配置信 息还包含: 多组指定实体属性; 任意一组指定实体属性, 是从对应的父类知 识图谱中第一类实体节点的若干个实体属性中选择的; 当接收到所述 查询请求时, 所述方法还 包括: 利用所述多个数据文件和所述配置信 息, 确定所述第 一类实体节点融合后的实体属性 的属性值。 9.根据权利要求8所述的方法, 所述确定所述第一类实体节点融合后的实体属性的属 性值的步骤, 包括: 从所述多个数据文件中分别获取 所述第一类实体节点的实体属性的属性 值; 基于所述配置信息, 从获取的属性 值中筛选出所述指定实体属性的属性 值; 利用筛选出的属性 值, 确定所述第一类实体节点融合后的实体属性的属性 值。 10.根据权利要求2所述的方法, 任意一个数据文件中的关系数据, 是若干个第一类实 体节点与相连的一跳实体节点之间的关系数据; 所述确定所述第一类实体节点融合后的关系数据的步骤, 包括: 利用所述多个数据文件和所述配置信 息, 确定所述第 一类实体节点与相连的多个一跳 实体节点之间的关系数据, 得到融合后的关系数据。 11.一种针对多个知识图谱的实体融合装置, 用于从多个父类知识图谱融合得到子类 知识图谱, 任意一个父类知识图谱包含若干种实体类型 的实体节点, 以及表示实体节点之 间关系的连接边; 所述装置包括: 实体确定模块, 配置为, 确定待融合的第一类实体节点; 文件获取模块, 配置为, 获取多个父类知识图谱分别对应的数据文件, 任意一个数据文 件包含: 若干个第一类实体节点的关系数据; 所述关系数据具有 若干种关系类型; 配置获取模块, 配置为, 获取用于实体 融合的配置信 息, 其中包含: 多组指定关系类型; 任意一组指定 关系类型, 是从对应的父类知识图谱中第一类实体节点的关系数据具有的关 系类型中选择的; 图谱确定模块, 配置为, 将多个数据文件和所述配置信息确定为所述子类知识图谱的 数据; 所述子类知识图谱用于响应于针对所述第一类实体节点的查询请求, 提供所述多个 数据文件和所述配置信息, 以确定所述第一类实体节点融合后的关系数据。 12.根据权利要求1 1所述的装置, 还 包括: 实体融合模块, 配置为, 当接收到针对所述子类知识图谱中第一类实体节点的查询请 求时, 利用所述多个数据文件和所述配置信息, 确定所述第一类实体节点融合后的关系 数 据。 13.根据权利要求12所述的装置, 所述实体融合模块, 包括: 第一获取子模块, 配置为, 从所述多个数据文件中分别获取所述第一类实体节点的关 系数据; 第一筛选子模块, 配置为, 基于所述配置信 息, 从获取的关系数据中筛选出具有所述指 定关系类型的关系数据;权 利 要 求 书 2/3 页 3 CN 114357198 B 3

.PDF文档 专利 一种针对多个知识图谱的实体融合方法及装置

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种针对多个知识图谱的实体融合方法及装置 第 1 页 专利 一种针对多个知识图谱的实体融合方法及装置 第 2 页 专利 一种针对多个知识图谱的实体融合方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:55:27上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。