全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210067605.7 (22)申请日 2022.01.20 (71)申请人 上海弘玑信息技 术有限公司 地址 200000 上海市闵行区紫星路58 8号2 幢13层055室 (72)发明人 王伟印 张晓程  (74)专利代理 机构 江苏瑞途律师事务所 32346 代理人 徐倩 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/295(2020.01) (54)发明名称 一种生成知识图谱的方法和电子设备 (57)摘要 本发明公开了一种生成知识图谱的方法, 包 括: 定义知识结构; 根据所述知识结构将现有文 档和/或增量文档转换为结构化数据、 半结构化 数据、 非结构化数据中的一种或多种; 将所述结 构化数据、 半结构化数据、 非结构化数据中一种 或多种的实体、 关系和属性进行整合, 得到知识 图谱。 本技术方案通过定义所需的知识结构, 针 对现有文档和增量文档进行转换, 得到结构化数 据、 半结构化数据、 非结构化数据中的一种或多 种, 利用结构化数据、 半结构化数据、 非结构化数 据中的一种或多种得到知识图谱, 能够有效提升 知识图谱的生成 效率和准确率。 本发 明还包括一 种电子设备, 该电子设备包括的处理器用于执行 一条或多条计算机程序指令以实现上述的方法。 权利要求书2页 说明书9页 附图3页 CN 114417012 A 2022.04.29 CN 114417012 A 1.一种生成知识图谱的方法, 其特 征在于: 包括以下步骤: 定义知识结构; 根据所述知识结构将现有文档和/或增量文档转换为结构化数据、 半结构化数据、 非结 构化数据中的一种或多种; 将所述结构化数据、 半结构化数据、 非结构化数据中的一种或多种的实体、 关系和属性 进行整合, 得到知识图谱。 2.根据权利要求1所述的生成知识图谱的方法, 其特 征在于: 所述定义知识结构包括: 获取所述现有 文档; 根据所述现有 文档和预设需求, 定义所述知识结构; 其中, 所述预设需求包括生成知识图谱所需要的实体、 关系和属性; 所述知识结构包括 知识结构的实体、 关系和 属性。 3.根据权利要求2所述的生成知识图谱的方法, 其特征在于: 在根据所述知识结构将现 有文档和增量文档转换为结构化数据、 半结构化数据、 非结构化数据中的一种或多种之前, 还包括: 根据所述知识结构生成增量文档, 具体为: 根据所述知识结构, 构建关系型数据库; 其中, 所述关系型数据库的主键为知识结构的 属性, 外键为知识结构的关系和 属性; 接收用户录入的数据; 根据所述用户录入的数据和关系型 数据库生成所述增量文档。 4.根据权利要求2所述的生成知识图谱的方法, 其特征在于: 在将所述结构化数据、 半 结构化数据、 非结构化数据中的一种或多种的实体、 关系和 属性进行整合之前, 还 包括: 根据所述知识结构的实体、 关系和属性, 利用自然语言处理技术对所述结构化数据、 半 结构化数据、 非结构化数据中的一种或多种进行处理, 具体为: 对其中的实体进行实体识 别, 对其中的关系进行关系抽取, 对其中的属性进行属性抽取。 5.根据权利要求2所述的生成知识图谱的方法, 其特征在于: 在将所述结构化数据、 半 结构化数据、 非结构化数据中的一种或多种的实体、 关系和 属性进行整合之前, 还 包括: 根据所述知识结构的实体、 关系和属性, 利用自然语言处理技术对所述现有文档转换 的结构化数据、 半结构化数据、 非结构化数据中的一种或多种进行处理, 具体为: 对其中的 实体进行实体识别, 对其中的关系进行关系抽取, 对其中的属性进行属性抽取; 根据所述知识结构的实体、 关系和属性, 获得第一知识内容; 其中, 所述第一知识内容 为所述增量文档转换的结构化数据中的实体、 关系和 属性。 6.根据权利要求4或5所述的生成知识图谱的方法, 其特征在于: 所述将所述结构化数 据、 半结构化数据、 非结构化数据中的一种或多种的实体、 关系和 属性进行整合包括: 将利用自然语言处理技术进行处理后获得的实体、 关系和属性进行实体统一、 实体消 歧和指代消解, 获得第二知识内容。 7.根据权利要求6所述的生成知识图谱的方法, 其特征在于: 所述将所述结构化数据、 半结构化数据、 非结构化数据中的一种或多种的实体、 关系和属性进 行整合, 得到知识图谱 包括: 将所述第一知识内容、 第二知识内容中的一种或两种存储到 图数据库中, 完成知识图 谱的构建。权 利 要 求 书 1/2 页 2 CN 114417012 A 28.根据权利要求7所述的生成知识图谱的方法, 其特征在于: 所述将所述第一知识内 容、 第二知识内容中的一种或两种存 储到图数据库中包括: 当所述第 一知识内容、 第 二知识内容中的一种或两种缺失实体、 关系或属性 时, 通过外 部数据获取缺失的实体、 关系或属性。 9.根据权利要求5所述的生成知识图谱的方法, 其特 征在于: 所述方法还 包括: 将所述第一知识内容作为所述自然语言处理技术的标注数据, 对自然语言处理技术中 的模型进行训练。 10.一种电子设备, 其特 征在于, 包括: 存 储器和处 理器; 所述存储器用于存 储一条或多条计算机程序指令; 所述处理器用于执行所述一条或多条计算机程序指令以用于: 执行权利要求1—9任一 项所述的方法中的步骤。权 利 要 求 书 2/2 页 3 CN 114417012 A 3

.PDF文档 专利 一种生成知识图谱的方法和电子设备

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种生成知识图谱的方法和电子设备 第 1 页 专利 一种生成知识图谱的方法和电子设备 第 2 页 专利 一种生成知识图谱的方法和电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:54:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。