全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210337302.2 (22)申请日 2022.04.01 (71)申请人 杭州未名信科 科技有限公司 地址 311200 浙江省杭州市萧 山区宁围街 道钱江世纪 公园C区1幢101室 申请人 浙江省北 大信息技 术高等研究院 (72)发明人 段宏英 陈家银 张伟 陈曦  麻志毅  (74)专利代理 机构 北京辰权知识产权代理有限 公司 11619 代理人 李小朋 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/335(2019.01) G06F 40/295(2020.01)G06F 40/30(2020.01) G06Q 30/08(2012.01) (54)发明名称 知识图谱的构建方法、 装置、 电子设备及介 质 (57)摘要 本申请公开了一种知识图谱的构建方法、 装 置、 电子设备及介质。 通过应用本申请的技术方 案, 可以构建一个能够应用于所有传统制造业的 知识图谱, 其中包括招标数据、 中标数据、 联系信 息数据以及企业经营范围数据的图谱 数据, 从而 避免了相关技术中存在的, 现有的行业图谱构建 方法粒度较细以及覆盖面较窄进而导致识别准 确率不高的问题。 权利要求书2页 说明书11页 附图3页 CN 114428864 A 2022.05.03 CN 114428864 A 1.一种知识图谱的构建方法, 其特 征在于, 包括: 构建本体 图, 包括: 构建包含企业招投标联系人、 企业上下游、 企业联系方式和以产业 链为导向的行业 ‑企业‑产品的子图谱层的本体图; 利用多个实体识别模型针对多数据源进行实体抽取, 得到样本实体集合, 所述多数据 源为企业信息对应的招标数据、 中标数据、 联系信息数据以及企业经营范围数据的至少一 种; 将所述样本实体集 合输入到所述本体图中, 得到初始知识图谱; 将所述初始知识图谱中的实体信息进行知识融合, 得到待挖掘知识图谱, 并在对所述 待挖掘知识图谱进行实体相互关系挖掘后, 得到用于处 理企业业务的目标知识图谱。 2.如权利要求1所述的方法, 其特 征在于, 所述构建本体图, 包括: 构建用于所述反映用户类本体与对应企业类本体之间关联关系的子图谱层, 其中所述 用户类本体包括企业招投标联系 人, 所述企业类本体包括招标企业、 招标组织以及代理机 构; 以及, 构建用于所述反映各个招标企业类本体之间关联关系的子图谱层, 所述招标企业类本 体包括招标企业/组织、 代理机构、 投标企业以及中标企业; 以及, 构建用于所述各个企业联系方式的子图谱层; 以及, 构建用于所述企业类本体、 行业类本体与对应产品类本体之间关联关系的子 图谱层, 所述产品类本体包括上游产品本体、 中游产品本体以及下游产品本体, 所述行业类本体包 括上游行业、 中游行业以及下游行业。 3.如权利要求1所述的方法, 其特征在于, 所述利用多个实体识别模型针对多数据源进 行实体抽取, 得到样本实体集 合, 包括: 若所述数据源对应于所述企业信 息的招标数据以及中标数据, 利用企业实体抽取模型 抽取所述数据源中包括的招标企业、 投标企业、 中标企业、 代理机构; 以及, 使用联系人信息 抽取模型抽取招标联系用户、 招标项目负责用户、 代理机构联系用户, 得到所述样本实体集 合; 和/或, 若所述数据源对应于所述企业信 息的企业经营范围数据, 利用企业联系信 息抽取模型 抽取所述数据源中包括的企业实体, 以及该企业对应的联系方式, 得到所述样本实体集 合; 和/或, 若所述数据源对应于所述企业信 息的联系信 息数据, 利用深度 学习模型抽取所述数据 源中包括的产品实体, 得到所述样本实体集 合。 4.如权利要求1或3所述的方法, 其特征在于, 所述将所述样本实体集合输入到所述本 体图中, 得到初始知识图谱, 包括: 根据所述本体图的本体结构, 将所述样本实体集合中的样本数据输入至所述本体图对 应的结构中, 得到所述初始知识图谱。 5.如权利要求 4所述的方法, 其特 征在于, 在所述得到所述初始知识图谱之后, 还 包括: 对所述初始知识图谱进行质量评估, 并在通过所述质量评估后, 将所述初始知识图谱 中的实体信息进 行知识融合, 其中所述质量评估对应于确定实体信息间的关系以及实体信 息属性。权 利 要 求 书 1/2 页 2 CN 114428864 A 26.如权利要求1所述的方法, 其特征在于, 所述将所述初始知识图谱中的实体信 息进行 知识融合, 得到待挖掘知识图谱, 包括: 对所述初始知识图谱中的实体信 息进行实体分解以及实体合并, 得到所述待挖掘知识 图谱, 其中所述实体分解用于处理筛选出来的名称相同但含义不同的实体信息, 所述实体 合并用于处 理筛选出来的含义相同但名称不同的实体信息 。 7.如权利要求1所述的方法, 其特征在于, 所述对所述待挖掘知识图谱进行实体相互关 系挖掘后, 得到用于处 理企业业务的目标知识图谱, 包括: 获取各个实体间的原有关系, 并利用图模型将所述各个实体以及所述各个实体间的原 有关系进行向量转换, 实现对所述待挖掘知识图谱进行实体相互关系挖掘, 得到所述 目标 知识图谱。 8.一种知识图谱的构建装置, 其特 征在于, 包括: 构建模块, 被配置为构建本体图, 包括: 构建包含企业招投标联系人、 企业上下游、 企业 联系方式和以产业链为 导向的行业 ‑企业‑产品的子图谱层的本体图; 生成模块, 被配置为利用多个实体识别模型针对多数据源进行实体抽取, 得到样本实 体集合, 所述多数据源为 企业信息对应的招标数据、 中标数据、 联系信息数据以及企业经营 范围数据的至少一种; 输入模块, 被配置为将所述样本实体集 合输入到所述本体图中, 得到初始知识图谱; 所述生成模块, 被配置为将所述初始知识图谱中的实体信息进行知识融合, 得到待挖 掘知识图谱, 并在对所述待挖掘知识图谱进行实体相互关系挖掘后, 得到用于处理企业业 务的目标知识图谱。 9.一种电子设备, 其特 征在于, 包括: 存储器, 用于存 储可执行指令; 以及, 处理器, 用于与所述存储器执行所述可执行指令从而完成权利要求1 ‑7中任一所述知 识图谱的构建方法的操作。 10.一种计算机可读存储介质, 用于存储计算机可读取的指令, 其特征在于, 所述指令 被执行时执行权利要求1 ‑7中任一所述知识图谱的构建方法的操作。权 利 要 求 书 2/2 页 3 CN 114428864 A 3

.PDF文档 专利 知识图谱的构建方法、装置、电子设备及介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 知识图谱的构建方法、装置、电子设备及介质 第 1 页 专利 知识图谱的构建方法、装置、电子设备及介质 第 2 页 专利 知识图谱的构建方法、装置、电子设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:59:39上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。