全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210149195.0 (22)申请日 2022.02.18 (65)同一申请的已公布的文献号 申请公布号 CN 114528413 A (43)申请公布日 2022.05.24 (73)专利权人 北京融信数联科技有限公司 地址 100000 北京市海淀区上地信息路26 号10层10 04室 (72)发明人 张广志 于笑博 成立立 杨占军  李奇  (74)专利代理 机构 北京沃杰永益知识产权代理 事务所(普通 合伙) 11905 专利代理师 杨杰 (51)Int.Cl. G06F 16/36(2019.01)G06F 16/23(2019.01) G06F 16/28(2019.01) (56)对比文件 CN 113704499 A,2021.1 1.26 CN 110347894 A,2019.10.18 CN 113505244 A,2021.10.15 CN 112434169 A,2021.0 3.02 US 2016314158 A1,2016.10.27 李正华.基于众包标注提高教学效果的探 索. 《科教导刊(上旬刊)》 .2020, 审查员 黄蓉冰 (54)发明名称 众包标注支持的知识图谱更新方法、 系统和 可读存储介质 (57)摘要 本发明公开的一种众包标注支持的知识图 谱更新方法、 系统和可读存储介质, 其中方法包 括: 获取目标数据, 并对其进行目标作业, 获取每 一种所述目标作业所得结果对应的标注数据, 并 基于所述标注数据进行分析迭代, 其中, 若所述 迭代结果不满足对应的停止条件, 则继续迭代更 新; 若所述迭代结果满足对应的所述停止条件, 则停止迭代, 结束所述知识图谱的更新。 本发明 提供一种支持众包标注的知识图谱 更新方法, 能 够根据人工标注的结果, 对知识图谱中实体、 关 系以及事件, 进行更新, 以提高知 识图谱质量, 丰 富知识图谱存量; 通过标注的结果进行分析, 对 知识进行抽取、 融合以及推理将所得结果进行迭 代更新, 直至更新结束。 权利要求书2页 说明书10页 附图1页 CN 114528413 B 2022.08.12 CN 114528413 B 1.一种众包标注支持的知识图谱更新方法, 其特征在于, 包括以下步骤: 获取目标数 据, 并对其进行目标作业, 其中, 所述目标作业包括知识抽取作业、 知识融合作业以及知识 推理作业; 获取每一种所述目标作业所得结果对应的标注数据, 并基于所述标注数据进行分析迭 代, 并判断当前迭代结果是否满足对应的停止条件, 其中, 若 所述迭代结果满足预设的样本 阈值, 则停止迭代, 结束所述知识图谱的更新; 若所述迭代结果满足预设的准确率阈值, 则停止迭代, 结束所述知识图谱的更新; 将预处理数据转化成非结构化数据以得到所述目标数据, 其中, 包括将网页特殊格式 数据转化成对应文本数据; 基于所述目标数据进行所述知识抽取作业, 具体包括: 基于预设深度学习算法对所述 目标数据进行实体抽取 得到实体结果; 基于所述实体结果进行实体消歧作业以得到实体链接; 基于预设触发词模板对所述实体结果进行关系提取, 得到对应的提取 结果; 利用动态池化卷积神经网络模型对所述目标 数据进行事 件抽取; 待所述知识抽取作业完成后, 收集所述实体结果、 所述实体链接以及所述提取结果对 应的所述标注数据; 其中, 实体抽取的迭代具体步骤包括: 识别当前所述实体的标注准确率, 其中, 若所述 准确率高于预设准确阈值, 则停止所述实体抽取对应的迭代更新; 所述实体链接的迭代具体步骤包括: 基于Rank  SVM模型进行实体消歧作业, 当识别到 消歧准确率高于预设消歧阈值, 则停止所述实体链接的迭代; 所述关系提取的迭代步骤包括: 基于提取到的关系标注结果进行识别, 若识别到无新 添加的所述关系标注结果, 则停止所述关系提取的迭代; 所述事件抽取的迭代具体步骤包括: 提取所述事件抽取标注结果, 其中, 若无新添加的 所述事件抽取标注结果, 则停止所述事 件抽取的迭代。 2.根据权利要求1所述的一种众包标注支持的知识图谱更新方法, 其特征在于, 基于所 述目标数据进行 所述知识融合作业, 具体包括: 基于所述知识抽取 得到的结果进行分块; 并对分块后的所述实体进行相似度计算; 将相似度计算结果超过预设阈值的链接进行标注, 其中, 基于所述实体结果计算实体 相似度以记录实体对的链接 。 3.根据权利要求2所述的一种众包标注支持的知识图谱更新方法, 其特征在于, 利用预 设规则对分块后的所述实体进行知识推理, 并基于支持度以及置信度进行评估。 4.一种众包标注支持的知识图谱更新系统, 其特征在于, 包括存储器和处理器, 所述存 储器中包括众包标注支持的知识图谱更新方法程序, 所述众包标注支持的知识图谱更新方 法程序被所述处理器执行时实现如下步骤: 获取目标数据, 并对其进行目标作业, 其中, 所 述目标作业包括知识抽取作业、 知识融合作业以及 知识推理作业; 获取每一种所述目标作业所得结果对应的标注数据, 并基于所述标注数据进行分析迭 代, 并判断当前迭代结果是否满足对应的停止条件, 其中, 若 所述迭代结果满足预设的样本 阈值, 则停止迭代, 结束所述知识图谱的更新; 若所述迭代结果满足预设的准确率阈值, 则停止迭代, 结束所述知识图谱的更新;权 利 要 求 书 1/2 页 2 CN 114528413 B 2将预处理数据转化成非结构化数据以得到所述目标数据, 其中, 包括将网页特殊格式 数据转化成对应文本数据; 基于所述目标数据进行所述知识抽取作业, 具体包括: 基于预设深度学习算法对所述 目标数据进行实体抽取 得到实体结果; 基于所述实体结果进行实体消歧作业以得到实体链接; 基于预设触发词模板对所述实体结果进行关系提取, 得到对应的提取 结果; 利用动态池化卷积神经网络模型对所述目标 数据进行事 件抽取; 待所述知识抽取作业完成后, 收集所述实体结果、 所述实体链接以及所述提取结果对 应的所述标注数据; 其中, 实体抽取的迭代具体步骤包括: 识别当前所述实体的标注准确率, 其中, 若所述 准确率高于预设准确阈值, 则停止所述实体抽取对应的迭代更新; 所述实体链接的迭代具体步骤包括: 基于Rank  SVM模型进行实体消歧作业, 当识别到 消歧准确率高于预设消歧阈值, 则停止所述实体链接的迭代; 所述关系提取的迭代步骤包括: 基于提取到的关系标注结果进行识别, 若识别到无新 添加的所述关系标注结果, 则停止所述关系提取的迭代; 所述事件抽取的迭代具体步骤包括: 提取所述事件抽取标注结果, 其中, 若无新添加的 所述事件抽取标注结果, 则停止所述事 件抽取的迭代。 5.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中包括一种众包 标注支持的知识图谱更新方法程序, 所述众包标注支持的知识图谱更新方法程序被处理器 执行时, 实现如权利要求 1至3中任一项 所述的一种众包标注支持的知识图谱更新方法的步 骤。权 利 要 求 书 2/2 页 3 CN 114528413 B 3

.PDF文档 专利 众包标注支持的知识图谱更新方法、系统和可读存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 众包标注支持的知识图谱更新方法、系统和可读存储介质 第 1 页 专利 众包标注支持的知识图谱更新方法、系统和可读存储介质 第 2 页 专利 众包标注支持的知识图谱更新方法、系统和可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:56:02上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。