全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211139524.X (22)申请日 2022.09.19 (71)申请人 三一重工股份有限公司 地址 102206 北京市昌平区北清路8号6幢5 楼 (72)发明人 王健健 蒋华晨 邓伟杰  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 杨小庆 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/28(2019.01) (54)发明名称 风机标准作业知识图谱构建方法、 装置及作 业机械 (57)摘要 本发明涉及知识图谱 领域, 提供一种风机标 准作业知识图谱构建方法、 装置及作业机械, 方 法包括: 获取风机标准作业的文本数据; 对结构 化数据基于预设规则直接进行知识抽取, 获取结 构化数据的实体数据、 属性数据和关系数据, 将 非结构化数据和半结构化数据文本数据输入至 训练完成的神经网络模型中, 进行实体抽取、 属 性抽取以及关系抽取, 分别得到实体数据、 属性 数据和关系数据; 基于已构建的本体库对实体数 据、 属性数据和关系数据进行知识融合和知 识加 工, 构建风机标准作业的文本数据对应的知 识图 谱。 本发明利用神经网络模型进行知识抽取代替 了人工知识抽取, 从而节省了大量的人力和财 力, 实现高效地、 自动化构建风机标准专业知识 图谱。 权利要求书2页 说明书10页 附图2页 CN 115391567 A 2022.11.25 CN 115391567 A 1.一种风机标准作业知识图谱构建方法, 其特 征在于, 包括: 获取风机标准作业的文本数据; 其中, 所述文本数据包括结构化数据、 非结构化数据以 及半结构化数据; 对所述结构化数据基于预设规则直接进行知识抽取, 获取所述结构化数据的实体数 据、 属性数据和关系 数据, 将所述非结构化数据和半结构化数据输入至训练完成的神经网 络模型中, 进行实体抽取、 属性抽取以及关系抽取, 得到非结构化数据的实体数据、 属 性数 据和关系数据, 以及半结构化数据的实体数据、 属性数据和关系数据; 基于已构建的本体库对所述实体数据、 属性数据和关系数据进行知识融合和知识加 工, 构建所述 风机标准作业的文本数据对应的知识图谱。 2.根据权利要求1所述的风机标准作业知识图谱构建方法, 其特征在于, 将所述非结构 化数据和半结构化数据文本数据输入至训练完成的神经网络模型中, 进行实体抽取、 属 性 抽取以及关系抽取, 得到非结构化数据的实体数据、 属性数据和关系数据, 以及半结构化数 据的实体数据、 属性数据和关系数据, 包括: 将所述非结构化数据输入至训练完成的实体抽取模型中, 获取所述非结构化数据的实 体数据和 属性数据; 将不同的所述实体数据输入至训练完成的关系抽取模型中, 获取不同实体之间的关系 数据; 对所述半结构化数据进行文字识别得到识别数据, 将所述识别数据输入至实体识别模 型, 获取半结构化数据的实体数据和属 性数据, 将不同的所述半结构化数据的实体数据输 入至关系抽取模型中, 获取不同的半结构化数据的关系数据; 其中, 所述实体抽取模型是基于非结构化样本和所述非结构化样本的标签进行训练得 到的, 所述关系抽取模型是基于半结构化样本和所述半结构化样本的标签进行训练得到 的。 3.根据权利要求2所述的风机标准作业知识图谱构建方法, 其特征在于, 所述对所述半 结构化数据进行文字识别得到识别数据, 包括: 将所述半结构化数据输入至表格信息抽取模型中, 基于表头识别规则, 获取所述半结 构化数据的表头位置; 基于预先构建的映射关系获取 所述表头位置对应的待获取 数据; 将所述待获取 数据输入至文字识别模型中, 得到所述识别数据。 4.根据权利要求2所述的风机标准作业知识图谱构建方法, 其特征在于, 所述实体抽取 模型包括BERT层和CRF层; 将所述非结构化数据输入至训练完成的实体抽取模型中, 获取所述非结构化数据的实 体数据和 属性数据, 包括: 将所述非结构化数据输入至所述BERT层中, 获取非结构化数据的特 征向量; 将所述特征向量输入至所述CRF层中进行实体识别和属性识别, 获取所述特征向量的 实体数据和 属性数据。 5.根据权利要求1所述的风机标准作业知识图谱构建方法, 其特征在于, 基于已构建的 本体库对所述实体数据、 属性数据和关系数据进行知识融合和知识加工之前, 还 包括: 将风机标准作业划分为 不同的作业类别;权 利 要 求 书 1/2 页 2 CN 115391567 A 2设定不同的作业类别的本体关系、 本体属性及本体上下位, 并基于所述本体关系、 本体 属性及本体上 下位将本体确认为实体; 规范实体的关系 、 作业类别以及属性联系并构建本体库。 6.根据权利要求2所述的风机标准作业知识图谱构建方法, 其特征在于, 获取风机标准 作业的文本数据之后, 还 包括: 将所述结构化数据与专 家知识库进行 数据融合得到融合数据; 基于已构建的本体库对所述实体数据、 属性数据和关系数据进行知识融合和知识加 工, 包括: 将所述实体数据、 属性数据、 关系数据结合所述融合数据基于已构建的本体库进行实 体消歧和共指消解, 得到知识对齐数据; 对所述对齐数据进行质量评估和本体创建的知识加工; 构建所述 风机标准作业的文本数据对应的知识图谱之后, 还 包括: 将所述知识图谱进行知识推理, 并再次进行质量评估。 7.一种风机标准作业知识图谱构建装置, 其特 征在于, 包括: 获取单元, 用于获取风机标准作业的文本数据; 其中, 所述文本数据包括结构化数据、 非结构化数据以及半结构化数据; 抽取单元, 用于对所述结构化数据基于预设规则直接进行知识抽取, 获取所述结构化 数据的实体数据、 属 性数据和关系 数据, 将所述非结构化数据和半结构化数据输入至训练 完成的神经网络模型中, 进行实体抽取、 属性抽取以及关系抽取, 得到非结构化数据的实体 数据、 属性数据和关系数据, 以及半结构化数据的实体数据、 属性数据和关系数据; 构建单元, 用于基于已构建的本体库对所述实体数据、 属性数据和关系数据进行知识 融合和知识加工, 构建所述 风机标准作业的文本数据对应的知识图谱。 8.一种作业机械, 其特征在于, 包括如权利要求7所述的风机标准作业知识图谱构建装 置。 9.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至6任一项所 述风机标准作业知识图谱构建方法的步骤。 10.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算 机程序被处理器执行时实现如权利要求1至6任一项所述风机标准作业知识图谱构建方法 的步骤。权 利 要 求 书 2/2 页 3 CN 115391567 A 3

.PDF文档 专利 风机标准作业知识图谱构建方法、装置及作业机械

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 风机标准作业知识图谱构建方法、装置及作业机械 第 1 页 专利 风机标准作业知识图谱构建方法、装置及作业机械 第 2 页 专利 风机标准作业知识图谱构建方法、装置及作业机械 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:44:47上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。