全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210173874.1 (22)申请日 2022.02.25 (65)同一申请的已公布的文献号 申请公布号 CN 114238663 A (43)申请公布日 2022.03.25 (73)专利权人 北京理工大 学 地址 100000 北京市海淀区中关村南大街5 号 (72)发明人 张洪梅 程兴旺 肖晖  (74)专利代理 机构 成都顶峰专利事务所(普通 合伙) 51224 专利代理师 陈秋霞 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/216(2020.01)G06N 3/04(2006.01) G16C 20/90(2019.01) (56)对比文件 CN 112650855 A,2021.04.13 汪晶.磁性材 料性能建模与知识库智能设计 方法研究. 《中国优秀博硕士学位 论文全文数据 库(硕士)工程科技 Ⅱ辑》 .2019,C 042-136. 郑慎鹏 等.基 于主体掩码的实体关系抽取 方法. 《大 数据》 .2021,3 -14. 审查员 郭婉莹 (54)发明名称 一种材料数据用知识图谱分析方法、 系统、 电子设备及 介质 (57)摘要 本发明涉及数据处理技术领域, 其目的在于 提供一种材料数据用知识图谱分析方法、 系统、 电子设备及介质。 其中的方法包括: 获取原始材 料数据, 并对 所述原始材料数据进行实体关系识 别处理, 得到材料知识图谱; 实时判断是否接收 到查询指令以及与所述查询指令对应的待查询 信息, 若是, 则对所述待查询信息进行 实体识别, 得到所述待查询信息对应的待检测实体, 最后将 所述材料知识 图谱中的所述待检测实体与所述 相关实体之间的关系、 所有相关实体之间的关 系、 所述相关实体以及所述待检测实体进行多层 级联可视化输出。 本发明解决了材料数据知 识的 关联与整合问题, 可有助于用户快速选取相关满 足性能要求的材 料。 权利要求书3页 说明书9页 附图3页 CN 114238663 B 2022.06.10 CN 114238663 B 1.一种材 料数据用知识图谱分析 方法, 其特 征在于: 包括: 获取原始材料数据, 并对所述原始材料数据进行实体关系识别处理, 得到所述原始材 料数据中的所有实体、 所有实体之间的关系以及与所有实体对应的标识码; 将所有实体与其对应的标识码进行绑定, 并对所有实体以及所有实体的关系 进行实体 融合, 得到材料知识图谱; 其中, 所述标识码以token属性的形式与所述实体进行绑定, token属性基于对应的标识码生 成, 以便于标识实体或关系; 所述t  oken属性用于标识任一 实体所属于的材 料数据; 实时判断是否接收到查询指令以及与所述查询指令对应的待查询信息, 若是, 则对所 述待查询信息进行实体识别, 得到所述待查询信息对应的待检测实体, 并进入下一 步; 获取所述待检测实体对应的标识码, 并根据所述待检测实体对应的标识码, 在所述知 识图谱中筛选得到绑定有 所述待检测实体对应的标识码的所有相关实体, 并抽取所述待检 测实体与所述相关实体之间的关系以及所有相关实体之间的关系; 将所述材料知识图谱中的所述待检测实体与所述相关实体之间的关系、 所有相关实体 之间的关系 、 所述相关实体以及所述待检测实体进行多层级联 可视化输出。 2.根据权利要求1所述的一种材料数据用知识图谱分析方法, 其特征在于: 对所述原始 材料数据进 行实体关系识别处理时, 基于实体关系识别模型实现, 其中, 所述 实体关系识别 模型包括编码层、 主体识别指针网络、 主体掩码计算模块、 Transformer层、 关系 ‑客体指针 网络、 客体识别网络和标识码生成模块; 基于所述实体关系识别模型对所述原始材料数据 进行实体关系识别处 理的步骤如下: 将所述原 始材料数据输入所述编码层进行文本编码处 理, 得到文本向量序列; 将所述文本向量序列输入所述主体识别指针网络进行主体生成处理, 得到所述原始材 料数据中的所有 主体; 将所有主体输入所述主体掩码计算模块进行计算, 得到所有主体对应的主体掩码序 列; 将所述文本向量序列和所述主体掩码序列输入Transformer层进行处理, 得到所有主 体对应的主体向量序列; 将所述主体向量序列和所述文本向量序列输入所述关系 ‑客体指针网络进行处理, 得 到关系‑客体向量序列; 将所述关系 ‑客体向量序列输入客体识别网络进行预测 处理, 得到与所有主体对应的 相关客体, 其中, 所有主体以及与所有主体对应的相关客体即为根据所述原始材料数据得 到的实体; 将所述实体输入所述标识码生成模块进行标识码生成处理, 得到所述实体对应的标识 码。 3.根据权利要求2所述的一种材料数据用知识图谱分析方法, 其特征在于: 所述主体识 别指针网络对所述文本向量序列进行主体生成处理, 得到所述原始材料数据中的所有主体 时, 步骤如下: 计算所述文本向量序列中所有文字为主体开始位置的第一概率及为主体结束位置的 第二概率; 判断所述文本向量序列中任一文字的第一概率或第二概率是否大于第一阈值, 若是,权 利 要 求 书 1/3 页 2 CN 114238663 B 2则将该文字所在的位置标记为1, 否则将该文字所在的位置标记为0; 从所述文本向量序列的首位文字开始, 将所述位置标记为1的文字与所述文本向量序 列中位置在该文字之后的所在位置标记为 1的文字进 行配对处理, 得到一个主体, 然后 将进 行该所述位置标记为1的文字之后文字的配对处理, 直到得到所述原始材料数据中的所有 主体。 4.根据权利要求3所述的一种材料数据用知识图谱分析方法, 其特征在于: 所述文本向 量序列中, 第 i个文字为主体开始位置的第一 概率为: f1(i)=σ(W1*a(i)+b1); 所述文本向量序列中, 第 i个文字为主体结束位置的第二 概率为: f2(i)=σ(W2*a(i)+b2); 其中,σ为sigmoid函数, W1、b1、W2和b2为与关系类 型相关的可训练参数, a(i)为所述文本 向量序列中第 i个文字的位置向量。 5.根据权利要求1所述的一种材料数据用知识图谱分析方法, 其特征在于: 所述原始材 料数据从预存的材料数据库获取, 所述材料数据库中包括数据属 性和性能数据; 所述数据 属性包括材料类别、 名称、 生产单位、 研制单位、 成分、 品种、 技术标准、 工艺、 规格和/或批 次; 其中, 名称与生产单位、 研制单位、 成分和品种建立属性关联, 品种 与技术标准和工艺建 立属性关联, 工艺与规格建立属性关联, 规格与批次建立属性关联, 批次与性能数据建立关 联; 所述性能数据包括力学性能数据和/或物理性能数据。 6.根据权利要求1所述的一种材料数据用知识图谱分析方法, 其特征在于: 获取原始材 料数据后, 所述材 料数据用知识图谱分析 方法还包括: 对材料数据进行预处理, 然后将预处理后实体进行实体关系识别处理; 其中, 所述预处 理包括标准 化处理、 数据清洗处 理和/或数据噪声处 理。 7.根据权利要求1所述的一种材料数据用知识图谱分析方法, 其特征在于: 对所述待查 询信息进行实体识别时, 包括: 采用循环神经网络对所述待查询信息进行句法解析, 得到解析后待查询信息; 将解析后待查询信息输入基于LSTM+CRF的序列标注模型, 得到与所述待查询信息对应 的待检测实体。 8.一种材料数据知识图谱构建系统, 其特征在于: 用于实现如权利要求1至7中任一项 所述的材 料数据用知识图谱分析 方法; 所述材 料数据知识图谱构建系统包括: 实体关系识别处理模块, 用于获取原始材料数据, 并对所述原始材料数据进行实体关 系识别处理, 得到所述原始材料数据中的所有实体、 所有实体之间的关系以及与所有实体 对应的标识码; 知识图谱生成模块, 用于将所有实体与其对应的标识码进行绑定, 并对所有实体以及 所有实体的关系进行实体融合, 得到材 料知识图谱; 查询模块, 用于实时判断是否接收到查询指令以及与所述查询指令对应的待查询信 息, 若是, 则对所述待查询信息进行实体识别, 得到所述待查询信息对应的待检测实体, 然 后获取所述待检测实体对应的标识码, 并根据所述待检测实体对应的标识码, 在所述知识 图谱中筛选得到绑定有所述待检测实体对应的标识码的所有相关实体, 并抽取所述待检测 实体与所述相关实体之间的关系以及所有相关实体之间的关系;权 利 要 求 书 2/3 页 3 CN 114238663 B 3

.PDF文档 专利 一种材料数据用知识图谱分析方法、系统、电子设备及介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种材料数据用知识图谱分析方法、系统、电子设备及介质 第 1 页 专利 一种材料数据用知识图谱分析方法、系统、电子设备及介质 第 2 页 专利 一种材料数据用知识图谱分析方法、系统、电子设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:54:21上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。