全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210007129.X (22)申请日 2022.01.05 (71)申请人 田煜 地址 100000 北京市海淀区西土城路10号 19162 (72)发明人 田煜  (51)Int.Cl. G06F 16/36(2019.01) G06F 40/117(2020.01) G06F 40/211(2020.01) G06F 40/295(2020.01) G06Q 10/08(2012.01) G06Q 50/26(2012.01) (54)发明名称 一种面向应急物资管理的知识图谱技术的 构建方法 (57)摘要 本发明公开了一种面向应急物资管理的知 识图谱技术的构建方法, 包括下列构建方法步 骤: S1对原始数据集进行获取; S2对实体属性进 行抽取; S3实现融合BERT的基于序列标注和依存 句法分析的三元组抽取模型(B ‑STDP); S4构建知 识图谱; S5完成应急物资管理知 识搜索系统的环 境搭建、 需求分析、 整体架构设计、 前端设计与开 发。 本发明通过在应急物资高效储存的基础上, 考虑不同场景的需求, 利用知识图谱构建技术对 突发事件发生的情景下完善对应急物资的管理, 为应急资源优化分类方法及元数据规范研究、 突 发事件及应急资源关联匹配技术、 研究应急资源 动态管理数据库构建提供了理论支撑, 为应急事 件查询应急资源与调度分配物资提升效率。 权利要求书2页 说明书3页 附图2页 CN 114297410 A 2022.04.08 CN 114297410 A 1.一种面向应急物资管理的知识图谱技术的构建方法, 其特征在于, 包括下列构建方 法步骤: S1对原始数据集进行获取, 已完成多源数据集的整合, 使用爬虫工具对来源包括百度 百科、 MSDS数据库、 应急管理局官方网站、 各省市公开应急预案、 突发事件案例等非结构化 数据以及半结构化数据进行收集; S2对实体属性进行抽取, 在应急领域的危险化学品分类中, 对危险化学品的属性从百 度百科中使用scrapy框架提取并构成三元组自动存 入mongodb数据库; S3实现融合BERT的基于序列标注和依存句法分析的三元组抽取模型(B ‑STDP); S4构建知识图谱, 将以上准备好的三元组数据用Cypher进行操作存入Neo4j数据库, 并 对不同类型的数据进行 标注区分, 整体数据排布以事 件为中心进行扩散; S5完成应急物资管理知识搜索系统的环境搭建、 需求分析、 整体架构设计、 前端设计与 开发。 2.根据权利要求1所述的一种面向应急物资管理的知识图谱技术的构建方法, 其特征 在于: 所述在步骤S3中, 首先从MSDS库中把每一种危化品处置当中用到的应急物资抽取出 来, 应急物资类目采用应急物资分类编码标准中的数据, MSDS库本身 是结构化的数据, 结构 化处理应急措施中具体使用的以自然语言形式存在的处置物资, 然后根据非结构化数据的 特点和BERT模型的优势, 实现B ‑STDP模型, 将非结构化文档中的三元组提取出来, 以RDF数 据格式进行存 储。 3.根据权利要求1所述的一种面向应急物资管理的知识图谱技术的构建方法, 其特征 在于: 所述在步骤S1中, 采用非结构化数据来 获取数据的来源, 非结构化数据是没有 预定义 的、 不完整或不规则的数据模型, 在应急领域, 应急物资的完整数据、 包含应急物资的突发 事件描述、 历史应急事 件的概况等信息, 均由非结构化数据组成。 4.根据权利要求1所述的一种面向应急物资管理的知识图谱技术的构建方法, 其特征 在于: 所述在步骤S2中, 实体关系抽取模 型主要由四个部 分组成: 数据获取、 数据预 处理、 序 列标注、 实体关系联合抽取。 5.根据权利要求4所述的一种面向应急物资管理的知识图谱技术的构建方法, 其特征 在于: 所述数据获取中含应急物资清单、 突发事件事故调查报告、 突发事件专项预案, 采用 基于Python的Scrapy框架实现网络爬虫爬取直接 保存至Neo4j数据库, 同时存入mongodb作 为备份, 数据预 处理中爬取的数据文件中包含加密的pdf文件, 将pdf转化为图片, 再利用百 度OCR技术将pdf文件内的数据识别 出来, 对爬取的数据进行过滤操作, 以句子为单位进行 人工标注操作, 实体关系联合抽取中通过联合建模实体、 关系之间的内在联系, 缓解误差累 积, 为推荐系统、 多轮自动问答系统、 复杂 信息检索等下游子任务 提供有力的支持。 6.根据权利要求1所述的一种面向应急物资管理的知识图谱技术的构建方法, 其特征 在于: 所述在步骤S4中, 采用图数据库进行查询、 删除、 增加、 更新等一系 列操作, Neo4j数据 库属于图数据库的一种, Neo4j作为图数据库的主要代表, 其运行方式有两种: 服务的方式, 对外提供REST接口; 嵌入式模式, 数据以文件的形式存放在本地, 可以直接对本地文件进 行 操作。 7.根据权利要求1所述的一种面向应急物资管理的知识图谱技术的构建方法, 其特征 在于: 所述在步骤S4中, C ypher是一个描述性的图形查询语言, 即Neo4j的查询语言, C ypher权 利 要 求 书 1/2 页 2 CN 114297410 A 2查询语句与结构化数据库中SQL查询语句作用类似, 通过模式匹配来匹配图数据库中的节 点和关系, 也可以创建、 更新和删除节点、 关系和属性, 一个完整的Cypher查询语句可以对 图数据库中数据进行操作, 通常包括MATCH关键字、 WHERE关键字和RETURN关键字, Cypher的 关键字可分为 三类: 读关键 字、 写关键 字、 通用关键 字。 8.根据权利要求1所述的一种面向应急物资管理的知识图谱技术的构建方法, 其特征 在于: 所述在步骤S5中, 根据应急资源调度系统的需求, 构建相关的知识图谱后, 将多维的 网络空间资源及其关联关系融合到系统中, 利用搜索系统提供交互, 在构建好的知识图谱 中, 每对实体间存在大量关系路径的信息, 且每 个实体都有对应的实体描述信息 。权 利 要 求 书 2/2 页 3 CN 114297410 A 3

.PDF文档 专利 一种面向应急物资管理的知识图谱技术的构建方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向应急物资管理的知识图谱技术的构建方法 第 1 页 专利 一种面向应急物资管理的知识图谱技术的构建方法 第 2 页 专利 一种面向应急物资管理的知识图谱技术的构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:55:37上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。