全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210404352.8 (22)申请日 2022.04.18 (71)申请人 北京计算机技 术及应用研究所 地址 100854 北京市海淀区永定路51号 (72)发明人 谢德鹏 胡欣欣 葛志 袁晓光  (74)专利代理 机构 中国兵器 工业集团公司专利 中心 11011 专利代理师 辛海明 (51)Int.Cl. G06F 16/28(2019.01) G06F 16/215(2019.01) G06F 16/26(2019.01) G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 16/838(2019.01)G06F 16/951(2019.01) (54)发明名称 一种面向军 事领域的知识图谱构建方法 (57)摘要 本发明涉及一种面向军事领域的知识图谱 构建方法, 属于知识图谱领域。 本发明通过爬虫 从互联网获取到军事相关新闻报道和百科类装 备及机构等信息, 对已有的数据进行补充; 然后 通过总结和前期经验, 设置部分实体类型和实体 关系类型, 利用多种算法融合的方式进行军事实 体、 要素属性和实体间关系的抽取; 对获得的实 体、 属性和关系进行融合校验, 得到正确数据集 合, 进而进行知识图谱的可视化和推理、 挖掘等 其他应用。 本发明可形成知识图谱, 可 以进行进 一步应用和可视化展现。 权利要求书2页 说明书7页 附图2页 CN 114860852 A 2022.08.05 CN 114860852 A 1.一种面向军事领域的知识图谱构建方法, 其特 征在于, 该 方法包括如下步骤: S11、 融合整理已有的结构化数据和半结构化军事数据; S12、 通过爬虫从互联网获取到军事相关新闻报道和百科知识, 对已有的数据进行补 充; S13、 对已经获取到的数据进行文本清洗, 删除重复信息、 纠正无效值和缺失值, 包括不 需要用的标点符号、 停用词、 标签和无关内容, 并提供数据审查、 校验和一致性检测, 进而 执 行分词、 词性标注和向量 化工作; S14、 通过总结和前期经验设置 部分实体 类型和实体关系类型; S15、 利用规则匹配和实体向量算法融合的方式进行军事实体、 属性和实体间关系的抽 取; S16、 对获得的军事实体、 属性和实体间关系进行融合校验, 得到正确数据集 合; S17、 进行知识图谱的可视化和推理。 2.如权利要求1所述的面向军事领域的知识图谱构建方法, 其特征在于, 结构化数据包 括物资装备字典、 地 点字典和同名词典。 3.如权利要求1所述的面向军事领域的知识图谱构建方法, 其特征在于, 半结构化军事 数据包括装备属性数据和作战文 书。 4.如权利要求1所述的面向军事领域的知识图谱构建方法, 其特征在于, 所述步骤S14 中, 实体类型包括军事装备、 人员、 机构和物资; 实体关系类型包括应用、 就职、 部署、 搭载、 指挥和打击关系。 5.如权利要求1 ‑4任一项所述的面向军事领域的知识图谱构建方法, 其特征在于, 所述 步骤S15具体包括: 首先与已有的武器装备实体字典、 同义词库进行匹配识别实体 内容, 进一步通过语义、 语法规则识别模板进 行实体识别, 采用基于词向量的Bi ‑LSTM‑CRF算法, 并在其中添加注 意 力机制, 增强军事实体关键特 征的权重, 抽取出军事实体、 属性和实体间关系类型; 其中, 借助实体字典和关联同义词库, 通过迭代式同步更新实体字典和同义词库, 从而 在下次识别同义实体时, 一定范围快速解决; 其中, 针对新词, 利用语义和语法规则匹配方式进行简单发现, 进行归类和整理, 而后 进一步通过Bert ‑BiLSTM‑CRF算法, 并在其中添加注意力机制进行军事实体的新词发现和 识别。 6.如权利要求5所述的面向军事领域的知识图谱构建方法, 其特征在于, 所述实体识别 具体包括: 通过利用属 性关系指示词、 位置规律和共现规律的规则匹配对实体和实体属 性 进行识别, 直接连接对应属性信息, 通过关系触发字与位置特 征发现新的实体关系。 7.如权利要求5所述的面向军事领域的知识图谱构建方法, 其特征在于, 所述步骤S16 具体包括: 通过实体属 性和实体上下文语义判断实体是否对齐, 对多源的属 性和关系进行 纠错和择优以消除矛盾和歧义, 最终 实现对实体属性和关系的融合和 消歧。 8.如权利要求7所述的面向军事领域的知识图谱构建方法, 其特征在于, 所述步骤S17 具体包括: 进 行抽取结果的可视化, 在充分考虑数据量和数据关联性情况下, 通过图数据库 实现可视化; 通过可视化界面建立战场焦点, 关联相关实体和属性、 关系, 可以进行战场 兵 力和武器效能对比; 通过图推理算法实现未知实体关系和 属性的推理。权 利 要 求 书 1/2 页 2 CN 114860852 A 29.一种面向军事领域的知识图谱构建方法, 其特 征在于, 该 方法包括如下步骤: S21、 整合已有非结构化军事文本数据; S22、 通过从网络获取到国内外军事相关新闻报道和百科类装备及机构信息, 对已有的 数据进行补充; S23、 通过总结和前期经验设置部分实体类型和 实体关系类型, 形成装备类别、 人员机 构类别实体元 数据; S24、 利用多种算法融合的方式进行军事实体、 要素属性和实体间关系的抽取; S25、 对获得的实体、 属性和关系进行融合校验, 得到正确数据集 合; S26、 进行知识图谱的可视化和推理。 10.一种基于权利要求1 ‑9任一项所述的方法的面向军事领域的知识图谱构建系统, 其 特征在于, 该系统包括如下模块: 数据获取模块, 用于结构化数据和半结构化军事数据的获取; 数据预处理模块, 用于非结构化数据的清洗, 提供数据审查、 校验和一致性检测, 进而 执行分词、 词性标注和向量 化工作; 预定义模块, 用于实体、 属性元 数据预定义和实体关系类型 预定义; 要素信息抽取模块, 用于军事相关实体、 属性及关系的抽取, 并进行融合校验; 知识图谱可视化模块, 用于知识图谱的可视化和定制化展现。权 利 要 求 书 2/2 页 3 CN 114860852 A 3

.PDF文档 专利 一种面向军事领域的知识图谱构建方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向军事领域的知识图谱构建方法 第 1 页 专利 一种面向军事领域的知识图谱构建方法 第 2 页 专利 一种面向军事领域的知识图谱构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:55:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。