(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211011628.2
(22)申请日 2022.08.23
(71)申请人 中国人民解 放军国防科技大 学
地址 410073 湖南省长 沙市开福区德雅路
109号
(72)发明人 成清 司悦航 黄金才 刘忠
程光权 杜航
(74)专利代理 机构 长沙大珂知识产权代理事务
所(普通合伙) 4323 6
专利代理师 伍志祥
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 16/332(2019.01)
G06F 16/36(2019.01)
G06F 40/295(2020.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于知识图谱的情 报智能问答方法
(57)摘要
本发明公开了一种基于知识图谱的情报智
能问答方法, 利用知识库构建知识图谱: 根据军
事类型数据库, 识别数据库中的实体、 实体间关
系, 并基于文档型数据库, 构建知 识图谱; 给定自
然语言问题, 利用Trie树存储实体库信息, 并根
据AC自动机算法进行 实体检索; 针对未得到匹配
的实体, 配合Word2Vec算法进行实体模糊匹配;
再基于关系模板穷举的方式识别自然语言问题
中涉及到的问题, 实现实体与查询属性项之间的
对应和成对; 根据返回得到的问题的实体和关
系, 转换为查询语句并作为问答搜索的结构化查
询语言, 返回查询结果。 本发明提升模型的特征
实体提取能力, 提高了模型的鲁棒 性和精度。
权利要求书2页 说明书16页 附图3页
CN 115422323 A
2022.12.02
CN 115422323 A
1.一种基于知识图谱的情 报智能问答方法, 其特 征在于, 包括以下步骤:
利用知识库构建知识图谱: 根据已有的小规模军事类型数据库, 识别数据库中的实体、
实体间关系, 并基于文档型 数据库Mo ngoDB, 构建知识图谱;
给定自然语言问题, 利用Trie树存 储实体库信息, 并根据AC自动机算法进行实体 检索;
针对未得到匹配 的实体, 配合Word2Vec算法中的CBOW网络进行实体模糊匹配; 再基于
关系模板穷举的方式识别自然语言问题中涉及到的问题, 实现实体与查询属性项之 间的对
应和成对;
根据返回得到的问题的实体和关系, 转换为MongoDB_SQLs查询语句并作为问答搜索的
结构化查询语言, 输入Mo ngoDB数据库中查询, 并返回查询结果。
2.根据权利要求1所述的基于知识图谱的情报智能问答方法, 其特征在于, 构建关系 模
板库包括: 通过最大范围地将可能输入的问题制作成模板加入库中, 从而实现对问题的高
效问答。
3.根据权利要求1所述的基于知识图谱的情报智能问答方法, 其特征在于, 所述CBOW网
络模型的目标函数如下:
对于当前词语ω, 目标是对其所在上下文Context(ω)中可 能存在的词进行预测, 目标
函数设置为如下对数似然函数 形式:
按照Hierarc hical Softmax思想, CBOW模型将其定义 为:
4.根据权利要求3所述的基于知识图谱的情报智能问答方法, 其特征在于, CBOW模型
中,
写成整体表达式形式为:
带入目标函数并简化对数运 算可得:
进一步简化为:
至此, 得到 CBOW模型的目标函数。
5.根据权利要求3所述的基于知识图谱的情报智能问答方法, 其特征在于, 使用梯度类权 利 要 求 书 1/2 页
2
CN 115422323 A
2算法进行参数 更新:
首先计算L(ω,j)对
的梯度:
因此,
的更新公式写为:
η为学习率;
同理, 依据对称性质, 可以计算得到L(ω,u,j)对 v(ω)的梯度:
v(ω)的更新公式为:
6.根据权利要求3所述的基于知识图谱的情报智能问答方法, 其特征在于, 根据
Word2Vec算法得到实体名称的词向量后, 同时得出其他候选同义词、 领域词的词向量, 并计
算两者的欧氏距离后, 根据设置的距离阈值进行判断, 记录相似度排名前八的候选近义词,
实现对不在实体名称库中实体的模糊匹配。
7.根据权利要求1所述的基于知识图谱的情报智能问答方法, 其特征在于, 设计包含多
种模板的关系模板库及其对应的数据库搜索语句, 以对问题的精准匹配。权 利 要 求 书 2/2 页
3
CN 115422323 A
3
专利 一种基于知识图谱的情报智能问答方法
安全报告 >
其他 >
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:39:04上传分享