全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210072483.0 (22)申请日 2022.01.21 (71)申请人 中国船舶重 工集团公司第七0九研 究所 地址 430074 湖北省武汉市东湖新 技术开 发区凤凰产业园藏龙 北路1号 (72)发明人 张顺舟 乔宏永 何志峰 程义林  (74)专利代理 机构 武汉华之喻知识产权代理有 限公司 42 267 专利代理师 廖盈春 曹葆青 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/253(2020.01) G06F 40/289(2020.01) (54)发明名称 一种基于知识图谱的问答交 互方法及系统 (57)摘要 本发明公开了一种基于知识图谱的问答交 互方法及系统, 其中, 问答交互方法包括: 关键词 划分步骤, 问答交互步骤; 本发明通过语音识别 算法和图像识别算法将非结构化文本转化为结 构化文本, 并从中抽取出DF三元组构建知识图 谱, 从而使得 非结构化文本以知识图谱的形式存 储下来; 本发 明通过训练好的神经网络模型在知 识图谱中查找并返回与输入问题相对应的RDF三 元组, 保证了回答的准确性; 本发明通过语法分 析算法将问题集中每个问题按主语、 谓语、 宾语、 定语、 状语和补语进行划分, 并和问题对应的答 案一起构建训练集, 使用训练集对神经网络模型 进行训练。 权利要求书3页 说明书7页 附图1页 CN 114461814 A 2022.05.10 CN 114461814 A 1.一种基于知识图谱的问答交 互方法, 其特 征在于, 包括以下步骤: (1)关键词划分步骤: 通过语法分析算法, 将每个输入的问题按句子成分进行划分, 得到主语、 谓语、 宾语、 定 语、 状语和补语中的任几个或全部作为关键词, 组成一个词集; (2)问答交 互步骤: 将所述词集输入训练好的神经网络模型; 训练好的神经网络模型在知识图谱中查找并返回对应的一个RDF三元组, 以获得对应 的输入的问题的正确答案; 所述知识图谱的构建方法为: 通过关系抽取算法从结构化文本集中的每一个结构化文 本中均提取 出若干个RDF三元组, 由它 们构建知识图谱; 所述结构化文本集由所有的音频结构化文本、 图片结构化文本和视频结构化文本组 成; 所述每个音频结构化文本是通过语音识别算法将音频文件库中的每个音频文件转化 而成; 所述每个图片结构化文本是通过图像识别算法将图片文件库中的每个图片文件转化 而成; 所述每个视频结构化文本是通过图像识别算法将视频文件库中的每个视频文件转化 而成。 2.如权利要求1所述的基于知识图谱的问答交互方法, 其特征在于, 所述构建知识图谱 的过程为: (1)提取RDF: 通过关系抽取算法,从所述结构化文本集中的每个结构化文本中均提取出若干个RDF 三元组; (2)生成存 储单元: 所述每个结构化文本对应一个存 储单元, 所述存 储单元包含所述若干个RDF三元组; (3)生成知识图谱: 所有的存 储单元中的数据组成知识图谱。 3.如权利要求1所述的基于知识图谱的问答交互方法, 其特征在于, 训练所述神经网络 模型的过程 为: (1)通过语法分析算法, 将预先设定的问题集中的每个问题按句子成分进行划分, 得到 主语、 谓语、 宾语、 定语、 状语和补语中的任几个或全部作为关键词, 组成一个关键词集; 一 个关键词集及其对应的问题的正确 答案组成一个样本, 所有的样本组成训练集; 所述正确 答案为一个预先设定的RDF三元组; (2)将所述训练集中未经训练的一个样本输入神经网络模型; 神经网络模型输出预测 答案; 根据预测答案和该样本中的正确答案计算 误差值; (3)根据误差值判断神经网络模型是否达到预先设定的合格率, 是则判定神经网络模 型已经训练好, 结束; 否则, 按梯度下降法调整参数权值, 转过程(2)。 4.如权利要求3所述的基于知识图谱的问答交互方法, 其特征在于, 所述预先设定的问 题集和正确答案是根据所述结构化文本集而设定 。权 利 要 求 书 1/3 页 2 CN 114461814 A 25.一种基于知识图谱的问答交 互系统, 其特 征在于, 包括以下模块: 结构化文本转 化模块: 用于分别将音频文件库中的每个音频文件、 图片文件库中的每个图片文件和视频文件 库中的每个视频文件转化为一个音频结构化文本、 一个图片结构化文本和一个视频结构化 文本; 所述音频结构化文本通过通过语音识别算法转化而成; 所述图片结构化文本和视频结 构化文本均通过图像识别算法转 化而成; 知识图谱构建模块: 用于通过关系抽取算法从所述结构化文本集中的每一个结构化文本中均提取出若干 个RDF三元组; 由它 们构建知识图谱; 关键词划分模块: 通过语法分析算法, 将每个输入的问题按句子成分进行划分, 得到主语、 谓语、 宾语、 定 语、 状语和补语中的任几个或全部作为关键词, 组成一个词集; 问答交互模块: 将所述词集输入训练好的神经网络模型; 训练好的神经网络模型在知识图谱中查找并返回对应的一个RDF三元组, 以获得对应 的输入的问题的正确答案 。 6.如权利要求5所述的基于知识图谱的问答交互系统, 其特征在于, 所述知识图谱构建 模块包括以下子模块: RDF提取子模块: 用于通过关系抽取算法,从所述结构化文本集中的每个结构化文本 中均提取出若干个 RDF三元组; 存储单元生成子模块: 用于所述每个结构化文本对应一个存储单元, 所述存储单元包含所述若干个RDF三元 组; 知识图谱生成子模块: 用于将所有的存 储单元中的数据组成知识图谱。 7.如权利要求5所述的基于知识图谱的问答交互系统, 其特征在于, 训练所述神经网络 模型的操作为: (1)通过语法分析算法, 将预先设定的问题集中的每个问题按句子成分进行划分, 得到 主语、 谓语、 宾语、 定语、 状语和补语中的任几个或全部作为关键词, 组成一个关键词集; 一 个关键词集及其对应的问题的正确 答案组成一个样本, 所有的样本组成训练集; 所述正确 答案为一个预先设定的RDF三元组; (2)将所述训练集中未经训练的一个样本输入神经网络模型; 神经网络模型输出预测 答案; 根据预测答案和该样本中的正确答案计算 误差值; (3)根据误差值判断神经网络模型是否达到预先设定的合格率, 是则判定神经网络模 型已经训练好, 结束; 否则, 按梯度下降法调整参数权值, 转操作(2)。 8.如权利要求7所述的基于知识图谱的问答交互系统, 其特征在于, 所述预先设定的问 题集和正确答案是根据所述结构化文本集而设定 。权 利 要 求 书 2/3 页 3 CN 114461814 A 3

.PDF文档 专利 一种基于知识图谱的问答交互方法及系统

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的问答交互方法及系统 第 1 页 专利 一种基于知识图谱的问答交互方法及系统 第 2 页 专利 一种基于知识图谱的问答交互方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:53:16上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。