全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210371151.2 (22)申请日 2022.04.08 (71)申请人 北京捷通 华声科技股份有限公司 地址 100193 北京市海淀区东北旺西路8号 9号楼3层2区318 (72)发明人 李天阳 李健 陈明 武卫东  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 专利代理师 苏培华 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 40/242(2020.01) G06F 40/289(2020.01) (54)发明名称 一种基于知识图谱的问答方法及装置 (57)摘要 在本发明提供了一种基于知识图谱的问答 方法及装置, 包括: 获取输入的问答语句, 对问答 语句进行分词, 得到分词结果; 将分词结果与预 设的实体词典进行匹配, 得到分词结果对应的第 一候选实体和第一候选实体对应的候选意图; 将 问答语句和第一候选实体输入预设的语言处理 模型进行实体识别, 得到目标实体; 将问答语句 和候选意图输入语 言处理模型进行意图识别, 得 到目标意图, 根据目标实体和目标意图, 确定针 对问答语句的答复内容。 本发明通过第一候选实 体与实体识别得到的语料片段进行相似度计算 确定目标实体, 提高了实体匹配的准确度, 根据 候选意图与问句进行相似度计算确定目标意图, 提高了意图识别的准确度, 可以快速且准确的得 到答复内容。 权利要求书2页 说明书11页 附图6页 CN 114880480 A 2022.08.09 CN 114880480 A 1.一种基于知识图谱的问答方法, 其特 征在于, 包括: 获取输入的问答语句, 对所述问答语句进行分词, 得到分词结果; 将所述分词结果与 预设的实体词典进行匹配, 得到所述分词结果对应的第 一候选实体 和所述第一候选实体对应的候选意图; 所述实体词典包括关键词、 实体、 意图的对应关系; 所述实体用于表征 具有预设意图含义的对象; 将所述问答语句和所述第 一候选实体输入预设的语言处理模型进行实体识别, 得到目 标实体, 所述目标实体是基于所述第一候选实体和所述问答语句中包含实体的语料之 间的 文本相似度所确定; 将所述问答语句和所述候选意图输入所述语言处理模型进行意图识别, 得到目标意 图, 所述目标意图是基于所述问答语句和所述 候选意图之间的文本相似度所确定; 根据所述目标实体和所述目标意图, 确定针对所述问答语句的答复内容。 2.根据权利要求1所述的方法, 其特征在于, 所述语言处理模型包括语料识别模块和对 齐模块; 所述将所述问答语句和第 一候选实体输入预设的语言处理模型进行实体识别, 得到目 标实体, 包括: 将所述问答语句输入所述语料识别模块, 得到所述问答语句中包含的所述第 二候选实 体的实体 语料片段; 将由所述实体语料片段和所述第 一候选实体构 成的第一组合输入所述对齐模块, 确定 所述第一组合中的所述第一候选实体和所述 实体语料片段的文本相似度, 并从文本相似度 最大的所述第一组合中确定所述目标实体。 3.根据权利要求2所述的方法, 其特征在于, 所述从文本相似度最大的第 一组合中确定 所述目标实体, 包括: 将文本相似度最大的所述第一组合中的所述第一 候选实体确定为目标实体。 4.根据权利要求1所述的方法, 其特征在于, 所述将所述问答语句和所述候选意图输入 所述语言处 理模型进行意图识别, 得到目标意图, 包括: 将由所述问答语句和所述候选意图构 成的第二组合输入所述语言处理模型, 确定所述 第二组合中所述问答语句和所述候选意图的文本相似度, 并将文本相似度最大的所述第二 组合中的所述 候选意图确定为目标意图。 5.根据权利要求1所述的方法, 其特征在于, 所述实体词典包括: 具有子词和所述实体 的对应关系的第一词典, 所述子词为所述实体分词后得到的词; 所述将所述分词结果与预设的实体词典进行匹配, 得到所述分词结果对应的第 一候选 实体和所述第一 候选实体对应的候选意图, 包括: 将所述分词结果中的分词与 所述第一词典中的子词进行匹配, 并将与 所述分词匹配的 子词对应的实体确定为所述第一 候选实体, 以及确定所述第一 候选实体对应的候选意图。 6.根据权利要求1所述的方法, 其特征在于, 所述实体词典还包括: 具有别称和实体的 对应关系的第二词典, 所述别称为所述实体的别名; 所述将所述分词结果与预设的实体词典进行匹配, 得到所述分词结果对应的第 一候选 实体和所述第一 候选实体包 含的候选意图, 包括: 将所述分词结果中的分词与 所述第二词典中的别称进行匹配, 并将与 所述分词匹配的权 利 要 求 书 1/2 页 2 CN 114880480 A 2别称对应的实体确定为所述第一 候选实体, 以及确定所述第一 候选实体对应的候选意图。 7.根据权利要求1所述的方法, 其特征在于, 根据所述目标实体和所述目标意图, 确定 针对所述问答语句的答复内容, 包括: 基于所述目标实体和所述目标意图生成图谱查询语句; 采用所述图谱查询语句查询所述知识图谱, 得到查询结果; 根据所述 查询结果构建答复内容。 8.一种基于知识图谱的问答装置, 其特 征在于, 所述装置包括: 分词模块, 用于获取输入的问答语句, 对所述问答语句进行分词, 得到分词结果; 第一确定模块, 用于将所述分词结果与预设的实体词典进行匹配, 得到所述分词结果 对应的第一候选实体和所述第一候选实体对应的候选意图; 所述 实体词典包括关键词 与实 体的对应关系; 所述实体用于表征 具有预设意图含义的对象; 第二确定模块, 用于将所述问答语句和所述第 一候选实体输入预设的语言处理模型进 行实体识别, 得到目标实体, 所述 目标实体是基于所述第一候选实体和所述问答语句中包 含实体的语料之间的文本相似度所确定; 第三确定模块, 用于将所述问答语句和所述第 一候选实体输入预设的语言处理模型进 行实体识别, 得到目标实体, 所述 目标实体是基于所述第一候选实体和所述问答语句中包 含实体的语料之间的文本相似度所确定; 答复生成模块, 用于根据所述目标实体和所述目标意图, 确定针对所述问答语句的答 复内容。 9.一种电子设备, 其特 征在于, 包括: 处 理器; 用于存储所述处 理器可执行指令的存 储器; 其中, 所述处理器被配置为执行所述指令, 以实现如权利要求1至7中任一项所述的方 法。 10.一种计算机可读存储介质, 其特征在于, 当所述计算机可读存储介质中的指令由电 子设备的处理器执行时, 使得所述电子设备能够执行如权利要求1至7中任一项所述的方 法。 11.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序被处理器执 行时实现权利要求1至7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114880480 A 3

.PDF文档 专利 一种基于知识图谱的问答方法及装置

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的问答方法及装置 第 1 页 专利 一种基于知识图谱的问答方法及装置 第 2 页 专利 一种基于知识图谱的问答方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:53:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。