全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111635799.8 (22)申请日 2021.12.3 0 (71)申请人 中国电子科技 集团公司第二十八研 究所 地址 210046 江苏省南京市栖霞区灵山 南 路一号 (72)发明人 方酉 崔隽 后弘毅 吴姗姗  陈佳林  (74)专利代理 机构 南京苏高专利商标事务所 (普通合伙) 32204 代理人 徐博 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/35(2019.01)G06F 40/295(2020.01) G06K 9/62(2022.01) (54)发明名称 一种基于问句匹配的智能问答系统和方法 (57)摘要 本发明公开了一种基于问句匹配的智能问 答系统和方法, 所述系统主要包括知识库、 检索 模块、 相似问句选择模块和对话管理模块; 其中 知识库存储 频繁问答对数据集; 检索模块通过问 句领域分类、 命名实体识别后利用全文检索从知 识库中检索可能与用户问题相似的若干标准问 句, 并根据问句长度调整候选相似问题数量; 相 似问句选择模块用于从候选相似问句中选择与 用户问题 最相似的标准问, 采用句向量的余弦相 似度作为排序依据。 对话管 理模块用于跟踪对话 状态, 可基于学习机制对知识库进行更新; 另外 可进行意图识别, 支持接入闲聊系统、 任务系统 等外部扩展模块。 该种智能问答系统和方法针对 用户提问具有较高的实时性和匹配精 准度, 还具 备较好的可扩 展性。 权利要求书1页 说明书5页 附图2页 CN 114003709 A 2022.02.01 CN 114003709 A 1.一种基于问句匹配的智能问答方法, 其特 征在于: 该 方法包括 步骤如下: (1) 利用问答对数据构建知识库; (2) 接收用户提问数据, 从问答对知识库中检索得到待定数据子集, 再对待定数据子集 中数据进行二次匹配, 得到与用户提问数据相似度满足设定阈值的相似问句。 2.根据权利要求1所述的一种基于问句匹配的智能问答系统, 其特征在于: 所述的步骤 (1) 中构建知识库时, 按照领域创建多个索引, 然后将问答对数据插 入搜索引擎中。 3.根据权利要求1所述的一种基于问句匹配的智能问答系统, 其特征在于: 所述的步骤 (2) 中接收用户发送的自然语 言数据后, 根据自然语 言数据对用户意图进 行判定, 按需求对 接外部执行模块。 4.根据权利要求2所述的一种基于问句匹配的智能问答系统, 其特征在于: 所述的步骤 (2) 中接收用户提问数据后, 进行检索时包括 步骤如下: (S1) 基于文本分类算法对用户提问的所属领域进行判断; (S2) 进行实体识别, 如果识别到实体, 则在检索中使用组合查询, 返回包含实体的结 果; (S3) 对用户提问数据进行全文检索, 获取检索结果组成待定数据子集。 5.根据权利要求4所述的一种基于问句匹配的智能问答系统, 其特征在于: 所述的二 次 匹配以待定数据子集作为输入, 利用文本相似度算法对待定数据子集中的待定问答对进 行 排序, 选出与用户提问相似度最高的候选问句, 并判断其是否满足预设的置信度。 6.根据权利要求5所述的一种基于问句匹配的智能问答系统, 其特征在于: 计算待定数 据子集中各个待定问句与用户提问的余弦相似度, 将高于匹配阈值的待定问句对应的答案 回复给用户。 7.根据权利要求6所述的一种基于问句匹配的智能问答系统, 其特征在于: 当步骤 (S3) 中全文检索的结果为空集或各个待定问句与用户提问的余弦相似度最高值低于匹配阈值, 则判定知识库中没有与用户提问匹配的问答对, 按照设定内容进行回复或转 为人工回复。 8.根据权利要求2所述的一种基于问句匹配的智能问答系统, 其特征在于: 所述的步骤 (2) 中接收用户提问数据后, 当触发了预设关键词或未检索到匹配 问句或匹配 问句答案存 在错误时, 利用学习机制对知识库中的问答对数据进行增 加、 删除或修改。 9.一种基于问句匹配的智能问答系统, 其特征在于: 包括用于接收用户提问数据的对 话管理模块, 所述的对话管理模块用于对用户提问进行对话状态跟踪和 意图识别, 所述的 对话管理模块与用于对用户提问数据进行全文检索的检索 模块连接, 所述的检索 模块与知 识库连接, 所述的检索 模块与用于对全文检索结果进 行相似度计算的相似问句选择模块连 接。 10.根据权利要求9所述的一种基于问句匹配的智能问答系统, 其特征在于: 检索模块 内包括用于对用户提问进 行领域分类的问句分类模块、 用于对用户提问进 行实体识别的命 名实体识别模块和用于对用户提问进 行全文检索的全文检索 模块; 所述的相似问句选择模 块内包括用于对全文检索得到的候选 问句进行句向量计算的句向量计算模块和用于机选 候选问句与用户提问余弦相似度的相似度计算模块。权 利 要 求 书 1/1 页 2 CN 114003709 A 2一种基于问句匹配的智能问答系统和方 法 技术领域 [0001]本发明属于人工智能领域, 具体涉及一种基于问句匹配的智能问答系统和方法。 背景技术 [0002]问答系统 (Quest ion Answering,  QA) 是信息检索系统的一种高级形式, 能够用准 确、 简洁的自然语言回答用户用自然语言提出的问题。 现代的问答系统融合了知识库、 信息 检索、 机器学习、 自然语言理解等技术, 其与传统的信息检索系统在很多方面有所不同。 在 系统输入和输出方面, 问答系统的输入和输出都是自然语言, 而信息检索系统的输入是关 键词组合, 输出是一系列文档; 问答系统有时需要考虑用户对话的上下文, 而信息检索系统 不需要; 对于任务驱动的问答系统, 在不能理解用户意图的情况下, 会请求用户补充信息, 而信息检索系统会尽可能理解输入的查询内容, 不要求用户补充信息 。 [0003]问答系统可以被划 分为很多类型。 按照涉及的领域进行分类, 可将问答系统分为 限定域问答系统和开放域问答系统。 限定域问答系统所能处理的问题只限定于某个领域或 内容范围, 如法律、 金融、 医学或某个公司的业务领域等。 开放域的问答系统可回答的问题 不限定于某个特定领域, 需要一定的常识知识并具有语义词典, 通常需要有海量的数据支 撑, 并可以提供一个能闲聊的服 务。 [0004]按照支持问答系统产生答案的数据来源以及实现的技术分类, 可以分为基于知识 库的问答系统 (KBQA) 、 基于常见问题集的问答系统 (FAQ ‑QA) 、 基于数据库的问答系统 (TableQA)、 基于大规模文档集的问答系统 (DBQA) 等。 基于知识库的问答系统把系统所需的 全部领域知识按照统一的方式表示成 内部的结构化格式并保存为知识库, 在对问题进 行语 义解析后可以从知识库中获取答案。 基于 常见问题集的问答系统, 通常面向一个垂 直领域, 在已有的问题 ‑答案对的集合中找到与用户提问相匹配的问题, 然后把对应的答案返回给 用户。 基于数据库的问答系统将自然语言的问题转换为数据库查询 语句, 然后进行数据库 查询操作, 返回结果。 [0005]FAQ问答系统是目前应用最广泛的问答系统。 这种问答系统结构框架清晰、 实现较 为简单, 但其效果取决于构建的问答对数据集的质量以及问句匹配算法。 如何构建高质量 的数据集, 以及在问题匹配中同时达到理想的准确 率和较高的计算效率, 是本领域技术人 员需要解决的问题。 发明内容 [0006]发明目的: 本发明的第一发明目的在于提供一种基于问句匹配 的智能问答方法; 本发明的第二发明目的在于提供一种基于问句匹配的智能问答系统。 [0007]技术方案: 本发明所述的一种基于问句匹配的智能问答方法, 该方法包括步骤如 下: (1) 利用问答对数据构建知识库; (2) 接收用户提问数据, 从问答对知识库中检索得到待定数据子集, 再对待定数据说 明 书 1/5 页 3 CN 114003709 A 3

.PDF文档 专利 一种基于问句匹配的智能问答系统和方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于问句匹配的智能问答系统和方法 第 1 页 专利 一种基于问句匹配的智能问答系统和方法 第 2 页 专利 一种基于问句匹配的智能问答系统和方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 04:42:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。