全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211175960.2 (22)申请日 2022.09.26 (71)申请人 科大讯飞股份有限公司 地址 230088 安徽省合肥市高新 开发区望 江西路666号 (72)发明人 郭思敏 李亚 刘权  (74)专利代理 机构 北京布瑞知识产权代理有限 公司 11505 专利代理师 尚文文 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/36(2019.01) G06F 40/126(2020.01) G06F 40/295(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 问答方法、 装置、 设备及存 储介质 (57)摘要 本申请提供了问答方法、 装置、 设备及存储 介质, 具体实现方案为: 基于问题文本确定候选 实体以及与候选实体对应的候选关系; 对候选实 体和候选关系分别进行编码, 分别得到候选实体 对应的第一文本向量和候选关系对应的第二文 本向量; 对第一文本向量、 第二文本向量、 第一标 签和第二标签进行编码, 得到第三文本向量; 其 中, 第一标签用于标记候选实体, 第二标签用于 标记候选关系; 利用第三文本向量, 确定问题文 本对应的答案文本。 根据本申请的技术方案, 能 够更准确地确定出问题文本对应的答案文本 。 权利要求书3页 说明书14页 附图3页 CN 115455168 A 2022.12.09 CN 115455168 A 1.一种问答方法, 其特 征在于, 包括: 基于问题文本确定候选实体以及与所述 候选实体对应的候选关系; 对所述候选实体和所述候选关系分别进行编码, 分别得到所述候选实体对应的第 一文 本向量和所述 候选关系对应的第二文本向量; 对所述第 一文本向量、 所述第 二文本向量、 第 一标签和第 二标签进行编码, 得到第三文 本向量; 其中, 所述第一标签用于标记所述候选实体, 所述第二标签用于标记所述候选关 系; 利用所述第三文本向量, 确定所述问题文本对应的答案文本 。 2.根据权利要求1所述的方法, 其特征在于, 所述候选实体以及与所述候选实体对应的 候选关系有 多组时, 利用所述第三文本向量, 确定所述问题文本对应的答案文本, 包括: 利用与每组候选实体及其对应的候选关系 对应的第 三文本向量和所述问题文本, 从所 述多组候选实体及其对应的候选关系中, 确定出与所述问题文本对应的目标候选实体及其 对应的目标候选关系; 根据所述目标候选实体及其对应的目标候选关系, 在预设的知识图谱中确定所述问题 文本对应的答案文本 。 3.根据权利要求1所述的方法, 其特征在于, 所述候选实体以及与所述候选实体对应的 候选关系有一组时, 利用所述第三文本向量, 确定所述问题文本对应的答案文本, 包括: 在所述第三文本向量与所述问题文本满足预设条件的情况下, 将所述候选实体及其对 应的候选关系确定为所述问题文本对应的目标候选实体及其对应的目标候选关系; 根据所述目标候选实体及其对应的目标候选关系, 在预设的知识图谱中确定所述问题 文本对应的答案文本 。 4.根据权利要求1 ‑3任一项所述的方法, 其特征在于, 所述对所述第一文本向量、 所述 第二文本向量、 第一标签和第二标签进行编码, 得到第三文本向量, 包括: 对所述第一标签和所述第二标签进行拼接, 得到第一向量; 对所述第一文本向量和所述第二文本向量进行拼接, 得到第四文本向量; 对所述第一向量和所述第四文本向量进行拼接, 得到所述第三文本向量。 5.根据权利要求2所述的方法, 其特征在于, 所述利用与每组候选实体及其对应的候选 关系对应的第三文本 向量和所述问题文本, 从所述多组候选实体及其对应的候选关系中, 确定出与所述问题文本对应的目标候选实体及其对应的目标候选关系, 包括: 基于所述问题文本和第三标签进行编码, 得到第五文本向量; 其中, 所述第 三标签用于 标记所述问题文本; 计算与每组候选实体及其对应的候选关系对应的所述第三文本向量与所述第五文本 向量之间的相似度; 基于每个所述第三文本向量对应的相似度, 在所述多组候选实体及其对应的候选关系 中确定所述问题文本对应的目标候选实体及其对应的目标候选关系。 6.根据权利要求1 ‑3中任一项所述的方法, 其特征在于, 所述基于问题文本确定候选实 体以及与所述 候选实体对应的候选关系, 包括: 基于所述问题文本确定所述问题文本中的目标实体以及所述目标实体的类别; 利用所述问题文本、 所述目标实体以及所述目标实体的类别, 在数据库中确定所述候权 利 要 求 书 1/3 页 2 CN 115455168 A 2选实体; 基于所述 候选实体确定对应的候选关系。 7.根据权利要求6所述的方法, 其特征在于, 所述基于所述问题文本确定所述问题文本 中的目标实体以及所述目标实体的类别, 包括: 基于所述问题文本的应用场景, 确定对应的神经网络模型; 利用所述神经网络模型对所述问题文本进行处理, 得到所述目标实体以及所述目标实 体的类别。 8.根据权利要求6所述的方法, 其特征在于, 所述利用所述问题文本、 所述目标实体以 及所述目标实体的类别, 在数据库中确定候选实体, 包括: 对所述目标实体和所述类别进行编码, 得到第六文本向量; 对所述问题文本进行编码, 得到第七文本向量; 对所述第六文本向量和所述第七文本向量进行拼接, 得到第八文本向量; 利用所述数据库中实体对应的向量与所述第八文本向量的相似度, 在数据库中确定所 述候选实体。 9.根据权利要求8所述的方法, 其特征在于, 所述对所述第六文本向量和所述第七文本 向量进行拼接, 得到第八文本向量, 包括: 对所述第六文本向量、 所述第七文本向量、 第 三标签和第四标签进行编码, 得到所述第 八文本向量; 其中, 所述第三标签用于标记所述问题文本, 所述第四标签用于标记所述目标 实体。 10.根据权利要求9所述的方法, 其特征在于, 所述对所述第六文本向量、 所述第七文本 向量、 第三标签和第四标签进行编码, 得到所述第八文本向量, 包括: 对所述第三标签和所述第四标签进行拼接, 得到第二向量; 对所述第六文本向量和所述第七文本向量进行拼接, 得到第九文本向量; 对所述第二向量和所述第九文本向量进行拼接, 得到所述第八文本向量。 11.根据权利要求9所述的方法, 其特 征在于, 其中, 所述第一标签是由第 一标识符组成的序列或向量, 所述第 一标签对应的序列或向量长 度与所述 候选实体字符数量相同; 所述第二标签是由第 二标识符组成的序列或向量, 所述第 二标签对应的序列或向量长 度与所述 候选关系字符数量相同; 所述第三标签是由第 三标识符组成的序列或向量, 所述第 三标签对应的序列或向量长 度与所述问题文本 字符数量相同; 第四标签均 是由第四标识符组成的序列或向量, 所述第四标签对应的序列或向量长度 与所述目标实体字符数量相同。 12.根据权利要求8所述的方法, 其特征在于, 所述对所述目标实体和所述类别进行编 码, 得到第六文本向量, 包括: 确定每个所述类别对应的类别编号; 对所述目标实体进行编码, 得到第十文本向量; 利用所述目标实体的编码顺序, 对所述目标实体的类别编号进行拼接, 得到第三向量; 对所述第十文本向量和所述第三向量进行拼接, 得到所述第六文本向量。权 利 要 求 书 2/3 页 3 CN 115455168 A 3

.PDF文档 专利 问答方法、装置、设备及存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 问答方法、装置、设备及存储介质 第 1 页 专利 问答方法、装置、设备及存储介质 第 2 页 专利 问答方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:44:43上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。