全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210995846.8 (22)申请日 2022.08.17 (71)申请人 科大讯飞股份有限公司 地址 230088 安徽省合肥市高新 开发区望 江西路666号 申请人 联通在线信息科技有限公司   广州市讯飞樽鸿信息技 术有限公司 (72)发明人 赵红红 常剑 何玄 王宝鑫  伍大勇 陈志刚 王士进  (74)专利代理 机构 北京布瑞知识产权代理有限 公司 11505 专利代理师 秦卫中 (51)Int.Cl. G06F 40/35(2020.01) G06F 16/36(2019.01)G06F 16/35(2019.01) G06N 5/02(2006.01) (54)发明名称 对话处理方法、 装置、 电子设备及存 储介质 (57)摘要 本申请提出一种对话处理方法、 装置、 电子 设备及存储介质, 方法包括: 至少基于当前对话 文本预测得到当前对话文本对应的第一语义信 息; 其中, 第一语义信息包括: 领域信息、 意图信 息和语义槽信息; 根据预先构建的对话知识图 谱, 对第一语义信息以及历史对话语义信息进行 语义信息融合, 得到第二语义信息, 其中, 历史对 话语义信息为根据历史对话文本而确定的语义 信息; 根据第二语义信息, 确定与第二语义信息 对应的对话提示信息。 采用本方案, 对当前对话 文本对应的第一语义信息以及历史对话文本对 应的语义信息进行融合, 可以实现对话状态追 踪, 准确把握各个对话之间依赖关系, 从而能够 确定更加准确的有益信息, 因此能够提高对话管 理的准确度。 权利要求书3页 说明书20页 附图5页 CN 115455982 A 2022.12.09 CN 115455982 A 1.一种对话处 理方法, 其特 征在于, 包括: 至少基于当前对话文本预测得到所述当前对话文本对应的第一语义信息; 其中, 所述 第一语义信息包括: 领域信息、 意图信息和语义槽信息; 根据预先构建的对话知识图谱, 对所述第 一语义信 息以及历史对话语义信 息进行语义 信息融合, 得到第二语义信息; 其中, 所述对话知识图谱中记录各个对话领域、 每一对话领 域所包含的对话意图, 以及每一对话意图对应的语义槽; 所述历史对话语义信息为根据历 史对话文本而确定的语义信息; 根据所述第二语义信息, 确定与所述第二语义信息对应的对话 提示信息。 2.根据权利要求1所述的方法, 其特征在于, 根据预先构建的对话知识图谱, 对所述第 一语义信息以及历史对话语义信息进行语义信息融合, 得到第二语义信息, 包括: 根据预先构建的对话知识图谱, 分别对所述第 一语义信 息以及历史对话语义信 息中的 领域信息、 意图信息和语义槽信息进行向量化表示, 得到第一语义信息 向量以及历史对话 语义信息向量; 根据所述第 一语义信 息向量和所述历史对话语义信 息向量, 重新确定所述第 一语义信 息向量的每 个向量位的值, 得到第二语义信息向量; 根据所述第二语义信息向量和所述对话知识图谱, 确定第二语义信息 。 3.根据权利要求2所述的方法, 其特征在于, 根据 所述第一语义信 息向量和所述历史对 话语义信息向量, 重新确定所述第一语义信息向量的每 个向量位的值, 包括: 将所述第一语义信息向量和所述历史对话语义信息向量输入预先训练的语义信息分 类模型, 以使 所述语义信息 分类模型将所述第一语义信息向量中的各个向量位分类为所述 第一语义信息向量和所述历史对话语义信息向量拼接成的向量中的任一向量位, 得到对所 述第一语义信息向量的各个向量 位的分类结果; 根据所述语义信 息分类模型输出的分类结果、 所述第 一语义信 息向量的各个向量位的 值, 以及所述历史对话语义信息 向量的各个 向量位的值, 确定所述第一语义信息 向量的更 新后的每 个向量位的值。 4.根据权利要求2所述的方法, 其特征在于, 根据 所述第二语义信 息向量和所述对话知 识图谱, 确定第二语义信息, 包括: 根据所述第二语义信息向量中的对应领域信息的向量位的值和对应意图信息的向量 位的值, 确定目标 领域和目标意图; 根据所述对话知识图谱确定与所述目标意图对应的目标语义槽; 从所述第二语义信 息向量中确定出对应所述目标语义槽的语义槽向量位, 并根据 所述 语义槽向量 位的值确定所述目标语义槽对应的槽值; 基于所述目标 领域、 所述目标意图和所述目标语义槽对应的槽值, 确定第二语义信息 。 5.根据权利要求1所述的方法, 其特 征在于, 所述当前对话文本通过如下处 理得到: 对获取的当前对话语音 进行语音识别, 得到所述当前对话语音对应的识别文本; 将所述识别文本输入到预先训练的语句处理模型, 以使所述语句处理模型对所述识别 文本中的冗余实体和完整语句进行序列标注; 根据所述语句处理模型输出的序列标注结果, 将所述识别文本中的冗余文本剔除, 并 提取剔除冗余文本后的所有完整语句作为当前对话文本 。权 利 要 求 书 1/3 页 2 CN 115455982 A 26.根据权利要求1所述的方法, 其特征在于, 所述至少基于当前对话文本预测得到所述 当前对话文本对应的第一语义信息, 包括: 基于当前对话文本和历史对话文本, 预测得到所述当前对话文本对应的第一语义信 息。 7.根据权利要求6所述的方法, 其特征在于, 所述基于当前对话文本和历史对话文本, 预测得到所述当前对话文本对应的第一语义信息, 包括: 分别确定当前对话文本和历史对话文本 中的各个文本字符对应的文本向量, 并根据 所 有文本字符对应的文本向量, 计算所述当前对话文本对应的分类嵌入特 征向量; 对所述分类嵌入特 征向量进行分类, 确定所述当前对话文本的领域和意图; 根据所述分类嵌入特征向量和所述当前对话文本中各个文本字符对应的文本向量, 对 所述当前对话文本中的语义槽实体进行序列标注, 确定所述当前对话文本的语义槽信息 。 8.根据权利要求7所述的方法, 其特征在于, 分别确定当前对话文本和历史对话文本中 的各个文本字符对应的文本 向量, 并根据所有文本字符对应的文本 向量, 计算所述当前对 话文本对应的分类嵌入特征向量, 对所述分类嵌入特征向量进行分类, 确定所述当前对话 文本的领域和意图, 以及根据所述分类 嵌入特征向量和所述当前对话文本中各个文本字符 对应的文本 向量, 对所述当前对话文本中的语义槽实体进行序列标注, 确定所述当前对话 文本的语义槽信息, 包括: 将当前对话文本和历史对话文本输入到预先训练 的自然语言理解模型, 使所述自然语 言理解模型分别确定当前对话文本和历史对话文本中的各个文本字符对应的文本向量, 并 根据所有文本字符对应的文本 向量, 计算所述当前对话文本对应的分类嵌入特征向量, 对 所述分类嵌入特征向量进行分类, 确定所述当前对话文本的领域信息和 意图信息, 以及根 据所述分类 嵌入特征向量和所述当前对话文本中各个文本字符对应的文本向量, 对所述当 前对话文本中的语义槽实体进行序列标注, 确定所述当前对话文本的语义槽信息 。 9.根据权利要求7或8所述的方法, 其特征在于, 根据所述分类嵌入特征向量和所述当 前对话文本中各个文本字符对应的文本向量, 对所述当前对话文本中的语义槽实体进 行序 列标注, 确定所述当前对话文本的语义槽信息, 包括: 将所述分类嵌入特征向量分别与所述当前对话文本中各个文本字符对应的文本向量 相结合, 确定所述当前对话文本中各个文本 字符对应的待预测文本向量; 根据每个待预测文本向量, 对所述当前对话文本中的语义槽实体进行序列标注, 确定 所述当前对话文本的语义槽信息 。 10.根据权利要求1所述的方法, 其特征在于, 根据 所述第二语义信 息, 确定与 所述第二 语义信息对应的对话 提示信息, 包括: 从所述对话知识图谱中查询所述第二语义信息对应的提 示操作; 根据所述第二语义信 息中的领域、 意图、 语义槽和语义槽值, 确定所述提示操作对应的 对话提示信息; 所述提示操作包括: 问题推荐操作、 信息推送操作和摘要生成操作中的至少一种。 11.一种对话处 理装置, 其特 征在于, 包括: 自然语言理解模块, 用于至少基于当前对话文本预测得到所述当前对话文本对应的第 一语义信息; 其中, 所述第一语义信息包括: 领域信息、 意图信息和语义槽信息;权 利 要 求 书 2/3 页 3 CN 115455982 A 3

.PDF文档 专利 对话处理方法、装置、电子设备及存储介质

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 对话处理方法、装置、电子设备及存储介质 第 1 页 专利 对话处理方法、装置、电子设备及存储介质 第 2 页 专利 对话处理方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:43:16上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。