全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210806707.6 (22)申请日 2022.07.08 (71)申请人 广州华多网络科技有限公司 地址 511442 广东省广州市番禺区南村镇 万达广场B1栋24层 (72)发明人 王耿鑫  (74)专利代理 机构 广州利能知识产权代理事务 所(普通合伙) 44673 专利代理师 王增鑫 (51)Int.Cl. G06F 16/9032(2019.01) G06F 16/9035(2019.01) G06F 16/906(2019.01) G06F 40/30(2020.01) (54)发明名称 问答系统应答方法及其装置、 设备、 介质、 产 品 (57)摘要 本申请涉及问答系统应答方法及其装置、 设 备、 介质、 产品, 所述方法包括: 获取当前会话的 聊天记录中的用户语句序列, 用户语句序列中包 含用户在先提交的顺序连续的多个对话语句; 根 据用户语句序列的序列标注信息, 确定出所述用 户语句序列中的数个对话语句构成精选语句序 列; 根据所述精选语句序列进行提问意图识别, 确定其相对应的目标提问意图; 将所述目标提问 意图相对应的答案文本输出至当前会话中。 本申 请通过自动精选用户提交的在先对话语句, 避免 为用户真实意图的识别引入噪声信息, 可提升问 答系统中对用户真实意图的识别能力, 从而精准 理解用户意图进行准确的答复, 可以提升问答系 统的用户体验, 降低后台运营成本, 适于电商平 台的独立站使用。 权利要求书2页 说明书16页 附图4页 CN 115146124 A 2022.10.04 CN 115146124 A 1.一种问答系统应答方法, 其特 征在于, 包括: 获取当前会话的聊天记录 中的用户语句序列, 所述用户语句序列中包含用户在先提交 的顺序连续的多个对话语句; 根据所述用户语句序列的序列 标注信息, 确定出所述用户语句序列中的数个对话语句 构成精选语句序列; 根据所述精选语句序列进行提问意图识别, 确定其相对应的目标提问意图; 将所述目标提问意图相对应的答案文本 输出至当前会话中。 2.根据权利要求1所述的问答系统应答方法, 其特征在于, 获取当前会话的聊天记录中 的用户语句序列, 所述用户语句序列中包含用户在先提交的顺序连续的多个对话语句, 包 括: 接收用户在当前会话中提交的最后一个对话语句, 将其添加到当前会话的聊天记录 中; 基于最后一个对话语句回溯当前会话的聊天记录, 倒序获取用户的多个对话语句; 将所述顺序连续的多个对话语句进行文本格式化预处 理后构造为用户语句序列。 3.根据权利要求1所述的问答系统应答方法, 其特征在于, 根据 所述用户语句序列的序 列标注信息, 确定出 所述用户语句序列中的数个对话语句构成精选语句序列, 包括: 构造所述用户语句序列相对应的编码向量序列; 采用预设的序列 标注模型, 对所述编码向量序列进行序列 标注, 获得序列 标注信息, 所 述序列标注信息包 含对用户语句序列中各个对话语句的二分类结果; 根据所述序列标注信 息查询所述用户语句序列, 提取其中二分类结果表征正向类型的 对话语句构造为精选语句序列。 4.根据权利要求3所述的问答系统应答方法, 其特征在于, 采用预设的序列 标注模型的 步骤之前, 包括: 调用数据集中的单个训练样本, 所述训练样本为样本语句序列, 包括语义不相关的第 一样本语句和第二样本语句, 其中多个第一样本语句之间语义相连贯, 所述数据集中关联 该训练样本 设置有标签序列, 标签序列中对应样本语句序列包含区分第一样本语句和 第二 样本语句的二 值化标签; 构造所述单个训练样本的编码向量序列, 所述编码向量序列中包含区分各个样本语句 对应的向量的分隔符; 将所述编码向量序列输入序列标注模型进行解码实现序列标注, 获得序列标注信息, 所述序列标注信息包 含对样本语句序列中各个样本语句的二分类结果; 根据所述单个训练样本的标签序列计算所述序列标注信 息的损失值, 根据该损失值对 序列标注模型实施梯度更新, 在序列标注模型未收敛时从数据集中调用下一训练样本将序 列标注模型训练于收敛状态。 5.根据权利要求4所述的问答系统应答方法, 其特征在于, 调用数据集中的单个训练样 本的步骤之前, 包括: 从预采集的对话数据中提取训练样本, 获得其相对应的样本语句序列, 其中包括语义 连贯的多个第一样本语句; 选取与所述对话数据语义不相关的文本 中获取多个第 二样本语句, 第 二样本语句的数权 利 要 求 书 1/2 页 2 CN 115146124 A 2量在与第一样本语句总量相对应的数值区间随机取整数值; 按照自大到小的概率分布确定各个所述第二样本语句在样本语句序列中的插入顺序 并插入到所述样本语句序列的相应位置, 构造出 数据集中的所述训练样本 。 6.根据权利要求1所述的问答系统应答方法, 其特征在于, 根据 所述精选语句序列进行 提问意图识别, 确定其相对应的目标提问意图, 包括: 构造所述精选语句序列的嵌入向量序列; 采用预设的意图识别模型, 对所述嵌入向量序列进行特征提取后进行分类映射, 获得 映射到预设的知识库中各个提问意图的分类概 率; 将分类概 率最大的提问意图作为目标提问意图。 7.根据权利要求1所述的问答系统应答方法, 其特征在于, 根据 所述精选语句序列进行 提问意图识别, 确定其相对应的目标提问意图, 包括: 构造所述精选语句序列的嵌入向量序列; 采用预设的意图识别模型, 对所述嵌入向量序列进行 特征提取获得深层语义向量; 计算所述深层语义向量与预设的知识库中的各个提问意图的深层语义向量的向量相 似度, 将相似度最大的提问意图确定为目标提问意图。 8.一种问答系统应答装置, 其特 征在于, 包括: 语句调用模块, 用于获取当前会话的聊天记录中的用户语句序列, 所述用户语句序列 中包含用户在先提交的顺序连续的多个对话语句; 语句精选模块, 用于根据所述用户语句序列的序列标注信息, 确定出所述用户语句序 列中的数个对话语句构成精选语句序列; 意图识别模块, 用于根据所述精选语句序列进行提问意图识别, 确定其相对应的目标 提问意图; 自动应答模块, 用于将所述目标提问意图相对应的答案文本 输出至当前会话中。 9.一种计算机设备, 包括中央处理器和存储器, 其特征在于, 所述中央处理器用于调用 运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的 步骤。 10.一种计算机可读存储介质, 其特征在于, 其以计算机可读指令的形式存储有依据权 利要求1至7中任意一项 所述的方法所实现的计算机程序, 该计算机程序被计算机调用运行 时, 执行相应的方法所包括的步骤。权 利 要 求 书 2/2 页 3 CN 115146124 A 3

.PDF文档 专利 问答系统应答方法及其装置、设备、介质、产品

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 问答系统应答方法及其装置、设备、介质、产品 第 1 页 专利 问答系统应答方法及其装置、设备、介质、产品 第 2 页 专利 问答系统应答方法及其装置、设备、介质、产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:15:19上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。