全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210926028.2 (22)申请日 2022.08.03 (71)申请人 深圳办事宝信息服 务有限公司 地址 518000 广东省深圳市罗湖区莲塘街 道仙湖社区畔山路53号富达花园5栋 四单元705 (72)发明人 黄碧银 伍圣亮 谢津  (74)专利代理 机构 深圳卓正专利代理事务所 (普通合伙) 44388 专利代理师 万正平 (51)Int.Cl. G06F 16/332(2019.01) G06F 40/232(2020.01) G06F 40/284(2020.01) G06F 40/289(2020.01)G06F 40/30(2020.01) (54)发明名称 基于多语言模型的智能问答方法、 装置、 设 备及介质 (57)摘要 本发明涉及人工智能领域, 揭露一种基于多 语言模型的智能问答方法、 装置、 电子设备以及 存储介质, 所述方法包括: 将用户问题转换为待 纠错文本并进行纠错处理与分词处理; 计算分词 文本的双向隐藏状态, 计算隐含向量与文本向 量; 对文本向量并进行空间转换, 提取语义特征 并压缩, 计算压缩特征与意图类别的关系向量与 关系得分, 确定意图识别结果; 识别词格文本并 进行向量映射, 计算词格向量的标签得分, 确定 词格标签与实体识别结果; 在对话节 点树中定位 意图识别结果与实体识别结果的目标对话节点, 识别目标对话节点的对话策略, 利用对话策略生 成用户问题的回答结果。 本发明可以减少智能问 答机器人的回复内容与用户意图之间的语言隔 阂。 权利要求书4页 说明书17页 附图3页 CN 115269803 A 2022.11.01 CN 115269803 A 1.一种基于多语言模型的智能问答方法, 其特 征在于, 所述方法包括: 接收用户问题, 将所述用户问题转换为待纠 错文本, 利用文本纠 错模型对所述待纠 错 文本进行纠错处 理, 得到纠错文本, 对所述纠错文本进行分词处 理, 得到分词文本; 识别所述分词文本的时间属性, 根据所述时间属性, 计算所述分词文本的双 向隐藏状 态, 根据所述双向隐藏状态, 计算所述分词文本的隐含向量, 根据所述隐含向量, 计算所述 分词文本的文本向量; 对所述文本向量并进行类别空间转换, 得到空间向量, 从所述空间向量中提取语义特 征, 对所述语义特征进 行非线性压缩, 得到压缩特征, 计算所述压缩 特征与所述预构建的特 征-类别映射表中意图类别的关系向量, 计算所述关系向量的关系 得分, 根据所述关系得 分, 确定所述分词文本的意图识别结果; 识别所述分词文本 中的词格文本, 对所述词格文本进行向量映射, 得到词格向量, 计算 所述词格向量的标签得分, 根据所述标签得分, 确定所述词格文本的词格标签, 根据所述词 格标签, 确定所述分词文本的实体识别结果; 在预先构建的对话节点树中定位所述意图识别结果与所述实体识别结果的目标对话 节点, 识别所述目标对话节点的对话策略, 利用所述对话策略生成所述用户问题的回答结 果。 2.根据权利要求1所述的方法, 其特征在于, 所述利用文本纠错模型对所述待纠错文本 进行纠错处 理, 得到纠错文本, 包括: 利用所述文本纠错模型中的RN N网络计算所述待纠错文本的RN N隐状态; 根据所述RNN隐状态, 利用所述文本纠错模型中的注意力机制计算所述待纠错文本的 纠错向量; 根据所述纠错向量, 利用所述文本纠错模型中的解码器计算所述待纠错文本的解码器 状态; 根据所述 解码器状态与所述纠错向量, 确定所述纠错文本 。 3.根据权利要求1所述的方法, 其特征在于, 所述根据所述RNN隐状态, 利用所述文本纠 错模型中的注意力机制计算所述待纠错文本的纠错向量, 包括: 根据所述RN N隐状态, 利用所述注意力机制计算所述待纠错文本的注意力得分; 根据所述注意力得分, 计算所述待纠错文本的注意力概 率; 根据所述注意力概 率, 计算所述待纠错文本的纠错向量; 其中, 利用下述公式计算所述待纠错文本的注意力得分: 其中, 表示所述待纠错文本的注意力得分, 表示所述模型的非线性函数, 表示所述待纠错文本的前一个词对应的解码器隐状态, 表示编码器 中所述待纠错文本 中第j时刻单词对应的隐状态; 利用下述公式计算所述待纠错文本的注意力概 率: 权 利 要 求 书 1/4 页 2 CN 115269803 A 2其中, 表示所述待纠错文本的注意力概率, 表示所述待纠错文本的注意力得 分; 利用下述公式计算所述待纠错文本的纠错向量: 其中, 表示所述待纠错文本中第 i个词的纠错向量, 表示注意力概率分布, 表示编码器 中所述待纠错文本 中第j时刻单词对应的隐状态,   表示所述待纠错文本 的前一个词对应的解码器隐状态, 表示最大时间刻度。 4.根据权利要求1所述的方法, 其特征在于, 所述根据所述解码器状态与所述纠错向 量, 确定所述纠错文本, 包括: 计算所述 解码器状态与所述纠错向量的纠错 概率; 判断所述纠错 概率是否大于预设概 率; 在所述纠错 概率大于预设概 率时, 将所述纠错 概率对应的文本作为所述纠错文本; 其中, 利用下述公式计算所述 解码器状态与所述纠错向量的纠错 概率: 其中, 表示所述解码器状态与所述纠错向量的纠错概率, 表示所述待纠错文本的第i ‑1个词的模型预测结果, 表示所述待纠错文本中第i 个词的纠错向量, 表示所述待纠错文本的第i个词对应的解码器隐状态, 表示 的 最大数量的i对应的模型 预测结果。 5.根据权利要求1所述的方法, 其特征在于, 所述根据所述时间属性, 计算所述分词文 本的双向隐藏状态, 包括: 根据所述时间属性, 计算所述分词文本的前向隐藏状态与后向隐藏状态; 根据所述前向隐藏状态与所述后向隐藏状态, 确定所述分词文本的双向隐藏状态; 其中, 利用下述公式计算所述分词文本的所述前向隐藏状态与所述后向隐藏状态: ( ),t ( ),t 其中, 表示t时刻的后向隐藏状态, 表示t时刻的前向隐藏状态, 表示前 向的LSTM模型, 表示后向的LSTM模型, 表示t时刻的分词文本, 表示t 时刻的双向隐藏状态, 表示t 时刻的双向隐藏状态, 表示最大时刻; 利用下述公式确定所述分词文本的双向隐藏状态: 权 利 要 求 书 2/4 页 3 CN 115269803 A 3

PDF文档 专利 基于多语言模型的智能问答方法、装置、设备及介质

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于多语言模型的智能问答方法、装置、设备及介质 第 1 页 专利 基于多语言模型的智能问答方法、装置、设备及介质 第 2 页 专利 基于多语言模型的智能问答方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。