全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111678800.5 (22)申请日 2021.12.31 (66)本国优先权数据 202110790836.6 2021.07.13 CN (71)申请人 北京金山数字 娱乐科技有限公司 地址 100085 北京市海淀区西二 旗中路33 号院5号楼1 1层002号 (72)发明人 冯晓阳 李长亮  (74)专利代理 机构 北京智信禾专利代理有限公 司 11637 代理人 何定润 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/332(2019.01) G06K 9/62(2022.01) (54)发明名称 问答模型训练方法及装置、 问答方法及装置 (57)摘要 本申请提供一种问答模 型训练方法及 装置、 问答方法及装置, 其中, 问答模型训练方法包括: 获取基于指定领域构建的语料库, 语料库包括大 量的语料样本, 语料样本携带语境标签, 基于各 语料样本的语境标签, 利用预设的任务分类算 法, 建立多个任务导向型的文本集, 针对各文本 集, 利用该文本集中的各语料样本, 对预设神经 网络进行训练, 得到该文本集对应的问答模型。 基于各语料样本的语境标签, 将海量的语料样本 进行划分, 建立多个任务导向型的文本集, 针对 各文本集分别进行训练, 得到各文本集对应的问 答模型, 每个问答模型的训练耗时更短, 且一个 问答模型针对的是一种任务类型, 针对性更强, 提高了模型应用的精准度。 权利要求书3页 说明书15页 附图4页 CN 114328841 A 2022.04.12 CN 114328841 A 1.一种问答模型训练方法, 其特 征在于, 包括: 获取基于指定领域构建的语料库, 其中, 所述语料库包括大量的语料样本, 所述语料样 本携带语境标签; 基于各语料样本的语境标签, 利用预设的任务分类算法, 建立多个任务导向型的文本 集; 针对各文本集, 利用该文本集中的各语料样本, 对预设神经网络进行训练, 得到该文本 集对应的问答模型。 2.根据权利要求1所述的问答模型训练方法, 其特征在于, 在所述基于各语料样本的语 境标签, 利用预设的任务分类算法, 建立多个任务导向型的文本集的步骤之后, 所述方法还 包括: 针对各文本集, 利用语义分析算法, 提取出该文本集中各语料样本的关键词, 得到各语 料样本的关键词组。 3.根据权利要求2所述的问答模型训练方法, 其特征在于, 所述针对各文本集, 利用语 义分析算法, 提取出该文本集中各语料样本的关键词, 得到各语料样本的关键词组的步骤, 包括: 针对各文本集, 根据 该文本集中各语料样本的词特征, 利用语义分析算法, 计算各语料 样本中的词重要度; 针对各语料样本, 根据该语料样本中的词重要度, 提取词重要度高于预设阈值的关键 词, 组成该语料样本的关键词组。 4.根据权利要求2所述的问答模型训练方法, 其特征在于, 所述语料样本包括提问样本 和所述提问样本对应的回答样本; 在所述针对各文本集, 利用该文本集中的各语料样本, 对预设神经网络进行训练, 得到 该文本集对应的问答模型的步骤之后, 所述方法还 包括: 获取实时问句, 利用所述语义分析算法, 提取出所述实时问句中的关键词, 得到所述实 时问句的关键词组; 将所述实时问句的关键词组与所述各文本集中各提问样本的关键词组分别进行比对, 确定与所述实时问句 相似度最高的第一 提问样本及所述第一 提问样本所属的第一文本集; 以所述实时问句作为输入、 所述第一提问样本对应的回答样本作为标称信息, 对所述 第一文本集对应的问答模型进行训练, 记录下本轮迭代训练的所述实时问句的关键词组; 返回执行所述获取实时问句, 利用所述语义分析算法, 提取出所述实时问句中的关键 词, 得到所述实时问句的关键词组的步骤, 并结合已记录的各轮迭代训练的实时问句的关 键词组, 进行 下一轮迭代, 得到多轮迭代训练后的问答模型。 5.根据权利要求1 ‑4任一项所述的问答模型训练方法, 其特征在于, 所述语境标签的添 加方式为: 利用隐含狄利克 雷分布LDA模型, 为所述语料库中的各语料样本添加语境标签。 6.根据权利要求1 ‑4任一项所述的问答模型训练方法, 其特征在于, 所述语料样本还携 带有时间标签; 在所述基于各语料样本的语境标签, 利用预设的任务分类算法, 建立多个任 务导向型的文本集的步骤之前, 所述方法还 包括: 根据各语料样本的时间标签, 筛 选出符合预设时间条件的语料样本; 所述基于各语料样本的语境标签, 利用预设的任务分类算法, 建立多个任务导向型的权 利 要 求 书 1/3 页 2 CN 114328841 A 2文本集的步骤, 包括: 基于符合所述预设时间条件的各语料样本的语境标签, 利用预设的任务分类算法, 建 立多个任务 导向型的文本集。 7.根据权利要求1 ‑4任一项所述的问答模型训练方法, 其特征在于, 在所述基于各语料 样本的语境标签, 利用预设的任务分类算法, 建立多个任务导向型的文本集的步骤之前, 所 述方法还 包括: 利用预设的净化 规则, 筛选出符合预设净化条件的语料样本; 所述基于各语料样本的语境标签, 利用预设的任务分类算法, 建立多个任务导向型的 文本集的步骤, 包括: 基于符合所述预设净化条件的各语料样本的语境标签, 利用预设的任务分类算法, 建 立多个任务 导向型的文本集。 8.根据权利要求1所述的问答模型训练方法, 其特征在于, 所述语料样本包括提问样本 和所述提问样本对应的回答样本; 所述针对各文本集, 利用该文本集中的各语料样本, 对预设神经网络进行训练, 得到该 文本集对应的问答模型的步骤, 包括: 针对各文本集, 将该文本集中的提问样本 输入预设神经网络, 得到预测回答结果; 比较所述预测回答结果与所述 提问样本对应的回答样本, 得到 差异值; 基于所述差异值, 调整所述预设神经网络的网络参数, 并返回执行将该文本集中的提 问样本输入预设神经网络, 得到预测回答结果的步骤, 直至所述差异值小于预设阈值或者 返回执行 的次数达到预设次数, 则停止训练, 确定网络参数调整后的预设神经网络为该文 本集对应的问答模型。 9.根据权利要求1或8所述的问答模型训练方法, 其特征在于, 所述预设神经网络为双 向长短期记 忆网络Bi LSTM。 10.根据权利要求4所述的问答模型训练方法, 其特征在于, 所述以所述实时问句作为 输入、 所述第一提问样本对应的回答样本作为标称信息, 对所述第一文本集对应的问答模 型进行训练的步骤, 包括: 将所述实时问句输入所述第一文本集对应的问答模型, 得到预测回答结果; 比较所述预测回答结果与所述第一 提问样本对应的回答样本, 得到 差异值; 基于所述差异值, 调整所述第一文本集对应的问答模型的模型参数, 并返回执行所述 将所述实时问句 输入所述第一文本集对应的问答模型, 得到预测回答结果的步骤, 直至所 述差异值小于预设阈值或者返回执行的次数达到预设次数, 则停止本轮对 所述第一文本集 对应的问答模型的训练。 11.一种问答方法, 其特 征在于, 包括: 获取提问语句; 将所述提问语句输入利用如权利要求1 ‑10任一项所述的方法训练得到的问答模型中, 得到所述 提问语句对应的回答语句。 12.一种问答模型训练装置, 其特 征在于, 包括: 第一获取模块, 被配置为获取基于指定领域构建的语料库, 其中, 所述语料库包括大量 的语料样本, 所述语料样本携带语境标签;权 利 要 求 书 2/3 页 3 CN 114328841 A 3

.PDF文档 专利 问答模型训练方法及装置、问答方法及装置

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 问答模型训练方法及装置、问答方法及装置 第 1 页 专利 问答模型训练方法及装置、问答方法及装置 第 2 页 专利 问答模型训练方法及装置、问答方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:46:01上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。