专利问答模型训练方法及装置、问答方法及装置

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111678800.5 (22)申请日 2021.12.31 (66)本国优先权数据 202110790836.6 2021.07.13 CN (71)申请人北京金山数字娱乐科技有限公司地址 100085 北京市海淀区西二旗中路33 号院5号楼1 1层002号 (72)发明人冯晓阳　李长亮　 (74)专利代理机构北京智信禾专利代理有限公司 11637 代理人何定润 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/332(2019.01) G06K 9/62(2022.01) (54)发明名称问答模型训练方法及装置、问答方法及装置 (57)摘要本申请提供一种问答模型训练方法及装置、问答方法及装置，其中，问答模型训练方法包括：获取基于指定领域构建的语料库，语料库包括大量的语料样本，语料样本携带语境标签，基于各语料样本的语境标签，利用预设的任务分类算法，建立多个任务导向型的文本集，针对各文本集，利用该文本集中的各语料样本，对预设神经网络进行训练，得到该文本集对应的问答模型。基于各语料样本的语境标签，将海量的语料样本进行划分，建立多个任务导向型的文本集，针对各文本集分别进行训练，得到各文本集对应的问答模型，每个问答模型的训练耗时更短，且一个问答模型针对的是一种任务类型，针对性更强，提高了模型应用的精准度。权利要求书3页说明书15页附图4页 CN 114328841 A 2022.04.12 CN 114328841 A 1.一种问答模型训练方法，其特征在于，包括：获取基于指定领域构建的语料库，其中，所述语料库包括大量的语料样本，所述语料样本携带语境标签；基于各语料样本的语境标签，利用预设的任务分类算法，建立多个任务导向型的文本集；针对各文本集，利用该文本集中的各语料样本，对预设神经网络进行训练，得到该文本集对应的问答模型。 2.根据权利要求1所述的问答模型训练方法，其特征在于，在所述基于各语料样本的语境标签，利用预设的任务分类算法，建立多个任务导向型的文本集的步骤之后，所述方法还包括：针对各文本集，利用语义分析算法，提取出该文本集中各语料样本的关键词，得到各语料样本的关键词组。 3.根据权利要求2所述的问答模型训练方法，其特征在于，所述针对各文本集，利用语义分析算法，提取出该文本集中各语料样本的关键词，得到各语料样本的关键词组的步骤，包括：针对各文本集，根据该文本集中各语料样本的词特征，利用语义分析算法，计算各语料样本中的词重要度；针对各语料样本，根据该语料样本中的词重要度，提取词重要度高于预设阈值的关键词，组成该语料样本的关键词组。 4.根据权利要求2所述的问答模型训练方法，其特征在于，所述语料样本包括提问样本和所述提问样本对应的回答样本；在所述针对各文本集，利用该文本集中的各语料样本，对预设神经网络进行训练，得到该文本集对应的问答模型的步骤之后，所述方法还包括：获取实时问句，利用所述语义分析算法，提取出所述实时问句中的关键词，得到所述实时问句的关键词组；将所述实时问句的关键词组与所述各文本集中各提问样本的关键词组分别进行比对，确定与所述实时问句相似度最高的第一提问样本及所述第一提问样本所属的第一文本集；以所述实时问句作为输入、所述第一提问样本对应的回答样本作为标称信息，对所述第一文本集对应的问答模型进行训练，记录下本轮迭代训练的所述实时问句的关键词组；返回执行所述获取实时问句，利用所述语义分析算法，提取出所述实时问句中的关键词，得到所述实时问句的关键词组的步骤，并结合已记录的各轮迭代训练的实时问句的关键词组，进行下一轮迭代，得到多轮迭代训练后的问答模型。 5.根据权利要求1 ‑4任一项所述的问答模型训练方法，其特征在于，所述语境标签的添加方式为：利用隐含狄利克雷分布LDA模型，为所述语料库中的各语料样本添加语境标签。 6.根据权利要求1 ‑4任一项所述的问答模型训练方法，其特征在于，所述语料样本还携带有时间标签；在所述基于各语料样本的语境标签，利用预设的任务分类算法，建立多个任务导向型的文本集的步骤之前，所述方法还包括：根据各语料样本的时间标签，筛选出符合预设时间条件的语料样本；所述基于各语料样本的语境标签，利用预设的任务分类算法，建立多个任务导向型的权　利　要　求　书 1/3 页 2 CN 114328841 A 2文本集的步骤，包括：基于符合所述预设时间条件的各语料样本的语境标签，利用预设的任务分类算法，建立多个任务导向型的文本集。 7.根据权利要求1 ‑4任一项所述的问答模型训练方法，其特征在于，在所述基于各语料样本的语境标签，利用预设的任务分类算法，建立多个任务导向型的文本集的步骤之前，所述方法还包括：利用预设的净化规则，筛选出符合预设净化条件的语料样本；所述基于各语料样本的语境标签，利用预设的任务分类算法，建立多个任务导向型的文本集的步骤，包括：基于符合所述预设净化条件的各语料样本的语境标签，利用预设的任务分类算法，建立多个任务导向型的文本集。 8.根据权利要求1所述的问答模型训练方法，其特征在于，所述语料样本包括提问样本和所述提问样本对应的回答样本；所述针对各文本集，利用该文本集中的各语料样本，对预设神经网络进行训练，得到该文本集对应的问答模型的步骤，包括：针对各文本集，将该文本集中的提问样本输入预设神经网络，得到预测回答结果；比较所述预测回答结果与所述提问样本对应的回答样本，得到差异值；基于所述差异值，调整所述预设神经网络的网络参数，并返回执行将该文本集中的提问样本输入预设神经网络，得到预测回答结果的步骤，直至所述差异值小于预设阈值或者返回执行的次数达到预设次数，则停止训练，确定网络参数调整后的预设神经网络为该文本集对应的问答模型。 9.根据权利要求1或8所述的问答模型训练方法，其特征在于，所述预设神经网络为双向长短期记忆网络Bi LSTM。 10.根据权利要求4所述的问答模型训练方法，其特征在于，所述以所述实时问句作为输入、所述第一提问样本对应的回答样本作为标称信息，对所述第一文本集对应的问答模型进行训练的步骤，包括：将所述实时问句输入所述第一文本集对应的问答模型，得到预测回答结果；比较所述预测回答结果与所述第一提问样本对应的回答样本，得到差异值；基于所述差异值，调整所述第一文本集对应的问答模型的模型参数，并返回执行所述将所述实时问句输入所述第一文本集对应的问答模型，得到预测回答结果的步骤，直至所述差异值小于预设阈值或者返回执行的次数达到预设次数，则停止本轮对所述第一文本集对应的问答模型的训练。 11.一种问答方法，其特征在于，包括：获取提问语句；将所述提问语句输入利用如权利要求1 ‑10任一项所述的方法训练得到的问答模型中，得到所述提问语句对应的回答语句。 12.一种问答模型训练装置，其特征在于，包括：第一获取模块，被配置为获取基于指定领域构建的语料库，其中，所述语料库包括大量的语料样本，所述语料样本携带语境标签；权　利　要　求　书 2/3 页 3 CN 114328841 A 3

专利 问答模型训练方法及装置、问答方法及装置

专利问答模型训练方法及装置、问答方法及装置