专利问答匹配模型的训练方法、装置及电子设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 20221078076 6.0 (22)申请日 2022.07.04 (71)申请人北京百度网讯科技有限公司地址 100085 北京市海淀区上地十街10号百度大厦二层 (72)发明人妥明翔　丁宇辰　刘璟　 (74)专利代理机构北京清亦华知识产权代理事务所(普通合伙) 11201 专利代理师罗岚 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01)G06K 9/62(2022.01) (54)发明名称问答匹配模型的训练方法、装置及电子设备 (57)摘要本公开提供了问答匹配模型的训练方法、装置及电子设备，涉及人工智能技术领域，尤其涉及自然语言处理、智能搜索、深度学习技术领域。具体实现方案为：获取训练数据，其中，训练数据包括多个对抗类别下的对抗样本以及对抗样本的标签；标签表征对抗样本中对抗样本答案是否为对抗样本中样本问题的正确答案；获取初始的问答匹配模型；采用多个对抗类别下的对抗样本以及对抗样本的标签，对问答匹配模型进行训练，从而能够采用多个对抗类别下的对抗样本对问答匹配模型进行训练，使得问答匹配模型能够很好的针对相同样本问题，区分样本答案以及对抗样本答案，从而提高训练得到的问答匹配模型的准确度，提高问答匹配模型的鲁棒性。权利要求书3页说明书12页附图5页 CN 115129816 A 2022.09.30 CN 115129816 A 1.一种问答匹配模型的训练方法，包括：获取训练数据，其中，所述训练数据包括多个对抗类别下的对抗样本以及所述对抗样本的标签；所述标签表征所述对抗样本中对抗样本答案是否为所述对抗样本中样本问题的正确答案；获取初始的问答匹配模型；采用多个对抗类别下的所述对抗样本以及所述对抗样本的标签，对所述问答匹配模型进行训练。 2.根据权利要求1所述的方法，其中，所述训练数据还包括：非对抗类别下的原始样本以及所述原始样本的标签；所述采用多个对抗类别下的所述对抗样本以及所述对抗样本的标签，对所述问答匹配模型进行训练，包括：针对每个对抗类别下的对抗样本，获取所述对抗样本中的样本问题；根据所述样本问题，获取包括所述样本问题的目标原始样本；根据所述对抗样本以及所述目标原始样本，组成样本对；采用多个所述样本对，对所述问答匹配模型进行训练。 3.根据权利要求1所述的方法，其中，所述获取训练数据，包括：获取非对抗类别下的原始样本以及所述原始样本的标签；针对每个对抗类别，根据所述原始样本中的样本问题，获取所述样本问题对应的多个候选答案；基于所述对抗类别的类别特征，从多个所述候选答案中抽取所述样本问题的对抗样本答案。 4.根据权利要求1所述的方法，其中，所述获取训练数据，包括：获取非对抗类别下的原始样本以及所述原始样本的标签；针对每个对抗类别，获取所述对抗类别下的对抗问答匹配模型；根据所述原始样本中的样本问题，获取所述样本问题对应的多个候选答案；获取所述对抗问答匹配模型对多个所述候选答案的第一排序结果，以及所述初始的问答匹配模型对多个所述候选答案的第二排序结果；根据所述第一排序结果以及所述第二排序结果，获取多个所述候选答案中的逆序候选答案组，其中，所述逆序候选答案组中两个候选答案在所述第一排序结果和所述第二排序结果中的先后顺序不一致；将所述第一排序结果中两个所述候选答案中排序在后的候选答案作为所述样本问题的对抗样本答案。 5.根据权利要求4所述的方法，其中，所述针对每个对抗类别，获取所述对抗类别下的对抗问答匹配模型，包括：针对每个对抗类别，获取所述对抗类别下的测试对抗样本；确定多个候选问答匹配模型，以及每个所述候选问答匹配模型在所述测试对抗样本上的测试准确度；将对应的测试准确度满足第一测试要求的候选问答匹配模型，作为所述对抗类别下的对抗问答匹配模型。权　利　要　求　书 1/3 页 2 CN 115129816 A 26.根据权利要求1所述的方法，其中，所述方法还包括：获取多个对抗类别下的测试对抗样本；确定训练好的问答匹配模型在所述测试对抗样本上的测试准确度；在所述测试准确度未满足第二测试要求时，重新获取训练数据对所述训练好的问答匹配模型进行训练，直至训练好的问答匹配模型的所述测试准确度满足所述第二测试要求。 7.一种问答匹配方法，包括：获取待处理的问题，以及所述问题对应的多个候选答案；将所述问题以及多个所述候选答案输入问答匹配模型，获取所述问题与多个所述候选答案之间的匹配度；其中，所述问答匹配模型结合多个对抗类别下的对抗样本以及所述对抗样本的标签训练得到，所述标签表征所述对抗样本中对抗样本答案是否为所述对抗样本中样本问题的正确答案；根据所述匹配度，从多个所述候选答案中选择所述问题对应的答案。 8.一种问答匹配模型的训练装置，包括：第一获取模块，用于获取训练数据，其中，所述训练数据包括多个对抗类别下的对抗样本以及所述对抗样本的标签；所述标签表征所述对抗样本中对抗样本答案是否为所述对抗样本中样本问题的正确答案；第二获取模块，用于获取初始的问答匹配模型；训练模块，用于采用多个对抗类别下的所述对抗样本以及所述对抗样本的标签，对所述问答匹配模型进行训练。 9.根据权利要求8所述的装置，其中，所述训练数据还包括：非对抗类别下的原始样本以及所述原始样本的标签；所述训练模块具体用于，针对每个对抗类别下的对抗样本，获取所述对抗样本中的样本问题；根据所述样本问题，获取包括所述样本问题的目标原始样本；根据所述对抗样本以及所述目标原始样本，组成样本对；采用多个所述样本对，对所述问答匹配模型进行训练。 10.根据权利要求8所述的装置，其中，所述第一获取模块包括：第一获取单元、第二获取单元和抽取单元；所述第一获取单元，用于获取非对抗类别下的原始样本以及所述原始样本的标签；所述第二获取单元，用于针对每个对抗类别，根据所述原始样本中的样本问题，获取所述样本问题对应的多个候选答案；所述抽取单元，用于基于所述对抗类别的类别特征，从多个所述候选答案中抽取所述样本问题的对抗样本答案。 11.根据权利要求8所述的装置，其中，所述第一获取模块包括：第三获取单元、第四获取单元、第五获取单元、第六获取单元、第七获取单元和确定单元；所述第三获取单元，用于获取非对抗类别下的原始样本以及所述原始样本的标签；所述第四获取单元，用于针对每个对抗类别，获取所述对抗类别下的对抗问答匹配模型；所述第五获取单元，用于根据所述原始样本中的样本问题，获取所述样本问题对应的多个候选答案；权　利　要　求　书 2/3 页 3 CN 115129816 A 3

专利 问答匹配模型的训练方法、装置及电子设备

专利问答匹配模型的训练方法、装置及电子设备