专利分类模型的增量训练方法、装置和计算机设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211388547.4 (22)申请日 2022.11.08 (71)申请人腾讯科技（深圳）有限公司地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦3 5层 (72)发明人刘孟洋　 (74)专利代理机构华进联合专利商标代理有限公司 44224 专利代理师杨欢 (51)Int.Cl. G06K 9/62(2022.01) (54)发明名称分类模型的增量训练方法、装置和计算机设备 (57)摘要本申请涉及一种分类模型的增量训练方法、装置和计算机设备。所述方法包括：获取经真实样本和虚构样本共同训练得到的目标分类模型；获取新增样本，新增样本所属的新增类别不同于任一真实类别；将新增样本输入至目标分类模型，并通过目标分类模型提取新增样本的特征向量；确定特征空间中与各个虚构类别分别对应的目标代表特征，并基于特征向量与各目标代表特征间的差异，确定与新增样本匹配的目标虚构类别；将目标虚构类别更新为新增类别，以使得目标分类模型支持对新增类别的预测。采用本方法能够在分类任务中快速支持对新增数据和新增类别的预测。权利要求书4页说明书24页附图6页 CN 115438755 A 2022.12.06 CN 115438755 A 1.一种分类模型的增量训练方法，其特征在于，所述方法包括：获取经真实样本和虚构样本共同训练得到的目标分类模型，所述目标分类模型支持对虚构类别和真实类别的预测；获取新增样本，所述新增样本所属的新增类别不同于任一所述真实类别；将所述新增样本输入至所述目标分类模型，并通过所述目标分类模型提取所述新增样本的特征向量；确定特征空间中与各个虚构类别分别对应的目标代表特征，并基于所述特征向量与各目标代表特征间的差异，确定与所述新增样本匹配的目标虚构类别；将所述目标虚构类别更新为所述新增类别，以使得所述目标分类模型支持对所述新增类别的预测。 2.根据权利要求1所述的方法，其特征在于，所述目标分类模型通过如下步骤训练得到：获取真实样本和虚构样本，所述虚构样本是基于所述真实样本构建得到；通过待训练的分类模型对所述真实样本进行预测，并基于预测得到的第一输出确定所述真实样本对应于第一目标类别的第一损失，所述第一目标类别包括所述真实样本所属的目标真实类别、和与所述真实样本匹配的目标虚构类别；通过所述待训练的分类模型对所述虚构样本进行预测，并基于预测得到的第二输出确定所述虚构样本对应于第二目标类别的第二损失，所述第二目标类别包括分别与所述虚构样本匹配的目标真实类别和目标虚构类别；基于所述第一损失和第二损失，构建目标损失函数，通过所述目标损失函数对所述待训练的分类模型进行迭代训练，直至达到训练停止条件时停止，得到训练完成的目标分类模型。 3.根据权利要求2所述的方法，其特征在于，所述通过所述目标损失函数对所述待训练的分类模型进行迭代训练，包括：通过所述目标损失函数对所述待训练的分类模型进行多次迭代训练，并在每次迭代训练后，确定当次迭代训练对应的梯度，并基于所述梯度的反向传播，对特征空间中每个类别各自对应的代表特征进行更新；其中，最后一次迭代训练完成后所得到的每个类别各自对应的代表特征，为各个类别的目标代表特征。 4.根据权利要求2所述的方法，其特征在于，所述通过待训练的分类模型对所述真实样本进行预测，并基于预测得到的第一输出确定所述真实样本对应于第一目标类别的第一损失，包括：通过待训练的分类模型提取所述真实样本的特征向量，并基于所述真实样本的特征向量进行预测，得到所述真实样本对应于所有类别的第一概率；基于所述第一概率、以及所述真实样本所属的目标真实类别，确定所述真实样本对应于所述目标真实类别的第一原始损失；基于所述第一概率，确定所述真实样本对应于除所述目标真实类别以外的其他类别的第一假设概率；基于所述第一假设概率，确定所述真实样本对应于所匹配的目标虚构类别的第一虚构损失；权　利　要　求　书 1/4 页 2 CN 115438755 A 2基于所述第一原始损失和所述第一虚构损失，确定所述真实样本对应于第一目标类别的第一损失。 5.根据权利要求4所述的方法，其特征在于，所述基于所述第一概率，确定所述真实样本对应于除所述目标真实类别以外的其他类别的第一假设概率，包括：基于所述真实样本所属的目标真实类别，确定与所述真实样本对应的二值化向量，所述二值化向量的维度与预设类别的数量相匹配；对与所述真实样本对应的二值化向量进行逆运算，得到与所述真实样本对应的二值化逆向量；基于所述第一概率和与所述真实样本对应的所述二值化逆向量，确定所述真实样本对应于除所述目标真实类别以外的其他类别的第一假设概率。 6.根据权利要求4所述的方法，其特征在于，所述基于所述第一假设概率，确定所述真实样本对应于所匹配的目标虚构类别的第一虚构损失，包括：确定与所述真实样本匹配的目标虚构类别；基于所述第一假设概率、以及所述目标虚构类别对应的虚构类别标签，确定所述真实样本对应于所述目标虚构类别的第一虚构损失。 7.根据权利要求6所述的方法，其特征在于，所述确定与所述真实样本匹配的目标虚构类别，包括：确定特征空间中与各虚构类别分别对应的第一代表特征，所述第一代表特征为当次训练中与各虚构类别对应的代表特征；分别确定所述真实样本的特征向量与各第一代表特征之间的距离；将所述距离中的最小值对应的第一代表特征所代表的虚构类别，作为与所述真实样本匹配的目标虚构类别。 8.根据权利要求2所述的方法，其特征在于，所述通过所述待训练的分类模型对所述虚构样本进行预测，并基于预测得到的第二输出确定所述虚构样本对应于第二目标类别的第二损失，包括：通过所述待训练的分类模型提取所述虚构样本的特征向量，并基于所述虚构样本的特征向量进行预测，得到所述虚构样本对应于所有类别的第二概率；确定用于构建所述虚构样本的至少一个真实样本，并基于与所述至少一个真实样本匹配的目标虚构类别，确定所述虚构样本对应的目标虚构类别；基于所述第二概率、以及所述虚构样本对应的目标虚构类别，确定所述虚构样本对应于所述目标虚构类别的第二原始损失；基于所述第二概率，确定所述虚构样本对应于除所述目标虚构类别以外的其他类别的第二假设概率；基于所述第二假设概率，确定所述虚构样本对应于所匹配的目标真实类别的第二虚构损失；基于所述第二原始损失和所述第二虚构损失，确定所述虚构样本对应于第二目标类别的第二损失。 9.根据权利要求8所述的方法，其特征在于，所述基于所述第二概率，确定所述虚构样本对应于除所述目标虚构类别以外的其他类别的第二假设概率，包括：权　利　要　求　书 2/4 页 3 CN 115438755 A 3

专利 分类模型的增量训练方法、装置和计算机设备

专利分类模型的增量训练方法、装置和计算机设备