全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211388547.4 (22)申请日 2022.11.08 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 刘孟洋  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 专利代理师 杨欢 (51)Int.Cl. G06K 9/62(2022.01) (54)发明名称 分类模型的增量训练方法、 装置和计算机设 备 (57)摘要 本申请涉及一种分类模 型的增量训练方法、 装置和计算机设备。 所述方法包括: 获取经真实 样本和虚构样本共同训练得到的目标分类模型; 获取新增样 本, 新增样本所属的新增类别不同于 任一真实类别; 将新增样本输入至目标分类模 型, 并通过目标分类模型提取新增样本的特征向 量; 确定特征空间中与各个虚构类别分别对应的 目标代表特征, 并基于特征向量与各目标代表特 征间的差异, 确定与新增样本匹配的目标虚构类 别; 将目标虚构类别更新为新增类别, 以使得目 标分类模型支持对新增类别的预测。 采用本方法 能够在分类任务中快速支持对新增数据和新增 类别的预测。 权利要求书4页 说明书24页 附图6页 CN 115438755 A 2022.12.06 CN 115438755 A 1.一种分类模型的增量训练方法, 其特 征在于, 所述方法包括: 获取经真实样本和虚构样本共同训练得到的目标分类模型, 所述目标分类模型支持对 虚构类别和真实类别的预测; 获取新增样本, 所述 新增样本所属的新增类别不同于任一所述真实类别; 将所述新增样本输入至所述目标分类模型, 并通过所述目标分类模型提取所述新增样 本的特征向量; 确定特征空间中与 各个虚构类别分别对应的目标代表特征, 并基于所述特征向量与 各 目标代表特征间的差异, 确定与所述 新增样本匹配的目标虚构类别; 将所述目标虚构类别更新为所述新增类别, 以使得所述目标分类模型支持对所述新增 类别的预测。 2.根据权利要求1所述的方法, 其特征在于, 所述目标分类模型通过如下步骤训练得 到: 获取真实样本和虚构样本, 所述虚构样本是基于所述真实样本构建得到; 通过待训练的分类模型对所述真实样本进行预测, 并基于预测得到的第 一输出确定所 述真实样本对应于第一目标类别的第一损失, 所述第一目标类别包括所述真实样本所属的 目标真实类别、 和与所述真实样本匹配的目标虚构类别; 通过所述待训练 的分类模型对所述虚构样本进行预测, 并基于预测得到的第 二输出确 定所述虚构样本对应于第二目标类别的第二损失, 所述第二目标类别包括分别与所述虚构 样本匹配的目标真实类别和目标虚构类别; 基于所述第一损 失和第二损 失, 构建目标损 失函数, 通过所述目标损 失函数对所述待 训练的分类模型进行迭代训练, 直至达到训练停止条件时停止, 得到训练完成的目标分类 模型。 3.根据权利要求2所述的方法, 其特征在于, 所述通过所述目标损失函数对所述待训练 的分类模型进行迭代训练, 包括: 通过所述目标损失函数对所述待训练 的分类模型进行多次迭代训练, 并在每次迭代训 练后, 确定 当次迭代训练对应的梯度, 并基于所述梯度的反向传播, 对特征 空间中每个类别 各自对应的代表特征进行更新; 其中, 最后一次迭代训练完成后所得到的每个类别各自对 应的代表特征, 为各个 类别的目标代 表特征。 4.根据权利要求2所述的方法, 其特征在于, 所述通过待训练的分类模型对所述真实样 本进行预测, 并基于预测得到的第一输出确定所述真实样本对应于第一目标类别的第一损 失, 包括: 通过待训练的分类模型提取所述真实样本的特征向量, 并基于所述真实样本的特征向 量进行预测, 得到所述真实样本对应于所有类别的第一 概率; 基于所述第一概率、 以及所述真实样本所属的目标真实类别, 确定所述真实样本对应 于所述目标真实类别的第一原 始损失; 基于所述第 一概率, 确定所述真实样本对应于除所述目标真实类别以外的其他类别的 第一假设概率; 基于所述第 一假设概率, 确定所述真实样本对应于所匹配的目标虚构类别的第 一虚构 损失;权 利 要 求 书 1/4 页 2 CN 115438755 A 2基于所述第 一原始损失和所述第 一虚构损失, 确定所述真实样本对应于第 一目标类别 的第一损失。 5.根据权利要求4所述的方法, 其特征在于, 所述基于所述第一概率, 确定所述真实样 本对应于除所述目标真实类别以外的其 他类别的第一 假设概率, 包括: 基于所述真实样本所属的目标真实类别, 确定与所述真实样本对应的二值化向量, 所 述二值化向量的维度与预设类别的数量相匹配; 对与所述真实样本对应的二值化向量进行逆运算, 得到与所述真实样本对应的二值化 逆向量; 基于所述第 一概率和与所述真实样本对应的所述二值化逆向量, 确定所述真实样本对 应于除所述目标真实类别以外的其 他类别的第一 假设概率。 6.根据权利要求4所述的方法, 其特征在于, 所述基于所述第一假设概率, 确定所述真 实样本对应于所匹配的目标虚构类别的第一虚构损失, 包括: 确定与所述真实样本匹配的目标虚构类别; 基于所述第一假设概率、 以及所述目标虚构类别对应的虚构类别标签, 确定所述真实 样本对应于所述目标虚构类别的第一虚构损失。 7.根据权利要求6所述的方法, 其特征在于, 所述确定与 所述真实样本匹配的目标虚构 类别, 包括: 确定特征空间中与 各虚构类别分别对应的第 一代表特征, 所述第 一代表特征为当次训 练中与各虚构类别对应的代 表特征; 分别确定所述真实样本的特 征向量与各第一代 表特征之间的距离; 将所述距离 中的最小值对应的第 一代表特征所代表的虚构类别, 作为与所述真实样本 匹配的目标虚构类别。 8.根据权利要求2所述的方法, 其特征在于, 所述通过所述待训练 的分类模型对所述虚 构样本进 行预测, 并基于预测得到的第二输出确定所述虚构样本对应于第二目标类别的第 二损失, 包括: 通过所述待训练 的分类模型提取所述虚构样本的特征向量, 并基于所述虚构样本的特 征向量进行 预测, 得到所述虚构样本对应于所有类别的第二 概率; 确定用于构建所述虚构样本的至少一个真实样本, 并基于与 所述至少一个真实样本匹 配的目标虚构类别, 确定所述虚构样本对应的目标虚构类别; 基于所述第二概率、 以及所述虚构样本对应的目标虚构类别, 确定所述虚构样本对应 于所述目标虚构类别的第二原 始损失; 基于所述第 二概率, 确定所述虚构样本对应于除所述目标虚构类别以外的其他类别的 第二假设概率; 基于所述第 二假设概率, 确定所述虚构样本对应于所匹配的目标真实类别的第 二虚构 损失; 基于所述第 二原始损失和所述第 二虚构损失, 确定所述虚构样本对应于第 二目标类别 的第二损失。 9.根据权利要求8所述的方法, 其特征在于, 所述基于所述第二概率, 确定所述虚构样 本对应于除所述目标虚构类别以外的其 他类别的第二 假设概率, 包括:权 利 要 求 书 2/4 页 3 CN 115438755 A 3

.PDF文档 专利 分类模型的增量训练方法、装置和计算机设备

文档预览
中文文档 35 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共35页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 分类模型的增量训练方法、装置和计算机设备 第 1 页 专利 分类模型的增量训练方法、装置和计算机设备 第 2 页 专利 分类模型的增量训练方法、装置和计算机设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:42:56上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。