全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211142519.4 (22)申请日 2022.09.20 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 陈毅 徐杨柳 谢群义 钦夏孟  姚锟  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 杨贝贝 黄健 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) (54)发明名称 模型的半监督训练、 分类方法装置、 设备、 介 质及产品 (57)摘要 本公开提供了模 型的半监督训练、 分类方法 装置、 设备、 介质及产品, 涉及人工智能领域, 尤 其涉及计算机视觉、 深度学习领域。 具体实现方 案为: 采用有标签图像样本对待训练的图像分类 模型进行训练, 获得第一分类模型, 所述第一分 类模型为第一次训练后的分类模 型; 确定两个无 标签图像样本为一组, 获得目标图像样本组; 以 所述目标图像样本组中两个无标签图像样本互 为标签对所述第一分类模型进行训练, 获得第二 分类模型, 所述第二分类模型为第二次训练后的 分类模型。 权利要求书6页 说明书17页 附图4页 CN 115471717 A 2022.12.13 CN 115471717 A 1.一种模型的半监 督训练方法, 包括: 采用有标签图像样本对待训练的图像分类模型进行训练, 获得第一分类模型, 所述第 一分类模型为第一次训练后的分类模型; 确定两个无标签图像样本为 一组, 获得目标图像样本组; 以所述目标图像样本组中两个无标签图像样本互为标签对所述第一分类模型进行训 练, 获得第二分类模型, 所述第二分类模型为第二次训练后的分类模型。 2.根据权利要求1所述的方法, 其中, 所述以所述目标图像样本组中两个无标签图像样 本互为标签对所述第一分类模型进行训练, 获得第二分类模型, 包括: 将所述目标图像样本组中两个无标签图像样本分别进行两种程度的形变处理, 获得两 个无标签图像样本分别对应的形变图像对; 基于所述第一分类模型, 对两个形变图像对的形变图像进行分类处理, 获得所述两个 形变图像对分别对应的处 理结果; 根据所述两个形变图像对分别对应的处理结果, 以及两个处理结果之间的结果差异, 对所述第一分类模型进行 更新, 获得 所述第二分类模型。 3.根据权利要求2所述的方法, 其中, 所述形变图像对包括第 一形变图像和第 二形变图 像, 所述处 理结果包括两个形变图像的图像特 征和目标类别; 所述根据 所述两个形变图像对分别对应的处理结果, 以及两个处理结果之间的结果差 异, 对所述第一分类模型进行 更新, 获得 所述第二分类模型, 包括: 根据所述两个形变图像对分别对应的第 一形变图像的图像特征和目标类别, 计算所述 两个形变图像对之间的特 征误差, 获得第一损失值; 根据第一组形变图像对中两个形变图像的图像特征和目标类别, 对所述第 一组形变图 像对进行损失计算, 获得第二损失值; 根据第二组形变图像对中两个形变图像的图像特征和目标类别, 对所述第 二组形变图 像对进行损失计算, 获得第三损失值; 利用所述第一损 失值、 所述第二损 失值和所述第三损 失值, 对所述第一分类模型进行 反馈更新, 获得 所述第二分类模型。 4.根据权利要求3所述的方法, 其中, 所述根据所述第一损 失值、 所述第二损 失值和所 述第三损失值, 对所述第一分类模型进行反馈更新, 获得 所述第二分类模型, 包括: 对所述第一损失值、 第二损失值和所述第三损失值进行加权求和, 获得目标损失值; 响应于确定所述目标损失值满足收敛条件, 确定所述第 一分类模型为所述第 二分类模 型; 响应于确定所述目标损 失值不满足收敛条件, 基于所述目标损 失值, 更新所述第一分 类模型, 返回执行所述将所述目标图像样本组中两个无标签图像样本 分别进行不同程度的 形变处理, 获得两个无 标签图像样本分别对应的形变图像对。 5.根据权利要求3或4所述的方法, 其中, 所述根据所述两个形变图像对分别对应的第 一形变图像的图像特征和目标类别, 计算所述两个形变图像对之间的特征误差, 获得第一 损失值, 包括: 响应于确定所述两个形变图像对分别对应第 一形变图像的目标类别相同, 基于类 内损 失计算策略, 对所述两个形变图像对分别对应第一形变图像的图像特征进行空间损失计权 利 要 求 书 1/6 页 2 CN 115471717 A 2算, 获得所述第一损失值; 响应于确定所述两个形变图像对分别对应第 一形变图像的目标类别不同, 基于类间损 失计算策略, 对所述两个形变图像对分别对应第一形变图像的图像特征进行损失计算, 获 得所述第一损失值。 6.根据权利要求5所述的方法, 其中, 所述基于类内损 失计算策略, 对所述两个形变图 像对分别对应第一形变图像的图像特 征进行空间损失计算, 获得 所述第一损失值, 包括: 对所述两个形变图像对分别对应第 一形变图像的图像特征进行特征距离计算, 获得特 征空间距离; 计算所述特 征空间距离与预设距离阈值的差值, 以获得第一距离 差值; 从预设数值和所述特 征空间距离 差值中确定最大值 为所述第一损失值。 7.根据权利要求5所述的方法, 其中, 所述基于类间损 失计算策略, 对所述两个形变图 像对分别对应第一形变图像的图像特 征进行损失计算, 获得 所述第一损失值, 包括: 对所述两个形变图像对分别对应第 一形变图像的图像特征进行特征距离计算, 获得特 征空间距离; 计算距离阈值与所述特 征空间距离的差值, 以获得第二距离 差值; 从预设数值和所述特 征空间距离阈值中确定最小值 为所述第一损失值。 8.根据权利要求3 ‑7任一项所述的方法, 其中, 所述根据所述两个形变图像对分别对应 的第一形变图像的图像特征和目标类别, 计算所述两个形变图像对之间的误差, 获得第一 损失值, 包括: 根据所述两个形变图像对分别对应第 一形变图像的目标类别, 确定所述两个形变图像 对分别对应第一形变图像的目标类别的类别置信度; 响应于确定所述两个形变图像对分别对应第一形变图像的目标类别的类别置信度均 大于置信度阈值, 根据所述两个形变图像对分别对应的第一形变图像的图像特征和目标类 别, 计算所述两个形变图像对之间的误差, 获得第一损失值。 9.根据权利要求3 ‑7任一项所述的方法, 其中, 所述处理结果还包括目标类别的类别置 信度, 所述根据所述第一组形变图像对中两个形变图像的图像特征和目标类别, 对所述第 一组形变图像对进行损失计算, 获得第二损失值, 包括: 响应于确定所述第一组形变图像对中第一形变图像的目标类别对应类别置信度大于 置信度阈值, 根据所述第一组形变图像对中两个形变图像的图像特征和目标类别, 对所述 第一组形变图像对进行损失计算, 获得第二损失值; 所述根据 所述第二组形变图像对中两个形变图像的图像特征和目标类别, 对所述第 二 组形变图像对进行损失计算, 获得第三损失值, 包括: 响应于确定所述第二组形变图像对中第一形变图像的目标类别对应类别置信度大于 置信度阈值, 根据所述第二组形变图像对中两个形变图像的图像特征和目标类别, 对所述 第二组形变图像对进行损失计算, 获得第三损失值。 10.根据权利要求3 ‑9任一项所述的方法, 其中, 所述根据所述第一组形变图像对中两 个形变图像的图像特征和目标类别, 对所述第一组形变图像对进行损失计算, 获得第二损 失值, 包括: 对所述第一组形变图像对中两个形变图像的图像特征进行特征距离计算, 获得第 一距权 利 要 求 书 2/6 页 3 CN 115471717 A 3

PDF文档 专利 模型的半监督训练、分类方法装置、设备、介质及产品

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型的半监督训练、分类方法装置、设备、介质及产品 第 1 页 专利 模型的半监督训练、分类方法装置、设备、介质及产品 第 2 页 专利 模型的半监督训练、分类方法装置、设备、介质及产品 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。