全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211151977.4 (22)申请日 2022.09.21 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦二层 (72)发明人 沈智勇 赵一麟 陆勤  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 张润 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/778(2022.01) G06V 10/82(2022.01) (54)发明名称 图像筛选模 型的训练方法、 装置以及图像筛 选方法 (57)摘要 本公开提供了图像筛选模型的训练方法、 装 置以及图像筛选方法, 人工智 能技术领域, 尤其 涉及图像识别、 视频分析技术领域。 具体实现方 案为: 基于未标注样本图像集i和标注样本图像 集i对图像筛选模型进行第i轮融合半监督的主 动学习, 并获取未标注样本图像集i中未标注图 像对应的模 型置信度; 根据模型置信度从未标注 样本图像集i中筛选多个目标未标注样本图像进 行标注, 得到标注样本图像集i+1; 基于标注图像 集i+1和未标注样本图像集i+1对图像筛选模型 进行第i+1轮融合半监督的主动学习, 直至得到 训练好的目标图像筛选模型。 本公开充分利用未 标注数据, 从而在标注预算受限的情况下优先针 对难例进行挖掘, 可 以提升模型性能, 提高图像 识别的效率和准确率。 权利要求书4页 说明书11页 附图5页 CN 115482436 A 2022.12.16 CN 115482436 A 1.一种图像筛 选模型的训练方法, 其中, 包括: 基于未标注样本图像集i和标注样本图像集i对图像筛选模型进行第 i轮融合半监督的 主动学习, 并获取所述未标注样本图像集i中未标注图像对应的模型置信度, 其中所述i为 大于1的整数; 根据所述模型置信度从所述未标注样本图像集i中筛选多个目标未标注样本图像进行 标注, 得到标注样本图像集 i+1; 基于所述标注图像集i+1和未标注样本图像集i+1对所述图像筛选模型进行第i+1轮 融 合半监督的主动学习, 直至得到训练好的目标图像筛 选模型。 2.根据权利要求1所述的方法, 其中, 所述基于未标注样本图像集i和标注样本图像集i 对图像筛 选模型进行第i轮融合半监 督的主动学习之前, 还 包括: 针对所述图像筛选模型的首轮训练, 从原始样本 图像中获取部分样本 图像进行标注, 以获取所述首轮对应的初始标注样本图像集; 基于所述初始标注样本图像集对所述图像筛 选模型进行有监 督训练。 3.根据权利要求1所述的方法, 其中, 所述基于未标注样本图像集i和标注样本图像集i 对图像筛 选模型进行第i轮融合半监 督的主动学习, 包括: 基于所述未标注样本 图像集i中未标注样本 图像和所述标注样本 图像集i中的标注样 本图像, 确定所述图像筛 选模型的批量训练样本; 将所述批量训练样本 输入所述图像筛 选模型进行 特征提取; 对提取的特征表示进行分类定位识别, 获取所述未标注样本图像和所述标注样本图像 的分类定位结果; 根据所述分类定位结果获取 所述图像筛 选模型的损失函数; 根据所述损失函数对所述图像筛 选模型进行反向调整。 4.根据权利要求3所述的方法, 其中, 所述图像筛选模型包括特征提取网络和至少两个 检测头, 所述方法还 包括: 由所述特征提取网络对输入的样本图像进行特征提取, 获取所述样本图像对应的特征 表示; 将所述特征表示分别 输入所述至少两个检测头 中, 得到所述至少两个检测头各自输出 的分类定位结果; 根据所述至少两个检测头各自输出的分类定位结果, 确定所述图像筛选模型的损失函 数。 5.根据权利要求4所述的方法, 其中, 所述获取所述未标注样本 图像集i中未标注样本 图像对应的模型置信度, 包括: 获取所述未标注样本图像的所述至少两个 检测头各自输出的分类定位结果; 获取所述未标注样本图像对应的至少两个所述分类定位结果之间的欧氏距离; 根据所述欧式距离, 获取 所述未标注样本图像的模型置信度。 6.根据权利要求1所述的方法, 其中, 所述根据所述模型置信度从所述未标注样本图像 集i中筛选多个目标 未标注样本图像, 包括: 从所述未标注样本图像集i中, 筛选所述模型置信度大于预设阈值的未标注样本图像, 并确定为所述目标 未标注样本图像; 或者,权 利 要 求 书 1/4 页 2 CN 115482436 A 2对所述未标注样本 图像集i中的未标注样本 图像, 按照所述模型置信度从大到小进行 排序; 选取所述模型置信度最大的预设数量的未标注样本图像, 并确定为目标未标注样本图 像。 7.根据权利要求1 ‑3或6中任一项所述的方法, 其中, 所述方法还 包括: 每进行一轮融合半监督的主动学习, 判断所述图像筛选模型的是否满足模型训练结束 条件, 并在 满足所述模型训练结束条件时, 确定所述图像筛选模型完成训练, 得到所述目标 图像筛选模型。 8.根据权利要求7 所述的方法, 其中, 还 包括: 针对第j轮 融合半监督的主动学习, 获取至少一个图像采集装置在第j个采样周期内采 集的图像, 所述j为大于1的整数; 根据所述第j个采样周期内采集的图像, 获取 所述未标注样本图像集j。 9.根据权利要求7 所述的方法, 其中, 还 包括: 获取图像库, 所述图库中包 含多个样本图像; 针对第j轮融合半监督的主动学习, 从所述图像库中随机抽取预设比例的样本 图像作 为所述未 标注样本图像集j。 10.一种图像筛 选方法, 其中, 包括: 获取M个待筛 选的候选图像, 所述M为 正整数, 且M≥1; 将M个所述候选图像输入到目标图像筛选模型中, 获取M个所述候选图像对应的模型置 信度; 根据所述模型置信度, 从M个所述多个候选图像筛选出N个目标图像, 所述N为正整数, 且1≤N≤ M; 其中, 所述目标图像筛 选模型为采用如权要 要求1‑9中任一项所述的方法训练的模型。 11.一种图像筛 选模型的训练装置, 其中, 包括: 第一训练模块, 用于基于未标注样本图像集i和标注样本图像集i对图像筛选模型进行 第i轮融合半监督的主动学习, 并获取所述未标注样本图像集i中未标注图像对应的模型置 信度, 其中所述 i为大于1的整数; 筛选模块, 用于根据所述模型置信度从所述未标注样本 图像集i中筛选多个目标未标 注样本图像进行 标注, 得到标注样本图像集 i+1; 第二训练模块, 用于基于所述标注图像集i+1和未标注样本图像集i+1对所述图像筛选 模型进行第i+1轮融合半监 督的主动学习, 直至得到训练好的目标图像筛 选模型。 12.根据权利要求10所述的装置, 其中, 所述第一训练模块, 还用于: 针对所述图像筛选模型的首轮训练, 从原始样本 图像中获取部分样本 图像进行标注, 以获取所述首轮对应的初始标注样本图像集; 基于所述初始标注样本图像集对所述图像筛 选模型进行有监 督训练。 13.根据权利要求1 1所述的装置, 其中, 所述第一训练模块, 还用于: 基于所述未标注样本 图像集i中未标注样本 图像和所述标注样本 图像集i中的标注样 本图像, 确定所述图像筛 选模型的批量训练样本; 将所述批量训练样本 输入所述图像筛 选模型进行 特征提取;权 利 要 求 书 2/4 页 3 CN 115482436 A 3

PDF文档 专利 图像筛选模型的训练方法、装置以及图像筛选方法

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像筛选模型的训练方法、装置以及图像筛选方法 第 1 页 专利 图像筛选模型的训练方法、装置以及图像筛选方法 第 2 页 专利 图像筛选模型的训练方法、装置以及图像筛选方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。