全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210234795.7 (22)申请日 2022.03.10 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 刘欢 谭资昌 赵耀 李晓龙  郭国栋  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 范芳茗 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06V 40/40(2022.01) G06V 40/16(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) (54)发明名称 深度学习模 型的训练方法、 目标对象识别方 法和装置 (57)摘要 本公开提供了一种深度学习模型的训练方 法和装置、 一种目标对象识别方法和装置、 电子 设备、 存储介质及计算机程序产品, 涉及人工智 能领域, 尤其涉及深度学习、 图像识别和计算机 视觉领域。 具体实现方案为: 根据样本图像的初 始向量特征图, 得到融合特征图, 样本图像包括 目标对象以及目标对象 的标签; 根据融合特征图 和标签, 得到目标对象的第一分类差异值; 根据 第一分类差异值和初始向量特征图, 确定与 样本 图像相对应的增强图像; 以及利用增强图像训练 深度学习模型。 权利要求书4页 说明书14页 附图9页 CN 114612743 A 2022.06.10 CN 114612743 A 1.一种深度学习模型的训练方法, 包括: 根据样本 图像的初始向量特征图, 得到融合特征图, 所述样本 图像包括目标对象以及 所述目标对象的标签; 根据所述融合特 征图和所述标签, 得到目标对象的第一分类差异值; 根据所述第 一分类差异值和所述初始向量特征图, 确定与所述样本图像相对应的增强 图像; 以及 利用所述增强图像训练所述深度学习模型。 2.根据权利要求1所述的方法, 其中, 所述根据样本 图像的初始向量特征图, 得到融合 特征图包括: 对所述初始向量特 征图执行池化操作, 得到第一池化特 征图; 利用第一权 重对所述第一池化特 征图进行处 理, 得到加权池化特 征图; 以及 根据所述第一池化特 征图和所述加权池化特 征图, 得到所述融合特 征图。 3.根据权利要求2所述的方法, 其中, 所述第一权重指示了目标对象的特征的分布概 率。 4.根据权利要求2所述的方法, 其中, 所述根据所述第 一分类差异值和所述初始向量特 征图, 确定与所述样本图像相对应的增强图像包括: 根据所述初始向量图和所述第一权 重, 确定注意力特 征图; 确定所述注意力特 征图中, 数值较大的预定数目个元 素; 根据所述预定数目个元 素, 得到增强矩阵; 以及 根据所述增强矩阵和所述样本图像, 确定所述增强图像。 5.根据权利要求4所述的方法, 其中, 所述确定所述注意力特征图中, 数值较大的预定 数目个元 素包括: 根据选择阈值, 确定所述预定数目。 6.根据权利要求5所述的方法, 其中, 所述样本图像包括N个样本图像, N为大于1的整 数; 所述方法还 包括: 确定所述 N个样本图像的N个第一分类差异值的平均第一分类差异值; 以及 根据所述平均第一分类差异值, 确定所述选择阈值。 7.根据权利要求4所述的方法, 其中, 所述根据所述增强矩阵和所述样本 图像, 确定所 述增强图像包括: 对所述样本图像进行平 滑处理, 得到平 滑样本图像; 以及 根据所述平 滑样本图像、 所述样本图像以及所述增强矩阵, 确定所述增强图像。 8.根据权利要求1所述的方法, 其中, 所述深度学习模型包括特征提取模块、 池化模块 和全连接模块; 所述利用所述增强图像训练所述深度学习模型包括: 根据增强图像的增强向量特 征图, 得到增强融合特 征图; 根据所述增强融合特 征图和所述标签, 得到目标对象的第二分类差异值; 以及 根据所述第二分类差异值, 调整特 征提取模块、 池化模块和全连接模块的参数。 9.根据权利要求8所述的方法, 其中, 所述根据所述增强融合特征图, 得到目标对象的 第二分类差异值包括: 根据所述增强融合特 征图, 确定所述目标对象的增强分类结果 值;权 利 要 求 书 1/4 页 2 CN 114612743 A 2根据初始分类结果值和所述增强分类结果值, 确定所述目标对象的第二分类差异值, 其中, 所述初始分类结果 值是基于所述融合特 征图得到的。 10.根据权利要求9所述的方法, 其中, 所述根据初始分类结果值和所述增强分类结果 值, 确定所述目标对象的第二分类差异值包括: 根据所述初始分类结果值和所述增强分类结果值之间的相对熵, 确定所述目标对象的 第二分类差异值。 11.根据权利要求8所述的方法, 其中, 所述根据所述增强融合特征图, 得到目标对象的 第二分类差异值包括: 根据所述增强融合特 征图, 确定所述目标对象的增强分类结果 值; 以及 根据所述标签和所述增强分类结果 值, 确定所述目标对象的第二分类差异值。 12.一种目标对象识别方法, 包括: 将待识别图像输入深度学习模型, 得到所述待识别图像中目标对象的识别结果, 其中, 所述深度学习模型 是利用权利要求1至1 1中任一项所述的方法训练的。 13.根据权利要求12所述的方法, 其中, 所述目标对象包括面部, 所述识别结果包括真 实面部和伪造面部 。 14.一种深度学习模型的训练装置, 包括: 融合模块, 用于根据样本图像的初始向量特征图, 得到 融合特征图, 所述样本图像包括 目标对象以及所述目标对象的标签; 计算模块, 用于根据所述融合特 征图和所述标签, 得到目标对象的第一分类差异值; 增强模块, 用于根据所述第一分类差异值和所述初始向量特征图, 确定与所述样本 图 像相对应的增强图像; 以及 训练模块, 用于利用所述增强图像训练所述深度学习模型。 15.根据权利要求14所述的装置, 其中, 所述融合模块包括: 池化子模块, 用于对所述初始向量特 征图执行池化操作, 得到第一池化特 征图; 加权子模块, 用于利用第一权重对所述第一池化特征图进行处理, 得到加权池化特征 图; 以及 第一融合子模块, 用于根据所述第一池化特征图和所述加权池化特征图, 得到所述融 合特征图。 16.根据权利要求15所述的装置, 其中, 所述第 一权重指示了目标对象的特征的分布概 率。 17.根据权利要求15所述的装置, 其中, 所述增强模块包括: 注意力子模块, 用于根据所述初始向量图和所述第一权 重, 确定注意力特 征图; 选择子模块, 用于确定所述注意力特 征图中, 数值较大的预定数目个元 素; 生成子模块, 用于根据所述预定数目个元 素, 得到增强矩阵; 以及 增强子模块, 用于根据所述增强矩阵和所述样本图像, 确定所述增强图像。 18.根据权利要求17 所述的装置, 其中, 所述选择子模块包括: 选择单元, 用于根据选择阈值, 确定所述预定数目。 19.根据权利要求18所述的装置, 其中, 所述样本图像包括N个样本图像, N为大于1的整 数; 所述装置还 包括:权 利 要 求 书 2/4 页 3 CN 114612743 A 3

.PDF文档 专利 深度学习模型的训练方法、目标对象识别方法和装置

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 深度学习模型的训练方法、目标对象识别方法和装置 第 1 页 专利 深度学习模型的训练方法、目标对象识别方法和装置 第 2 页 专利 深度学习模型的训练方法、目标对象识别方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:22:54上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。