全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210672873.1 (22)申请日 2022.06.14 (71)申请人 浙江大华 技术股份有限公司 地址 310051 浙江省杭州市滨江区滨安路 1187号 (72)发明人 肖丰 吴立 周祥明 黄鹏 张朋  蔡丹平  (74)专利代理 机构 深圳市威世博知识产权代理 事务所(普通 合伙) 44280 专利代理师 严翠霞 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06N 20/00(2019.01) (54)发明名称 一种模型蒸馏方法、 目标检测方法及相关设 备 (57)摘要 本申请公开了一种模 型蒸馏方法、 目标检测 方法及相关设备, 该方法包括: 获取教师模型与 学生模型; 获取样本图像, 并将样本图像输入教 师模型, 得到第一输出结果, 第一输出结果包括 样本图像中每个目标对象 的第一检测 信息; 将样 本图像输入学生模型, 得到第二输出结果, 第二 输出结果包括样本图像中每个目标对象的第二 检测信息; 基于至少两个目标对象的第一检测信 息与相应的第二检测 信息, 计算出类间注意力一 致性损失; 基于类间注意力一致性损失, 计算学 生模型的当前损失值; 基于当前损失值学生模型 进行更新。 通过上述方式, 本申请能够提升学生 模型的性能。 权利要求书4页 说明书9页 附图4页 CN 115273136 A 2022.11.01 CN 115273136 A 1.一种模型蒸馏方法, 其特 征在于, 包括: 获取教师模型与学生模型; 获取样本图像, 并将所述样本图像输入所述教师模型, 得到第一输出结果, 所述第一输 出结果包括所述样本图像中每 个目标对象的第一检测信息; 将所述样本 图像输入所述学生模型, 得到第二输出结果, 所述第二输出结果包括所述 样本图像中每 个目标对象的第二检测信息; 基于至少两个所述目标对象的第 一检测信 息与相应的第 二检测信 息, 计算出类间注意 力一致性损失; 基于所述类间注意力一 致性损失, 计算所述学生模型的当前损失值; 基于所述当前损失值所述学生模型进行 更新。 2.根据权利要求1所述的模型蒸馏方法, 其特征在于, 所述基于至少两个所述目标对象 的第一检测信息与相应的第二检测信息, 计算出类间注意力一 致性损失的步骤, 包括: 获取所述样本图像对应的标签数据; 基于所述标签数据, 生成第一配对结果与第二配对结果; 基于所述第 一配对结果, 从所述第 一输出结果中挑选出至少两个目标对象的第 一检测 信息, 得到第一 候选检测信息集; 基于所述第 二配对结果, 从所述第 二输出结果中挑选出与所述第 一候选检测信 息集中 的第一检测信息对应的第二检测信息, 得到第二 候选检测信息集; 基于所述第 一候选检测信 息集与所述第二候选检测信 息集, 生成所述类间注意力一致 性损失。 3.根据权利要求2所述的模型蒸馏方法, 其特征在于, 所述标签数据包括所述样本图像 中的每个目标对 象的标注框, 所述第一检测信息包括所述 目标对象的第一检测框, 所述第 二检测信息包括所述 目标对象的第二检测框, 所述基于所述标签数据, 生成第一配对结果 与第二配对结果的步骤, 包括: 将所述目标对象的标注框与所述第一检测框进行匹配, 得到所述第一配对结果, 所述 第一配对结果包括所述标注框以及与所述标注框匹配的第一检测框; 将所述目标对象的标注框与所述第二检测框进行匹配, 得到所述第二配对结果, 所述 第二配对结果包括所述标注框以及与所述标注框匹配的第二检测框 。 4.根据权利要求2所述的模型蒸馏方法, 其特征在于, 所述第 一检测信 息还包括所述目 标对象的第一特征信息, 所述第二检测信息还包括所述 目标对象的第二特征信息, 所述从 所述第一输出结果中挑选出至少两个目标对象的第一检测信息, 得到第一候选检测信息集 的步骤之前, 还 包括: 从所述标签数据中选取至少两个标注框, 得到标注框集; 所述从所述第 一输出结果中挑选出至少两个目标对象的第 一检测信 息, 得到第 一候选 检测信息集的步骤, 包括: 从所述第一配对结果中选取与所述标注框集中的标注框匹配的第 一检测框, 得到第 一 候选检测框集; 将所述第一候选检测框集中的第 一检测框对应的第 一特征信 息输入第 一注意力模型, 得到第三特 征信息;权 利 要 求 书 1/4 页 2 CN 115273136 A 2将所述第一候选检测框集中的每个第一检测框以及相应的第三特征信息放入所述第 一候选检测信息集; 所述从所述第二输出结果中挑选出与所述第一候选检测信息集中的第一检测信息对 应的第二检测信息, 得到第二 候选检测信息集的步骤, 包括: 从所述第二配对结果中选取与所述标注框集中的标注框匹配的第 二检测框, 得到第 二 候选检测框集; 将所述第二候选检测框集中的第二检测框对应的第二特征信息输入所述第一注意力 模型, 得到第四特 征信息, 所述第四特 征信息与所述第三特 征信息的维度相同; 将所述第二候选检测框集中的每个第二检测框以及相应的第四特征信息放入所述第 二候选检测信息集。 5.根据权利要求4所述的模型蒸馏方法, 其特征在于, 所述基于所述第 一候选检测信 息 集与所述第二 候选检测信息集, 生成所述类间注意力一 致性损失的步骤, 包括: 从所述第一候选检测信 息集中选出两个第 三特征信 息, 得到第 一候选特征信 息与第二 候选特征信息; 计算所述第 一候选特征信 息与第二候选特征信 息的差异, 得到第 一类间注意力 差异信 息; 从所述第二候选检测信 息集中选出与所述第 一候选特征信 息对应的第四特征信 息, 得 到第三候选特征信息; 从所述第二候选检测信息集中选出与所述第二候选特征信息对应的 第四特征信息, 得到第四候选特 征信息; 计算所述第 三候选特征信 息与所述第四候选特征信 息的差异, 得到第 二类间注意力 差 异信息; 基于所述第 一类间注意力 差异信息与所述第 二类间注意力 差异信息, 计算出所述类间 注意力一 致性损失。 6.根据权利要求5所述的模型蒸馏方法, 其特征在于, 所述基于所述第 一类间注意力 差 异信息与所述第二类间注意力差异信息, 计算出 所述类间注意力一 致性损失的步骤, 包括: 在所述第一候选检测信 息集中第 一特征信 息的数量为预设值 时, 计算所述第 一类间注 意力差异信息与所述第二类间注意力差异信息的差异, 得到所述类间注意力一 致性损失。 7.根据权利要求5所述的模型蒸馏方法, 其特征在于, 所述基于所述第 一类间注意力 差 异信息与所述第二类间注意力差异信息, 计算出所述类间注意力一致性损失的步骤, 还包 括: 在所述第一候选检测信 息集中第 一特征信 息的数量大于预设值 时, 计算所述第 一类间 注意力差异信息与每个所述第二类间注意力差异信息的差异, 得到多个子类间注意力损 失; 计算所述多个子类间注意力损失的平均值, 得到所述类间注意力一 致性损失。 8.根据权利要求3所述的模型蒸馏方法, 其特征在于, 所述将所述目标对象的标注框与 所述第一检测框进行匹配, 得到所述第一配对结果的步骤, 包括: 计算所述目标对象的标注框与每 个所述第一检测框的交并比, 得到多个第一并比; 计算所述多个第一并比的最大值, 并在所述最大值大于第一预设阈值时, 确定所述最 大值对应的第一检测框与所述标注框匹配;权 利 要 求 书 2/4 页 3 CN 115273136 A 3

PDF文档 专利 一种模型蒸馏方法、目标检测方法及相关设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种模型蒸馏方法、目标检测方法及相关设备 第 1 页 专利 一种模型蒸馏方法、目标检测方法及相关设备 第 2 页 专利 一种模型蒸馏方法、目标检测方法及相关设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:43:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。