全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210411140.2 (22)申请日 2022.04.19 (71)申请人 合肥综合 性国家科 学中心人工智能 研究院 (安徽省人工智能实验室) 地址 230000 安徽省合肥市望江西路5 089 号, 中国科学技术大学先进技术研究 院未来中心B120 5-B1208 (72)发明人 王福田 陈菲儿 汤进 赵海峰  (74)专利代理 机构 合肥天明专利事务所(普通 合伙) 34115 专利代理师 苗娟 (51)Int.Cl. G06V 20/00(2022.01) G06V 10/40(2022.01) G06V 10/774(2022.01)G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于YOLOv5的尺度 自适应目标检测的方法 及存储介质 (57)摘要 本发明的基于YOLOv5的尺度自适应目标检 测的方法及存储介质, 包括实时采集待测图像, 输入事先构建的目标检测模型中, 计算输出置信 度大于阈值的分类结果作为待测图像的识别结 果; 其中目标检测模型构建包括将获得的样本进 行Mosaic数据增强, 将数据增强后的样本输入模 型网络中, 将切片操作得到的新图片再经过卷积 操作, 然后将得到的特征图送入backbone中, 提 取样本的多层深度特征; 将得到的特征图送入分 层特征自适应融合模块; 将得到的特征继续送入 后续的网络中, 实现网络前向传播以得到目标物 体的边界框信息, 本发明让每个样 本自适应地选 择合适的尺度, 通过自适应融合机制来抑制低质 量通道带来的噪声影响, 以此 实现目标检测的尺 度自适应, 提高目标检测的鲁棒 性。 权利要求书2页 说明书7页 附图3页 CN 114926722 A 2022.08.19 CN 114926722 A 1.一种基于 YOLOv5的尺度自适应目标检测的方法, 其特 征在于, 包括以下步骤, 步骤1: 采集图像, 然后将 样本集按一定比例随机分为训练集和验证集; 步骤2: 将步骤1获得的样本进行Mosaic数据增强, 即随机使用4张图片, 随机缩放, 再随 机分布进行拼接; 步骤3: 将数据增强后的样本输入模型网络中, 首先将样本送入fcous模块, 对图片进行 切片操作, 将切片操作得到的新图片再经过卷积操作, 最终得到了没有信息丢失情况下 的 二倍下采样特 征图, 然后将得到的特 征图送入backbo ne中, 提取样本的多层深度特 征; 步骤4: 将步骤3中得到的特征图送入分层特征自适应融合模块; 先通过三个并行的网 络组成的分层 模块, 三个网络的参数是共享的, 只有空洞卷积的膨胀率不同, 将提取到的多 尺度特征送入自适应融合模块处理; 在经过一个全局平均池化之后每个分支都连接一个全 连接层, 一 起做SoftMax操作, 与每 个分支相乘后再做一个残差连接; 步骤5: 将步骤4中得到的特征继续送入后续的网络中, 实现网络前向传播以得到目标 物体的边界框信息, Y OLOv5检测层在3种不同尺度的特征图上对输入的图像进 行检测, 在每 个尺度上, 每个网络单元使用3种不同长宽比的锚点框预测边界框, 输出的预测信息包括: 边界框中心 坐标、 边界框宽度和高度、 边界框中包含目标物体的置信度, 以及边界框中目标 物体属于某一类的概率; 接着, 设置置信度阈值, 进行非极大值抑制, 取高于置信度阈值的 边界框的并集作为 最终预测的结果; 步骤6: 实时采集待测图像, 输入至步骤5 中所述的目标检测模型中, 计算输出置信度大 于阈值的分类结果作为待测图像的识别结果。 2.根据权利 要求1所述的基于YOLOv5的尺度自适应目标检测的方法, 其特征在于: 步骤 5还包括通过损失函数计算预测的边界框与标记的真实边界框之间的误差, 将误差反向传 播, 更新网络参数, 损失函数如下定义: Loss=Lreg+Lobj+Lcls 其中, A为模型的预测框, B为标注的真实框, C表示包 含A与B的最小凸闭合框; 置信度误差使用交叉熵来表示, S和B代表图片划分成S ×S个网格, 每个网格预测B个候 选框; 和代表第i个网格的第j个候选框是否负责该目标, 表示参数置信度; 当第i个网格的 第j个候选框负责某一个真实目标时, 才会去计算这个候选框所产生的分类损失, 代表分类 概率; 边界框回归损失、 置信度损失和分类损失三 者之和为网络的总损失。权 利 要 求 书 1/2 页 2 CN 114926722 A 23.根据权利 要求1所述的基于YOLOv5的尺度自适应目标检测的方法, 其特征在于: 步骤 1中采用标注工具对图像中的需要检测的目标进行标注, 得到所有感兴趣目标所在的边界 框, 并生成相应的标签文件(class,x,y,w,h), 其中(x,y)为目标所在边界框的中心坐标w,h 分别为边界框的宽和高, clas s表示目标物体的种类。 4.根据权利 要求1所述的基于YOLOv5的尺度自适应目标检测的方法, 其特征在于: 步骤 2中将步骤1 获得的样本进行Mosaic数据增强具体包括: 将样本进行Mosaic数据增强, 即每次读取4张图片, 分别对4张图片进行随机概率的翻 转即对原始图片进行左右的翻转、 缩放即对原始图片进行大小的缩放、 色域变换即对原始 图片的明亮度、 饱和度、 色调进行改变, 操作完成之后然后再将四张原始图片完成摆放之 后, 利用矩阵的方式将四张图片固定的区域截取下来, 然后将它们拼接起来, 拼接成一张新 的分辨率为1600×1600图片。 5.根据权利 要求1所述的基于YOLOv5的尺度自适应目标检测的方法, 其特征在于: 步骤 3中的对图片进行切片操作, 具体操作是在一张图片中每隔一个像素拿到一个值, 类似于邻 近下采样, 这样就拿到了四张图片, 四张图片互补, 将W、 H信息就集中到了通道空间, 输入通 道扩充了4 倍, 即拼接起 来的图片相对于原先的RGB三 通道模式变成了12个通道。 6.一种计算机可读存储介质, 存储有计算机程序, 所述计算机程序被处理器执行时, 使 得所述处理器执行如权利要求1至 5中任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114926722 A 3

.PDF文档 专利 基于YOLOv5的尺度自适应目标检测的方法及存储介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于YOLOv5的尺度自适应目标检测的方法及存储介质 第 1 页 专利 基于YOLOv5的尺度自适应目标检测的方法及存储介质 第 2 页 专利 基于YOLOv5的尺度自适应目标检测的方法及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:36:59上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。