(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 20221078021 1.6
(22)申请日 2022.07.04
(71)申请人 西安邮电大 学
地址 710121 陕西省西安市长安区西安邮
电大学南校区计算机学院
(72)发明人 潘晓英 贾凝心 王昊 丁雅眉
(74)专利代理 机构 西安新思维专利商标事务所
有限公司 61 114
专利代理师 李凤鸣
(51)Int.Cl.
G06V 20/13(2022.01)
G06V 10/80(2022.01)
G06V 10/75(2022.01)
G06V 10/776(2022.01)
G06V 10/82(2022.01)
(54)发明名称
一种基于特征增强的复杂场景下小目标检
测方法
(57)摘要
本发明属于计算机视觉和目标检测领域, 具
体涉及一种基于特征增强的复杂场景下小目标
检测方法。 本发明的技术方案是: 首先提出
Cutout‑DA数据增强方法, 生成新的遮挡数据扩
充至VisDrone2021数据集中, 然后设计多尺度融
合的特征增强路径聚合网络MSFE ‑PANet, 通过集
成注意机制、 特征融合以及针对小目标的网络预
测尺度策略, 获取到更丰富、 细致的语义信息特
征和空间信息特征, 设计预测框排斥损失函数
RB_Loss, 最后训练模型。 本发明可以增强深层特
征图的强定位信息与浅层特征图的强语义信息
相互融合, 帮助网络在复杂场景中找到感兴趣区
域, 提高对小目标的敏 感度。 并设计RB_Lo ss排斥
损失函数、 网络预测尺度解决复杂背景下重叠、
遮挡小目标的漏检、 误检的问题。
权利要求书2页 说明书6页 附图4页
CN 115063691 A
2022.09.16
CN 115063691 A
1.一种基于特 征增强的复杂场景 下小目标检测方法,包括以下步骤
步骤1、 数据准备: 数据集 来源于航拍图像;
步骤2、 数据增强: 提出Cutout ‑DA数据增强方法, 该方法首先在 数据集中任意选取部分
数据图像, 然后通过对这些图像中的可见部分目标和全部目标, 随机地按照目标大小比例
的0.2、 0.4、 0.6、 0.8进行部分位置的遮挡, 生成新的遮挡数据扩充至VisDrone2021数据集
中;
步骤3、 设计多尺度融合的特 征增强路径聚合网络 MSFE‑PANet;
步骤3.1: 改进网络预测尺度
在YOLOv4中移除针对检测大目标预测头YOLO head3, 但保留其所对应的13*13的特征
图; 同时, 在预测网络中增加了由浅层高分辨率的特征图104*104生 成的针对检测小尺度目
标的预测头 YOLO head0,生成新的网络预测尺度结构;
步骤3.2: 特 征层融合
在新的网络预测尺度结构上将每一层特征网络提取的特征图进行相应倍数上采样分
别与第一层特 征图相加融合得到新的特 征图;
步骤3.3: 引入注意力模块;
步骤4: 设计预测框排斥损失函数RB_L oss;
步骤5: 训练模型。
2.根据权利要求1所述的一种基于特征增强的复杂场景下小目标检测方法,其特征在
于: 所述步骤3.3具体包括
步骤3.3.1: 添加CBAM注意力模块, 如公式(1)所示;
通道注意力的计算公式为(2): 其中σ 为Sigmo id激活函数, MLP权 重W0和W1是共享的
空间注意力的计算公式为(3): 其中σ 为Sigmo id激活函数, f7*7表示7*7的滤波器;
步骤3.3.2: 改进CBAM的通道 注意力模块;
步骤3.3.3: 引入SE ‑attention注意力模块;
步骤3.3.4: 改进S PP模块;
步骤3.3.5: 优化SE ‑attention注意力模块。
3.根据权利要求2所述的一种基于特征增强的复杂场景下小目标检测方法,其特征在
于: 所述步骤3.3.2, 计算公式定义 为(4)
4.根据权利要求3所述的一种基于特征增强的复杂场景下小目标检测方法,其特征在权 利 要 求 书 1/2 页
2
CN 115063691 A
2于: 所述步骤3.3.3, 给定一个输入 X,通道数为C1,经过Ftr的一系列卷积、 池化操作得到通道
数为C2的特征U; Fsq为特征压缩操作, 顺着空间维度进行特征压缩, 并将每个二维的特征通
道变成一个 像素; 接着进行 Fex激励操作, 然后通过乘法加权 到之前的特 征上
计算公式(5):
其中: UC表示特征图中的第C个通道; ZC为压缩操作的输出, 计算公式(6):σ 为Sigmoid激
活函数; W1,W2均为全连接操作; δ 为ReLU激活函数, 计算公式(7): SC为步长S中的第C个权 重;
S=Fex(Z,W)=σ(g(Z,W) )=σ(W2δ(W1Z)) (6)
Fscale=(UC,SC)=SC·UC (7)。
5.根据权利要求4所述的一种基于特征增强的复杂场景下小目标检测方法,其特征在
于: 所述步骤3.3.4具体为
将SPP中的1*1, 5*5, 9*9和13*13尺寸内核的池化层改为1*1卷积和3*3空洞卷积, 改进
的SPP模块不会改变特 征图的尺寸, 输出 特征图尺寸计算公式为(8)
6.根据权利要求5所述的一种基于特征增强的复杂场景下小目标检测方法,其特征在
于: 所述步骤3.3.5具体为
在SE‑attention中加入改进的S PP模块, 得到S SE‑attention注意力模块。
7.根据权利要求2 ‑6任意一个权利要求所述的一种基于特征增强的复杂场景下小目标
检测方法,其特 征在于: 所述 步骤4具体为
把两个重叠目标的先验预测框之间的重叠度IOU作为损失的值, 反向传播网络会按照
梯度方向进 行优化, 将两个目标的重叠先验预测框 分离, 定义为(9)公式中和表示不同目标
框匹配的先验预测框
权 利 要 求 书 2/2 页
3
CN 115063691 A
3
专利 一种基于特征增强的复杂场景下小目标检测方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:27:04上传分享