专利一种基于特征增强的复杂场景下小目标检测方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 20221078021 1.6 (22)申请日 2022.07.04 (71)申请人西安邮电大学地址 710121 陕西省西安市长安区西安邮电大学南校区计算机学院 (72)发明人潘晓英　贾凝心　王昊　丁雅眉　 (74)专利代理机构西安新思维专利商标事务所有限公司 61 114 专利代理师李凤鸣 (51)Int.Cl. G06V 20/13(2022.01) G06V 10/80(2022.01) G06V 10/75(2022.01) G06V 10/776(2022.01) G06V 10/82(2022.01) (54)发明名称一种基于特征增强的复杂场景下小目标检测方法 (57)摘要本发明属于计算机视觉和目标检测领域，具体涉及一种基于特征增强的复杂场景下小目标检测方法。本发明的技术方案是：首先提出 Cutout‑DA数据增强方法，生成新的遮挡数据扩充至VisDrone2021数据集中，然后设计多尺度融合的特征增强路径聚合网络MSFE ‑PANet，通过集成注意机制、特征融合以及针对小目标的网络预测尺度策略，获取到更丰富、细致的语义信息特征和空间信息特征，设计预测框排斥损失函数 RB_Loss，最后训练模型。本发明可以增强深层特征图的强定位信息与浅层特征图的强语义信息相互融合，帮助网络在复杂场景中找到感兴趣区域，提高对小目标的敏感度。并设计RB_Lo ss排斥损失函数、网络预测尺度解决复杂背景下重叠、遮挡小目标的漏检、误检的问题。权利要求书2页说明书6页附图4页 CN 115063691 A 2022.09.16 CN 115063691 A 1.一种基于特征增强的复杂场景下小目标检测方法,包括以下步骤步骤1、数据准备：数据集来源于航拍图像；步骤2、数据增强：提出Cutout ‑DA数据增强方法，该方法首先在数据集中任意选取部分数据图像，然后通过对这些图像中的可见部分目标和全部目标，随机地按照目标大小比例的0.2、 0.4、 0.6、 0.8进行部分位置的遮挡，生成新的遮挡数据扩充至VisDrone2021数据集中；步骤3、设计多尺度融合的特征增强路径聚合网络 MSFE‑PANet；步骤3.1：改进网络预测尺度在YOLOv4中移除针对检测大目标预测头YOLO head3，但保留其所对应的13*13的特征图；同时，在预测网络中增加了由浅层高分辨率的特征图104*104生成的针对检测小尺度目标的预测头 YOLO head0,生成新的网络预测尺度结构；步骤3.2：特征层融合在新的网络预测尺度结构上将每一层特征网络提取的特征图进行相应倍数上采样分别与第一层特征图相加融合得到新的特征图；步骤3.3：引入注意力模块；步骤4：设计预测框排斥损失函数RB_L oss；步骤5：训练模型。 2.根据权利要求1所述的一种基于特征增强的复杂场景下小目标检测方法,其特征在于：所述步骤3.3具体包括步骤3.3.1：添加CBAM注意力模块，如公式(1)所示；通道注意力的计算公式为(2)：其中σ 为Sigmo id激活函数， MLP权重W0和W1是共享的空间注意力的计算公式为(3)：其中σ 为Sigmo id激活函数， f7*7表示7*7的滤波器；步骤3.3.2：改进CBAM的通道注意力模块；步骤3.3.3：引入SE ‑attention注意力模块；步骤3.3.4：改进S PP模块；步骤3.3.5：优化SE ‑attention注意力模块。 3.根据权利要求2所述的一种基于特征增强的复杂场景下小目标检测方法,其特征在于：所述步骤3.3.2，计算公式定义为(4) 4.根据权利要求3所述的一种基于特征增强的复杂场景下小目标检测方法,其特征在权　利　要　求　书 1/2 页 2 CN 115063691 A 2于：所述步骤3.3.3，给定一个输入 X,通道数为C1,经过Ftr的一系列卷积、池化操作得到通道数为C2的特征U； Fsq为特征压缩操作，顺着空间维度进行特征压缩，并将每个二维的特征通道变成一个像素；接着进行 Fex激励操作，然后通过乘法加权到之前的特征上计算公式(5)：其中： UC表示特征图中的第C个通道； ZC为压缩操作的输出，计算公式(6):σ 为Sigmoid激活函数； W1,W2均为全连接操作； δ 为ReLU激活函数，计算公式(7): SC为步长S中的第C个权重； S＝Fex(Z,W)＝σ(g(Z,W) )＝σ(W2δ(W1Z)) (6) Fscale＝(UC,SC)＝SC·UC (7)。 5.根据权利要求4所述的一种基于特征增强的复杂场景下小目标检测方法,其特征在于：所述步骤3.3.4具体为将SPP中的1*1， 5*5， 9*9和13*13尺寸内核的池化层改为1*1卷积和3*3空洞卷积，改进的SPP模块不会改变特征图的尺寸，输出特征图尺寸计算公式为(8) 6.根据权利要求5所述的一种基于特征增强的复杂场景下小目标检测方法,其特征在于：所述步骤3.3.5具体为在SE‑attention中加入改进的S PP模块，得到S SE‑attention注意力模块。 7.根据权利要求2 ‑6任意一个权利要求所述的一种基于特征增强的复杂场景下小目标检测方法,其特征在于：所述步骤4具体为把两个重叠目标的先验预测框之间的重叠度IOU作为损失的值，反向传播网络会按照梯度方向进行优化，将两个目标的重叠先验预测框分离，定义为(9)公式中和表示不同目标框匹配的先验预测框权　利　要　求　书 2/2 页 3 CN 115063691 A 3

专利 一种基于特征增强的复杂场景下小目标检测方法

专利一种基于特征增强的复杂场景下小目标检测方法