专利一种基于改进Faster RCNN的目标检测方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 20221049174 4.2 (22)申请日 2022.05.07 (71)申请人上海工程技术大学地址 201620 上海市松江区龙腾路3 33 (72)发明人高玮玮　单明陶　方宇　张海峰　范狄庆　刘欣荣　沙玲　杨皓　 (74)专利代理机构上海唯智赢专利代理事务所 (普通合伙) 31293 专利代理师姜晓艳 (51)Int.Cl. G06V 10/25(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称一种基于改进Faster RCN N的目标检测方法 (57)摘要本发明属于目标识别的技术领域，公开了一种基于改进Faster RCNN的目标检测方法，包括步骤一、将待检图像输入融合注意力机制模块的主干网络，得到不同尺度的初始特征图，再将不同尺度的所述初始特征图输入改进的FPN网络进行深层特征和浅层特征的融合，输出不同尺度的最终特征图；步骤二、利用RPN网络提取不同尺度的最终特征图中的感兴趣区域，再将感兴趣区域通过ROIAlign层映射到不同尺度的最终特征图上，并转化成统一大小，以获取固定尺寸的特征矩阵；步骤三、将所述特征矩阵拉直后输入全连接层，对目标位置进行回归，并用分类器对目标对象进行分类，从而完成目标检测。权利要求书1页说明书6页附图6页 CN 115035290 A 2022.09.09 CN 115035290 A 1.一种基于改进Faster RCNN的目标检测方法，其特征在于包括以下步骤：步骤一、将待检图像输入融合注意力机制模块的主干网络，得到不同尺度的初始特征图，再将不同尺度的所述初始特征图输入改进的FPN网络进行深层特征和浅层特征的融合，输出不同尺度的最终特征图；步骤二、利用RPN网络提取不同尺度的最终特征图中的感兴趣区域，再将感兴趣区域通过ROI Align层映射到不同尺度的最终特征图上，并转化成统一大小，以获取固定尺寸的特征矩阵；步骤三、将所述特征矩阵拉直后输入全连接层，对目标位置进行回归，并用分类器对目标对象进行分类，从而完成目标检测。 2.根据权利要求1所述的基于改进Faster RCNN的目标检测方法，其特征在于：所述主干网络以ResNeXt50网络为基础，在ResNeXt50网络的第2阶段、第3阶段和第4阶段的最后一个残差模块的快捷连接之前嵌入SENet 注意力机制模块。 3.根据权利要求2所述的基于改进Faster RCNN的目标检测方法，其特征在于：所述改进的FPN网络将深层的初始特征图上采样后与浅层的初始特征图进行相加，然后再将浅层的初始特征图下采样后与深层的初始特征图进行相加，经过双向融合方式获得不同尺度的最终特征图。 4.根据权利要求3所述的基于改进Faster RCNN的目标检测方法，其特征在于：选取主干网络的第2阶段、第3阶段、第4阶段和第5阶段的输出作为初始特征图，由浅层至深层依次分别记为C2、 C 3、 C4、 C5，先将初始特征图C2、 C 3、 C4、 C5均经过一个1×1的卷积计算；再将初始特征图C5通过两倍上采样与初始特征图C4进行拼接形成初始特征图C4 ’，将所述特征图C4 ’通过两倍上采样与初始特征图C3进行拼接形成特征图C3 ’，将所述特征图 C3’通过两倍上采样与初始特征图C2进行拼接形成特征图C2’；然后将所述特征图C2 ’通过两倍下采样与特征图C3 ’进行拼接形成特征图C3 ”，将所述特征图C3 ”通过两倍下采样与特征图C4’进行拼接形成特征图C4 ”，将所述特征图C4 ”通过两倍下采样与初始特征图C5进行拼接形成特征图C5”；最后将特征图C2 ’、 C3”、 C4”、 C5”均通过一个3 ×3的卷积输出，得到最终特征图P2、 P3、 P4、 P5。 5.根据权利要求2所述的基于改进Faster RCNN的目标检测方法，其特征在于：所述 ResNeXt50网络的第1阶段包括一个卷积层和一个最大池化层，第2阶段包括三个ResNeXt残差模块，第3阶段包括四个ResNeXt残差模块，第4阶段包括六个ResNeXt残差模块，第5阶段包括三个ResNe Xt残差模块，所述注意力机制模块采用SENet 注意力机制模块。权　利　要　求　书 1/1 页 2 CN 115035290 A 2一种基于改进Fa ster RCNN的目标检测方法技术领域 [0001]本发明属于目标检测的技术领域，具体涉及一种基于改进Faster RCNN的目标检测方法。背景技术 [0002]目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标并确定它们的类别和位置，是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态，加上成像时光照、遮挡等因素的干扰，目标检测一直是计算机视觉领域最具有挑战性的问题。 [0003]在现在流行的目标检测算法中， Faster R‑CNN算法的应用最为广泛，该算法主要通过基础网络如卷积层CNN网络进行特征提取，获得特征图feature map，再借助RPN网络从特征图feature map中提取感兴趣区域ROI，一般可以输出比较精确的300个ROIs，最后把 RPN网络输出的ROIs通过ROI pooling映射到 feature map上进行bbox回归和分类。该算法属于二阶段目标检测算法，检测精度较高且检测速度较快，但Faster R‑CNN算法也存在一些缺点，如仅采用主干网络提取的最后一张特征图进行检测导致目标定位信息较弱； ROI Pooling层的两次量化操作会引入定位误差等，这些缺点会对目标检测的精度造成严重的影响，使其难以得到应用，因此，很有必要改进该算法。发明内容 [0004]本发明提供了一种基于改进Faster RCNN的目标检测方法，解决了现有 Faster RCNN仅使用主干网络最后一张特征图进行检测导致目标定位信息较弱，对细小目标物的检测率较低等技术问题。 [0005]本发明可通过以下技术方案实现： [0006]一种基于改进Faster RCNN的目标检测方法，包括以下步骤： [0007]步骤一、将待检图像输入融合注意力机制模块的主干网络，得到不同尺度的初始特征图，再将不同尺度的所述初始特征图输入改进的FPN网络进行深层特征和浅层特征的融合，输出不同尺度的最终特征图； [0008]步骤二、利用RPN网络提取不同尺度的最终特征图中的感兴趣区域，再将感兴趣区域通过ROI Align层映射到不同尺度的最终特征图上，并转化成统一大小，以获取固定尺寸的特征矩阵； [0009]步骤三、将所述特征矩阵拉直后输入全连接层，对目标位置进行回归，并用分类器对目标对象进行分类，从而完成目标检测。 [0010]进一步，所述主干网络以ResNeXt50网络为基础，在ResNeXt50网络的第2 阶段、第 3阶段和第4阶段的最后一个残差模块的快捷连接之前嵌入SENet 注意力机制模块。 [0011]进一步，所述改进的FPN网络将深层的初始特征图上采样后与浅层的初始特征图进行相加，然后再将浅层的初始特征图下采样后与深层的初始特征图进行相加，经过双向说　明　书 1/6 页 3 CN 115035290 A 3

专利 一种基于改进Faster RCNN的目标检测方法

专利一种基于改进Faster RCNN的目标检测方法