全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221049174 4.2 (22)申请日 2022.05.07 (71)申请人 上海工程 技术大学 地址 201620 上海市松江区龙腾路3 33 (72)发明人 高玮玮 单明陶 方宇 张海峰  范狄庆 刘欣荣 沙玲 杨皓  (74)专利代理 机构 上海唯智赢专利代理事务所 (普通合伙) 31293 专利代理师 姜晓艳 (51)Int.Cl. G06V 10/25(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称 一种基于改进Faster RCN N的目标检测方法 (57)摘要 本发明属于目标识别的技术领域, 公开了一 种基于改进Faster  RCNN的目标检测方法, 包括 步骤一、 将待检图像输入融合注 意力机制模块的 主干网络, 得到不同尺度的初始特征图, 再将不 同尺度的所述初始特征图输入改进的FPN网络进 行深层特征和浅层特征的融合, 输出不同尺度的 最终特征图; 步骤二、 利用RPN网络提取不同尺度 的最终特征图中的感兴趣区域, 再将感兴趣区域 通过ROIAlign层映射到不同尺度的最终特征图 上, 并转化成统一大小, 以获取固定尺寸的特征 矩阵; 步骤三、 将所述特征矩阵拉直后输入全连 接层, 对目标位置进行回归, 并用分类器对目标 对象进行分类, 从而完成目标检测。 权利要求书1页 说明书6页 附图6页 CN 115035290 A 2022.09.09 CN 115035290 A 1.一种基于改进Faster  RCNN的目标检测方法, 其特 征在于包括以下步骤: 步骤一、 将待检图像输入融合注意力机制模块的主干网络, 得到不同尺度的初始特征 图, 再将不同尺度的所述初始特征图输入改进的FPN网络进 行深层特征和浅层特征的融合, 输出不同尺度的最终特 征图; 步骤二、 利用RPN网络提取不同尺度的最终特征图中的感兴趣区域, 再将感兴趣区域通 过ROI Align层映射到不同尺度的最终特征图上, 并转化 成统一大小, 以获取固定尺 寸的特 征矩阵; 步骤三、 将所述特征矩阵拉直后输入全连接层, 对目标位置进行回归, 并用分类器对目 标对象进行分类, 从而完成目标检测。 2.根据权利要求1所述的基于改进Faster  RCNN的目标检测方法, 其特征在于: 所述主 干网络以ResNeXt50网络为基础, 在ResNeXt50网络的第2阶段、 第3阶段和第4阶段的最后一 个残差模块的快捷连接之前嵌入SENet 注意力机制模块。 3.根据权利要求2所述的基于改进Faster  RCNN的目标检测方法, 其特征在于: 所述改 进的FPN网络将深层的初始特征图上采样后与浅层的初始特征图进行相加, 然后再将浅层 的初始特征图下采样后与深层的初始特征图进行相加, 经过双向融合方式获得不同尺度的 最终特征图。 4.根据权利要求3所述的基于改进Faster  RCNN的目标检测方法, 其特征在于: 选取主 干网络的第2阶段、 第3阶段、 第4阶段和第5阶段的输出作为初始特征图, 由浅层至深层依次 分别记为C2、 C 3、 C4、 C5, 先将初始特 征图C2、 C 3、 C4、 C5均经过一个1×1的卷积计算; 再将初始特征图C5通过两倍上采样与初始特征图C4进行拼接形成初始特征图C4 ’, 将 所述特征图C4 ’通过两倍上采样与初始特征图C3进行拼接形成特征图C3 ’, 将所述特征图 C3’通过两倍上采样与初始特 征图C2进行拼接形成特 征图C2’; 然后将所述特征图C2 ’通过两倍下采样与特征图C3 ’进行拼接形成特征图C3 ”, 将所述 特征图C3 ”通过两倍下采样与特征图C4’进行拼接形成特征图C4 ”, 将所述特征图C4 ”通过两 倍下采样与初始特 征图C5进行拼接形成特 征图C5”; 最后将特征图C2 ’、 C3”、 C4”、 C5”均通过一个3 ×3的卷积输出, 得到最终特征图P2、 P3、 P4、 P5。 5.根据权利要求2所述的基于改进Faster  RCNN的目标检测方法, 其特征在于: 所述 ResNeXt50网络的第1阶段包括一个卷积层和一个最大池化层, 第2阶段包括三个ResNeXt残 差模块, 第3阶段包括四个ResNeXt残差模块, 第4阶段包括六个ResNeXt残差模块, 第5阶段 包括三个ResNe Xt残差模块, 所述注意力机制模块采用SENet 注意力机制模块。权 利 要 求 书 1/1 页 2 CN 115035290 A 2一种基于改进Fa ster RCNN的目标检测方法 技术领域 [0001]本发明属于目标检测的技术领域, 具体涉及一种基于改进Faster  RCNN的目标检 测方法。 背景技术 [0002]目标检测(Object  Detection)的任务是找出图像中所有感兴趣的目标并确定它 们的类别和位置, 是计算机视觉领域的核心问题之一。 由于各类物体有不同的外观、 形状和 姿态, 加上成像时光照、 遮挡等因素的干扰, 目标检测一直是计算机视觉领域最具有挑战性 的问题。 [0003]在现在流行的目标检测 算法中, Faster  R‑CNN算法的应用最为广泛, 该算法主要 通过基础网络如卷积层CNN网络进行特征提取, 获得特征图feature  map, 再借助RPN网络从 特征图feature  map中提取感兴趣区域ROI, 一般可以输出比较精确的300个ROIs, 最后把 RPN网络输 出的ROIs通过ROI  pooling映射到  feature map上进行bbox回归和分类。 该算法 属于二阶段目标检测算法, 检测精度较高且检测速度较快, 但Faster  R‑CNN算法也存在一 些缺点, 如仅采用主干网络提取的最后一张特征图进行检测导致目标定位信息较弱; ROI   Pooling层的两次量化操作会引入定位误差等, 这些缺点会对目标检测的精度造成严重的 影响, 使其难以得到应用, 因此, 很有必要改进该算法。 发明内容 [0004]本发明提供了一种基于改进Faster  RCNN的目标检测方法, 解决了现有  Faster  RCNN仅使用主干网络最后一张特征图进 行检测导致目标定位信息较弱, 对细 小目标物的检 测率较低等 技术问题。 [0005]本发明可通过以下技 术方案实现: [0006]一种基于改进Faster  RCNN的目标检测方法, 包括以下步骤: [0007]步骤一、 将待检图像输入融合注意力机制模块的主干网络, 得到不同尺度的初始 特征图, 再将不同尺度的所述初始特征图输入 改进的FPN网络进行深层特征和浅层特征 的 融合, 输出不同尺度的最终特 征图; [0008]步骤二、 利用RPN网络提取不同尺度的最终特征图中的感兴趣区域, 再将感兴趣区 域通过ROI  Align层映射到不同尺度的最终特征图上, 并转化 成统一大小, 以获取固定尺 寸 的特征矩阵; [0009]步骤三、 将所述特征矩阵拉直后输入全连接层, 对目标位置进行回归, 并用分类器 对目标对象进行分类, 从而完成目标检测。 [0010]进一步, 所述主干网络以ResNeXt50网络为基础, 在ResNeXt50网络的第2  阶段、 第 3阶段和第4阶段的最后一个残差模块的快捷连接之前嵌入SENet 注意力机制模块。 [0011]进一步, 所述改进的FPN网络将深层的初始特征图上采样后与浅层的初始特征 图 进行相加, 然后再将浅层的初始特征图下采样后与深层的初始特征图进行相加, 经过双向说 明 书 1/6 页 3 CN 115035290 A 3

.PDF文档 专利 一种基于改进Faster RCNN的目标检测方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于改进Faster RCNN的目标检测方法 第 1 页 专利 一种基于改进Faster RCNN的目标检测方法 第 2 页 专利 一种基于改进Faster RCNN的目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:33:17上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。