全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210172891.3 (22)申请日 2022.02.24 (71)申请人 北京奕斯伟计算 技术有限公司 地址 100176 北京市大兴区北京经济技 术 开发区科创十街18号院3号楼1层101 室 (72)发明人 邢永鑫 闫俊超 张喆尧  (74)专利代理 机构 北京成创同维知识产权代理 有限公司 1 1449 专利代理师 刘静 (51)Int.Cl. G06V 20/10(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01)G06N 3/04(2006.01) (54)发明名称 目标检测方法、 装置及存 储介质 (57)摘要 本申请公开了一种目标检测方法、 装置及存 储介质。 该目标检测方法包括: 接收目标图像; 将 目标图像输入给注意力特征融合多尺度单发射 击检测AFF ‑SSD网络结构, 以获得多个特征图和 至少一个注意力特征融合 图, AFF‑SSD网络结构 将至少两个特征图进行特征融合得到注意力特 征融合图, AFF‑SSD网络结构以多尺度单发射击 检测SSD基础网络结构为基础构建而成; 以及基 于注意力特征融合图和特征图对目标图像进行 特征识别。 该方法可以实现对小物体目标的精确 检测。 权利要求书3页 说明书9页 附图5页 CN 114596486 A 2022.06.07 CN 114596486 A 1.一种目标检测方法, 其特 征在于, 包括: 接收目标图像; 将所述目标图像输入给注意力特征融合多尺度单发射击检测AFF ‑SSD网络结构, 以获 得多个特征图和 至少一个注意力特征融合图, 所述AFF ‑SSD网络结构将至少两个所述特征 图进行特征融合得到所述注意力特征融合图, 所述AFF ‑SSD网络结构以多尺度单发射击检 测SSD基础网络结构为基础构建而成; 以及 基于所述注意力特 征融合图和所述特 征图对所述目标图像进行 特征识别。 2.根据权利要求1所述的目标检测方法, 其特征在于, 将至少两个所述特征图进行特征 融合得到所述注意力特 征融合图包括: 将Conv4_3层和Fc7层进行 特征融合, 以获得新的Co nv4_3层; 将Fc7层和Co nv8_2层进行 特征融合, 以获得新的Fc7层; 将所述新的Conv4_3层和所述 新的Fc7层分别作为所述注意力特 征融合图。 3.根据权利要求1或2所述的目标检测方法, 其特征在于, 将至少两个所述特征图进行 特征融合的方法包括: 对所述AFF ‑SSD网络结构中的第n个特征图进行处理, 以获得所述第n个特征图的空间 注意力图, n 为自然数; 对所述AFF ‑SSD网络结构中的第n+1个特征 图进行处理, 以获得所述第n+1个特征 图的 通道注意力图; 以及 基于特征增强方法将所述第n个特征图的空间注意力图和所述第n+1个特征图的通道 注意力图进行 特征融合, 以获得初始融合图, 其中, 所述第n个特征图是Conv4_3层输出的特征图, 所述第n+1个特征图是Fc7层输出 的特征图, 或者所述第n个特征图是Fc7层输出的特征图, 所述第n+1个特征图是Conv8_2层 输出的特 征图。 4.根据权利要求3所述的目标检测方法, 其特征在于, 将至少两个所述特征图进行特征 融合的方法还包括: 将所述初始融合图与所述第n个特征图进 行特征融合, 以获得所述注 意 力特征融合图。 5.根据权利要求3所述的目标检测方法, 其特征在于, 获得所述第n个特征图的空间注 意力图的方法包括: 对所述第n个特 征图进行 卷积, 以获得第一矩阵; 对所述第n个特 征图进行 卷积, 以获得第二矩阵; 对所述第一矩阵进行维度重排, 以获得第三矩阵; 对所述第二矩阵进行维度重排和矩阵转置, 以获得第四矩阵; 将所述第三矩阵和第四矩阵相乘, 以得到第一特 征图矩阵; 在列方向上对所述第一特 征图矩阵进行归一 化处理; 以及 对归一化处理后的所述第一特征图矩阵进行维度重排, 以获得所述第n个特征图的空 间注意力图。 6.根据权利要求3所述的目标检测方法, 其特征在于, 获得所述第n+1个特征图的通道 注意力图的方法包括: 对所述第n+1个特 征图进行 卷积, 以获得第五矩阵;权 利 要 求 书 1/3 页 2 CN 114596486 A 2对所述第n+1个特 征图进行 卷积, 以获得第六矩阵; 对所述第五矩阵进行维度重排和矩阵转置, 以获得第七矩阵; 对所述第六矩阵进行维度重排, 以获得第八矩阵; 将所述第七矩阵和第八矩阵相乘, 以得到第二特 征图矩阵; 在列方向上对所述第二特 征图矩阵进行归一 化处理; 以及 对归一化处理后的所述第二特征图矩阵进行维度重排, 以获得所述第n+1个特征图的 通道注意力图。 7.一种目标检测装置, 其特 征在于, 包括: 接收模块, 接收目标图像; 特征提取模块, 将所述目标图像输入给注意力特征融合多尺度单发射击检测AFF ‑SSD 网络结构, 以获得多个特征图和至少一个注意力特征融合图, 所述AFF ‑SSD网络结构将 至少 两个所述特征图进行特征融合得到所述注意力特征融合图, 所述AFF ‑SSD网络结构以多尺 度单发射击检测S SD基础网络结构为基础构建而成; 以及 识别模块, 基于所述注意力特 征融合图和所述特 征图对所述目标图像进行 特征识别。 8.根据权利要求7所述的目标检测装置, 其特征在于, 所述AFF ‑SSD网络结构包括两个 所述注意力特 征融合模块, 其中, 一个注意力特征融合模块将Conv4_3层和Fc7层进行特征融合, 以获得新的 Conv4_3层, 另一个注意力特 征融合模块将Fc7层和Co nv8_2层进行 特征融合, 以获得新的Fc7层, 所述新的Conv4_3层和所述 新的Fc7层分别作为所述注意力特 征融合图。 9.根据权利要求7或8所述的目标检测装置, 其特征在于, 所述注意力特征融合模块包 括: 空间注意力 模块, 对所述AFF ‑SSD网络结构中的第n个特征图进行处理, 以获得所述第n 个特征图的空间注意力图, n 为自然数; 通道注意力模块, 对所述AFF ‑SSD网络结构中的第n+1个特征图进行处理, 以获得所述 第n+1个特 征图的通道 注意力图; 以及 融合模块, 基于特征增强方法将所述第n个特征图的空间注意力图和所述第n+1个特征 图的通道 注意力图进行 特征融合, 以获得初始融合图, 其中, 所述第n个特征图是Conv4_3层输出的特征图, 所述第n+1个特征图是Fc7层输出 的特征图, 或者所述第n个特征图是Fc7层输出的特征图, 所述第n+1个特征图是Conv8_2层 输出的特 征图。 10.根据权利要求8所述的目标检测装置, 其特征在于, 所述注意力特征融合模块还包 括: 拼接模块, 将所述初始融合图与所述第n个特征图进行特征融合, 以获得所述注意力特 征融合图。 11.权利要求9所述的目标检测装置, 其特 征在于, 所述空间注意力模块包括: 第一卷积层, 对所述第n个特 征图进行 卷积, 以获得第一矩阵; 第二卷积层, 对所述第n个特 征图进行 卷积, 以获得第二矩阵; 第一Reshape层, 对所述第一矩阵进行维度重排, 以获得第三矩阵; 第二Reshape层, 对所述第二矩阵进行维度重排和矩阵转置, 以获得第四矩阵;权 利 要 求 书 2/3 页 3 CN 114596486 A 3

.PDF文档 专利 目标检测方法、装置及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 目标检测方法、装置及存储介质 第 1 页 专利 目标检测方法、装置及存储介质 第 2 页 专利 目标检测方法、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:23:07上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。