全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221086172 2.0 (22)申请日 2022.07.20 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 邹智康 叶晓青 孙昊  (74)专利代理 机构 北京市汉坤律师事务所 11602 专利代理师 姜浩然 吴丽丽 (51)Int.Cl. G06T 7/00(2017.01) G06V 10/82(2022.01) G06V 10/80(2022.01) (54)发明名称 图像检测方法、 装置、 电子设备和存 储介质 (57)摘要 本公开提供了一种图像检测方法、 装置、 电 子设备和存储介质, 涉及人工智 能技术领域, 具 体涉及图像处理、 计算机视觉和深度学习等技术 领域, 尤其涉及3D视觉、 虚拟现实等场景。 实现方 案为: 获取目标图像, 目标图像包括目标对象; 获 得目标图像的对应于多个尺度的多个特征图; 基 于多个特征图, 获得多尺度融合特征; 以及基于 多尺度融合特征, 获得目标对象的检测结果, 检 测结果指示目标对象的三维空间信息 。 权利要求书3页 说明书10页 附图5页 CN 115511779 A 2022.12.23 CN 115511779 A 1.一种图像 检测方法, 包括: 获取目标图像, 所述目标图像包括目标对象; 将所述目标图像输入至包含多个卷积层的卷积网络, 以所述多个卷积层中的每一个卷 积层的输出; 基于所述多个卷积层的多个输出, 获得所述目标图像的对应于多个尺度的多个特征 图; 基于所述多个特 征图, 获得多尺度融合特 征; 以及 基于所述多尺度融合特征, 获得所述目标对象的检测结果, 所述检测结果指示所述目 标对象的三维空间信息 。 2.根据权利要求1所述的方法, 其中, 所述多个输出中的每一个输出对应于多个通道, 所述基于所述多个卷积层的多个输出, 获得 所述多个特 征图包括: 针对所述多个输出中的每一个输出, 获得与该输出相应的对应于多个通道中的每一个 通道的权 重; 针对所述多个输出中的每一个输出, 基于该输出对应于多个通道的多个权重, 获得经 更新的输出; 以及 基于所述多个输出对应的多个经 更新的输出, 获得 所述多个特 征图。 3.根据权利要求1所述的方法, 其中, 所述卷积网络是采用包含训练图像的训练图像集 进行训练而获得的, 所述训练图像集还包括将所述训练图像的尺寸进 行缩放后获得的多个 其他训练图像。 4.根据权利要求2所述的方法, 其中, 所述获得与 该输出相应的对应于多个通道中的每 一个通道的权 重包括: 将该输出输入全局池化网络, 以获得第一特征, 所述全局池化网络用于聚合该输出中 的空间维度的信息; 以及 基于所述第一特 征, 获得所述输出对应的多个通道中的每一 通道的权 重。 5.根据权利要求1所述的方法, 其中, 所述基于所述多个特征图, 获得多尺度融合特征 包括: 将所述多个特征图中的每一个特征图的尺度调 整至第一尺度, 所述第 一尺度不小于所 述多个尺度中的最大尺度; 以及 将所述多个特征图对应的多个调 整后的特征图进行特征融合, 以获得所述多尺度融合 特征。 6.根据权利要求5所述的方法, 其中, 所述将所述多个特征图对应的多个调 整后的特征 进行特征融合包括: 将所述多个调整后的特 征在通道方向上堆叠 。 7.根据权利要求1所述的方法, 其中, 所述基于所述多尺度融合特征, 获得所述目标对 象的检测结果包括: 将所述多尺度融合特 征输入至特 征提取网络, 以获得第二特 征; 以及 基于所述第二特 征, 获得所述检测结果。 8.根据权利要求1所述的方法, 其中, 所述三维空间信息包括位置信息、 三维空间尺寸 信息或者朝向角信息 。权 利 要 求 书 1/3 页 2 CN 115511779 A 29.一种图像 检测装置, 包括: 图像获取 单元, 被配置用于获取目标图像, 所述目标图像包括目标对象; 图像输入单元, 被配置用于将所述目标图像输入至包含多个卷积层的卷积网络, 以所 述多个卷积层中的每一个卷积层的输出; 特征图获取单元, 被配置用于基于所述多个卷积层的多个输出, 获得所述目标图像的 对应于多个尺度的多个特 征图; 融合特征获取单元, 被配置用于基于所述多个特 征图, 获得多尺度融合特 征; 以及 检测结果获取单元, 被配置用于基于所述多尺度融合特征, 获得所述目标对象的检测 结果, 所述检测结果指示所述目标对象的三维空间信息 。 10.根据权利要求9所述的装置, 其中, 所述多个输出中的每一个输出对应于多个通道, 所述特征图获取子单 元包括: 权重获取单元, 被配置用于针对所述多个输出中的每一个输出, 获得与该输出相应的 对应于多个通道中的每一个通道的权 重; 更新单元, 被配置用于针对所述多个输出中的每一个输出, 基于该输出对应于多个通 道的多个权 重, 获得经更新的输出; 以及 第一获取子单元, 被配置用于基于所述多个输出对应的多个经更新的输出, 获得所述 多个特征图。 11.根据权利要求9所述的装置, 其中, 所述卷积网络是采用包含训练图像的训练图像 集进行训练而获得的, 所述训练图像集还包括将所述训练图像的尺寸进 行缩放后获得的多 个其他训练图像。 12.根据权利要求10所述的装置, 其中, 所述权 重获取单元包括: 池化单元, 被配置用于将该输出输入全局池化网络, 以获得第一特征, 所述全局池化网 络用于聚合该输出中的空间维度的信息; 以及 第二获取子单元, 被配置用于基于所述第一特征, 获得所述输出对应的多个通道中的 每一通道的权 重。 13.根据权利要求9所述的装置, 其中, 所述融合特 征获取单元包括: 尺度调整单元, 被配置用于将所述多个特征图中的每一个特征图的尺度调 整至第一尺 度, 所述第一尺度不小于所述多个尺度中的最大尺度; 以及 融合单元, 被配置用于将所述多个特征图对应的多个调整后的特征图进行特征融合, 以获得所述多尺度融合特 征。 14.根据权利要求13所述的装置, 其中, 所述融合单 元包括: 堆叠单元, 被配置用于将所述多个调整后的特 征在通道方向上堆叠 。 15.根据权利要求9所述的装置, 其中, 所述检测结果获取 单元包括: 特征提取单元, 被配置用于将所述多尺度融合特征输入至特征提取网络, 以获得第二 特征; 以及 第三获取子单 元, 被配置用于基于所述第二特 征, 获得所述检测结果。 16.根据权利要求9所述的装置, 其中, 所述三维空间信 息包括位置信 息、 三维空间尺寸 信息或者朝向角信息 。 17.一种电子设备, 包括:权 利 要 求 书 2/3 页 3 CN 115511779 A 3

.PDF文档 专利 图像检测方法、装置、电子设备和存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像检测方法、装置、电子设备和存储介质 第 1 页 专利 图像检测方法、装置、电子设备和存储介质 第 2 页 专利 图像检测方法、装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:29:02上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。