全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210865756.7 (22)申请日 2022.07.22 (71)申请人 北京交通大 学 地址 100044 北京市海淀区上园村 3号 (72)发明人 丛润民 黄可 吴春雷 白慧慧  赵耀  (74)专利代理 机构 北京卫平智业专利代理事务 所(普通合伙) 11392 专利代理师 闫萍 (51)Int.Cl. G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于多投影表征的全景图像显著性目 标检测方法 (57)摘要 本发明涉及一种基于多投影表征的全景图 像显著性目标检测方法, 构建一个编码器 ‑解码 器结构的端到端检测网络, 将等矩形投影图像和 相应的四个立方体展开图像共同作为检测网络 的输入; 在编码器阶段, 等矩形投影分支和立方 体展开分支通过共享参数的五十层深度残差网 络ResNet ‑50提取特征; 在解码器阶段, 动态加权 融合模块自适应地融合等矩形投影特征和四种 立方体展开特征, 过滤与细化模块结合编码与解 码特征, 得到最终的显著性图。 本发明, 检测网络 结合等矩形投影与立方体展开两种全景图像的 表征方式, 将等矩形投影图像和相应的四个立方 体展开图像作为共同输入, 其中, 立方体展开图 像为等矩形 投影图像提供补 充信息, 确保目标的 完整性。 权利要求书3页 说明书11页 附图1页 CN 115424100 A 2022.12.02 CN 115424100 A 1.一种基于多投影表征的全景图像显著性目标检测方法, 其特征在于, 构建一个编码 器‑解码器结构的端到端检测网络, 将等矩形投影图像和相 应的四个立方体展开图像共同 作为检测网络的输入; 所述等矩形投影图像和四个立方体展开图像, 分别对应编码器的两个分支, 即等矩形 投影分支和立方体展开分支; 在编码器阶段, 等矩形投影分支和立方体展开分支通过共享参数的五十层深度残差网 络ResNet ‑50提取特征; 在解码器阶段, 动态加权 融合模块自适应地融合等矩形投影特征和四种立方体展开特 征, 过滤与细化模块结合编码与解码特 征, 得到最终的显著性图。 2.如权利要求1所述的一种基于多投影表征的全景图像显著性目标检测方法, 其特征 在于, 所述动态加权融合模块包括 门控表征间融合单元和加权表征内融合单元, 分别从表 征间和表征内两个角度对不同投影表征特征进行自适应融合; 最终, 表征间融合和表征内 融合被整合到动态加权融合模块中, 自适应地融合两种投影表征的编码器特 征; 所述过滤与细化模块通过过滤策略抑制特征本身与特征之间的冗余信 息, 同时通过细 化策略保留与显著性目标相关的细节信息 。 3.如权利要求1所述的一种基于多投影表征的全景图像显著性目标检测方法, 其特征 在于, 在编码器阶段, 两个分支采用共享参数的五十层深度残差网络ResNet ‑50作为编码 器, 通过编码器对等矩形投影图像和立方体展开图像的特征提取, 以学习全景图的多投影 表征特征, 所述特 征提取具体包括: 在两层低层的特征提取后, 利用立方体 ‑等矩形投影转换模块将立方体展开特征转化 为等矩形投影特 征, 再继续更高层的特 征提取。 4.如权利要求1所述的一种基于多投影表征的全景图像显著性目标检测方法, 其特征 在于, 在解码器阶段, 将检测网络学到的多层次和多投影表征的编码器特征送入到解码器 中, 以逐步恢复空间分辨 率, 并生成显著性图, 具体包括: 网络中的动态加权 融合模块从表征间和表征内两个角度, 自适应地融合了等矩形投影 特征和立方体展开特 征, 从而筛 选出更有效、 更全面的特 征; 过滤与细化模块通过过滤不同投影表征特征的低层特征中的冗余信 息, 从而增强高层 语义特征; 检测网络在主要损失函数和所有侧输出损失函数的共同监督下, 得到最终的显著性 图。 5.如权利要求1所述的一种基于多投影表征的全景图像显著性目标检测方法, 其特征 在于, 所述四个立方体展开图像采用四面水平连接、 三面垂 直连接的立方体展开方式, 这种 展开方式能够延伸立方体面之 间在水平和垂 直方向上的连续性, 从而最大限度地增加图像 中目标的完整性; 具体包括: 以立方体投影图像的前、 后、 左、 右四个面为中心, 分别进行4 ‑3型展开, 从而得到四个 立方体展开图像, 并将这四个立方体展开图像作为 立方体展开分支的输入。 6.如权利要求1所述的一种基于多投影表征的全景图像显著性目标检测方法, 其特征 在于, 将四个立方体展开图像与等矩形投影图像一起送入编码器后, 将立方体展开图像分权 利 要 求 书 1/3 页 2 CN 115424100 A 2成水平子图像和垂直子图像, 分别进行低层的特 征提取; 通过立方体 ‑等矩形投影转换模块, 将立方体展开特征转换为等矩形投影格 式, 再继续 提取高层语义特 征, 补偿立方体面连接时轻微的语义 不连续。 7.如权利要求1所述的一种基于多投影表征的全景图像显著性目标检测方法, 其特征 在于, 所述动态加权融合模块自适应地融合等矩形投影特征和四种立方体展开特征, 具体 包括: 采用一个门控表征间融合单元实现两种投影表征特征的融合, 将各立方体展开特征与 等矩形投影特征 的表征间融合, 自适应地筛选出两种不同投影表征特征中有价值的部分, 得到由立方体展开引导的融合特 征; 门控表征间融合单元首先学习 一个重要性图Pi, 用以评估立方体展开特征在融合中的 贡献; 再将等矩形投影特征FE与每个立方体展开特征 在通道维度进行拼接, 然后使用SE 模块计算 通道注意力, 随后通过一个瓶颈卷积层和sigmo id激活函数 得到重要性图Pi; 在得到重要性图Pi后, 由立方体展开引导的融合特 征则可以通过以下公式计算: 式中, 表示哈达玛乘法(Hadamard  multiplication), Fi表示由立 方体展开引导的融合 特征, 即为门控表征间融合单 元的最终输出; 通过上述门控表征间融合单元, 四个立方体展开特征分别与等矩形投影特征进行自适 应融合, 得到四个由立方体展开引导的融合特 征; 采用一个加权表征内 融合单元实现四个立方体展开引导的融合特 征的表征内 融合; 加权表征内融合单元将原始的四个立方体展开特征 拼接, 通过SE模块, 得到一个权 重向量α ∈r4C×1×1; 将权重向量进一 步切割成四个子向量αi∈RC×1×1, 经过归一化后得到自适应权 重ωi; 得到相应的自适应权 重后, 则进行如下 所述表征内 融合: 将门控表征间融合单元得到的四个由立方体展 开引导的融合特征Fi∈RC×H×W, 以自适应 地加权方式进行融合, 并结果与等矩形投影特 征FE相加, 得到 本模块最终的融合特 征Ff: 式中, ωi是由加权表征内融合 单元得到的相应权重, 表示逐元素加法, 表示在整个 特征平面上的逐 元素乘法。 8.如权利要求1所述的一种基于多投影表征的全景图像显著性目标检测方法, 其特征 在于, 所述过滤与细化模块步进式地实现特征 的筛选和融合, 使其既有助于抑制 两类冗余 信息, 又能保留与显著性目标相关的细节信息, 具体包括: 以第k个过滤与细化模块为例, k≥2, 过滤与细化模块存在两种特征输入: 第一种是来 自前一个解码层的解码器特征 另一种是来自相应编码层的五个不同投影表征特征 的编码器特征 最后一个过滤与 细化模块没有来自前一个解码层的 解码器特 征, 在此处被替换为动态加权融合模块的输出;权 利 要 求 书 2/3 页 3 CN 115424100 A 3

.PDF文档 专利 一种基于多投影表征的全景图像显著性目标检测方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多投影表征的全景图像显著性目标检测方法 第 1 页 专利 一种基于多投影表征的全景图像显著性目标检测方法 第 2 页 专利 一种基于多投影表征的全景图像显著性目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:26:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。