全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210864306.6 (22)申请日 2022.07.20 (71)申请人 复旦大学 地址 200433 上海市杨 浦区邯郸路2 20号 (72)发明人 张玥杰 徐际岚 刘靖正  (74)专利代理 机构 上海正旦专利代理有限公司 31200 专利代理师 陆飞 陆尤 (51)Int.Cl. G06V 10/24(2022.01) G06V 10/26(2022.01) G06V 10/762(2022.01) G06V 10/40(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) (54)发明名称 基于类重激活映射图的弱监督图像目标定 位分析系统 (57)摘要 本发明属于图像处理技术领域, 具体为基于 类重激活映射图的弱监督图像目标定位分析系 统。 本发明包括: 类别上下文特征学习模块、 类别 映射图重激活模块和类别映射图校准模块。 类别 上下文特征学习模块使用卷积神经网络对图像 特征进行提取, 生成初始类别映射图作为索引学 习类别上下文特征; 类别映射图重激活模块对类 别上下文特征作为聚类簇中心, 并应用期望最大 化算法对图像像素特征聚类, 使用隐变量作为类 重激活映射图; 类别映射图校准模块对类重激活 映射图的前背景激活值进行校准, 并聚合类别映 射图。 本发 明有效解决了初始 类别映射图的前背 景激活值混淆问题, 使前背景激活值区分度显 著, 在仅使用图像类别标签作为监督时提升目标 定位结果。 权利要求书4页 说明书8页 附图1页 CN 115311449 A 2022.11.08 CN 115311449 A 1.基于类重激活映射图的弱监督图像目标定位分析系统, 其特征在于, 包括类别上下 文特征学习模块、 类别映射图重激活模块与类重激活映射图校准模块; 所述类别上下文特 征学习模块对图像特征进行提取, 生成初始类别映射图作为索引学习类别上下文特征; 所 述类别映射图重激活模块接受图像特征与类别上下文 特征, 通过像素级别的聚类判定前景 与背景, 并生成类重激活映射图, 输入至类别映射图校准模块; 所述类别映射图校准模块根 据类别映射图定位 粗略前景背景区域, 并指导类重 激活映射图校准前 景与背景激活值。 2.根据权利要求1所述的弱监督图像目标定位分析系统, 其特征在于, 所述类别上下文 特征学习模块包括图像特征提取网络和全连接神经网络分类器; 图像特征提取网络使用 VGG16或Inception ‑V3或ResNet50深度卷积神经网络, 对图像进行层级特征提取, 生成维度 为h×w×1,024维的空间特征向量f; 特征向量f送入全连接神经网络分类器; 全连接神经网 络分类器对第c个类别, 将空间特征向量f与全连接网络权重w进行加权求和, 得到维度为h ×w的初始类别映射图Mc; 该过程表示 为: fk为空间特征向量f的第k个分量, 为对应于第c个类别的权重w的第k个分量; 基于类 别映射图, 分类 器对于图像的最终类别预测表示 为: 其中, i,j代表空间位置; 根据公式(2)可知, 使用神经网络分类器和类别映射图解决图 像弱监督目标定位问题可被归纳为解决 “哪些像素对类别预测做出贡献 ”; 把类别映射图归 一化到[0,1]区间中, 并通过阈值τ进行二值化; 对于类别映射图中每个位置的数值, 若 大于 τ则该位置被当作前 景部分, 否则作为背景部分。 3.根据权利要求2所述的弱监督图像目标定位分析系统, 其特征在于, 所述生成初始类 别映射图作为索引学习类别上下文特征, 具体为: 对于每个类别c, 前景上下文特征向量和 背景上下文特征向量分别表示为 和 上下文特征向量都是d维特征向量, 并作为每 个类别的簇中心用于概 括该类别的共同前 景和背景 特征; 首先, 将初始类别映射图二 值化: 其中, δ表示阈值; 1()代表指示函数; 与 作为前景和背景的粗略估计; 对于每 个样本, 深层特征为F, 使用前景和背景的估计 与 分别获取前景与背景特征, 并用均 值更新上 下文特征向量; 具体过程表示 为: 权 利 要 求 书 1/4 页 2 CN 115311449 A 2其中, Fij代表特征F在空间位置(i,j)的值; || ·||0计算所有非零值个数; 前景与背景 上下文特征向量使用动量更新, 动量参数为λ; 使用动量更新能够确保上下文特征更新缓 慢, 维护更多的历史特 征。 4.根据权利要求3所述的弱监督图像目标定位分析系统, 其特征在于, 所述类别映射图 重激活模块对类别映射图进行重激活, 提升前景部 分的激活值, 增大前背 景激活值区分度, 使目标定位更准确; 该模块将重激活问题定义为基于高斯混合模型 的参数估计问题, 并使 用期望最大化算法解该问题; 期望最大化算法为最大似然估计在含有隐变量的概率模型的 延伸; 具体地: 对于每个样本x, 目标 是最大化如下似然: 其中, 参数 为模型参数(fg, bg分别表示前景与背景); 对于每个 图像像素xij, 其服从一个概 率混合模型, 由前 景高斯分布和背景高斯分布组成: 其中, 混合权重 afg,abg为[0,1]之间的实数, 且符合afg+abg=1; 前景与背景基模型pfg和 pbg衡量图像特 征和已学习好的类别上 下文特征向量; 采用余弦相似度作为度量: 其中, σ 为超参数控制平 滑程度。 5.根据权利要求4所述的弱监督图像目标定位分析系统, 其特征在于, 所述使用期望最 大化算法解该问题, 具体为: 定义隐变量Zfg和Zbg分别表示在位置(i,j)图像 像素属于前 景和背景的概 率; E步骤: 期望最大化算法先根据经验为每个类别即隐变量赋予一个初始分布, 其作用是 假定分布参数Vfg与Vbg, 并根据分布参数求每 个数据的隐藏变量期望; M步骤: 再根据归类结果计算分布参数的最大似然值, 根据这个最大似然值重新计算每 个数据的隐藏变量的期望; 循环往复直至收敛; E步骤中, 当前模型的参数被用来计算隐变量的后验分布, 即 和 在每轮迭代过程中t(1≤t≤T)中, 假设模型参数为固定, 隐变量的计算 过程表示 为: 权 利 要 求 书 2/4 页 3 CN 115311449 A 3

.PDF文档 专利 基于类重激活映射图的弱监督图像目标定位分析系统

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于类重激活映射图的弱监督图像目标定位分析系统 第 1 页 专利 基于类重激活映射图的弱监督图像目标定位分析系统 第 2 页 专利 基于类重激活映射图的弱监督图像目标定位分析系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:58:35上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。