专利 一种融合注意力机制的启明星一号卫星多源数据生成对抗融合网络方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210427413.2 (22)申请日 2022.04.21 (71)申请人武汉大学地址 430072 湖北省武汉市武昌区八一路 299号 (72)发明人郭羽萱　张学敏　金光　戴小兵　 (74)专利代理机构合肥方舟知识产权代理事务所(普通合伙) 34158 专利代理师刘跃 (51)Int.Cl. G06V 10/74(2022.01) G06V 10/774(2022.01) G06V 10/54(2022.01) G06T 7/33(2017.01) G06T 5/50(2006.01)G06N 3/04(2006.01) G06V 10/82(2022.01) (54)发明名称一种融合注意力机制的启明星一号卫星多源数据生成对抗融合网络方法 (57)摘要本发明公开了一种融合注意力机制的启明星一号卫星多源数据生成对抗融合网络方法，包括以下步骤：步骤一：图像预处理：对多源数据进行配准，步骤二：步骤二：以红外与夜光的图像融合为例，采用AttentionFGAN网络，包含一个生成器和两个鉴别器，步骤三：插入注意力机制模块，步骤四：训练融合模型，利用得到的融合模型处理测试集，测试得到的模型性能；步骤五：评价多源遥感图像融合效果，本发明在 “启明星一号 ”微纳卫星的应用背景下，结合多种遥感数据特点，挖掘遥感图像内在纹理细节特征以及对应在不同图像域的相似关联性，在保留红外图像的亮度信息的同时，用夜光的细节信息提高红外图像的细节纹理信息，从而提高目标的探测概率。权利要求书3页说明书8页附图1页 CN 115482401 A 2022.12.16 CN 115482401 A 1.一种融合注意力机制的启明星一号卫星多源数据生成对抗融合网络方法，其特征在于，包括以下步骤：步骤一：图像预处理：对多源数据进行配准；步骤二：以红外与夜光的图像融合为例，采用AttentionFGAN网络，包含一个生成器和两个鉴别器，在生成器中设计两个多尺度注意力网络和一个融合网络，多尺度注意力网络为、红外多尺度注意力网络和可见光多尺度注意力网络，分别用来提取红外和可见光图像注意力图，使生成器能够聚焦于红外图像的目标区域和可见光图像的背景细节信息， AttentionFGAN采用双鉴别器结构，使融合图像保存更多源图像信息，同时，在两个鉴别器中也引入注意力模块，使鉴别器能够通过注意力模块更多的从典型特征区域而非整幅图像来鉴别图像，从而提高鉴别能力和效率， AttentionFGAN融合算法的损失函数，包括生成器损失和鉴别器损失两个部分；生成器损失： AttentionFGAN 融合算法的生成器损失主要包括三个部分：对抗损失：内容损失和注意力损失，生成器损失的定义如下： LG＝Ladv(G)+λLcon+ξ Latt 式中LG为生成器损失， Ladv表示对抗损失， Lcon表示内容损失， Latt代表本文提出的注意力损失， λ和 ξ为超参数，内容损失Lcon旨在使生成图像不断接近于红外图像，因为红外传感器通过捕获热辐射信息成像，图像特征主要通过像素强度来表示，所以内容损失Lcon主要计算红外图像和融合图像的像素强度差异， Lcon的定义如下：式中H和W分别为图像的长和宽， If和Iir分别表示融合图像和红外图像； AttentionFGAN将注意力机制引入到鉴别器，使鉴别器更多的关注典型特征区域而非整幅图像来鉴别输入图像，因此，当鉴别器无法正确鉴别两幅输入图像时，两幅图像在鉴别器中计算得到的注意力图应具有相似特征，所以为了使融合图像保存更多的注意力区域信息，通过计算同一鉴别器中两幅源图像和融合图像注意力图间的差异来计算注意力损失，其计算公式如下：式中H和W分别为图像的长和宽，和分别表示鉴别器1(输入为红外和融合图像)中当输入分别为融合图像和红外图像时的注意力图，和分别表示鉴别器2 中当输入分别为融合图像和可见光图像时的注意力图；在AttentionFGAN融合框架中为了使融合图像保存更多的红外目标信息和可见光中的背景细节信息，设计了两个鉴别器，因此对抗损失的计算公式如下：式中If表示融合图像，表示融合图像的数据分布， Dir表示以红外和融合图像作为输入的鉴别器， Dvis表示以可见光和融合图像作为输入的鉴别器；权　利　要　求　书 1/3 页 2 CN 115482401 A 2鉴别器损失： AttentionFGAN融合算法中采用双鉴别器结构，且在该算法中使用了WGAN，因此 AttentionFGAN的鉴别器损失定义如下：式中分别表示以红外与融合图像作为输入的鉴别器损失和以可见光与融合图像作为输入的鉴别器损失， Pir表示红外与可见光图像数据分布， Pf表示融合图像数据分布；步骤三：插入注意力机制模块：多尺度注意力计算模块旨在通过计算注意力图使生成器和鉴别器聚焦于典型特征区域，其中多尺度注意力计算模块的输入数据为源图像卷积层特征，由于源图像所包含的对象往往具有不规则性，单一尺度往往不能充分提取空间特征信息，通过不同尺度的池化操作计算多尺度特征，针对不同尺度特征考虑特征的重要性，使网络能够聚焦于重要特征而忽略冗余特征，即网络通过特征的全局信息计算不同特征的权重，重新标定输入特征，具体计算过程为多尺度注意力模块通过训练获得在s池化尺度下的第k个特征的权重其公式如下：其中为特征全局信息计算， σ 代表Sigmoid函数， w1为函数系数，其尺寸为1*1*k，为特征权重，再将计算得到的特征权重与原始特征对相乘来强调不同特征间的相对重要性，在此基础上将重新标定的特征按照通道方向求和，其计算公式如下：式中Fsum为重新标定的特征在通道方向上的和， Hup为针对不同尺度特征的上采样过程，在此基础上对每个尺度的Fsum做归一化操作得到不同尺度的注意力图Fs，为了获得最终的注意力图，将不同尺度的注意力图Fs在通道方向连接，并沿着通道方向取各个像素位置的最大值，因为在注意力图中像素值能反映该位置特征的重要性。步骤四：训练融合模型，利用得到的融合模型处理测试集，测试得到的模型性能；步骤五：评价多源遥感图像融合效果：采用主观评价和客观评价两种方式对融合结果进行评估；熵：熵是基于信息理论测量融合图像中包含信息量的指标，计算方式如下：其中L是灰度级的个数， pl是融合图像中相应灰度级的归一化直方图，熵值越大，信息越丰富，融合效果越好，熵值易受噪声影响，因此只作为辅助指标；互信息：权　利　要　求　书 2/3 页 3 CN 115482401 A 3

专利 一种融合注意力机制的启明星一号卫星多源数据生成对抗融合网络方法

专利一种融合注意力机制的启明星一号卫星多源数据生成对抗融合网络方法