专利 一种去除图像阴影模型及其构建方法、装置及应用

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211307124.5 (22)申请日 2022.10.25 (71)申请人城云科技（中国）有限公司地址 310052 浙江省杭州市滨江区长河街道江南大道588号恒鑫大厦主楼17层、 18层 (72)发明人李圣权　厉志杭　董墨江　张香伟　 (74)专利代理机构杭州汇和信专利代理有限公司 33475 专利代理师吴琰 (51)Int.Cl. G06T 5/00(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种去除图像阴影模型及其构建方法、装置及应用 (57)摘要本方案提出了一种去除图像阴影模型的构建方法、装置及应用，包括以下步骤：获取训练样本，对训练样本进行预处理得到预筛阴影图像和阴影掩码；使用第一编码器和第二编码器进行编码得到第一编码结果和第二编码结果；使用跨区域Transformer层对第一编码结果和第二编码结果添加位置信息后送入区域感知交叉注意力层得到阴影特征图；使用RefineNet网络将所述原始图像、预筛阴影图像和阴影特征图作为输入进行编解码，得到与所述原始图像相对应的去阴影结果图。本方案通过对跨区域Transformer层和其中的区域感知交叉注意力层进行改进，可以将足够的上下文信息从非阴影区域转移到阴影区域来恢复阴影像素，从而可以提高模型去阴影的效果。权利要求书3页说明书10页附图5页 CN 115375589 A 2022.11.22 CN 115375589 A 1.一种去除图像阴影模型的构建方法，其特征在于，包括：获取至少一原始图像作为训练样本，对每一所述训练样本进行预处理得到对应的预筛阴影图像，其中所述预筛阴影图像上标记阴影掩码；构建去阴影模型，所述去阴影模型由两个并行的编码器、跨区域Transformer层、解码器和Refi neNet网络串联组成；两个并行的编码器分别为第一编码器和第二编码器，所述第一编码器对包含非阴影区域的上下文信息的原始图像进行编码得到第一编码结果，所述第二编码器对包含阴影掩码的预筛阴影图像进行编码得到第二编码结果；所述跨区域Transformer层包含串联的特征转换层、区域感知交叉注意力层和多层感知机制层组成，所述特征转换层对所述第一编码结果进行特征转换后并添加位置编码信息得到第一信息，所述特征转换层对所述第二编码结果进行特征转换后并添加位置编码信息得到第二信息，所述第一信息、所述第二信息以及所述阴影掩码输入到所述区域感知交叉注意力层，所述区域感知交叉注意力层根据所述第一信息和阴影掩码对所述第二信息优化得到优化数据，将所述优化数据输入所述多层感知机制层中进行解码得到阴影特征图；将所述原始图像、预筛阴影图像和阴影特征图输入所述RefineNet网络进行编解码，得到与所述原始图像相对应的去阴影结果图。 2.根据权利要求1所述的一种去除图像阴影模型的构建方法，其特征在于，在 “对每一所述训练样本进行预处理”步骤中，对所述训练样本进行二值化处理得到预筛阴影图像，根据分辨所述预筛阴影图像中每一像素点是否属于阴影区域而得到阴影掩码，若像素点为阴影区域则设定该像素点为阴影掩码的组成部分。 3.根据权利要求1所述的一种去除图像阴影模型的构建方法，其特征在于，所述跨区域 Transformer层对所述第一编码结果和第二编码结果进行特征转换，并以逐点相加池化的方法为所述第一编码结果和第二编码结果添加位置编码信息得到第一信息和第二信息，再结合所述阴影掩码送入所述区域感知交叉注意力层得到优化数据，所述区域感知交叉注意力层后紧跟一个残差归一层对所述优化数据进行残差归一化，再将其送入多层感知机制层，所述多层感知机制层后也紧跟一个残差归一化层再次进行残差归一化后进行特征转换得到阴影特征图。 4.根据权利要求1所述的一种去除图像阴影模型的构建方法，其特征在于，所述第一编码结果在所述区域感知交叉注意力层中进行矩阵转换得到关键像素矩阵和值向量矩阵，所述第二编码结果在所述区域感知交叉注意力层中进行矩阵转换得到查询像素矩阵，对所述查询像素矩阵和所述关键像素矩阵做点积运算得到注意力像素矩阵，使用所述阴影掩码与所述注意力像素矩阵进行逐点相加池化得到第一注意结果，所述第一注意结果经过 softmax函数后再与所述值向量矩阵进行点积运算得到第二注意结果，所述第二注意结果与所述查询像素矩阵进行逐点相加池化后得到第三注意结果，将所述第三注意结果进行线性投影得到所述优化数据。 5.根据权利要求4所述的一种去除图像阴影模型的构建方法，其特征在于，在 “使用所述阴影掩码与所述注意力像素矩阵进行逐点相加池化得到第一注意结果 ”步骤中，对所述阴影掩码提取有效位置信息并构建一个阴影掩码的映射，使用逐点相加池化的方式根据所述注意力像素矩阵在阴影掩码的映射中表示非阴影像素和阴影像素之间的位置对应关系，权　利　要　求　书 1/3 页 2 CN 115375589 A 2所述第一注意结果为所述阴影掩码的有效位置信息内的所有阴影像素。 6.根据权利要求1所述的一种去除图像阴影模型的构建方法，其特征在于，在 “将所述原始图像、预筛阴影图像和阴影特征图输入所述RefineNet网络进行编解码 ”步骤中，先对所述原始图像、阴影特征图、预筛阴影图像进行计算，得到复合特征图，将所述复合特征图和原始图像输入到Refi neNet网络得到去阴影结果图。 7.一种去除图像阴影模型，其特征在于，使用权利要求1 ‑6所述的任意一种方法进行构建得到。 8.一种去除图像阴影方法，其特征在于，获取一待去除阴影图像，对所述待去除阴影图像进行预处理得到预筛阴影图像和阴影掩码，第一编码器所述待去阴影图像及其上下文特征进行编码得到第一编码结果，第二编码器对所述预筛阴影图像及其上下文特征以及阴影掩码进行编码得到第二编码结果；使用跨区域Transformer层对第一编码结果和第二编码结果添加位置编码信息后得到第一信息和第二信息，将所述第一信息、第二信息、阴影掩码送入所述区域感知交叉注意力层，所述区域感知交叉注意力层根据所述第一信息和阴影掩码对所述第二信息优化得到优化数据，将所述优化数据通过多层感知机制层进行输出后解码得到阴影特征图；使将所述原始图像、预筛阴影图像和阴影特征图输入所述Re fineNet网络进行编解码，得到与所述原始图像相对应的去阴影结果图。 9.一种去阴影图像模型的构建装置，其特征在于，包括：获取模块：获取至少一原始图像作为训练样本，对每一所述训练样本进行预处理得到对应的预筛阴影图像，其中所述预筛阴影图像上标记阴影掩码；构建模块：构建去阴影模型，所述去阴影模型由两个并行的编码器、跨区域 Transformer层、解码器和Refi neNet网络串联组成；编码模块：两个并行的编码器分别为第一编码器和第二编码器，所述第一编码器对包含非阴影区域的上下文信息的原始图像进行编码得到第一编码结果，所述第二编码器对包含阴影掩码的预筛阴影图像进行编码得到第二编码结果；处理模块：所述跨区域Transformer层包含串联的特征转换层、区域感知交叉注意力层和多层感知机制层组成，所述特征转换层对所述第一编码结果进行特征转换后并添加位置编码信息得到第一信息，所述特征转换层对所述第二编码结果进行特征转换后并添加位置编码信息得到第二信息，所述第一信息、所述第二信息以及所述阴影掩码输入到所述区域感知交叉注意力层，所述区域感知交叉注意力层根据所述第一信息和阴影掩码对所述第二信息优化得到优化数据，将所述优化数据输入所述多层感知机制层中进行解码得到阴影特征图；去阴影模块：将所述原始图像、预筛阴影图像和阴影特征图输入所述Re fineNet网络进行编解码，得到与所述原始图像相对应的去阴影结果图。 10.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行权利要求1到6任一所述的一种去除图像阴影模型的构建方法或权利要求8所述的一种去除图像阴影方法。 11.一种可读存储介质，其特征在于，所述可读存储介质中存储有计算机程序，所述计算机程序包括用于控制过程以执行过程的程序代码，所述过程包括根据权利要求1到6任一权　利　要　求　书 2/3 页 3 CN 115375589 A 3

专利 一种去除图像阴影模型及其构建方法、装置及应用

专利一种去除图像阴影模型及其构建方法、装置及应用