专利一种基于深层残差网络多尺度特征融合的行人重识别方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210065979.5 (22)申请日 2022.01.20 (71)申请人高新兴科技集团股份有限公司地址 510530 广东省广州市黄埔区科学城开创大道 2819号六楼 (72)发明人刘彪　林焕凯　洪曙光　陈利军　王祥雪　刘双广　 (74)专利代理机构广州国鹏知识产权代理事务所(普通合伙) 44511 专利代理师葛红 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/22(2022.01) G06V 10/42(2022.01) G06V 10/44(2022.01)G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种基于深层残差网络多尺度特征融合的行人重识别方法 (57)摘要本发明涉及行人重识别领域，特别涉及一种基于深层残差网络多尺度特征融合的行人重识别方法，包括步骤： S1：收集行人数据库； S2：利用训练好的行人检测器对行人数据库进行人体检测，得到行人检测框的位置信息； S3：根据行人检测框的位置信息，对行人数据库图像进行人体裁剪，裁剪后缩放到统一尺寸，并按照适当比例划分训练集和测试集； S4：在训练阶段，构建多尺度特征融合的残差神经网络，采用Softmax Loss和 Triplet Loss损失函数进行联合训练，经过充分训练后得到最优的行人分类模型； S5：在测试阶段，该方法能同时兼顾全局特征和局部特征，并设计了一个高效的特征提取模块，加强深层网络的特征提取能力，从而能够有效地提升行人重识别的精度。权利要求书1页说明书4页附图2页 CN 114529941 A 2022.05.24 CN 114529941 A 1.一种行人重识别方法，其特征在于，包括步骤： S1，获取行人图像； S2，将所述行人图像送入预先训练好的多尺度特征融合的深层残差网络进行识别，判断是否为同一人；其中所述预先训练好的多尺度特征融合的深层残差网络的结构为：第一网络模块，第一特征提取模块，第二网络模块，第二特征提取模块，第三特征提取模块，特征拼接层；其中行人图像输入第一网络模块，第一网络模块的输出分别接入第一特征提取模块，第二网络模块；第二网络模块输出分别接入第二特征提取模块，第三特征提取模块；特征拼接层接入第一特征提取模块、第二特征提取模块、第三特征提取模块并将所述第一特征提取模块、第二特征提取模块、第三特征提取模块的输出进行拼接，并将拼接后的结果作为输出。 2.根据权利要求1所述的行人重识别方法，其特征在于，所述第一特征提取模块、第二特征提取模块、第三特征提取模块的具体结构为：一最大池化层、一平均池化层、第一批量归一化层batchnormalization，一修正线性层ReLU，一全连接层；第二批量归一化层 batchnormalization；其中，其中最大池化层、平均池化层分别接入输入的特征数据，第一批量归一化层batchnormalization接入最大池化层、平均池化层的输出，第一批量归一化层的输出送入修正线性层ReLU，全连接层接入修正线性层ReLU的输出，修正线性层ReLU的输出送入第二批量归一化层batc hnormalization。 3.根据权利要求2所述的行人重识别方法，其特征在于，第一网络模块包括 4层网络层。 4.根据权利要求1所述的行人重识别方法，其特征在于，第二网络模块的输出特征平面为一2*2的网格。 5.根据权利要求4所述的行人重识别方法，其特征在于，第一特征提取模块的输出大小为1*1*1024，第二特征提取模块的输出大小为1*1*2048，第三特征提取模块的输出大小为 2*2*2048。 6.根据权利要求1所述的行人重识别方法，其特征在于，在步骤S1中，在数据库中建立多个文件夹，每个文件夹存放同一行人的多张图像，不同行人按不同文件夹存放。 7.根据权利要求6所述的行人重识别方法，其特征在于，所述全连接层的输出维度为 512。 8.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1 ‑7任一所述的行人重识别方法的步骤。 9.一种存储器，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1‑7任一所述的行人重识别方法的步骤。 10.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求 1‑7任一所述的行人重识别方法的步骤。权　利　要　求　书 1/1 页 2 CN 114529941 A 2一种基于深层残差网络多尺度特征融合的行人重识别方法技术领域 [0001]本发明涉及行人重识别领域，特别涉及一种基于深层残差网络多尺度特征融合的行人重识别方法。背景技术 [0002]行人重识别指的是利用行人在某一设备下的图像，在跨设备的图像库中检索出该行人，其与行人检测、行人跟踪技术相结合，可广泛应用于智能视频监控、办案区人员定位等领域。其技术路线可以总结为：输入一张图像或一段视频，首先采用人体检测器对图像或视频中的人体进行检测，将检测到人体图像进行裁剪、优选等预处理，然后将预处理后的多个人体图像输入到特征提取模型中提取特征，最后通过度量多个特征的相似性来判断是否为同一个人。 [0003]早期的行人重识别方法主要通过提取传统的图像特征来进行识别，如公开号为 “CN107316031A ”中通过对齐局部描述子提取和分级全局特征提取来进行行人重识别，其优点是速度快，但是传统的图像特征提取方法泛化性能差，难以适应不同姿态、遮挡、运动模糊、光照等外部条件的变化，导致其识别准确率偏低。 [0004]近年来，卷积神经网络的出现大幅提升了大规模图像分类的准确率，由于卷积神经网络分类准确率高、泛化能力强、能自动学习到具有区分力的深层特征信息，因此被广泛应用在行人重识别中。如公开号 “CN109598191A ”的发明专利提出了使用残差网络来进行行人重识别，通过利用残差网络的特征提取能力以及利用余弦空间损失进行训练，提高行人重识别的精度和鲁棒性。 [0005]现有的技术一般是直接通过深层残差网络提取行人特征来进行行人重识别，但常规的深层残差网络主要为大规模图像分类任务而设计，直接应用在行人重识别任务上的效果并不佳。 [0006]公开号为“CN110717411A ”的发明专利提出了一种深层特征融合的行人重识别方法，这种基于深层特征融合的方法在一定程度上虽然可以提升网络性能，但其只是先简单地进行特征融合，再进行批量归一化，并没有提升网络的特征提取能力，而且这种方法无法同时兼顾全局特征和局部特征。发明内容 [0007]针对上述问题，提出了一种基于深层残差网络多尺度特征融合的行人重识别方法，该方法能同时兼顾全局特征和局部特征，并设计了一个高效的特征提取模块，加强深层网络的特征提取能力，从而能够有效地提升行人重识别的精度。 [0008]本发明通过以下技术方案实现： [0009]一种行人重识别方法，包括步骤： [0010]S1，获取行人图像； [0011]S2，将所述行人图像送入预先训练好的多尺度特征融合的深层残差网络进行识说　明　书 1/4 页 3 CN 114529941 A 3

专利 一种基于深层残差网络多尺度特征融合的行人重识别方法

专利一种基于深层残差网络多尺度特征融合的行人重识别方法