全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210065979.5 (22)申请日 2022.01.20 (71)申请人 高新兴科技 集团股份有限公司 地址 510530 广东省广州市黄埔区科 学城 开创大道 2819号六楼 (72)发明人 刘彪 林焕凯 洪曙光 陈利军  王祥雪 刘双广  (74)专利代理 机构 广州国鹏知识产权代理事务 所(普通合伙) 44511 专利代理师 葛红 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/22(2022.01) G06V 10/42(2022.01) G06V 10/44(2022.01)G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于深层残差网络多尺度特征融合的 行人重识别方法 (57)摘要 本发明涉及行人重识别领域, 特别涉及一种 基于深层残差网络多尺度特征融合的行人重识 别方法, 包 括步骤: S1: 收集行人数据库; S2: 利用 训练好的行人检测器对行人数据库进行人体检 测, 得到行人检测框的位置信息; S3: 根据行人检 测框的位置信息, 对行人数据库图像进行人体裁 剪, 裁剪后缩放到统一尺寸, 并按照适当比例划 分训练集和测试集; S4: 在训练阶段, 构建多尺度 特征融合的残 差神经网络, 采用Softmax  Loss和 Triplet Loss损失函数进行联合训练, 经过充分 训练后得到最优的行人分类模型; S5: 在测试阶 段, 该方法能同时兼顾全局特征和局部特征, 并 设计了一个高效的特征提取模块, 加强深层网络 的特征提取能力, 从而能够 有效地提升行人重识 别的精度。 权利要求书1页 说明书4页 附图2页 CN 114529941 A 2022.05.24 CN 114529941 A 1.一种行 人重识别方法, 其特 征在于, 包括 步骤: S1, 获取行人图像; S2, 将所述行人图像送入预先训练好的多尺度特征融合的深层残差网络进行识别, 判 断是否为同一人; 其中所述预先训练好的多尺度特征融合的深层残差网络的结构为: 第一 网络模块, 第一特征提取模块, 第二网络模块, 第二特征提取模块, 第三特征提取模块, 特征 拼接层; 其中行人图像输入第一网络模块, 第一网络模块的输出分别接入第一特征提取模 块, 第二网络模块; 第二网络模块输出分别接入第二特征提取模块, 第三特征提取模块; 特 征拼接层接入第一特征提取模块、 第二特征提取模块、 第三特征提取模块并将所述第一特 征提取模块、 第二特征提取模块、 第三特征提取模块的输出进 行拼接, 并将拼接后的结果作 为输出。 2.根据权利要求1所述的行人重识别方法, 其特征在于, 所述第一特征提取模块、 第二 特征提取模块、 第三特征提取模块的具体结构为: 一最大池化层、 一平均池化层、 第一批量 归一化层batchnormalization, 一修正线性层ReLU, 一全连接层; 第二批量归一化层 batchnormalization; 其中, 其中最大池化层、 平均池化层分别接入输入的特征数据, 第一 批量归一化层batchnormalization接入最大池化层、 平均池化层的输出, 第一批量归一化 层的输出送入修正线性层ReLU, 全连接层接入修正线性层ReLU的输出, 修正线性层ReLU的 输出送入第二批量归一 化层batc hnormalization。 3.根据权利要求2所述的行 人重识别方法, 其特 征在于, 第一网络模块包括 4层网络层。 4.根据权利要求1所述的行人重识别方法, 其特征在于, 第 二网络模块的输出特征平面 为一2*2的网格。 5.根据权利要求4所述的行人重识别方法, 其特征在于, 第 一特征提取模块的输出大小 为1*1*1024, 第二特征提取模块的输出大小为1*1*2048, 第三特征提取模块的输出大小为 2*2*2048。 6.根据权利要求1所述的行人重识别方法, 其特征在于, 在步骤S1中, 在数据库中建立 多个文件夹, 每 个文件夹存放同一行 人的多张图像, 不同行 人按不同文件夹存放。 7.根据权利要求6所述的行人重识别方法, 其特征在于, 所述全连接层的输出维度为 512。 8.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执 行时实现权利要求1 ‑7任一所述的行 人重识别方法的步骤。 9.一种存储器, 其上存储有计算机程序, 其特征在于, 该程序被处理器执行时实现权利 要求1‑7任一所述的行 人重识别方法的步骤。 10.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述程序时实现权利要求 1‑7任一所述的行人重识 别方法的步骤。权 利 要 求 书 1/1 页 2 CN 114529941 A 2一种基于深层残差网 络多尺度特征融合的行人重识别方 法 技术领域 [0001]本发明涉及行人重识别领域, 特别涉及一种基于深层残差网络多尺度特征融合的 行人重识别方法。 背景技术 [0002]行人重识别指的是利用行人在某一设备下的图像, 在跨设备的图像库中检索出该 行人, 其与行人检测、 行人跟踪技术相结合, 可广泛应用于智能视频监控、 办案区人员定位 等领域。 其技术路线 可以总结为: 输入一张图像或一段视频, 首先采用人体检测器对图像或 视频中的人体进行检测, 将 检测到人体图像进行裁剪、 优选等预处理, 然后 将预处理后的多 个人体图像输入到特征提取模型中提取特征, 最后通过度量多个特征的相似性来判断是否 为同一个人。 [0003]早期的行人重识别方法主要通过提取传统的图像特征来进行识别, 如公开号为 “CN107316031A ”中通过对齐局部描述子提取和分级全局特征提取来进行行人重识别, 其优 点是速度快, 但是传统的图像特征提取方法泛化性能差, 难以适应不同姿态、 遮挡、 运动模 糊、 光照等外 部条件的变化, 导 致其识别准确率偏低。 [0004]近年来, 卷积神经网络 的出现大幅提升了大规模图像分类的准确率, 由于卷积神 经网络分类准确率高、 泛化能力强、 能自动学习到具有区分力的深层特征信息, 因此被广泛 应用在行人重识别中。 如公开号 “CN109598191A ”的发明专利提出了使用残差网络来进 行行 人重识别, 通过利用残差网络的特征提取能力以及利用余弦空间损失进行训练, 提高行人 重识别的精度和鲁棒 性。 [0005]现有的技术一般是直接通过深层残差网络提取行人特征来进行行人重识别, 但 常 规的深层残差网络主要为大规模图像分类任务而设计, 直接应用在行人重识别任务上的效 果并不佳。 [0006]公开号为“CN110717411A ”的发明专利提出了一种深层特征融合的行人重识别方 法, 这种基于深层特征融合的方法在一定程度上虽然可以提升网络性能, 但其只是先简单 地进行特征融合, 再进 行批量归一化, 并没有提升网络的特征提取能力, 而且这种方法无法 同时兼顾全局特 征和局部特征。 发明内容 [0007]针对上述问题, 提出了一种基于深层残差网络多尺度特征融合的行人重识别方 法, 该方法能同时兼顾全局特征和局部特征, 并设计了一个高效的特征提取模块, 加强深层 网络的特 征提取能力, 从而能够有效地 提升行人重识别的精度。 [0008]本发明通过以下技 术方案实现: [0009]一种行人重识别方法, 包括 步骤: [0010]S1, 获取行人图像; [0011]S2, 将所述行人图像送入预先训练好的多尺度特征融合的深层残差网络进行识说 明 书 1/4 页 3 CN 114529941 A 3

.PDF文档 专利 一种基于深层残差网络多尺度特征融合的行人重识别方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于深层残差网络多尺度特征融合的行人重识别方法 第 1 页 专利 一种基于深层残差网络多尺度特征融合的行人重识别方法 第 2 页 专利 一种基于深层残差网络多尺度特征融合的行人重识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:12:12上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。