全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111341430.6 (22)申请日 2021.11.12 (71)申请人 四川启睿 克科技有限公司 地址 610000 四川省成 都市中国 (四川) 自 由贸易试验区成都高新区天府四街 199号1栋33层 (72)发明人 秦昌辉  (74)专利代理 机构 四川省成 都市天策商标专利 事务所(有限合 伙) 51213 代理人 赵以鹏 (51)Int.Cl. G06V 20/52(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 一种行人重识别方法及系统 (57)摘要 本发明提供了一种行人重识别方法, 包括: 搭建上下文残差模块; 使用所述上下文残差模块 构建主干网络提取待识别图像的图像特征; 将所 述图像特征输入机器学习模型进行处理, 获得融 合特征; 基于所述融合特征获取用于图像识别辅 助信息, 所述图像识别辅助信息包括用于增强行 人特征的语义信息及细 节信息; 基于所述图像识 别辅助信息确定所述待识别图像的识别结果。 可 以实现通过自注意力机制学习像素的全局注意 力权重, 获取图像的全局上下文信息, 增强特征 语义信息, 改善识别效果。 权利要求书1页 说明书6页 附图3页 CN 113920477 A 2022.01.11 CN 113920477 A 1.一种行 人重识别方法, 其特 征在于, 包括: 搭建上下文残差模块; 使用所述上 下文残差模块构建主干网络提取待识别图像的图像特 征; 将所述图像特 征输入机器学习模型进行处 理, 获得融合特 征; 基于所述融合特征获取用于图像识别辅助信 息, 所述图像识别 辅助信息包括用于增强 行人特征的语义信息及 细节信息; 基于所述图像识别辅助信息确定所述待识别图像的识别结果。 2.根据权利要求1所述的一种行人重识别方法, 其特征在于, 所述图像特征包括高层特 征和低层特 征。 3.根据权利要求1所述的一种行人重识别方法, 其特征在于, 所述机器学习模型为包括 三个并行分支和三个损失函数 联合优化的模型。 4.根据权利要求1所述的一种行人重识别方法, 其特征在于, 所述融合特征中由若干特 征图融合而成, 所述特 征图的每 个位置的特 征与融合特 征具有长距离依赖关系。 5.一种行 人重识别系统, 其特 征在于, 包括: 搭建模块, 用于搭建上 下文残差模块; 提取模块, 用于使用所述上 下文残差模块构建主干网络提取待识别图像的图像特 征; 处理模块, 用于将所述图像特 征输入机器学习模型进行处 理, 获得融合特 征; 获取模块, 用于基于所述融合特征获取用于 图像识别辅助信息, 所述图像识别辅助信 息包括用于增强行 人特征的语义信息及 细节信息; 确定模块, 用于基于所述图像识别辅助信息确定所述待识别图像的识别结果。 6.根据权利要求1所述的一种行人重识别系统, 其特征在于, 所述图像特征包括高层特 征和低层特 征。 7.根据权利要求5所述的一种行人重识别系统, 其特征在于, 所述机器学习模型为包括 三个并行分支和三个损失函数 联合优化的模型。 8.根据权利要求5所述的一种行人重识别系统, 其特征在于, 所述融合特征中由若干特 征图融合而成, 所述特 征图的每 个位置的特 征与融合特 征具有长距离依赖关系。 9.一种行人重识别装置, 所述装置包括处理器以及存储器; 所述存储器用于存储指令, 所述指令被所述处理器执行时, 导致所述装置实现如权利要求1至4中任一项 所述行人重识 别方法。 10.一种计算机可读存储介质, 所述存储介质存储计算机指令, 当计算机读取存储介质 中的计算机指令后, 计算机运行如权利要求3 至4中任一项所述行 人重识别方法。权 利 要 求 书 1/1 页 2 CN 113920477 A 2一种行人重识别方 法及系统 技术领域 [0001]本发明涉及图像识别技 术领域, 具体涉及一种行 人重识别方法及系统。 背景技术 [0002]行人重识别是广泛应用于跨摄像头监控系统的图像检索技术, 其核心内容是特征 提取和距离度量, 已成为计算机视觉领域的研究热点。 由于行人姿态和视角变化、 遮挡、 摄 像头拍摄环境复杂多变等因素的影响, 研究出性能优良的行人重识别方法还是一项巨大的 挑战, 吸引了众多研究人员进行了大量的研究。 [0003]传统的行人重识别技术依靠人工设计的特征来表征行人目标, 包括颜色、 纹理、 HOG(Histogram  of oriented  gradient)、 SIFT(Scale  invariant  feature transform)等 特征及其它们的组合。 然而人工设计的特征表征能力有限, 难以满足复杂监控场景 的行人 重识别任务。 由于卷积神经网络强大 的特征提取能力, 能够自适应调节不同类别间的分界 面, 可以通过卷积神经网络来学习 出一个判别性强的特征空间, 然后通过距离度量函数计 算特征空间中样本的距离, 取 得了显著的效果。 [0004]现有方法都致力于提取全局特征和局部特征来获得具有判别性的行人特征表达, 但是构建的网络模型过于复杂, 训练时难以优化, 对计算资源的要求极高, 应用成本高。 本 发明方法采用卷积神经网络的自注意力机制以全局感受野提取上下文信息, 并融合高层语 义特征和低层细节特征表征行人, 模型结构简明, 快速 收敛, 准确 率高, 具有良好的实用价 值。 发明内容 [0005]本发明的目的在于提供一种行人重识别方法及系统。 以期解决背景技术中存在的 技术问题。 [0006]为了实现上述目的, 本发明采用以下技 术方案: [0007]一种行人重识别方法, 包括: 搭建上下文残差模块; 使用所述上下文残差模块构建 主干网络提取待识别图像的图像特征; 将所述图像特征输入机器学习模型进行处理, 获得 融合特征; 基于所述融合特征获取用于图像识别辅助信息, 所述图像识别辅助信息包括用 于增强行人特征的语义信息及细节信息; 基于所述图像识别辅助信息确定所述待识别图像 的识别结果。 [0008]在本发明的方案中, 使用上下文残差模块构建主干网络提取 图像特征, 使特征 图 每个位置的特征与整个特征图产生长距离依赖关系, 拥有全局感受野, 提取 的特征信息更 加充分。 主干网络提取的高低层特征输入三个并行分支进行身份识别和度量学习, 使用 Softmax损失、 三元组损失和中心损失联合优化模型, 可以获得一个类内紧致、 类间分离的 特征空间。 模型推理阶段将三个分支归一化后的特征融合, 使用更加丰富的特征来表征行 人, 获得更高的行 人重识别精度。 [0009]在一些实施例中, 所述图像特 征包括高层特 征和低层特 征。说 明 书 1/6 页 3 CN 113920477 A 3

.PDF文档 专利 一种行人重识别方法及系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种行人重识别方法及系统 第 1 页 专利 一种行人重识别方法及系统 第 2 页 专利 一种行人重识别方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:00:57上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。