全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111654112.5 (22)申请日 2021.12.3 0 (71)申请人 杭州电子科技大 学 地址 310018 浙江省杭州市下沙高教园区2 号大街 (72)发明人 姜明 高骏涛 张旻 李鹏飞  (74)专利代理 机构 杭州君度专利代理事务所 (特殊普通 合伙) 33240 代理人 朱月芬 (51)Int.Cl. G06V 40/10(2022.01) G06V 40/20(2022.01) G06K 9/62(2022.01) (54)发明名称 一种基于重识别和方位感知的实时跨摄像 头行人跟踪方法 (57)摘要 本发明公开了一种基于重识别和方位感知 的实时跨摄像头行人跟踪 方法。 本发 明包括以下 步骤: (1)行人检测, (2)外观特征提取, (3)行人 方位感知, (4)单摄像头目标跟踪, (5)基于层次 聚类的跨摄像头轨迹关联。 本发 明通过基于深度 学习的方位估计网络预测行人图像的方位, 为行 人重识别特征提供方位信息, 减 轻了由于摄像头 视角、 行人姿态造成的行人外观特征差距, 同时, 利用行人的空间信息缩小了跨摄像头轨迹关联 时的搜索范围, 提高了跨摄像头目标跟踪方法的 实时性。 权利要求书3页 说明书5页 附图1页 CN 114419669 A 2022.04.29 CN 114419669 A 1.一种基于重识别和方位感知的实时跨摄像头行人跟踪方法, 其特征在于包括如下步 骤: 步骤(1)利用行 人重识别数据集训练行 人重识别模型, 该模型用于提取 行人外观特 征; 步骤(2)设计行 人方位感知网络, 构建行 人方位数据集, 用于训练行 人方位感知网络; 步骤(3)捕获每个摄像头的输入视频流, 开启多线程读取每个视频流的图像帧存储到 队列中; 每 个线程读取一个视频流的图像帧; 步骤(4)逐帧读取队列中存储的图像, 使用行人检测算法对每一张图像进行检测, 得到 行人的边界框信息; 步骤(5)利用步骤(1)中训练的行人重识别模型提取步骤(4)中每一个行人边界框的外 观特征; 步骤(6)利用步骤(2)中训练的方位感知模型提取步骤(4)中每一个行人边界框的方位 信息; 步骤(7)利用卡尔曼滤波预测每个行人的运动信息, 运动信息结合行人重识别模型提 取的外观特 征共同完成单摄 像头下的目标跟踪, 得到单摄 像头下行人的运动轨 迹; 步骤(8)利用行人的方位信息对行人外观特征进行分类, 将单摄像头下的运动轨迹进 行跨摄像头轨迹关联, 为同一行人在不同摄像头下的运动轨迹分配同一ID, 从而完成跨摄 像头行人跟踪。 2.根据权利要求1所述的一种基于重识别和方位感知的实时跨摄像头行人跟踪方法, 其特征在于所述 步骤(1)具体实现过程如下: 1‑1以Strong  Baseline行人重识别模型为基准, 在模型的各个阶段之间添加注意力模 块, 该注意力模块由通道注意力和空间注意力组成, 表示为空间相关的注意力权重S和通道 相关的注意力权 重Vc之间的张量乘法, 计算过程如公式(1)所示; V=S×Vc    (1) 1‑2使用Market1501和DukeMTMC ‑reID这两个行人重识别领域的基准数据集对行人重 识别模型进行训练; 模型训练中使用两类损失: 困难三元组损失和交叉熵损失。 3.根据权利要求1所述的一种基于重识别和方位感知的实时跨摄像头行人跟踪方法, 其特征在于所述 步骤(2)具体实现过程如下: 2‑1设计行人方位感知网络实现行人方位估计; 将人的朝向分为正面、 背面和侧面, 将 DukeMTMC‑reID数据集中的数据分为以上三类, 以此构建行 人方位数据集; 2‑2使用Alpha  Pose模型获取上半部分的人体关键点信息, 该模型能够得到上半部分 的人体关键点信息Fbody={fls, frs, flh, frh}、 耳朵关键点信息Fe={fle, fre}, 以及人体关键点 信息置信度和耳朵关键点信息 置信度; 2‑3将人体方位估计当做一个分类任务, 设计一个行人方位估计模型, 行人方位估计模 型包括输入层、 3个全 连接层和输出层, 并在输出层的后面加入softmax层, 将 输出结果转换 为属于不同类别的可能性大小; 以人体关键点信 息Fbody、 耳朵关键点信 息Fe、 人体关键点信 息置信度和耳 朵关键点信息置信度作为输入, 3个朝向状态作为输出, 训练得到行人方位估 计模型。 4.根据权利要求1或3所述的一种基于重识别和方位感知的实时跨摄像头行人跟踪方 法, 其特征在于步骤(3)使用视频解码器ffmpeg, 以30fps的帧率捕获每个摄像头下的视频权 利 要 求 书 1/3 页 2 CN 114419669 A 2流, 并将图像帧存 储到队列中。 5.根据权利要求4所述的一种基于重识别和方位感知的实时跨摄像头行人跟踪方法, 其特征在于所述 步骤(4)具体实现过程如下: 4‑1依次读取摄像头视频流存储在队列中的每帧图像, 使用SSD算法对图像进行行人检 测, 得到每一个行人的边界框b=[x, y, w, h], 其中[ x, y]为边界框左上角像素坐标, [w, h]为 边界框宽度和高度。 6.根据权利要求5所述的一种基于重识别和方位感知的实时跨摄像头行人跟踪方法, 其特征在于所述 步骤(5)具体实现过程如下: 5‑1使用步骤(4)中得到的行人边界框, 在对应图像帧中截取行人图像 表示第j 个摄像头检测到的第i个行人图像; 将行人图像 输入到步骤(1)中得到的行人重识别模 型, 得到行 人的外观特 征 表示第j个 摄像头检测到的第i个行 人的外观特 征。 7.根据权利要求6所述的一种基于重识别和方位感知的实时跨摄像头行人跟踪方法, 其特征在于所述 步骤(6)具体实现过程如下: 6‑1使用Alpha  Pose模型获取步骤(5)中每一张行人图像 的人体关键点信息Fbody、 耳 朵关键点信息Fe、 人体关键点信息置信度和耳朵关键点信息置信度, 并将其输入步骤(2)中 的得到的行人方位估计模型, 获取每一张行人图像 中行人的方位信息 表示第j个摄 像头检测到的第i个行 人的方位信息 。 8.根据权利要求7所述的一种基于重识别和方位感知的实时跨摄像头行人跟踪方法, 其特征在于所述 步骤(7)具体实现过程如下: 7‑1使用一个基于常量速度模型和线性观测模型的标准卡尔曼滤波器进行目标运动状 态的预测, 预测结果为(u, p, w, h, vu, vp, vw, vh, ), 由行人边界框的中心坐标(u, p), 边界框宽 w, 边界框高h, 以及各自的速度变化值vu, vp, vw, vh组成; 将预测结果表示为行人的运动状态 信息; 7‑2采用马氏距离表示第m个检测目标和第n个轨迹之间的运动状态相似度, 如公式(2) 所示, 其中dm表示第m个检测目标的运动信息, yn表示第n个轨迹的运动信息, Sn是由卡尔曼 滤波器预测得到的第n个轨迹在当前观测空间的协方差矩阵; 使用余弦距离计算第m个检测 目标和第n个轨迹之间的外观特征相似度, 如公式(3)所示, fm表示第m个检测目标的外观特 征信息, fn表示第n个轨迹的外观特征信息; 通过线性加权融合运动状态相似度v(n, m)和外 观特征相似度f(n, m), 构建检测目标和轨迹 之间的代 价矩阵D, 如公 式(4)所示, α 是超参数, 用于调整不同项的权重; 最后采用匈牙利算法完成检测目标和轨迹之间的匹配任务, 实现 单摄像头下的目标跟踪; f(n, m)=cos(fm, fn)    (3) D(n, m)=α v(n, m)+(1 ‑α )f(n, m)     (4)。 9.根据权利要求8所述的一种基于重识别和方位感知的实时跨摄像头行人跟踪方法,权 利 要 求 书 2/3 页 3 CN 114419669 A 3

.PDF文档 专利 一种基于重识别和方位感知的实时跨摄像头行人跟踪方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于重识别和方位感知的实时跨摄像头行人跟踪方法 第 1 页 专利 一种基于重识别和方位感知的实时跨摄像头行人跟踪方法 第 2 页 专利 一种基于重识别和方位感知的实时跨摄像头行人跟踪方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:42:59上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。