(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210664167.2
(22)申请日 2022.06.13
(71)申请人 中国计量大 学
地址 310018 浙江省杭州市学源街258号中
国计量大 学
(72)发明人 张远辉 冯化涛 刘康 朱俊江
付铎
(51)Int.Cl.
G06V 40/10(2022.01)
G06V 10/762(2022.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于对比聚类的无监督行人重识别方
法
(57)摘要
本发明公开了一种基于对比聚类的无监督
行人重识别方法, 该方法包括以下步骤: 使用初
始特征编码器对无标注行人图像数据集进行前
向计算, 使用编码的特征初始化特征存储单元;
在每轮训练前对 特征存储单元进行聚类, 根据聚
类独立性标准与聚类紧密性标准进行聚类结果
的筛选; 对每一组小批量训练样本进行特征编
码, 利用统一对比损失函数进行网络的反向传播
更新; 使用编码的特征以动量更新的方式动态更
新特征存储 单元中的实例特征; 根据预先设定的
训练轮回数循环进行特征编码器及特征存储单
元的更新, 直到所述行人重识别网络收敛。 本发
明利用对比聚类的方法, 充分挖掘未聚类离群值
的可用信息, 提高了无监督行人重识别模型的识
别准确性。
权利要求书3页 说明书8页 附图3页
CN 114898406 A
2022.08.12
CN 114898406 A
1.一种基于对比聚类的无监 督行人重识别方法, 其特 征在于, 包括以下步骤:
步骤1: 使用初始特征编码器对无标注行人图像数据集进行前向计算, 使用编码的特征
初始化基于类别原型的特 征存储单元;
步骤2: 在每轮训练前进行特征存储单元中编码特征的聚类, 根据聚类可靠性评价标准
进行聚类结果的筛 选;
步骤3: 使用特征编码器对每一组小批量训练样本进行特征编码, 利用统一对比损失函
数进行网络的反向传播, 更新特 征编码器;
步骤4: 利用编码的特 征以动量更新的方式动态更新特 征存储单元;
步骤5: 根据训练轮回数循环进行步骤2 ‑步骤4, 直到所述行 人重识别网络收敛。
2.根据权利要求1所述的一种基于对比聚类的无监督行人重识别方法, 其特征在于, 所
述步骤1包括:
使用ResNet ‑50深度神经网络作为特征编码器, 并使用ImageNet图像数据集上的预训
练权重对其进行初始化;
使用特征编码器对行人图像数据集中的样本进行特征提取, 得到特征集合{v1,…,vn},
将样本特征以实例为单位全部保存到特 征存储单元中。
3.根据权利要求1所述的一种基于对比聚类的无监督行人重识别方法, 其特征在于, 所
述步骤2包括:
使用DBSCAN聚类算法对步骤1中特征存储单元中的特征集合{v1,…,vn}进行聚类, 特征
存储单元中的类别原型进一步分为聚类簇质心
及未聚类离群值实例
其中nc表示聚类簇的数量, no表示未聚类离群值 的数量, 使用自步学习策略并
结合聚类独立性与聚类紧密性标准, 保留可靠的聚类簇, 而将不可靠的聚类簇中的特征拆
解回无聚类的离群值实例中。
4.根据权利要求3所述的方法, 其特征在于, 所述自步学习策略在每轮训练开始前重新
进行聚类, 从最可靠的聚类簇开始, 逐步增加聚类簇的数量, 通过调整DBS CAN聚类算法中样
本邻域距离阈值, 交替 放宽与缩紧聚类标准;
所述聚类独立性标准用于度量类间距离, 表现为特征集合与放宽聚类标准后特征集合
之间的交并比:
其中|·|表示集合中特征的数量, I(fi)表示同一个簇中的样本集合, Iloose(fi)表示放
宽聚类标准后同一个簇中的样本集 合, Rindep(fi)表示簇I(fi)的独立性得分;
所述聚类 紧密性标准用于度量类内距离, 表现为特征集合与缩紧聚类标准后特征集合
之间的交并比:
其中Itight(fi)表示缩紧聚类标准后同一个簇中的样本集合, Rcomp(fi)表示簇I(fi)的紧
密性得分;
通过以上聚类可靠性评价标准度量聚类 中数据之间的独立性和紧密性, 设置α, β ∈[0,权 利 要 求 书 1/3 页
2
CN 114898406 A
21]表示独立性和紧密性阈值, 保留类间独立性Rcomp(fi)>α 且类内紧密性Rindep(fi)>β 的聚类
簇样本, 将其 余样本划分为未聚类的离群值。
5.根据权利要求1所述的一种基于对比聚类的无监督行人重识别方法, 其特征在于, 所
述步骤3包括:
给定无标签的训练样本
使用步骤2中的自步学习策略将其分为有聚类伪标签的样本
集合
和不属于任何聚类的离群值实例样本集 合
且
给定训练样本
使用特征编码器进行前向计算得到编码的特征f, 构建统一
对比损失函数:
其中, z+表示特征f的正面类别原型, τ表示温度系数, < ·,·>表示向量内积, ck为当前
聚类的簇质心, 表示聚类内的类别原型, vk为当前聚类离群点的实例特征, 表示无聚类的类
别原型;
对小批量样本编码特征后, 与两种类别原型进行比较, 使得每个训练样本靠近它所属
于的类别而远离其 他类别。
6.根据权利要求1所述的一种基于对比聚类的无监督行人重识别方法, 其特征在于, 所
述步骤4包括:
在特征存储单元中, 对同一聚类簇中的特征{v1,…,vn}计算特征之间的平均值得到聚
类簇质心
而未聚类离群值的实例特征
直接从特征存储单元中提取
剩余的实例特 征, 第k个聚类簇的质心 表示为:
其中Ik表示第k个聚类簇的特征向量集合, | ·|表示集合中特征向量的数量, 特征存储
单元中的实例特 征{v}最初由网络前向计算初始化 一次, 并在此后的训练过程中不断更新;
将训练样本全部以实例为单位对特征存储单元初始化, 在此后每一轮训练过程中, 将
当前小批量样本中的特征根据索引累加到特征存储单元对应的实例特征中, 使用小批量样
本中的编码特 征以动量更新的方式动态地更新特 征存储单元中的类别原型:
vi←mvi+(1‑m)fi
其中m∈[0,1]动量因子, 给定更新后的实例特征vi, 若fi属于聚类簇k, 那么对应的簇质
心ck需要相应进行 更新。
7.根据权利要求1所述的一种基于对比聚类的无监督行人重识别方法, 其特征在于, 所
述步骤5包括:
在每一次训练轮回中, 依据聚类独立性及聚类紧密性标准, 对特征存储单元中的特征
进行聚类, 将训练样本
划分为聚类簇样本
和无聚类离群值样本
计算
中的聚类簇
质心;
对于每个小批量中的训练样本, 使用特征编码器进行特征编码, 计算统一对比损失, 并
进行反向传播更新编码器;权 利 要 求 书 2/3 页
3
CN 114898406 A
3
专利 一种基于对比聚类的无监督行人重识别方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 11:54:44上传分享