专利一种基于对比聚类的无监督行人重识别方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210664167.2 (22)申请日 2022.06.13 (71)申请人中国计量大学地址 310018 浙江省杭州市学源街258号中国计量大学 (72)发明人张远辉　冯化涛　刘康　朱俊江　付铎　 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/762(2022.01) G06N 3/08(2006.01) (54)发明名称一种基于对比聚类的无监督行人重识别方法 (57)摘要本发明公开了一种基于对比聚类的无监督行人重识别方法，该方法包括以下步骤：使用初始特征编码器对无标注行人图像数据集进行前向计算，使用编码的特征初始化特征存储单元；在每轮训练前对特征存储单元进行聚类，根据聚类独立性标准与聚类紧密性标准进行聚类结果的筛选；对每一组小批量训练样本进行特征编码，利用统一对比损失函数进行网络的反向传播更新；使用编码的特征以动量更新的方式动态更新特征存储单元中的实例特征；根据预先设定的训练轮回数循环进行特征编码器及特征存储单元的更新，直到所述行人重识别网络收敛。本发明利用对比聚类的方法，充分挖掘未聚类离群值的可用信息，提高了无监督行人重识别模型的识别准确性。权利要求书3页说明书8页附图3页 CN 114898406 A 2022.08.12 CN 114898406 A 1.一种基于对比聚类的无监督行人重识别方法，其特征在于，包括以下步骤：步骤1：使用初始特征编码器对无标注行人图像数据集进行前向计算，使用编码的特征初始化基于类别原型的特征存储单元；步骤2：在每轮训练前进行特征存储单元中编码特征的聚类，根据聚类可靠性评价标准进行聚类结果的筛选；步骤3：使用特征编码器对每一组小批量训练样本进行特征编码，利用统一对比损失函数进行网络的反向传播，更新特征编码器；步骤4：利用编码的特征以动量更新的方式动态更新特征存储单元；步骤5：根据训练轮回数循环进行步骤2 ‑步骤4，直到所述行人重识别网络收敛。 2.根据权利要求1所述的一种基于对比聚类的无监督行人重识别方法，其特征在于，所述步骤1包括：使用ResNet ‑50深度神经网络作为特征编码器，并使用ImageNet图像数据集上的预训练权重对其进行初始化；使用特征编码器对行人图像数据集中的样本进行特征提取，得到特征集合{v1,…,vn}，将样本特征以实例为单位全部保存到特征存储单元中。 3.根据权利要求1所述的一种基于对比聚类的无监督行人重识别方法，其特征在于，所述步骤2包括：使用DBSCAN聚类算法对步骤1中特征存储单元中的特征集合{v1,…,vn}进行聚类，特征存储单元中的类别原型进一步分为聚类簇质心及未聚类离群值实例其中nc表示聚类簇的数量， no表示未聚类离群值的数量，使用自步学习策略并结合聚类独立性与聚类紧密性标准，保留可靠的聚类簇，而将不可靠的聚类簇中的特征拆解回无聚类的离群值实例中。 4.根据权利要求3所述的方法，其特征在于，所述自步学习策略在每轮训练开始前重新进行聚类，从最可靠的聚类簇开始，逐步增加聚类簇的数量，通过调整DBS CAN聚类算法中样本邻域距离阈值，交替放宽与缩紧聚类标准；所述聚类独立性标准用于度量类间距离，表现为特征集合与放宽聚类标准后特征集合之间的交并比：其中|·|表示集合中特征的数量， I(fi)表示同一个簇中的样本集合， Iloose(fi)表示放宽聚类标准后同一个簇中的样本集合， Rindep(fi)表示簇I(fi)的独立性得分；所述聚类紧密性标准用于度量类内距离，表现为特征集合与缩紧聚类标准后特征集合之间的交并比：其中Itight(fi)表示缩紧聚类标准后同一个簇中的样本集合， Rcomp(fi)表示簇I(fi)的紧密性得分；通过以上聚类可靠性评价标准度量聚类中数据之间的独立性和紧密性，设置α, β ∈[0,权　利　要　求　书 1/3 页 2 CN 114898406 A 21]表示独立性和紧密性阈值，保留类间独立性Rcomp(fi)>α 且类内紧密性Rindep(fi)>β 的聚类簇样本，将其余样本划分为未聚类的离群值。 5.根据权利要求1所述的一种基于对比聚类的无监督行人重识别方法，其特征在于，所述步骤3包括：给定无标签的训练样本使用步骤2中的自步学习策略将其分为有聚类伪标签的样本集合和不属于任何聚类的离群值实例样本集合且给定训练样本使用特征编码器进行前向计算得到编码的特征f，构建统一对比损失函数：其中， z+表示特征f的正面类别原型， τ表示温度系数， < ·,·>表示向量内积， ck为当前聚类的簇质心，表示聚类内的类别原型， vk为当前聚类离群点的实例特征，表示无聚类的类别原型；对小批量样本编码特征后，与两种类别原型进行比较，使得每个训练样本靠近它所属于的类别而远离其他类别。 6.根据权利要求1所述的一种基于对比聚类的无监督行人重识别方法，其特征在于，所述步骤4包括：在特征存储单元中，对同一聚类簇中的特征{v1,…,vn}计算特征之间的平均值得到聚类簇质心而未聚类离群值的实例特征直接从特征存储单元中提取剩余的实例特征，第k个聚类簇的质心表示为：其中Ik表示第k个聚类簇的特征向量集合， | ·|表示集合中特征向量的数量，特征存储单元中的实例特征{v}最初由网络前向计算初始化一次，并在此后的训练过程中不断更新；将训练样本全部以实例为单位对特征存储单元初始化，在此后每一轮训练过程中，将当前小批量样本中的特征根据索引累加到特征存储单元对应的实例特征中，使用小批量样本中的编码特征以动量更新的方式动态地更新特征存储单元中的类别原型： vi←mvi+(1‑m)fi 其中m∈[0,1]动量因子，给定更新后的实例特征vi，若fi属于聚类簇k，那么对应的簇质心ck需要相应进行更新。 7.根据权利要求1所述的一种基于对比聚类的无监督行人重识别方法，其特征在于，所述步骤5包括：在每一次训练轮回中，依据聚类独立性及聚类紧密性标准，对特征存储单元中的特征进行聚类，将训练样本划分为聚类簇样本和无聚类离群值样本计算中的聚类簇质心；对于每个小批量中的训练样本，使用特征编码器进行特征编码，计算统一对比损失，并进行反向传播更新编码器；权　利　要　求　书 2/3 页 3 CN 114898406 A 3

专利 一种基于对比聚类的无监督行人重识别方法

专利一种基于对比聚类的无监督行人重识别方法