专利模型训练方法、模型训练装置、终端设备及存储介质

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210031145.2 (22)申请日 2022.01.12 (71)申请人平安科技（深圳）有限公司地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼 (72)发明人司世景　王健宗　 (74)专利代理机构深圳中一联合知识产权代理有限公司 4 4414 代理人丁月蓉 (51)Int.Cl. G06K 9/62(2022.01) G06V 40/10(2022.01) G06V 10/62(2022.01) G06V 10/44(2022.01)G06V 10/774(2022.01) (54)发明名称模型训练方法、模型训练装置、终端设备及存储介质 (57)摘要本申请适用于人工智能技术领域，提供了一种模型训练方法、模型训练装置、终端设备及存储介质。该方法包括：针对样本集中的每个样本图像执行两种不同的数据增广操作，得到第一图像和第二图像；基于待训练的重识别模型对第一图像和第二图像进行行人重识别得到重识别预测结果；基于重识别预测结果计算待训练的重识别模型的第一损失值、第二损失值以及第三损失值；基于第一损失值、第二损失值、第三损失值及预设的目标损失函数计算得到待训练的重识别模型的总损失值，并基于总损失值对待训练的重识别模型优化，直至目标损失函数收敛，得到训练完成的重识别模型。该方法得到的重识别模型，具备较强的鲁棒性和泛化能力。此外，本申请还涉及区块链技术。权利要求书2页说明书10页附图3页 CN 114358205 A 2022.04.15 CN 114358205 A 1.一种模型训练方法，其特征在于，所述模型训练方法包括：针对样本集中的每个样本图像，对所述样本图像执行两种不同的数据增广操作，得到第一图像和第二图像；基于待训练的重识别模型分别对所述第一图像和所述第二图像进行行人重识别得到重识别预测结果，所述重识别模型包括主干网络、平均池化层以及全连接层；基于所述重识别预测结果计算所述待训练的重识别模型的第一损失值、第二损失值以及第三损失值，所述第一损失值用于描述图像所属标签的真实概率和预测概率之间的损失，所述第二损失值用于描述图像的真实区别特征与提取区别特征之间的损失，所述第三损失值用于描述图像的真实标签与预测标签之间的损失；基于所述第一损失值、所述第二损失值、所述第三损失值及预设的目标损失函数计算得到所述待训练的重识别模型的总损失值，并基于所述总损失值对所述待训练的重识别模型进行优化，直至所述目标损失函数收敛，得到训练完成的重识别模型。 2.根据权利要求1所述的模型训练方法，其特征在于，所述重识别预测结果包括所述第一图像的第一预测概率以及所述第二图像的第二预测概率，所述第一损失值通过如下方式计算得到：基于KL散度及预设的第一损失函数对所述第一预测概率和所述第二预测概率进行约束，得到所述第一损失值，所述第一损失函数为：其中，所述p1为第一图像的第一预测概率，所述p2为第二图像的第二预测概率，所述DKL (p1||p2)为所述第一图像的相对熵，所述DKL(p2||p1)为所述第二图像的相对熵。 3.根据权利要求1所述的模型训练方法，其特征在于，所述重识别预测结果包括正负样本对距离，所述第二损失值通过所述正负样本对距离和预设的第二损失函数计算，所述正负样本对距离通过以下步骤获得: 针对第一图像及第二图像中的每种图像，将所述图像分为至少1个批次，每个批次包括 P个行人标签，每个行人标签对应有K张图像，每个所述行人标签对应的K张图像中，包括一张固定图像a；针对每个批次中的每张固定图像 a，将与所述固定图像 a的行人标签相同的所述图像确定为正样本集A，将与所述固定图像a的行人标签不相同的所述图像确定为负样本集B，基于所述固定图像a、所述正样本集A以及所述负样本集B计算所述正负样本对距离。 4.根据权利要求3所述的模型训练方法，其特征在于，所述正负样本对距离包括正样本对距离和负样本对距离，所述基于所述固定图像a、所述正样本集A以及所述负样本集B计算所述正负样本对距离包括：计算正样本集A中每张所述图像与所述固定图像a之间的正样本对距离；计算负样本集B中每张所述图像与所述固定图像a之间的负样本对距离。 5.根据权利要求2所述的模型训练方法，其特征在于，所述第三损失值通过预设的第三损失函数计算得到，所述第三损失函数为：权　利　要　求　书 1/2 页 2 CN 114358205 A 2其中，所述N为所述样本集中行人标签的类别总数，所述qi为预测标签，所述pi为图像中的行人属于第i类行人标签的预测概率，所述y为图像中的行人的真实标签。 6.根据权利要求1 ‑5任意一项所述的模型训练方法，其特征在于，所述基于待训练的重识别模型分别对所述第一图像和所述第二图像进行行人重识别得到重识别预测结果，包括：基于所述主干网络分别对所述第一图像和所述第二图像进行特征提取，得到第一特征和第二特征；基于所述平均池化层将所述第一特征和所述第二特征向量化，得到第一特征向量和第二特征向量；基于所述全连接层、第一特征向量以及第二特征向量进行行人重识别，得到重识别预测结果。 7.根据权利要求1所述的模型训练方法，其特征在于，在所述得到训练完成的重识别模型之后，所述模型训练方法还包括：将样本集、待训练的重识别模型和/或训练完成的重识别模型上传至区块链中。 8.一种模型训练装置，其特征在于，所述模型训练装置包括：数据增广模块，用于针对样本集中的每个样本图像，对所述样本图像执行两种不同的数据增广操作，得到第一图像和第二图像；重识别模块，用于基于待训练的重识别模型分别对所述第一图像和所述第二图像进行行人重识别得到重识别预测结果，所述重识别模型包括主干网络、平均池化层以及全连接层；计算模块，用于基于所述重识别预测结果计算所述待训练的重识别模型的第一损失值、第二损失值以及第三损失值，所述第一损失值用于描述图像所属标签的真实概率和预测概率之间的损失，所述第二损失值用于描述图像的真实区别特征与提取区别特征之间的损失，所述第三损失值用于描述图像的真实标签与预测标签之间的损失；优化模块，用于基于所述第一损失值、所述第二损失值、所述第三损失值及预设的目标损失函数计算得到所述待训练的重识别模型的总损失值，并基于所述总损失值对所述待训练的重识别模型进行优化，直至所述目标损失函数收敛，得到训练完成的重识别模型。 9.一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7 任一项所述方法的步骤。 10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。权　利　要　求　书 2/2 页 3 CN 114358205 A 3

专利 模型训练方法、模型训练装置、终端设备及存储介质

专利模型训练方法、模型训练装置、终端设备及存储介质