全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210031145.2 (22)申请日 2022.01.12 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 司世景 王健宗  (74)专利代理 机构 深圳中一联合知识产权代理 有限公司 4 4414 代理人 丁月蓉 (51)Int.Cl. G06K 9/62(2022.01) G06V 40/10(2022.01) G06V 10/62(2022.01) G06V 10/44(2022.01)G06V 10/774(2022.01) (54)发明名称 模型训练方法、 模型训练装置、 终端设备及 存储介质 (57)摘要 本申请适用于人工智能技术领域, 提供了一 种模型训练方法、 模型训练装置、 终端设备及存 储介质。 该方法包括: 针对样本集中的每个样本 图像执行两种不同的数据增广操作, 得到第一图 像和第二图像; 基于待训练的重识别模型对第一 图像和第二图像进行行人重识别得到重识别预 测结果; 基于重识别预测结果计算待训练的重识 别模型的第一损失值、 第二损失值以及第三损失 值; 基于第一损失值、 第二损失值、 第三损失值及 预设的目标损失函数计算得到待训练的重识别 模型的总损失值, 并基于总损失值对待训练的重 识别模型优化, 直至目标损失函数收敛, 得到训 练完成的重识别模型。 该方法得到的重识别模 型, 具备较强的鲁棒性和泛化能力。 此外, 本申请 还涉及区块链技 术。 权利要求书2页 说明书10页 附图3页 CN 114358205 A 2022.04.15 CN 114358205 A 1.一种模型训练方法, 其特 征在于, 所述模型训练方法包括: 针对样本集中的每个样本 图像, 对所述样本 图像执行两种不同的数据增广操作, 得到 第一图像和第二图像; 基于待训练的重识别模型分别对所述第一图像和所述第二图像进行行人重识别得到 重识别预测结果, 所述重识别模型包括主干网络、 平均池化层以及全连接层; 基于所述重识别预测结果计算所述待训练 的重识别模型的第 一损失值、 第 二损失值以 及第三损失值, 所述第一损失值用于描述图像所属标签的真实概率和预测概率之间的损 失, 所述第二损失值用于描述图像的真实区别特征与提取区别特征之间的损失, 所述第三 损失值用于描述图像的真实标签与预测标签之间的损失; 基于所述第一损 失值、 所述第二损 失值、 所述第三损 失值及预设的目标损 失函数计算 得到所述待训练的重识别模型的总损失值, 并基于所述总损失值对所述待训练的重识别模 型进行优化, 直至所述目标损失函数收敛, 得到训练完成的重识别模型。 2.根据权利要求1所述的模型训练方法, 其特征在于, 所述重识别预测结果包括所述第 一图像的第一预测概率以及所述第二图像的第二预测概率, 所述第一损失值通过如下方式 计算得到: 基于KL散度及预设的第一损 失函数对所述第一预测概率和所述第二预测概率进行约 束, 得到所述第一损失值, 所述第一损失函数为: 其中, 所述p1为第一图像的第一预测概率, 所述p2为第二图像的第二预测概率, 所述DKL (p1||p2)为所述第一图像的相对熵, 所述DKL(p2||p1)为所述第二图像的相对熵。 3.根据权利要求1所述的模型训练方法, 其特征在于, 所述重识别预测结果包括正负样 本对距离, 所述第二损失值通过所述正负样本对距离和预设的第二损失函数计算, 所述正 负样本对距离通过以下步骤获得: 针对第一图像及第二图像 中的每种图像, 将所述图像分为至少1个批次, 每个批次包括 P个行人标签, 每个行人标签对应有K张图像, 每个所述行人标签对应的K张图像中, 包括一 张固定图像a; 针对每个批次中的每张固定图像 a, 将与所述固定图像 a的行人标签相同的所述图像确 定为正样本集A, 将与所述固定图像a的行人标签不相同的所述图像确定为负样本集B, 基于 所述固定图像a、 所述 正样本集A以及所述负 样本集B计算所述 正负样本对距离 。 4.根据权利要求3所述的模型训练方法, 其特征在于, 所述正负样本对距离包括正样本 对距离和负样本对距离, 所述基于所述固定图像a、 所述正样 本集A以及所述负样本集B计算 所述正负样本对距离包括: 计算正样本集A中每张所述图像与所述固定图像a之间的正样本对距离; 计算负样本集B中每张所述图像与所述固定图像a之间的负 样本对距离 。 5.根据权利要求2所述的模型训练方法, 其特征在于, 所述第 三损失值通过预设的第 三 损失函数计算得到, 所述第三损失函数为: 权 利 要 求 书 1/2 页 2 CN 114358205 A 2其中, 所述N为所述样本集中行人标签的类别总数, 所述qi为预测标签, 所述pi为图像中 的行人属于第i类行 人标签的预测概 率, 所述y为图像中的行 人的真实标签。 6.根据权利要求1 ‑5任意一项所述的模型训练方法, 其特征在于, 所述基于待训练的重 识别模型分别对所述第一图像和所述第二图像进行行人重识别得到重识别预测结果, 包 括: 基于所述主干网络分别对所述第 一图像和所述第 二图像进行特征提取, 得到第 一特征 和第二特 征; 基于所述平均池化层将所述第 一特征和所述第 二特征向量化, 得到第 一特征向量和第 二特征向量; 基于所述全连接层、 第一特征向量以及第二特征向量进行行人重识别, 得到重识别预 测结果。 7.根据权利要求1所述的模型训练方法, 其特征在于, 在所述得到训练完成的重识别模 型之后, 所述模型训练方法还 包括: 将样本集、 待训练的重识别模型和/或训练完成的重识别模型 上传至区块链中。 8.一种模型训练装置, 其特 征在于, 所述模型训练装置包括: 数据增广模块, 用于针对样本集中的每个样本 图像, 对所述样本 图像执行两种不同的 数据增广操作, 得到第一图像和第二图像; 重识别模块, 用于基于待训练 的重识别模型分别对所述第 一图像和所述第 二图像进行 行人重识别得到重识别预测结果, 所述重识别模型包括主干网络、 平均池化层以及全连接 层; 计算模块, 用于基于所述重识别预测结果计算所述待训练的重识别模型的第一损失 值、 第二损失值以及第三损失值, 所述第一损失值用于描述图像所属标签的真实概率和预 测概率之 间的损失, 所述第二损失值用于描述图像的真实区别特征与提取区别特征之 间的 损失, 所述第三损失值用于描述图像的真实标签与预测标签之间的损失; 优化模块, 用于基于所述第 一损失值、 所述第 二损失值、 所述第三损失值及预设的目标 损失函数计算得到所述待训练的重识别模型的总损失值, 并基于所述总损失值对所述待训 练的重识别模型进行优化, 直至所述目标损失函数收敛, 得到训练完成的重识别模型。 9.一种终端设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器上 运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至7 任一项所述方法的步骤。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处 理器执行时实现如权利要求1至7任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114358205 A 3

.PDF文档 专利 模型训练方法、模型训练装置、终端设备及存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、模型训练装置、终端设备及存储介质 第 1 页 专利 模型训练方法、模型训练装置、终端设备及存储介质 第 2 页 专利 模型训练方法、模型训练装置、终端设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:17:13上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。