全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111350153.5 (22)申请日 2021.11.15 (71)申请人 浙江大华 技术股份有限公司 地址 310051 浙江省杭州市滨江区滨安路 1187号 (72)发明人 张兴明 周旭亚 陈波扬 黄鹏  (74)专利代理 机构 深圳市威世博知识产权代理 事务所(普通 合伙) 44280 代理人 何倚雯 (51)Int.Cl. G06N 20/00(2019.01) G06K 9/62(2022.01) (54)发明名称 一种机器学习模 型的训练方法、 装置和可读 存储介质 (57)摘要 本申请公开了一种机器学习模型的训练方 法、 装置和可读存储介质, 该方法包括: 获取多个 第一训练样 本; 对第一训练样 本进行第一随机增 强处理, 得到第二训练样本; 在基于预设增强总 数判断到第二训练样本满足预设增强条件后, 对 第二训练样 本进行第二随机增强处理, 得到第三 训练样本, 预设增强总数为批处理数量的约数; 利用训练样 本对机器学习模型进行训练, 得到训 练完的机器学习模型, 训练样 本包括第二训练样 本或第三训练样本, 批处理数量为每次输入至机 器学习模型的训练样本的数量。 通过上述方式, 本申请能够加速模型的收敛速度。 权利要求书2页 说明书7页 附图4页 CN 114219095 A 2022.03.22 CN 114219095 A 1.一种机器学习模型的训练方法, 其特 征在于, 包括: 获取多个第一训练样本; 对所述第一训练样本进行第一随机增强处 理, 得到第二训练样本; 在基于预设增强总数判断到所述第 二训练样本满足预设增强条件后, 对所述第 二训练 样本进行第二随机增强处 理, 得到第三训练样本, 所述预设增强总数为批处 理数量的约数; 利用训练样本对机器学习模型进行训练, 得到训练完的机器学习模型, 所述训练样本 包括所述第二训练样本或所述第三训练样本, 所述批处理数量为每次输入至所述机器学习 模型的训练样本的数量。 2.根据权利要求1所述的机器学习模型的训练方法, 其特征在于, 所述对所述第 一训练 样本进行第一随机增强处 理, 得到第二训练样本的步骤之前, 包括: 对增强统计表进行初始化, 所述增强统计表包括不同类别的所述第 一训练样本以及与 所述第一训练样本对应的增强次数; 从所述增强统计表中选取增强次数为第 一预设值的第 一训练样本, 以形成本轮增强样 本集; 其中, 在所述增强统计表中的增强次数均为第二预设值时, 执行所述对增强统计表进 行初始化的步骤。 3.根据权利要求2所述的机器学习模型的训练方法, 其特征在于, 所述对所述第 二训练 样本进行第二随机增强处 理, 得到第三训练样本的步骤之前, 包括: 将本轮样本更新数量初始化 为第三预设值; 将所述本轮样本更新数量与所述预设增强总数进行比较, 得到比较结果; 基于所述比较结果, 判断所述第二训练样本是否满足所述预设增强条件。 4.根据权利要求3所述的机器学习模型的训练方法, 其特征在于, 所述第 二随机增强处 理为随机遮挡处理, 所述将所述本轮样本更新数量与所述预设增强总 数进行比较的步骤, 包括: 判断所述本轮样本更新数量是否小于所述预设增强总数; 若所述本轮样本更新数量小于所述预设增强总数, 则判断当前所述第 二训练样本是否 满足预设遮挡条件; 若当前所述第 二训练样本满足所述预设遮挡条件, 则确定所述第 二训练样本满足所述 预设增强条件, 对所述第二训练样本进行随机遮挡处 理, 得到所述第三训练样本; 将所述本轮样本更新数量与 预设步长相加, 并返回所述判断所述本轮样本更新数量是 否小于所述预设增强总 数的步骤, 直至所述本轮样本更新数量大于/等于所述预设增强总 数; 在所述本轮样本更新数量大于/等于所述预设增强总数后, 则执行所述利用训练样本 对机器学习模型进行训练的步骤。 5.根据权利要求4所述的机器学习模型的训练方法, 其特征在于, 所述判断当前所述第 二训练样本是否满足预设遮挡条件的步骤, 包括: 随机生成一个位于预设数值范围内的遮挡因子; 判断所述遮挡因子是否大于预设遮挡阈值; 若是, 则确定当前 所述第二训练样本满足所述预设遮挡条件。权 利 要 求 书 1/2 页 2 CN 114219095 A 26.根据权利要求4所述的机器学习模型的训练方法, 其特征在于, 所述第 二训练样本包 括多个第一待处理数据, 所述对所述第二训练样本进行随机遮挡处理, 得到所述第三训练 样本的步骤, 包括: 从所有所述第 一待处理数据中随机选择至少一个所述第 一待处理数据, 得到第 二待处 理数据; 对所述第二待处 理数据进行随机化处 理, 得到第三待处 理数据; 利用所述第 三待处理数据替换所述第 二训练样本中相应的第 一待处理数据, 得到所述 第三训练样本 。 7.根据权利要求2所述的机器学习模型的训练方法, 其特 征在于, 所述方法包括: 基于所述训练样本对应的标签值与 所述机器学习 模型输出的预测值, 判断当前所述机 器学习模型 是否满足预设训练结束条件; 若否, 则对所述本轮增强样本集中第一训练样本对应的增强次数进行更新, 并返回所 述从所述增强统计表中选取增强次数为第一预设值的第一训练样本的步骤, 直至所述机器 学习模型满足所述预设训练结束条件。 8.根据权利要求7所述的机器学习模型的训练方法, 其特征在于, 所述基于所述训练样 本对应的标签值与所述机器学习模型输出的预测值, 判断当前所述机器学习模型是否满足 预设训练结束条件的步骤, 包括: 计算所述训练样本对应的标签值与所述机器学习模型输出的预测值之间的损失值; 判断所述损失值是否小于预设损失阈值或当前训练次数 是否大于预设迭代次数阈值; 若是, 则确定当前 所述机器学习模型满足所述预设训练结束条件。 9.一种电子装置, 其特征在于, 包括互相连接的存储器和 处理器, 其中, 所述存储器用 于存储计算机程序, 所述计算机程序在被所述处理器执行时, 用于实现权利要求 1‑8中任一 项所述的机器学习模型的训练方法。 10.一种计算机可读存储介质, 用于存储计算机程序, 其特征在于, 所述计算机程序在 被处理器执行时, 用于实现权利要求1 ‑8中任一项所述的机器学习模型的训练方法。权 利 要 求 书 2/2 页 3 CN 114219095 A 3

.PDF文档 专利 一种机器学习模型的训练方法、装置和可读存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种机器学习模型的训练方法、装置和可读存储介质 第 1 页 专利 一种机器学习模型的训练方法、装置和可读存储介质 第 2 页 专利 一种机器学习模型的训练方法、装置和可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:00:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。