全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210875511.2 (22)申请日 2022.07.25 (71)申请人 湖南艾凯瑞斯智能科技有限公司 地址 410000 湖南省长 沙市长沙高新开发 区谷苑路186号工程孵化中心大楼-西 区102号 (72)发明人 陈逢军 龚胜 王涛 胡天  徐志强  (74)专利代理 机构 长沙中科启明知识产权代理 事务所(普通 合伙) 43226 专利代理师 谭勇 (51)Int.Cl. G06V 10/82(2022.01) G06V 10/774(2022.01) G06V 10/764(2022.01)G06V 10/766(2022.01) G06V 10/80(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种视觉目标检测网络模型的训练方法 (57)摘要 本发明涉及一种视觉目标检测网络模型的 训练方法, 其包括获取图像并标注, 将数据按比 例划分为训练集和验证集; 建立一个目标检测网 络模型; 利用训练集对目标网络检测模型使用多 样本匹配策略进行第一阶段训练, 并利用验证集 对正在训练的模 型进行验证; 利用训练集对目标 检测网络模型使用单样本匹配策略进行第二阶 段训练, 并利用验证集对正在训练的模型进行验 证; 最后将待检测的图像输入训练好的目标检测 网络模型, 检测出图像中的主体, 并且给出每个 目标的类别、 中心位置和大小。 本发明首次提出 了一种二阶段的目标检测网络模 型的训练方法, 在部署后无需进行非极大值抑制处理即可实现 模型端到端的检测性能, 节省计算开销的同时更 方便模型部署。 权利要求书2页 说明书4页 附图2页 CN 115359335 A 2022.11.18 CN 115359335 A 1.一种视 觉目标检测网络模型的训练方法, 其特 征在于, 包括以下步骤: S1, 获取图像样本, 对于每张图像样本中出现的目标, 根据位置、 类别和边界标注它们 的围框和类别, 并将数据集按比例划分为训练集和验证集; S2, 建立一个目标检测网络模型, 所述目标检测网络模型包括主干网路、 特征融合网络 和解耦预测网络, 所述主干网络用于特征提取, 并将不同尺度的语义特征传入特征融合网 络, 所述特征融合网络将不同尺度的语义特征进行融合, 并将融合后的语义特征传入解耦 预测网络, 所述 解耦预测网络根据融合后的语义特 征对每个锚点进行 预测; 所述解耦预测网络包括一个分类分支、 一个预测分支和一个回归分支, 所述分类分支 用于预测锚点对应目标类别, 所述预测分支用于预测锚点是否包含目标, 所述回归分支用 于预测锚点对应包围框的位置偏移量和大小; S3, 多样本第一阶段匹配训练, 利用训练集对目标网络检测模型使用多样本匹配策略 进行训练, 并利用验证集对正在训练的模型进行验证; S4, 单样本第二阶段匹配训练, 利用训练集对目标检测网络模型使用单样本匹配策略 进行训练, 并利用验证集对正在训练的模型进行验证; S5, 将待检测的图像输入训练好的目标检测网络模型, 检测出图像 中的主体, 并且给出 每个目标的类别、 中心位置和大小。 2.根据权利要求1所述视觉目标检测网络模型的训练方法, 其特征在于: 所述步骤S2中 的主干网络为基于卷积神经网络的特征提取器, 所述特征提取器包括但不限于Resnet和 CSPDarknet。 3.根据权利要求1所述视觉目标检测网络模型的训练方法, 其特征在于: 所述步骤S2中 特征融合网络将不同尺度的语义特征进行融合, 使得浅层特征具有深层的语义信息, 深层 特征具有浅层的语义信息, 实现不同尺度目标的识别。 4.根据权利要求1所述视觉目标检测网络模型的训练方法, 其特征在于: 所述步骤S3 中 多样本匹配策略通过自适应选择与每 个主体相匹配的正样本数量进行损失计算。 5.根据权利要求1所述视觉目标检测网络模型的训练方法, 其特征在于: 所述单样本匹 配策略通过自适应选择与每 个主体相匹配的最优正样本进行损失计算。 6.根据权利要求1所述视觉目标检测网络模型的训练方法, 其特征在于: 所述单样本第 二阶段匹配训练为预测分支的单独训练。 7.根据权利要求1所述视觉目标检测网络模型的训练方法, 其特征在于: 所述多样本第 一阶段匹配训练的具体步骤如下, S301, 将目标检测网络模型和训练集初始化; S302, 将一个Batc h的数据输入到目标检测网络模型进行 前向传播; S303, 根据输出 结果计算 落在目标区域内的锚点的代价矩阵; S304, 根据代价自适应 计算出每 个目标匹配的正样本数量 k; S305, 将代价最高的k个锚点作为单个目标匹配的正样本, 进而计算损失, 并通过损失 函数对每一个参数求 导后得到梯度; S306, 将S305求的梯度数据进行反向传播更新 参数; S307, 循环执行S302至S306, 直到迭代次数达到第一阶段预设次数或损失值小于某一 设定阈值时结束训练。权 利 要 求 书 1/2 页 2 CN 115359335 A 28.根据权利要求1所述视觉目标检测网络模型的训练方法, 其特征在于: 所述单样本第 二阶段匹配训练的具体步骤如下, S401, 冻结目标检测网络模型主干网络、 特征融合网络、 分类分支和回归分支的参数, 禁止后续训练过程中的梯度回传, 单独训练预测分支, 将匹配的正样本数量由k个改为1个; S402, 将一个Batc h的数据输入到目标检测网络模型进行 前向传播; S403, 根据输出 结果计算 落在目标区域内的锚点的代价矩阵; S404, 将代价矩阵内元素按列进行排序, 为单个目标选取代价最 高的1个锚点作 为匹配 的正样本, 进 而计算损失, 并通过损失函数对每一个参数求 导后得到梯度; S405, 将S404 求的梯度数据进行反向传播更新 参数; S406, 循环执行S402至S405, 直到迭代次数达到第二阶段的预设次数或损失值小于某 一设定阈值时结束训练。权 利 要 求 书 2/2 页 3 CN 115359335 A 3

.PDF文档 专利 一种视觉目标检测网络模型的训练方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种视觉目标检测网络模型的训练方法 第 1 页 专利 一种视觉目标检测网络模型的训练方法 第 2 页 专利 一种视觉目标检测网络模型的训练方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:28:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。