专利一种视觉目标检测网络模型的训练方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210875511.2 (22)申请日 2022.07.25 (71)申请人湖南艾凯瑞斯智能科技有限公司地址 410000 湖南省长沙市长沙高新开发区谷苑路186号工程孵化中心大楼-西区102号 (72)发明人陈逢军　龚胜　王涛　胡天　徐志强　 (74)专利代理机构长沙中科启明知识产权代理事务所(普通合伙) 43226 专利代理师谭勇 (51)Int.Cl. G06V 10/82(2022.01) G06V 10/774(2022.01) G06V 10/764(2022.01)G06V 10/766(2022.01) G06V 10/80(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种视觉目标检测网络模型的训练方法 (57)摘要本发明涉及一种视觉目标检测网络模型的训练方法，其包括获取图像并标注，将数据按比例划分为训练集和验证集；建立一个目标检测网络模型；利用训练集对目标网络检测模型使用多样本匹配策略进行第一阶段训练，并利用验证集对正在训练的模型进行验证；利用训练集对目标检测网络模型使用单样本匹配策略进行第二阶段训练，并利用验证集对正在训练的模型进行验证；最后将待检测的图像输入训练好的目标检测网络模型，检测出图像中的主体，并且给出每个目标的类别、中心位置和大小。本发明首次提出了一种二阶段的目标检测网络模型的训练方法，在部署后无需进行非极大值抑制处理即可实现模型端到端的检测性能，节省计算开销的同时更方便模型部署。权利要求书2页说明书4页附图2页 CN 115359335 A 2022.11.18 CN 115359335 A 1.一种视觉目标检测网络模型的训练方法，其特征在于，包括以下步骤： S1，获取图像样本，对于每张图像样本中出现的目标，根据位置、类别和边界标注它们的围框和类别，并将数据集按比例划分为训练集和验证集； S2，建立一个目标检测网络模型，所述目标检测网络模型包括主干网路、特征融合网络和解耦预测网络，所述主干网络用于特征提取，并将不同尺度的语义特征传入特征融合网络，所述特征融合网络将不同尺度的语义特征进行融合，并将融合后的语义特征传入解耦预测网络，所述解耦预测网络根据融合后的语义特征对每个锚点进行预测；所述解耦预测网络包括一个分类分支、一个预测分支和一个回归分支，所述分类分支用于预测锚点对应目标类别，所述预测分支用于预测锚点是否包含目标，所述回归分支用于预测锚点对应包围框的位置偏移量和大小； S3，多样本第一阶段匹配训练，利用训练集对目标网络检测模型使用多样本匹配策略进行训练，并利用验证集对正在训练的模型进行验证； S4，单样本第二阶段匹配训练，利用训练集对目标检测网络模型使用单样本匹配策略进行训练，并利用验证集对正在训练的模型进行验证； S5，将待检测的图像输入训练好的目标检测网络模型，检测出图像中的主体，并且给出每个目标的类别、中心位置和大小。 2.根据权利要求1所述视觉目标检测网络模型的训练方法，其特征在于：所述步骤S2中的主干网络为基于卷积神经网络的特征提取器，所述特征提取器包括但不限于Resnet和 CSPDarknet。 3.根据权利要求1所述视觉目标检测网络模型的训练方法，其特征在于：所述步骤S2中特征融合网络将不同尺度的语义特征进行融合，使得浅层特征具有深层的语义信息，深层特征具有浅层的语义信息，实现不同尺度目标的识别。 4.根据权利要求1所述视觉目标检测网络模型的训练方法，其特征在于：所述步骤S3 中多样本匹配策略通过自适应选择与每个主体相匹配的正样本数量进行损失计算。 5.根据权利要求1所述视觉目标检测网络模型的训练方法，其特征在于：所述单样本匹配策略通过自适应选择与每个主体相匹配的最优正样本进行损失计算。 6.根据权利要求1所述视觉目标检测网络模型的训练方法，其特征在于：所述单样本第二阶段匹配训练为预测分支的单独训练。 7.根据权利要求1所述视觉目标检测网络模型的训练方法，其特征在于：所述多样本第一阶段匹配训练的具体步骤如下， S301，将目标检测网络模型和训练集初始化； S302，将一个Batc h的数据输入到目标检测网络模型进行前向传播； S303，根据输出结果计算落在目标区域内的锚点的代价矩阵； S304，根据代价自适应计算出每个目标匹配的正样本数量 k； S305，将代价最高的k个锚点作为单个目标匹配的正样本，进而计算损失，并通过损失函数对每一个参数求导后得到梯度； S306，将S305求的梯度数据进行反向传播更新参数； S307，循环执行S302至S306，直到迭代次数达到第一阶段预设次数或损失值小于某一设定阈值时结束训练。权　利　要　求　书 1/2 页 2 CN 115359335 A 28.根据权利要求1所述视觉目标检测网络模型的训练方法，其特征在于：所述单样本第二阶段匹配训练的具体步骤如下， S401，冻结目标检测网络模型主干网络、特征融合网络、分类分支和回归分支的参数，禁止后续训练过程中的梯度回传，单独训练预测分支，将匹配的正样本数量由k个改为1个； S402，将一个Batc h的数据输入到目标检测网络模型进行前向传播； S403，根据输出结果计算落在目标区域内的锚点的代价矩阵； S404，将代价矩阵内元素按列进行排序，为单个目标选取代价最高的1个锚点作为匹配的正样本，进而计算损失，并通过损失函数对每一个参数求导后得到梯度； S405，将S404 求的梯度数据进行反向传播更新参数； S406，循环执行S402至S405，直到迭代次数达到第二阶段的预设次数或损失值小于某一设定阈值时结束训练。权　利　要　求　书 2/2 页 3 CN 115359335 A 3

专利 一种视觉目标检测网络模型的训练方法

专利一种视觉目标检测网络模型的训练方法