(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211307126.4
(22)申请日 2022.10.25
(71)申请人 城云科技 (中国) 有限公司
地址 310052 浙江省杭州市滨江区长河街
道江南大道588号恒 鑫大厦主楼17层、
18层
(72)发明人 张香伟 董墨江 毛若锴 曹喆
彭大蒙
(74)专利代理 机构 杭州汇和信专利代理有限公
司 33475
专利代理师 吴琰
(51)Int.Cl.
G06V 20/00(2022.01)
G06V 10/77(2022.01)
G06V 10/774(2022.01)G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
应用于危化品车检测的目标检测模 型、 方法
及装置
(57)摘要
本申请提出了一种应用于危化品车检测的
目标检测模型、 方法及装置, 该方案的窗口池化
多头部自注意力模块嵌入了窗口池化多头部自
注意力机制用于减少计算量, 且偏移窗口池化多
头部自注意力机制解决窗口与窗口之间是无法
进行信息传递的弊端, 降低了自注 意力的平方计
算复杂度; 另外引入了高阶空间交互模块完全基
于卷积结构的高阶空间交互建模, 具有十分灵活
的效果, 既可 以兼容各种卷积形式, 又能够在不
显著增加计算量的情况下, 将self ‑attention的
二阶空间交 互建模扩展到任意阶。
权利要求书2页 说明书12页 附图5页
CN 115375999 A
2022.11.22
CN 115375999 A
1.一种目标检测模型的构建方法, 其特 征在于, 包括:
获取包含待检测目标的待检测图像;
目标检测模型包括依次序连接的输入层、 主干网络和多尺度输出预测层, 其中所述主
干网络包括依次序布置的位于第一层级的线性嵌入层和窗口池化多头部自注意力模块、 位
于第二层级的高阶空间交互模块、 位于第三层级的窗口池化多头部自注意力模块以及位于
第四层级的块融合层和高阶空间交 互模块;
待检测图像在所述输入层中经历块分区后得到分块特征, 所述分块特征输入到所述主
干网络经历多个模块特征提取 处理, 且所述主干网络的每一层级输出的阶段特征下采样处
理, 每一层级的阶段特征对应的融合特征进行上采样处理, 每一 阶级特征和对应的融合特
征进行特征融合后的特 征输入到多尺度输出 预测层进行 预测得到预测特 征。
2.根据权利要求1所述的目标检测模型的构建方法, 其特征在于, 所述主干网络的第 一
层级包括依 次连接的线性嵌入层以及2个窗口池化多头部自注意力模块, 所述分块特征输
入到所述线性嵌入层后得到输入特征, 所述输入特征输入到所述窗口池化多头部自注意力
模块中进行处 理。
3.根据权利要求1所述的目标检测模型的构建方法, 其特征在于, 所述 窗口池化多头部
自注意力模块包括依 次串联的第一层归一化层、 窗口多头部池化自注意力机制、 第一多层
感知层、 第一全连接层、 激活函数、 第二层归一化层、 偏移窗口多头部池化自注意力机制以
及第二多层感知 层, 其中第一多层感知 层和第二多层感知 层采用相同的结构。
4.根据权利要求3所述的目标检测模型的构建方法, 其特征在于, 输入所述窗口池化多
头部自注意力模块的特征在经历第一层 归一化层后得到第一窗口归一化特征, 第一窗口归
一化特征经历窗口多头部池化自注意力机制后得到第一窗口自注意力特征, 第一窗口自注
意力特征和第一窗口归一化特征融合得到第一融合特征, 第一融合特征输入到第一多层感
知层进行多层感知后得到第一感知特征, 第一感知特征和 第一融合特征融合后输入到第二
层归一化层进 行层归一化处理后得到第二窗口层归一化特征, 第二窗口层 归一化特征经历
偏移窗口多头部池化自注意力机制后得到第二窗口自注意力特征, 第二窗口自注意力特征
和第二窗口归一化特征融合得到第二融合特征, 第二融合特征输入到第二多层感知层进 行
多层感知后得到第二感知特 征, 第二感知特 征和第二融合特 征融合后得到 输出特征。
5.根据权利要求3所述的目标检测模型的构建方法, 其特征在于, 所述 窗口多头部池化
自注意力机制包括并行的池化注意力块分支以及残差池化连接块, 残差池化连接块将池化
查询张量添加到池化注意力块分支得到的输出序列中。
6.根据权利要求5所述的目标检测模型的构建方法, 其特征在于, 输入到窗口多头部池
化自注意力机制中的特征在池化注意力块分支中经历LN层后经历查询线性投影得到池化
查询张量Q、 经历键线性投影后得到池化键张量K、 经历值线性投影后得到池化值张量V, 将
相对位置嵌入到所述池化键张量K中和池化查询张量Q进行卷积操作、 softmax计算后得到
第一池化特征, 所述第一池化特征和池化值张量V进 行卷积操作后得到第二池化特征, 第二
池化特征和经历恒等映射的池化查询张量Q进行融合后再进行线性投影得到输出序列, 将
残差池化连接块的池化查询张量Q添加到输出序列中得到窗口多头部池化自注意力机制的
输出特征。
7.根据权利要求1所述的目标检测模型的构建方法, 其特征在于, 高阶空间交互模块包权 利 要 求 书 1/2 页
2
CN 115375999 A
2括: 依次序 布置的第一高阶空间层 归一化层、 高阶空间交互卷积、 第二高阶空间层 归一化层
以及高阶空间多层感知层, 输入到高阶空间交互模块中的输入特征在经历第一高阶空间层
归一化层、 高阶空间交互卷积后得到交互卷积特征, 交互卷积特征和输入到高阶空间交互
模块中的输入特征融合后得到交互融合特征, 交互融合特征再经历第二高阶空间层 归一化
层以及高阶空间多层感知层后得到感知特征, 感知特征和交互融合特征融合后得到高阶空
间交互模块的输出 特征。
8.根据权利要求7所述的目标检测模型的构建方法, 其特征在于, 输入到高阶空间交互
卷积中的通道为C的特征首先经过通道为2C的卷积投影后得到通道2C的2C特征, 从2C特征
中分离出通道为C/4的第一C/4特征和通道 为7C/4的7C/4特征, 7C/4特征进行深度可分离卷
积后再次特征分离出通道为C/4的第二C/4特征、 通道为C/2的第二C/2特征以及通道为C的
第二C特征, 第一C/4特征和第二C/4特征进行点积以及通道为C/2的卷积投影后得到通道 为
C/2的第一C/2特征, 第一C/2特征和第二C/2特征进行点积以及通道为C的卷积投影后得到
通道为C的第一C特征, 第一C特征和第二C特征在经历点积以及通道为C的卷积投影后得到
输出特征。
9.一种目标检测模型, 其特征在于, 根据权利要求1到8任一所述的目标检测模型的构
建方法构建得到 。
10.一种用于危化品车检测的目标检测模型, 其特征在于, 利用标注有危化品车的图像
训练权利要求9所述的目标检测模型 得到。
11.一种危 化品车检测方法, 其特 征在于, 包括 步骤:
获取涵盖车辆的待检测图像;
所述待检测图像输入到权利要求10所述的用于危化品车检测的目标检测模型进行检
测, 若检测到危 化品车输出危 化品车目标。
12.一种目标检测装置, 其特 征在于, 包括:
图像获取 单元, 用于获取涵盖车辆的待检测图像;
检测单元, 用于将所述待检测图像输入到用于危化品车检测的目标检测模型进行检
测, 若检测到危化品车输出危化品车目标; 其中用于危化品车检测的目标检测模型利用标
记危化品车目标的图像作为训练样本训练权利要求8所述的目标检测模型 得到。
13.一种电子装置, 包括存储器和 处理器, 其特征在于, 所述存储器中存储有计算机程
序, 所述处理器被设置为运行所述计算机程序以执行权利要求1到8任一所述的目标检测模
型的构建方法或权利要求1 1所述的危 化品车检测方法。
14.一种可读存储介质, 其特征在于, 所述可读存储介质中存储有计算机程序, 所述计
算机程序包括用于控制过程以执行过程的程序代码, 所述过程包括根据执行权利要求书1
到8任一所述的目标检测模型的构建方法或权利要求1 1所述的危 化品车检测方法。权 利 要 求 书 2/2 页
3
CN 115375999 A
3
专利 应用于危化品车检测的目标检测模型、方法及装置
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:14上传分享