(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210792080.3
(22)申请日 2022.07.07
(71)申请人 重庆科技学院
地址 401331 重庆市沙坪坝区大 学城东路
20号
(72)发明人 刘成 彭橹屹 左清华 卢宏宇
金泓潭 李志军 余波 巫尚蔚
侯文赛 杜文曦
(74)专利代理 机构 重庆敏创专利代理事务所
(普通合伙) 50253
专利代理师 陈千
(51)Int.Cl.
G06V 20/40(2022.01)
G06V 10/82(2022.01)
G06V 10/44(2022.01)G06V 10/774(2022.01)
G06V 10/762(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于YoloV4-Lite网络的视频图像火焰检测
方法
(57)摘要
本发明涉及图像检测技术领域, 具体公开了
一种基于YoloV4 ‑Lite网络的视 频图像火焰检测
方法, 包括步骤: S1: 基于YoloV4 ‑Lite网络构建
火焰检测模型; S2: 采集视频图像帧; S3: 对步骤
S2采集的视频图像帧进行预处理, 得到数据集;
S4: 采用所述数据集对 所述火焰检测模 型进行训
练、 测试和验证, 最终利用训练好的火焰检测模
型实现视频图像火焰检测。 其效果是: 在主干特
征提取网络中使用Gho stNet网络, 保证减少网络
参数的同时, 准确率不会降低太多, 在加强特征
提取网络中使用深度可分离卷积替代1*1和3*3
的传统卷积, 进一步缩减网络的参数量, 同时在
加强特征提取网络部分加入信道注 意模块, 使神
经网络可以更好的关注在被检测的物体上, 达到
网络性能和复杂度的平衡 。
权利要求书1页 说明书9页 附图10页
CN 115131711 A
2022.09.30
CN 115131711 A
1.一种基于 YoloV4‑Lite网络的视频图像火焰检测方法, 其特 征在于, 包括 步骤:
S1: 基于YoloV4‑Lite网络构建火焰检测模型;
将所述YoloV4 ‑Lite网络的主干特征提取网络CSPD arkNet53替换为GhostNet网络, 将
所述YoloV4 ‑Lite网络的加强特征提取网络PaNet的1x1和3x3的标准卷积替换为深度可分
离卷积; 同时在加强特征提取网络中加入了信道注意模块, 所述信道注意模块由非线性自
适应确定的一维卷积组成;
S2: 采集视频图像帧;
S3: 对步骤S2采集的视频图像帧进行 预处理, 得到数据集;
S4: 采用所述数据集对所述火焰检测模型进行训练、 测试和验证, 最终利用训练好的火
焰检测模型实现视频图像火焰检测。
2.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法, 其特征在
于: 步骤S2中采集视频图像帧包括利用爬虫技术从网络页面上爬取部 分带有火焰图像的图
片数据, 经 过数据清洗 选择合适的图片进行 标注, 从而作为样本数据。
3.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法, 其特征在
于: 所述的预处理包括: 采用9个不同尺寸的先验框对样本数据的图像进行标注, 并利用K ‑
means++聚类算法对预 先标注的先验框的尺寸进行修 正。
4.根据权利要求3所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法, 其特征在
于: 所述K ‑means++聚类算法具体步骤 包括:
S31: 输入数据集, 随机从样本 框区域选取一个初始聚类中心xj;
S32: 计算每 个样本框xi与初始聚类中心之间的最短距离D(xi);
S33: 按照轮盘法选择一个新的点作为新的中心点, 设定距离较大的点具有更大的选取
概率;
S34: 重复S31 ‑S33直到每个簇中元素不在发生变化, 输出聚类结果, 得到 的9个聚类中
心结果乘以图片输入尺寸, 作为原 始的宽高。
5.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法, 其特征在
于: 所述信道 注意模块 根据通道维度c来确定卷积核大小k, 具体为:
其中, |t|odd表示距离t最近的奇数, α 和b为 修正系数。
6.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法, 其特征在
于: 所述深度可分离卷积由深度卷积和1*1逐点卷积组成, 其中: 所述深度卷积 中每个卷积
核的通道为1。
7.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法, 其特征在
于: 步骤S2中使用LabelImg软件对数据标注为Pascal VOC2007数据格式, 标注类别分为无
火焰和有火焰两种类别。权 利 要 求 书 1/1 页
2
CN 115131711 A
2基于YoloV4‑Lite网络的视频图像火焰检测方 法
技术领域
[0001]本发明涉及图像检测技术领域, 尤其涉及一种基于YoloV4 ‑Lite网络的视频图像
火焰检测方法。
背景技术
[0002]火灾作为威胁公众安全和社会发展的主要灾害之一, 不仅让人类的物质财产遭到
损失, 而且还直接或间接的危害 人民群众的生命。 为了避免火灾带来的巨大损失, 有 人提出
基于视频图像处 理来实现 火焰检测, 从而提前实现 火灾预警。
[0003]如中国专利202111104533.0所公开的一种基于YOLOv4网络的无人机火焰检测方
法, 可用于不同的环境、 光照强度以及天气情况, 可以保证较高的检测准确 性和快速性, 实
现了速度和精度的平衡。
[0004]认真研究后发现, YOLOV4整个网络结构可以分为三个部分, 如图1所示, 第一部分
为主干特征提取网络(CSPDarkNet53), 其作用是对图片进行初步的特征提取。
CSPDarkNet53由BasicConv模块和Resblock_body模块组成。 其中BasicConv结合了卷积层
(Conv2D)、 二维归一化处理层(BatchNormalization)、 激活函数(Mi sh)三个部分, 将输入的
(416,416,3)的图片通道数加深到64, 宽高不变。 Resblock_body模块采用了CSPnet结构, 如
图2所示。 CSPnet结构把原有的残差结构的堆叠部 分进行拆分成左右两部 分, 主干部 分保持
原有的堆叠结构, 另一部分存在一个大 的残差结构, 经过少量的处理与主干部分在最后直
接连接。 最后获得(52,52,25 6), (26,26,512), (13,13,1024)三个特 征有效层。
[0005]第二部分为空间池化金字塔(Spat ial Pyramid Pooling, SPP)和加强特征提取网
络(Path Aggregation Network, PANet)。 SPP网络结构的主要作用是极大增大特征层感受
野, 显著区分出不同特征层间的特征, 设计四个不同尺度的最大池化处理特征层, 其三个最
大池化核的大小分别为13*13、 9*9、 5*5。 PANet网络结构最显著的特征在于反复提取特征,
不仅需要在传统的特征金字塔结构里从下往上的特征提取, 还需要实现从上往下的特征提
取, 融合过程如图3所示。 第三部分为预测网络, 其功能是利用更有效的有效特征层获得预
测结果。 由不同的Conv2D构成, 获得三个输出层分别为(batch_size, 52, 52, 75)、 (batch_
size, 26, 26, 75)、 (batc h_size, 13, 13, 75)。
[0006]在应用YOLOV4进行视频图像火焰检测时, 申请人发现其具有的缺陷是:
[0007]CSPDarknet53虽然检测准确度和速度 有所提高, 但是存在网络结构复杂, FLOPs运
算大等缺点, 需要对卷积层进行 大量的计算, 十分耗费计算机资源。
发明内容
[0008]基于上述缺陷, 本 发明提供一种基于YoloV4 ‑Lite网络的视频图像火焰检测方法,
通过对传 统YoloV4网络架构进行改进, 使其利用更少的参数得到更多的图像特征, 从而节
约计算资源。
[0009]为实现上述目的, 本发明所采用的具体技 术方案如下:说 明 书 1/9 页
3
CN 115131711 A
3
专利 基于YoloV4-Lite网络的视频图像火焰检测方法
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:42:54上传分享