专利基于YoloV4-Lite网络的视频图像火焰检测方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210792080.3 (22)申请日 2022.07.07 (71)申请人重庆科技学院地址 401331 重庆市沙坪坝区大学城东路 20号 (72)发明人刘成　彭橹屹　左清华　卢宏宇　金泓潭　李志军　余波　巫尚蔚　侯文赛　杜文曦　 (74)专利代理机构重庆敏创专利代理事务所 (普通合伙) 50253 专利代理师陈千 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/82(2022.01) G06V 10/44(2022.01)G06V 10/774(2022.01) G06V 10/762(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于YoloV4-Lite网络的视频图像火焰检测方法 (57)摘要本发明涉及图像检测技术领域，具体公开了一种基于YoloV4 ‑Lite网络的视频图像火焰检测方法，包括步骤： S1：基于YoloV4 ‑Lite网络构建火焰检测模型； S2：采集视频图像帧； S3：对步骤 S2采集的视频图像帧进行预处理，得到数据集； S4：采用所述数据集对所述火焰检测模型进行训练、测试和验证，最终利用训练好的火焰检测模型实现视频图像火焰检测。其效果是：在主干特征提取网络中使用Gho stNet网络，保证减少网络参数的同时，准确率不会降低太多，在加强特征提取网络中使用深度可分离卷积替代1*1和3*3 的传统卷积，进一步缩减网络的参数量，同时在加强特征提取网络部分加入信道注意模块，使神经网络可以更好的关注在被检测的物体上，达到网络性能和复杂度的平衡。权利要求书1页说明书9页附图10页 CN 115131711 A 2022.09.30 CN 115131711 A 1.一种基于 YoloV4‑Lite网络的视频图像火焰检测方法，其特征在于，包括步骤： S1：基于YoloV4‑Lite网络构建火焰检测模型；将所述YoloV4 ‑Lite网络的主干特征提取网络CSPD arkNet53替换为GhostNet网络，将所述YoloV4 ‑Lite网络的加强特征提取网络PaNet的1x1和3x3的标准卷积替换为深度可分离卷积；同时在加强特征提取网络中加入了信道注意模块，所述信道注意模块由非线性自适应确定的一维卷积组成； S2：采集视频图像帧； S3：对步骤S2采集的视频图像帧进行预处理，得到数据集； S4：采用所述数据集对所述火焰检测模型进行训练、测试和验证，最终利用训练好的火焰检测模型实现视频图像火焰检测。 2.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法，其特征在于：步骤S2中采集视频图像帧包括利用爬虫技术从网络页面上爬取部分带有火焰图像的图片数据，经过数据清洗选择合适的图片进行标注，从而作为样本数据。 3.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法，其特征在于：所述的预处理包括：采用9个不同尺寸的先验框对样本数据的图像进行标注，并利用K ‑ means++聚类算法对预先标注的先验框的尺寸进行修正。 4.根据权利要求3所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法，其特征在于：所述K ‑means++聚类算法具体步骤包括： S31：输入数据集，随机从样本框区域选取一个初始聚类中心xj； S32：计算每个样本框xi与初始聚类中心之间的最短距离D(xi)； S33：按照轮盘法选择一个新的点作为新的中心点，设定距离较大的点具有更大的选取概率； S34：重复S31 ‑S33直到每个簇中元素不在发生变化，输出聚类结果，得到的9个聚类中心结果乘以图片输入尺寸，作为原始的宽高。 5.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法，其特征在于：所述信道注意模块根据通道维度c来确定卷积核大小k，具体为：其中， |t|odd表示距离t最近的奇数， α 和b为修正系数。 6.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法，其特征在于：所述深度可分离卷积由深度卷积和1*1逐点卷积组成，其中：所述深度卷积中每个卷积核的通道为1。 7.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法，其特征在于：步骤S2中使用LabelImg软件对数据标注为Pascal VOC2007数据格式，标注类别分为无火焰和有火焰两种类别。权　利　要　求　书 1/1 页 2 CN 115131711 A 2基于YoloV4‑Lite网络的视频图像火焰检测方法技术领域 [0001]本发明涉及图像检测技术领域，尤其涉及一种基于YoloV4 ‑Lite网络的视频图像火焰检测方法。背景技术 [0002]火灾作为威胁公众安全和社会发展的主要灾害之一，不仅让人类的物质财产遭到损失，而且还直接或间接的危害人民群众的生命。为了避免火灾带来的巨大损失，有人提出基于视频图像处理来实现火焰检测，从而提前实现火灾预警。 [0003]如中国专利202111104533.0所公开的一种基于YOLOv4网络的无人机火焰检测方法，可用于不同的环境、光照强度以及天气情况，可以保证较高的检测准确性和快速性，实现了速度和精度的平衡。 [0004]认真研究后发现， YOLOV4整个网络结构可以分为三个部分，如图1所示，第一部分为主干特征提取网络(CSPDarkNet53)，其作用是对图片进行初步的特征提取。 CSPDarkNet53由BasicConv模块和Resblock_body模块组成。其中BasicConv结合了卷积层 (Conv2D)、二维归一化处理层(BatchNormalization)、激活函数(Mi sh)三个部分，将输入的 (416,416,3)的图片通道数加深到64，宽高不变。 Resblock_body模块采用了CSPnet结构，如图2所示。 CSPnet结构把原有的残差结构的堆叠部分进行拆分成左右两部分，主干部分保持原有的堆叠结构，另一部分存在一个大的残差结构，经过少量的处理与主干部分在最后直接连接。最后获得(52,52,25 6)， (26,26,512)， (13,13,1024)三个特征有效层。 [0005]第二部分为空间池化金字塔(Spat ial Pyramid Pooling， SPP)和加强特征提取网络(Path Aggregation Network， PANet)。 SPP网络结构的主要作用是极大增大特征层感受野，显著区分出不同特征层间的特征，设计四个不同尺度的最大池化处理特征层，其三个最大池化核的大小分别为13*13、 9*9、 5*5。 PANet网络结构最显著的特征在于反复提取特征，不仅需要在传统的特征金字塔结构里从下往上的特征提取，还需要实现从上往下的特征提取，融合过程如图3所示。第三部分为预测网络，其功能是利用更有效的有效特征层获得预测结果。由不同的Conv2D构成，获得三个输出层分别为(batch_size， 52， 52， 75)、 (batch_ size， 26， 26， 75)、 (batc h_size， 13， 13， 75)。 [0006]在应用YOLOV4进行视频图像火焰检测时，申请人发现其具有的缺陷是： [0007]CSPDarknet53虽然检测准确度和速度有所提高，但是存在网络结构复杂， FLOPs运算大等缺点，需要对卷积层进行大量的计算，十分耗费计算机资源。发明内容 [0008]基于上述缺陷，本发明提供一种基于YoloV4 ‑Lite网络的视频图像火焰检测方法，通过对传统YoloV4网络架构进行改进，使其利用更少的参数得到更多的图像特征，从而节约计算资源。 [0009]为实现上述目的，本发明所采用的具体技术方案如下：说　明　书 1/9 页 3 CN 115131711 A 3

专利 基于YoloV4-Lite网络的视频图像火焰检测方法

专利基于YoloV4-Lite网络的视频图像火焰检测方法