全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210792080.3 (22)申请日 2022.07.07 (71)申请人 重庆科技学院 地址 401331 重庆市沙坪坝区大 学城东路 20号 (72)发明人 刘成 彭橹屹 左清华 卢宏宇  金泓潭 李志军 余波 巫尚蔚  侯文赛 杜文曦  (74)专利代理 机构 重庆敏创专利代理事务所 (普通合伙) 50253 专利代理师 陈千 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/82(2022.01) G06V 10/44(2022.01)G06V 10/774(2022.01) G06V 10/762(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于YoloV4-Lite网络的视频图像火焰检测 方法 (57)摘要 本发明涉及图像检测技术领域, 具体公开了 一种基于YoloV4 ‑Lite网络的视 频图像火焰检测 方法, 包括步骤: S1: 基于YoloV4 ‑Lite网络构建 火焰检测模型; S2: 采集视频图像帧; S3: 对步骤 S2采集的视频图像帧进行预处理, 得到数据集; S4: 采用所述数据集对 所述火焰检测模 型进行训 练、 测试和验证, 最终利用训练好的火焰检测模 型实现视频图像火焰检测。 其效果是: 在主干特 征提取网络中使用Gho stNet网络, 保证减少网络 参数的同时, 准确率不会降低太多, 在加强特征 提取网络中使用深度可分离卷积替代1*1和3*3 的传统卷积, 进一步缩减网络的参数量, 同时在 加强特征提取网络部分加入信道注 意模块, 使神 经网络可以更好的关注在被检测的物体上, 达到 网络性能和复杂度的平衡 。 权利要求书1页 说明书9页 附图10页 CN 115131711 A 2022.09.30 CN 115131711 A 1.一种基于 YoloV4‑Lite网络的视频图像火焰检测方法, 其特 征在于, 包括 步骤: S1: 基于YoloV4‑Lite网络构建火焰检测模型; 将所述YoloV4 ‑Lite网络的主干特征提取网络CSPD arkNet53替换为GhostNet网络, 将 所述YoloV4 ‑Lite网络的加强特征提取网络PaNet的1x1和3x3的标准卷积替换为深度可分 离卷积; 同时在加强特征提取网络中加入了信道注意模块, 所述信道注意模块由非线性自 适应确定的一维卷积组成; S2: 采集视频图像帧; S3: 对步骤S2采集的视频图像帧进行 预处理, 得到数据集; S4: 采用所述数据集对所述火焰检测模型进行训练、 测试和验证, 最终利用训练好的火 焰检测模型实现视频图像火焰检测。 2.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法, 其特征在 于: 步骤S2中采集视频图像帧包括利用爬虫技术从网络页面上爬取部 分带有火焰图像的图 片数据, 经 过数据清洗 选择合适的图片进行 标注, 从而作为样本数据。 3.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法, 其特征在 于: 所述的预处理包括: 采用9个不同尺寸的先验框对样本数据的图像进行标注, 并利用K ‑ means++聚类算法对预 先标注的先验框的尺寸进行修 正。 4.根据权利要求3所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法, 其特征在 于: 所述K ‑means++聚类算法具体步骤 包括: S31: 输入数据集, 随机从样本 框区域选取一个初始聚类中心xj; S32: 计算每 个样本框xi与初始聚类中心之间的最短距离D(xi); S33: 按照轮盘法选择一个新的点作为新的中心点, 设定距离较大的点具有更大的选取 概率; S34: 重复S31 ‑S33直到每个簇中元素不在发生变化, 输出聚类结果, 得到 的9个聚类中 心结果乘以图片输入尺寸, 作为原 始的宽高。 5.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法, 其特征在 于: 所述信道 注意模块 根据通道维度c来确定卷积核大小k, 具体为: 其中, |t|odd表示距离t最近的奇数, α 和b为 修正系数。 6.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法, 其特征在 于: 所述深度可分离卷积由深度卷积和1*1逐点卷积组成, 其中: 所述深度卷积 中每个卷积 核的通道为1。 7.根据权利要求1所述的基于YoloV4 ‑Lite网络的视频图像火焰检测方法, 其特征在 于: 步骤S2中使用LabelImg软件对数据标注为Pascal  VOC2007数据格式, 标注类别分为无 火焰和有火焰两种类别。权 利 要 求 书 1/1 页 2 CN 115131711 A 2基于YoloV4‑Lite网络的视频图像火焰检测方 法 技术领域 [0001]本发明涉及图像检测技术领域, 尤其涉及一种基于YoloV4 ‑Lite网络的视频图像 火焰检测方法。 背景技术 [0002]火灾作为威胁公众安全和社会发展的主要灾害之一, 不仅让人类的物质财产遭到 损失, 而且还直接或间接的危害 人民群众的生命。 为了避免火灾带来的巨大损失, 有 人提出 基于视频图像处 理来实现 火焰检测, 从而提前实现 火灾预警。 [0003]如中国专利202111104533.0所公开的一种基于YOLOv4网络的无人机火焰检测方 法, 可用于不同的环境、 光照强度以及天气情况, 可以保证较高的检测准确 性和快速性, 实 现了速度和精度的平衡。 [0004]认真研究后发现, YOLOV4整个网络结构可以分为三个部分, 如图1所示, 第一部分 为主干特征提取网络(CSPDarkNet53), 其作用是对图片进行初步的特征提取。 CSPDarkNet53由BasicConv模块和Resblock_body模块组成。 其中BasicConv结合了卷积层 (Conv2D)、 二维归一化处理层(BatchNormalization)、 激活函数(Mi sh)三个部分, 将输入的 (416,416,3)的图片通道数加深到64, 宽高不变。 Resblock_body模块采用了CSPnet结构, 如 图2所示。 CSPnet结构把原有的残差结构的堆叠部 分进行拆分成左右两部 分, 主干部 分保持 原有的堆叠结构, 另一部分存在一个大 的残差结构, 经过少量的处理与主干部分在最后直 接连接。 最后获得(52,52,25 6), (26,26,512), (13,13,1024)三个特 征有效层。 [0005]第二部分为空间池化金字塔(Spat ial Pyramid Pooling, SPP)和加强特征提取网 络(Path Aggregation  Network, PANet)。 SPP网络结构的主要作用是极大增大特征层感受 野, 显著区分出不同特征层间的特征, 设计四个不同尺度的最大池化处理特征层, 其三个最 大池化核的大小分别为13*13、 9*9、 5*5。 PANet网络结构最显著的特征在于反复提取特征, 不仅需要在传统的特征金字塔结构里从下往上的特征提取, 还需要实现从上往下的特征提 取, 融合过程如图3所示。 第三部分为预测网络, 其功能是利用更有效的有效特征层获得预 测结果。 由不同的Conv2D构成, 获得三个输出层分别为(batch_size, 52, 52, 75)、 (batch_ size, 26, 26, 75)、 (batc h_size, 13, 13, 75)。 [0006]在应用YOLOV4进行视频图像火焰检测时, 申请人发现其具有的缺陷是: [0007]CSPDarknet53虽然检测准确度和速度 有所提高, 但是存在网络结构复杂, FLOPs运 算大等缺点, 需要对卷积层进行 大量的计算, 十分耗费计算机资源。 发明内容 [0008]基于上述缺陷, 本 发明提供一种基于YoloV4 ‑Lite网络的视频图像火焰检测方法, 通过对传 统YoloV4网络架构进行改进, 使其利用更少的参数得到更多的图像特征, 从而节 约计算资源。 [0009]为实现上述目的, 本发明所采用的具体技 术方案如下:说 明 书 1/9 页 3 CN 115131711 A 3

PDF文档 专利 基于YoloV4-Lite网络的视频图像火焰检测方法

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于YoloV4-Lite网络的视频图像火焰检测方法 第 1 页 专利 基于YoloV4-Lite网络的视频图像火焰检测方法 第 2 页 专利 基于YoloV4-Lite网络的视频图像火焰检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:42:54上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。