全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210007093.5 (22)申请日 2022.01.05 (71)申请人 西安电子科技大 学 地址 710071 陕西省西安市雁塔区太白南 路2号 申请人 陕西理工大 学 (72)发明人 王兰美 魏兵 王桂宝 廖桂生  贾建科 孙长征  (51)Int.Cl. G06V 20/54(2022.01) G06V 20/56(2022.01) G06V 40/10(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于激活函数的改进YOLOv4车辆行人 检测算法 (57)摘要 本发明提出了一种基于激活函数的改进 YOLOv4车辆行人检测算法; 构造了零点处梯度并 不突变的FMi sh激活函数, 保证信息流动, 不会出 现“梯度消失 ”; 本发明在Dense ‑YOLOv4与 Dense‑ YOLOv4‑Small网络 结构的基础上, 将 全部的激活 函数替换为FMi sh激活函数; 本发明将KITT I道路 目标数据集中的 “Misc”和“Dontcare ”剔除得到 KITTI‑7classes道路目标数据集, 在KITTI ‑ 7classes数据集上对 三个模型进行训练, 并比较 了检测速度和检测性能; 基于FMish激活函数的 网络模型不仅避免饱和问题, 而且避免了 “梯度 爆炸”问题, 保证训练过程的稳定性, 提升检测效 果。 权利要求书2页 说明书7页 附图6页 CN 114694104 A 2022.07.01 CN 114694104 A 1.一种基于激活函数的改进YOLOv4车辆行人检测算法, 基于Kitti ‑7classes通用数据 集的道路目标 数据集的检测定位, 其特 征在于: 利用KITTI道路目标数据集进行车辆行人检测, KITTI包含各种 道路场景采集的真实图 像数据, KITTI数据 集共包含九类, 分别为Car, Van, Truck, Pedestri an, Person(sittin g), Cyclist, Tram, Mi sc和Dont care, 由于 KITTI中有两类为 “Misc”和“Dontcare”, 分别为“杂乱 无章”类和“不关心的 ”类, 这两种类别 是无意义的, 并且由于这两类没有特定的目标特征, 在不同的图片中其 “Misc”类可能包含的物体是不同的, 本发明对原始KITTI数据集中的 “Misc”和“Dontcare ”剔除, 形成KITTI ‑7Classes数据集, 本发明将在KITTI ‑7Classes上进 行训练和 测试; 所述车辆行 人检测算法包 含以下步骤: 步骤一、 下载当前目标检测领域通用数据集KITTI道路目标数据集, KITTI数据集是目 前最大的自动驾驶场景下数据集, 剔除原始KITTI数据集中的 “Misc”和“Dontcare ”两类数 据, 创建KITTI ‑7Classes道路目标数据集, 使用该数据集可保证算法检测效果与该领域公 开的通用数据集保持一致, 构建了本发明使用的道路目标数据集; 将测试集、 验证集与训练 集按照6:2:2的比例划分; 步骤二、 使用标准YOLOv4网络训练并识别和定位车辆行人; 使用标准YOLOv4网络对基 于步骤一道路目标数据集进行训练, 下载标准YOLOv4网络并进行编译, 标准YOLOv4网络的 下载地址: https://git hub.com/AlexeyAB/darknet; 为道路目标数据kitti ‑7classes更改 cfg文件夹中kitti7.data文件中的训练集、 验证集、 测试集目录为下载数据集的地址, 指定 类别数量与类别名称, 在训练执行的命令行中根据精度要求设定迭代次数(epoch)为100, 根据本次实验数据集加载kitti7.data, 同时加载yolov4.cfg, 程序即可开始训练; 保存训 练过程中各层的权重文件Q1, 作为训练结束后检测的权 值输入文件; 利用权重文件Q1进行测 试, 得到均值平均精度(Mean  Average Precision,mAP)、 召回率(Rec all)与检测时的帧率 (Frame Per Second, FPS); 1)构建YOLOv4 网络模型, 使用Initialization函数进行神经网络各层权值参数的初始 化; YOLOv4由四个部分组成, 分别是: (1)Input输入端: 指输入网络原始样本数据; (2) BackBone网络: 指进行特征提取操作的卷积神经网络结构; (3)Neck颈部: 对主干网络提取 的图像特征进行融合, 并将融合后的特征传递到预测层; (4)Head头部: 对图像中的感兴趣 目标物体进行 预测, 并生成可视化的预测框与目标类别; 下载标准YOLOv4网络后, 对YOLOv4网络使用make命令进行编译, 形成可执行文件 darknet; 为道路目标数据集KITT I‑7classes编辑cfg文件夹中kitti7.data文件, 将class、 train、 valid、 names字符串改为对应数据集的目录与参数, 这样就编辑好了标准YOLOv4网 络Input部分需要的参数, 在训练执行的命令行中设定epoch后, 根据本次实验数据集加载 kitti7 .data, 同时加载yolov4 .cfg, 程序即可开始训练; 程序在运行时会使用 Initialization函数进行神经网络各层权值 参数的初始化; 2)从Input部分输入图片数据, 经过Backbone部分, 最终输出两个尺度的特征图, 并使 用分类器输出预测框Pb1与分类概 率CPx; 从Input部分输入图片数据, 经过Backbone部分, 最终输出两个尺度的特征图, 将两种权 利 要 求 书 1/2 页 2 CN 114694104 A 2不同尺度的特征 图送入特征金字塔网络(Featuer  Pyramid Network,FPN)组成的Neck部 分, 并将融合后的特征传递到预测层中, 与此同时Head部分完成目标的分类并输出预测框 Pb1与分类概 率CPx, 其中x为每 个分类的索引; 3)对这些数据进行IoU与NMS后处理, 将预测框Pb2与真实框Gtb对比, 并使用Adam算 法进 行神经网络各层权值更新; 经过Backbone网络生成的预测框Pb1数量太大, 对图片中同一物体有大量检测框存在, 造成检测结果冗余; YOLOv4的Head部分会同时完成预测框与其对应的分类概率; 对这些数 据进行IoU与NMS后处理, 得到处理好的数据; 这里使用的IoU与NMS为标准YOLOv4的CIoU_ loss与NMS; 经过这些后处理后就可以得到感兴趣目标的预测框Pb2与其对应的分类概率 CPx; 同时, 使用Adam算法使用后处 理过程中得到的l oss进行神经网络各层权值更新; 4)循环执行步骤2)和3)继续迭代至命令中设定的epoch值, 停止训练, 输出记录每一层 权重与偏 移的文件Q1; 利用Q1得到的权重与偏移对测试集进行检测, 计 算得到mAP、 Recall与 检测时的帧率FP S; 本发明按照精度要求设置迭代阈值epoch=100, 迭代次数小于阈值时, 使用Adam算法 进行网络各层权值更新, 直到阈值epoch=100停止训练, 计算mAP与Recall, 输出记录每一 层权重与偏移的文件Q1; YOLOv4拥有良好的实时性, 模型检测速度与模型权重文件大小也是非常重要的评价指 标; 检测速度因硬件配置不同而不同, 本发明中所有实验使用同一硬件平台, 检测速度的标 准为每秒检测的图片数量, 基于YOLOv4的车辆行人 目标的检测表明模型检测 速度不高, 内 存占用大, 为了进一步提升检测速度和检测精度设计了基于FMish激活函数dense ‑FMish‑ YOLOv4与Dense ‑FMish‑YOLOv4‑Small模型; 步骤三、 设计FMish激活函数, 使得函数在零点处梯度并不突变, 而是为非常小 的负梯 度, 避免了饱和问题, 而且在x>0部分其梯度略小于Mish, 与Mish相比FMish函数较为平缓, 可以保证训练过程的稳定性; 本发明设计了FMish 激活函数, Mish 激活函数与本发明设计的FMish公式如下: 其中x为批标准 化(Batch Normalization,BN)层传递的矩阵; 本发明在Dense ‑YOLOv4与Dense ‑YOLOv4‑Small网络结构的基础上, 引入了FMish激活 函数, 将全部的激活函数替换为FMi sh激活函数, 称为Dense ‑FMish‑YOLOv4与Dense‑FMish‑ YOLOv4‑Small算法; 步骤四、 将步骤二与步骤三模型性能的检测结果进行对比, 包括模型检测精度、 模型检 测速度、 模型检测召回率、 模型权重文件大小, 并查看步骤二与步骤三 实际检测的数据集中 的图像, 分析检测结果。权 利 要 求 书 2/2 页 3 CN 114694104 A 3

.PDF文档 专利 一种基于激活函数的改进YOLOv4车辆行人检测算法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于激活函数的改进YOLOv4车辆行人检测算法 第 1 页 专利 一种基于激活函数的改进YOLOv4车辆行人检测算法 第 2 页 专利 一种基于激活函数的改进YOLOv4车辆行人检测算法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:12:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。