全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211164502.9 (22)申请日 2022.09.23 (71)申请人 珠海格力电器股份有限公司 地址 519030 广东省珠海市横琴新区汇通 三路108号办公6 08 申请人 珠海零边界集成电路有限公司 (72)发明人 李家欢  (74)专利代理 机构 广东朗乾 律师事务所 4 4291 专利代理师 杨焕军 (51)Int.Cl. G06V 20/40(2022.01) G06N 3/04(2006.01) G06N 5/04(2006.01) G06V 10/25(2022.01) G06V 10/774(2022.01)G06V 10/82(2022.01) (54)发明名称 基于深度神经网络的目标检测方法、 装置、 存储介质及嵌入式设备 (57)摘要 本申请实施例公开了一种基于深度神经网 络的目标检测方法、 装置、 存储介质及嵌入式设 备, 涉及目标检测领域。 本申请加载模型配置文 件, 利用模型配置文件配置深度神经网络, 配置 完成后采集 当前帧图像, 基于配置的深度神经网 络对当前帧图像进行前向推理, 基于当前帧图像 进行前向推理的过程中同时会采集下一帧图像, 即将图像采集和前向推理的过程进行并行执行, 这样可以提高目标检测的速度和效率, 从而进一 步提高输出视频的帧率。 权利要求书1页 说明书8页 附图4页 CN 115527146 A 2022.12.27 CN 115527146 A 1.一种基于深度神经网络的目标检测方法, 其特 征在于, 包括: 加载模型配置文件, 以及基于所述模型配置文件配置深度神经网络; 采集当前帧图像; 基于所述当前帧图像对所述深度神经网络进行前向推理, 以及在前向推理过程中采集 下一帧图像; 若根据前向推理结果在所述当前帧图像中检测到目标对象, 标记出所述目标对象在所 述当前帧图像中的位置 。 2.根据权利要求1所述的方法, 其特征在于, 所述深度神经网络包括至少一个卷积层, 所述至少一个卷积层采用netw ork in network结构。 3.根据权利要求1或2所述的方法, 其特征在于, 所述深度神经网络为改进的Gaussian   YOLOv3网络, 改进的Gaussian  YOLOv3网络由13个卷积层、 5个池化层、 11个批处理归一化 层、 11个激活层、 1个上采样层、 2个路由层和2个高斯定位层组成, 改进的Gaussian  YOLOv3 网络中第13、 20、 27、 3 3、 36和44层为卷积层且卷积核大小为1 ×1。 4.根据权利要求3所述的方法, 其特征在于, 所述模型配置文件为操作符集合文件, 所 述操作符集合文件是编译器对h5文件进行编译得到, 所述h5文件是计算机设备利用ker as 或DrakNet深度学习框架训练得到的。 5.根据权利要求1或2或4所述的方法, 所述加载模型配置文件, 以及基于所述模型配置 文件配置深度神经网络, 包括: 从闪存中读取模型配置文件, 解析所述模型配置文件得到网络权重参数和网络结构参 数, 基于所述网络 权重参数和所述网络结构参数配置深度神经网络 。 6.根据权利要求5所述的方法, 其特征在于, 所述基于所述当前帧图像对所述深度神经 网络进行 前向推理, 以及 在前向推理过程中采集下一帧图像, 包括: 通过前向推理线程基于所述当前帧图像对所述深度神经网络进行 前向推理; 在开始执行前向推理时, 通过所述前向推理线程向采集线程发送推理执行指令, 所述 推理执行指令用于指示所述采集线程采集下一帧图像。 7.根据权利要求1或2或4或6所述的方法, 其特征在于, 通过矩形的检测框在当前帧图 像中标记出目标对象的位置 。 8.一种基于深度神经网络的目标检测装置, 其特 征在于, 包括: 配置单元, 用于加载模型配置文件, 以及基于所述模型配置文件配置深度神经网络; 采集单元, 用于采集当前帧图像; 并行计算单元, 用于基于所述当前帧图像对所述深度神经网络进行前向推理, 以及在 前向推理过程中采集下一帧图像; 检测单元, 用于若根据前向推理结果在所述当前帧图像中检测到目标对象, 标记出所 述目标对象在所述当前帧图像中的位置 。 9.一种计算机存储介质, 其特征在于, 所述计算机存储介质存储有多条指令, 所述指令 适于由处 理器加载并执 行如权利要求1~7任意 一项的方法步骤。 10.一种嵌入式设备, 其特征在于, 包括: 处理器和存储器; 其中, 所述存储器存储有计 算机程序, 所述计算机程序适于由所述处理器加载并执行如权利要求 1~7任意一项的方法 步骤。权 利 要 求 书 1/1 页 2 CN 115527146 A 2基于深度神经 网络的目标 检测方法、 装置、 存储介质及 嵌入式 设备 技术领域 [0001]本申请涉及目标检测领域, 尤其涉及一种基于深度神经网络 的目标检测方法、 装 置、 存储介质及嵌入式设备。 背景技术 [0002]随着人工智能的发展深度神经网络的应用场景越来越广 泛, 例如: 语音识别、 计算 机视觉、 自然语言处理等各方面, 尤其在车辆辅助驾驶系统、 智能视频监控系统、 机器人、 武 鄂人机、 人机交互系统等嵌入式设备上得到大量应用。 嵌入式设备的硬件资源受限, 深度神 经网络的网络结构 较为复杂且网络参数较多, 因此深度神经网络在嵌入式设备上运行的速 度和效率较低。 发明内容 [0003]本申请实施例提供了基于深度神经网络 的目标检测方法、 装置、 存储介质及嵌入 式设备, 可以解决现有技术中深度神经网络在嵌入式设备上运行速度和效率较低的问题。 所述技术方案如下: [0004]第一方面, 本申请实施例提供了一种基于深度神经网络 的目标检测方法, 所述方 法包括: [0005]加载模型配置文件, 以及基于所述模型配置文件配置深度神经网络; [0006]采集当前帧图像; [0007]基于所述当前帧图像对所述深度神经网络进行前向推 理, 以及在前向推 理过程中 采集下一帧图像; [0008]若根据前向推 理结果在所述当前帧图像中检测到目标对象, 标记出所述目标对象 在所述当前帧图像中的位置 。 [0009]在一个或多个可能的实施例中, 所述深度神经网络包括至少一个卷积层, 所述至 少一个卷积层采用netw ork in network结构。 [0010]在一个或多个可能的实施例中, 所述深度神经网络为改进的Gaussian  YOLOv3网 络, 改进的Gaussian  YOLOv3网络由13个卷积层、 5个池化层、 11个批处理归一化层、 11个激 活层、 1个上采样层、 2个路由层和2个高斯定位层组成, 改进的Gaussian  YOLOv3网络中第 13、 20、 27、 3 3、 36和44层为卷积层且卷积核大小为1 ×1。 [0011]在一个或多个可能的实施例中, 所述模型配置文件为操作符集合文件, 所述操作 符集合文件是编译器对h5文件进行编译得到, 所述h5文件是计算机设备利用keras或 DrakNet深度学习框架训练得到的。 [0012]在一个或多个可能的实施例中, 所述加载模型配置文件, 以及基于所述模型配置 文件配置深度神经网络, 包括: [0013]从闪存中读取模型配置文件, 解析所述模型配置文件得到网络权重参数和网络结说 明 书 1/8 页 3 CN 115527146 A 3

PDF文档 专利 基于深度神经网络的目标检测方法、装置、存储介质及嵌入式设备

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于深度神经网络的目标检测方法、装置、存储介质及嵌入式设备 第 1 页 专利 基于深度神经网络的目标检测方法、装置、存储介质及嵌入式设备 第 2 页 专利 基于深度神经网络的目标检测方法、装置、存储介质及嵌入式设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:48上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。