全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210502602.1 (22)申请日 2022.05.09 (71)申请人 南通大学 地址 226019 江苏省南 通市崇川区啬园路9 号 (72)发明人 张堃 刘志诚 徐沛霞 林鹏程  刘纪元 涂鑫涛 任婉莹 韩宇  (51)Int.Cl. G06V 40/20(2022.01) G06V 10/10(2022.01) G06V 10/22(2022.01) G06V 10/40(2022.01) G06V 10/46(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于机器视觉的轻量化精准手指语智 能算法识别方法 (57)摘要 本发明属于手语识别技术领域, 具体涉及一 种基于机器视觉的轻量化精准手指语智能算法 识别方法, 具体步骤包括: 第一步单目相机采集 图像信息, 以Finger ‑YOLOv4算法对采集的图像 信息处理, 框选出手部的区域; 第二步在框选的 手部区域内基于稀疏性目标提取算法锁定操作 人员手部区域排除非操作人员手部干扰; 第三步 在操作人员手部区域内基于DFCRF ‑Net进行深度 学习, 识别出手部区域的21个关键点的坐标; 第 四步根据21个关键点坐标的位置关系采用强制 坐标法推理出当前手势表达的手指语。 本发明提 出的算法架构轻量化, 仅需单目相机即可部署, 检测速度快、 精度高; 经过不同环境、 操作人员的 测试, 该智能算法识别方法可以有效的识别出全 部手指语手势。 权利要求书4页 说明书13页 附图5页 CN 114898464 A 2022.08.12 CN 114898464 A 1.一种基于机器视觉的轻量化精准手指语智能算法识别方法, 其特征在于: 包括如下 步骤: S1、 操作人员面向单目相机, 手部区域出现在相机 视野范围内, 启动识别算法; S2、 单目相机采集图像信息, 采用Finger ‑YOLOv4算法对采集的图像信息处理, 框选出 手部的区域; S3、 在框选的手部区域内基于稀疏性目标提取算法锁定操作人员手部区域排除非操作 人员手部 干扰; S4、 在操作人员手部区域内基于双特征条件随机场网络进行深度学习, 识别出手部区 域的21个关键点的坐标; S5、 根据21个关键点 坐标的位置关系采用强制坐标法推理出当前手势 表达的手指语。 2.根据权利要求1所述的一种基于机器视觉的轻量化精准手指语智能算法识别方法, 其特征在于: 在S2中, Finger ‑YOLOv4算法是在YOLOv4算法的基础上进行改进, 改进方式包 括: 结合通道注意力机制、 孪生模块、 深度可分离卷积搭建Finger ‑bneck网络模块, 将 MobileNetv3中的bneck进行改进为Finger ‑bneck; 采用改进型MobileNetv3替换YOLOv4的 主干网络 CSPDarkNet; 将YOLOv4的Head结构 简化为2个分支。 3.根据权利要求2所述的一种基于机器视觉的轻量化精准手指语智能算法识别方法, 其特征在于: 结合通道注意力机制是用于通道之间的重要性调节, 在一个正常卷积之后首 先进行全局化操作, 使用池化层获取通道级的全局特征值, 定义全局化操作为 Fsq, 运算公式 为: 式中 表示全局化操作的结果, W、 H表示输入特征图的宽和高, Uc表示经过一个正常 卷积后的输出, 将空间维度进 行特征压缩, 即每个二 维的特征图变成一个实数, 相当于具有 全局感受野的池化操作, 特征通道数不变; 然后利用全连接层 对全局特征值进 行调节排序, 学习获取 各个通道的权 重; 最后利用学习的权 重值对原特 征进行加权处 理。 4.根据权利要求2所述的一种基于机器视觉的轻量化精准手指语智能算法识别方法, 其特征在于: 孪生模块是用来降低神经网络大小和计算资源占用的网络模块, 定义常规的 卷积公式Y=X*f+b, 式中*是卷积操作, X是输入 特征图, 是输出的特征图, h ′是输 出的高、 w ′是输出的宽、 n是输出维度即卷积核个数, 是卷积核, c是通道数, k是 卷积核的高和宽, n是输出维度, b是偏置操作; 定义整个卷积 操作的FLOPs为F, 计算公式: F=n×h′ ×w′ ×c×k×k 式中F为卷积操作的FLOPs, n是卷积操作的输出维度, c是通道数, h ′是输出的高, w ′是 输出的宽, k是 卷积操作中卷积核的高和宽; 孪生模块相对卷积操作进行了改进, 第 一步使用更少的卷积核生成输出特征图定义原 卷积核个数为n, 现在使用更少的卷积核个数为m; 第二步对第一步生成的每一张特征图进 行深度卷积操作, 每张特征图生成s张新的特征图共计m ×s张, 保证m ×s=n即保证孪生操 作和普通卷积输出 的特征形状相同; 第三步将特征图拼接到一起; 孪生模块的第一步卷积 公式为Y′=X*f′, 省去偏置操作, 式中 是输出的特征 图, h′是输出的高、 w ′是输权 利 要 求 书 1/4 页 2 CN 114898464 A 2出的宽、 m是输出维度, *是卷积操作, X是输入特征图, 是卷积核, c是通道数, k是 卷积核的高和宽, m是输出维度, 其余超参数都与卷积操作保持一致; 定义整个孪生操作的 FLOPs为F ′, 计算公式: F′=(m×h′ ×w′ ×c×k×k)+[(s‑1)×m×h′ ×w′ ×d×d] 式中F′为孪生操作的FLOPs, m是孪生操作的输出维度, c是通道数, h ′是输出的高, w ′是 输出的宽, k是卷积操作中卷积核的高和宽, d是孪生操作中卷积核的高和宽; 定义卷积操作 和孪生操作的加速比为TS, 计算公式为: 式中TS为加速度比, F为卷积操作的FLOPs, F ′为孪生操作的FLOPs, n是卷积操作的输出 维度, m是孪生操作的输出维度, c是通道数, h ′是输出的高, w ′是输出的宽, k是卷积操作中 卷积核的高和宽, d是孪生操作中卷积核的高和宽, s是新的特征图的张数, 卷积操作的 FLOPs是孪生模块的s倍。 5.据权利要求2所述的一种基于机器视觉的轻量化精准手指语智能算法识别方法, 其 特征在于: 深度可分离卷积搭建Finger ‑bneck网络模块其核心思想是将一个完整的卷积分 两部分进行, 一部分是逐点卷积、 另外一部 分是逐深度卷积; 逐点卷积是采用1 ×1的卷积组 合不同深度卷积的输出, 得到一组新的输出, 定义其过程中使用大小为Cp×1×1的卷积核, 数量为Co个; 逐深度卷积是将单个滤波器应用到每个通道上, 定义输入特征图的每个通道 通过一个d ×d的卷积核, 深度可分离卷积所需参数量 为Fd的计算公式为: Fd=Co×1×1+Cp×d×d 式中Fd为深度可分离卷积所需参数量, 为Co为卷积核数量, Cp为通道数, d为卷积核大 小。 6.根据权利要求2所述的一种基于机器视觉的轻量化精准手指语智能算法识别方法, 其特征在于: 改进型MobileNetv3采用结合通道注意力机制、 孪生模块、 深度可分离卷积搭 建Finger ‑bneck网络模块替换原MobileNetv3中的bneck, 在经过一个卷积后采用残差原 理, 一部分输入由孪生模块和深度可分离卷积组成的G ‑bneck后再经过一个通道注意力机 制模块, 最后经过一个卷积操作后与另外一部分通过shortcut连接最终输出; 采用改进型 MobileNetv3替换YOLOv4的主干网络CSPDarkNet, 将改进型MobileNetv3第7个Finger ‑权 利 要 求 书 2/4 页 3 CN 114898464 A 3

.PDF文档 专利 一种基于机器视觉的轻量化精准手指语智能算法识别方法

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于机器视觉的轻量化精准手指语智能算法识别方法 第 1 页 专利 一种基于机器视觉的轻量化精准手指语智能算法识别方法 第 2 页 专利 一种基于机器视觉的轻量化精准手指语智能算法识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:33:32上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。