全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210749923.1 (22)申请日 2022.06.29 (71)申请人 南京工业大 学 地址 211816 江苏省南京市浦口区浦珠南 路30号 (72)发明人 朱艾春 倪帆 邬健辉 朱晓梅  胡方强  (74)专利代理 机构 北京思创大成知识产权代理 有限公司 1 1614 专利代理师 高爽 (51)Int.Cl. G06V 40/20(2022.01) G06V 20/52(2022.01) G06V 20/40(2022.01) G06V 10/82(2022.01)G06V 10/774(2022.01) G06V 10/764(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 多粒度行为识别的模 型构建方法、 视频监控 方法及系统 (57)摘要 本申请公开了一种多粒度行为识别的模型 构建方法、 视频监控方法及系统。 该系统包括网 络摄像头、 客户端与服务器端, 客户端获取网络 摄像头的流媒体视频信息, 发送至服务器端; 服 务器端基于人体姿态检测网络模型获取人体姿 态识别画线结果并返回至客户端; 客户端读取人 体姿态识别画线结果进行本地显示; 服务器端基 于多粒度行为识别模型识别动作分类识别结果 并返回至客户端; 客户端读取动作分类识别结 果, 预警不安全行为。 本发明通过远程服务器连 接和人工智能的手段实现不受时间地点限制地 识别人员动作, 提升视频监控系统对摄像头监控 范围内的不安全 行为主动监控能力, 及时发现事 故隐患。 权利要求书3页 说明书11页 附图5页 CN 115188069 A 2022.10.14 CN 115188069 A 1.一种多粒度行为识别的模型构建方法, 其特 征在于, 包括: 设置多种不安全行为及其对应的动作分类以及人体姿态的多粒度 特征, 得到训练数据 集, 所述多粒度特 征包括骨架信息、 人体动作全身图像与头 部区域图像; 根据所述人体姿态进行网络训练, 获得人体姿态检测网络模型, 进而获得人体姿态识 别画线结果; 基于所述人体姿态识别画线结果, 对所述训练数据集中的所述多粒度 特征分别进行网 络训练, 分别获得骨架信息识别模型、 全身图像识别模型、 头 部区域图像识别模型; 将所述骨架信息识别模型、 所述全身图像识别模型、 所述头部区域图像识别模型进行 融合, 得到多粒度行为识别模型。 2.根据权利要求1所述的多粒度 行为识别的模型构建方法, 其中, 根据 所述人体姿态进 行网络训练, 获得 人体姿态检测网络模型, 进 而获得人体姿态 识别画线结果包括: 根据视频帧I检测人体区域, 输入对称空间变换网络S中, 得到所述人体区域框并保存 在人员全身图像Ib; 将所述人体区域框输入单人姿态估计器P中, 获得生成热图 与关于各个骨架点的真 值热图Hkn, 计算所述 生成热图 与所述真值热图Hkn之间的误差Lm; 提取所述生成热图中被高斯模糊的关节点中心, 得到 重构关节点 坐标集合 将所述人体区域框输入固定权重单人姿态估计器P ’中, 计算生成热图 与重构关节 点坐标集合 之间的误差Ls; 累加误差Lm和Ls得到所述对称空间变换网络S的误差LG, 并通过梯度下降法对所述对称 空间变换网络S进行优化; 将优化后的关节点坐标集合 通过空间反变换网络D将人体姿态重新映射回原 始图像中, 获得 所述人体姿态 识别画线结果; 通过梯度下降法对所述空间反变换网络D进行优化, 获取基于堆叠沙漏网络的人体姿 态检测网络模型。 3.根据权利要求2所述的多粒度 行为识别的模型构建方法, 其中, 对所述训练数据集中 的骨架信息进行网络训练, 获得骨架信息识别模型包括: 根据所述关节点坐标集合 计算视频帧中的相对位置, 输入双向长短期记忆神 经网络L中; 将双向长短期记忆神经网络L的输出向量作为卷积神经网络的输入, 输出人体行为的 预测动作分类r1; 计算r1和实际动作分类之间的动作预测误差Lr1; 累加动作预测误差Lr1, 得到累加误差LCNN‑LSTM, 通过梯度下降法对神经网络进行优 化, 获 取所述骨架信息识别模型。 4.根据权利要求1所述的多粒度 行为识别的模型构建方法, 其中, 对所述训练数据集中 的人体动作全身图像进行网络训练, 获取全身图像识别模型包括:权 利 要 求 书 1/3 页 2 CN 115188069 A 2将所述人体动作全身图像Ib输入图像 变换器S1进行变换处 理, 结果为Ib’; 将Ib’输入卷积神经网络 C1, 得到预测动作分类r2; 计算预测动作分类r2和实际动作分类之间的误差Lr2; 累加误差Lr2得到卷积神经网络C1的误差Limg1, 并通过梯度下降法进行优 化, 获取所述全 身图像识别模型。 5.根据权利要求1所述的多粒度 行为识别的模型构建方法, 其中, 对所述训练数据集中 的头部区域图像进行网络训练, 获取头 部区域图像识别模型包括: 将所述不安全行为的视频帧I 根据骨架点信息, 通过OpenCV截取雨布区域图像Ia; 将Ia输入图像 变换器T进行变换处 理, 结果为Ia’; 将Ia’输入卷积神经网络W, 得到预测动作分类r3; 计算预测动作分类r3和实际动作分类之间的误差Lr3; 累加误差Lr3得到卷积神经网络W的误差Limg2, 通过梯度下降法进行优化, 获取所述头部 区域图像识别模型。 6.利用权利要求1 ‑5中任意一项所述的多粒度行为识别的模型构建方法的一种基于多 粒度行为的视频监控方法, 其特 征在于, 包括: 基于人体姿态检测网络模型获取 人体姿态 识别画线结果; 根据所述人体姿态识别画线结果, 通过骨架信 息识别模型、 全身图像识别模型、 头部区 域图像识别模型分别进行动作分类识别以及误差计算, 获得3个动作类别及其对应的误差; 判断3个动作类别是否相同, 若相同, 则以该动作类别为所述动作分类识别结果, 若不 同, 则以所述 误差最小的动作类别为所述动作分类识别结果。 7.根据权利要求6所述的基于多粒度 行为的视频监控方法, 其中, 通过骨架信 息识别模 型进行动作分类识别以及误差计算包括: 根据所述人体姿态 识别画线结果, 得到关节点骨架信息; 将所述关节点骨架信息输入所述骨架信息识别模型, 进行误差计算, 得到基于关节点 骨架信息的动作类别。 8.根据权利要求6所述的基于多粒度 行为的视频监控方法, 其中, 通过全身图像识别模 型进行动作分类识别以及误差计算包括: 根据人体区域截取 人体全身区域图像, 得到全身图像; 将所述全身图像输入所述全身图像识别模型, 进行误差计算, 得到基于全身图像的动 作类别。 9.根据权利要求7所述的基于多粒度 行为的视频监控方法, 其中, 通过头部区域图像识 别模型进行动作分类识别以及误差计算包括: 根据所述关节点骨架信息截取头 部区域图像; 将所述头部区域图像输入所述头部区域图像识别模型, 进行误差计算, 得到基于头部 区域图像的动作类别。 10.一种基于多粒度行为的视频监控系统, 其特征在于, 包括网络摄像头、 客户端与服 务器端, 其中, 所述 客户端与所述网络摄 像头、 所述 客户端与所述 服务器端均为 通信连接, 所述客户端获取 所述网络摄 像头的流 媒体视频信息, 发送至所述 服务器端; 所述服务器端基于人体姿态检测网络模型获取人体姿态识别画线结果并返回至所述权 利 要 求 书 2/3 页 3 CN 115188069 A 3

.PDF文档 专利 多粒度行为识别的模型构建方法、视频监控方法及系统

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 多粒度行为识别的模型构建方法、视频监控方法及系统 第 1 页 专利 多粒度行为识别的模型构建方法、视频监控方法及系统 第 2 页 专利 多粒度行为识别的模型构建方法、视频监控方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:02:47上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。