专利基于深度自注意力变换网络的步态识别方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210048788.8 (22)申请日 2022.01.17 (71)申请人西安电子科技大学地址 710071 陕西省西安市太白南路2号 (72)发明人牛毅　赵鑫　马明明　李甫　石光明　 (74)专利代理机构重庆萃智邦成专利代理事务所(普通合伙) 50231 代理人许攀 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于深度自注意力变换网络的步态识别方法 (57)摘要本发明属于计算机视觉及视频分析技术领域，具体而言，涉及一种基于深度自注意力变换网络的步态识别方法，该方法包括如下步骤： S1，步态数据的获取及预处理； S2，基于Transformer 的步态识别网络的构建； S3，对步态识别网络进行训练和测试。该基于Transformer的步态识别网络包括空间特征提取模块、时间特征提取模块、分类器融合模块。本发明使用Tran sformer网络对步态序列的时间特征进行显性建模，充分提取步态序列的时间特征；通过训练多个弱分类器的方式解决了Transformer网络易过拟合的问题；本发明方法的步态识别准确率较高好。本发明通过对Transformer网络中Encoder模块的优化，减少了模型的参数量和计算量，使得本发明方法的步态识别速度和准确率较高。权利要求书1页说明书10页附图2页 CN 114429646 A 2022.05.03 CN 114429646 A 1.一种基于深度自注意力变换网络的步态识别方法，其特征在于，所述方法包括如下步骤： S1，步态数据的获取及预处理； S2，基于Transformer的步态识别网络的构建； S3，对所述步态识别网络进行训练和测试。 2.根据权利要求1所述的基于深度自注意力变换网络的步态识别方法，其特征在于，所述步态数据输入所述基于Transformer的步态识别网络时的输入维度为N*S*C*H*W，其中N 表示批的大小， S表示输入步态序列的帧数， C表示步态剪影图像的通道数， H表示步态剪影图像的高度， W表示步态剪影图像的宽度。 3.根据权利要求2所述的基于深度自注意力变换网络的步态识别方法，其特征在于，所述步骤S2构建的基于Tr ansformer的步态识别网络包括空间特征提取模块、时间特征提取模块、分类器融合模块。 4.根据权利要求3所述的基于深度自注意力变换网络的步态识别方法，其特征在于，所述空间特征提取模块包括局部空间特征提取部分和整体空间特征提取部分。 5.根据权利要求4所述的基于深度自注意力变换网络的步态识别方法，其特征在于，所述局部空间特征提取部分包括输入层和六个卷积层级联组成的特征提取网络。 6.根据权利要求5所述的基于深度自注意力变换网络的步态识别方法，其特征在于，所述六个卷积层中的两个卷积层包括最大池化操作。 7.根据权利要求6所述的基于深度自注意力变换网络的步态识别方法，其特征在于，所述整体空间特征提取部分包括全局最大池化操作和四个卷积层级联组成的特征提取网络。 8.根据权利要求7所述的基于深度自注意力变换网络的步态识别方法，其特征在于，所述四个卷积层中的一个卷积层包括最大池化操作。 9.根据权利要求8所述的基于深度自注意力变换网络的步态识别方法，其特征在于，所述时间特征提使模块使用改进的Transformer网络提取步态序列的时间特征。 10.根据权利要求9所述的基于深度自注意力变换网络的步态识别方法，其特征在于，所述基于Transformer的步态识别网络的损失函数为三元损失函数。权　利　要　求　书 1/1 页 2 CN 114429646 A 2基于深度自注意力变换网络的步态识别方法技术领域 [0001]本发明属于计算机视觉及视频分析技术领域，具体而言，涉及一种基于深度自注意力变换网络的步态识别方法，可用于针对步态的生物信息识别。背景技术 [0002]步态识别是一种旨在通过人们走路的姿态进行身份识别的生物特征识别技术，步态作为一种能够远距离识别的生物特征，在犯罪预防、司法鉴定和社会保障等方面有着广泛的应用前景。在生物特征识别领域，基于人脸、指纹、衣着等特征的识别技术已经十分完善，而步态识别因其具有无接触和不易伪装的特点，在生物特征识别领域有着广泛的应用前景。 [0003]典型的步态识别主要分为五个阶段：首先是步态检测，即对视频每一帧图像中的行人目标进行识别和定位；第二步是步态分割，根据检测结果将行人与背景进行分割；第三步是步态追踪，每一帧图像的分割结果组合成一个图像序列；第四步是特征提取，提取图像序列的特征，方便进行匹配，这一步是步态识别的关键；最后一步是步态比对和识别，将提取的特征与在数据库中存储的特征进行比对和识别，得到最终结果。 [0004]主流的步态识别特征提取主要分为两种，一种是将输入的步态剪影序列融合成为单张图像进行识别，代表方法有步态能量图，这种方法没有很好的利用输入序列的时域信息；另一种则是将步态序列直接作为输入，通过对其空间和时间特征的提取进行进一步的识别，但是在这种方法会引入大量的冗余信息，降低步态识别的效率和灵活性。 [0005]授权公告号为CN113159007B，名称为 “一种基于自适应图卷积的步态情感识别方法”的专利，公开的实现步骤包括从步态视频中获取步态数据，构造网络输入；构建自适应图卷积网络；将获得的步态数据输入到自适应图卷积网络中，根据网络提取到的特征进行步态情感类别的预测。该自适应图卷积网络主要包括三个依次连接的自适应图卷积块；自适应图卷积块主要依据自适应图的邻接矩阵进行图卷积操作。自适应图包括以下三部分：第一，自然链接，按人体物理结构将骨架上关节点相连形成的自然链接；第二，全局链接，是以脊椎节点为中心，其他节点与中心节点相连构成的全局链接；第三，可训练链接，是一种可训练的图结构构造方式，将其转化为图结构的邻接矩阵形式放入网络中训练。该方法存在三点不足之处：其一，在提取步态的空间特征时采用的是提取关节点的方式，这种方式丢失了大量的空间信息；其二，该网络并没有对步态序列的时间特征进行充分的提取；其三，该网络最终的目的是通过步态进行情感识别，但是只能识别提前训练集中存在的情感，不能识别出新的情感。 [0006]授权公告号为CN111967358B，名称为“一种基于注意力机制的步态识别方法 ”的专利提出的方法包括以下步骤：从基准数据集中分割出训练集和测试集；通过未嵌入注意力机制的步态提取模型预训练网络，以此来使得模型对人体步态有好的适应性；在网络中嵌入时域和空域注意力机制模块，并加载预训练的网络模型参数；重新运用数据集训练基于注意力机制的步态识别特征提取模型，以此可以获得较好的步态识别结果。该方法存在两说　明　书 1/10 页 3 CN 114429646 A 3

专利 基于深度自注意力变换网络的步态识别方法

专利基于深度自注意力变换网络的步态识别方法