专利 用于图像分类的脉冲神经网络的训练方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211289610.9 (22)申请日 2022.10.20 (71)申请人中山大学地址 510275 广东省广州市海珠区新港西路135号 (72)发明人赖剑煌　唐建雄　谢晓华　 (74)专利代理机构广州粤高专利商标代理有限公司 44102 专利代理师高棋 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称用于图像分类的脉冲神经网络的训练方法 (57)摘要本发明针对现有技术的局限性，提出了一种用于图像分类的脉冲神经网络的训练方法，提供了一种快速、节省内存的脉冲神经网络训练方法，设计并运用了一种人工神经网络 ‑脉冲神经网络的权重共享框架，将脉冲神经网络的训练迁移到一个人工神经网络上进行，在相同的网络结构以及时间窗口设置下，本发明的训练速度以及显存消耗是脉冲反向传播模型的43％～67％, 33％～55％。权利要求书2页说明书9页附图5页 CN 115546556 A 2022.12.30 CN 115546556 A 1.一种用于图像分类的脉冲神经网络的训练方法，其特征在于，包括以下步骤： S1，获取输入图像，对所述输入图像进行包括图像规范化在内的数据预处理； S2，获取待训练的脉冲神经网络以及相应的任务需求，根据所述任务需求，对所述脉冲神经网络进行网络初始化； S3，根据所述步骤S2的结果，构建一个权重参数共享的人工神经网络 ‑脉冲神经网络双分支网络结构； S4，以所述步骤S1的结果，对所述人工神经网络 ‑脉冲神经网络双分支网络结构中的人工神经网络分支进行训练；训练完成后，基于权重共享，以其中的脉冲神经网络分支作为可用于图像分类的脉冲神经网络训练结果。 2.根据权利要求1所述的用于图像分类的脉冲神经网络的训练方法，其特征在于，所述步骤S1的数据预处理包括以下过程：对所述输入图像各通道的内容进行图像规范化；根据预设的时间窗口大小T，将所述输入图像复制成T张，构造出长度为T的图像序列。 3.根据权利要求1所述的用于图像分类的脉冲神经网络的训练方法，其特征在于，所述步骤S2的网络初始化包括以下过程：根据任务需求，设定所述脉冲神经网络的网络层数、各层网络的结构、特征通道大小、卷积核大小、各层权重的初始值以及IF神经元的初始阈值电压。 4.根据权利要求3所述的用于图像分类的脉冲神经网络的训练方法，其特征在于，所述 IF神经元按以下公式表示：充电过程： ut+1,n＝ut,n(1‑ot,n)+It+1,n；放电过程：其中， n表示第n层脉冲神经网络，膜电压ut,n表示脉冲神经元的内部状态，膜电压ut,n通过累积‑放电机制，将每一个时刻的输入刺激累积到膜电压中； It+1,n为时刻t+1的输入刺激， It+1,n根据网络权重作用于输入脉冲得到； ot,n表示时刻t的脉冲信号， Vth表示电压阈值。 5.根据权利要求4所述的用于图像分类的脉冲神经网络的训练方法，其特征在于，在所述步骤S4中，通过以下方式对所述 IF神经元的电压阈值进行自适应增长：其中， k表示一轮训练代数中的第k次训练迭代， α ∈[0,1]表示动量系数； ε∈[0,1]表示容忍度； τ >0表示尺度因子， Ω表示噪声脉冲的索引集合。 6.根据权利要求1所述的用于图像分类的脉冲神经网络的训练方法，其特征在于，在所述人工神经网络 ‑脉冲神经网络双分支网络结构中：以整流脉冲单元或直通脉冲单元作为 ANN分支的激活函数，将脉冲神经网络分支的每层脉冲输出作为ANN分支每层的激活值，使得ANN分支能够等价表示脉冲神经网络分支。 7.根据权利要求6所述的用于图像分类的脉冲神经网络的训练方法，其特征在于，所述整流脉冲单元的工作流程按以下公式表示：权　利　要　求　书 1/2 页 2 CN 115546556 A 2其中，表示ANN分支的第n层激活输出，表示ANN分支的第n层网络经过其中的卷积以及线性整流单元后的输出；符号函数sign( ·)表示将量化为0和1，用于得到线性整流单元输出的激活位置；表示哈达玛积；表示来自脉冲神经网络分支第n层的累积脉冲输出。 8.根据权利要求6所述的用于图像分类的脉冲神经网络的训练方法，其特征在于，所述直通脉冲单元的工作流程按以下公式表示：其中，表示ANN分支的第n层激活输出，表示ANN分支的第n层网络经过其中的卷积以及线性整流单元后的输出；表示来自脉冲神经网络分支第n层的累积脉冲输出； c为与等值的张量。 9.根据权利要求6所述的用于图像分类的脉冲神经网络的训练方法，其特征在于，在所述步骤S4中，对所述人工神经网络 ‑脉冲神经网络双分支网络结构中的人工神经网络分支进行训练，包括以下过程：通过使用整流脉冲单元或直通脉冲单元对ANN分支进行建模，使脉冲神经网络分支每层网络的前向计算能够被A NN分支表示；随后利用交叉熵损失函数作用于A NN分支的FC层输出，实现对分类误差的描述；最后利用反向传播算法，在AN N分支上进行训练。 10.一种计算机设备，其特征在于：包括存储介质、处理器以及储存在所述存储介质中并可被所述处理器执行的计算机程序，所述计算机程序被处理器执行时实现如权利要求1 至9任一项所述的用于图像分类的脉冲神经网络的训练方法的步骤。权　利　要　求　书 2/2 页 3 CN 115546556 A 3

专利 用于图像分类的脉冲神经网络的训练方法

专利用于图像分类的脉冲神经网络的训练方法