专利 量化定点模型的训练方法、装置及电子设备

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111664630.5 (22)申请日 2021.12.31 (71)申请人湖南国科微电子股份有限公司地址 410131 湖南省长沙市长沙经济技术开发区泉塘街道东十路南段9号 (72)发明人胡建兵　袁涛　 (74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人王新哲 (51)Int.Cl. G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称量化定点模型的训练方法、装置及电子设备 (57)摘要本申请实施例提供了一种量化定点模型的训练方法、装置及电子设备，其中方法包括：获取标准浮点训练数据和标准定点训练数据；根据深度学习浮点模型、初始深度学习定点模型、标准浮点训练数据、标准定点训练数据、预设构造函数、预设相似度计算函数确定与深度学习浮点模型对应的量化定点模型。这样，可以通过预设构造函数、预设相似度计算函数获取与深度学习浮点模型匹配的深度学习定点模型，能快速实现深度学习浮点模型量化为深度学习定点模型，提高量化的精度。权利要求书4页说明书9页附图2页 CN 114330710 A 2022.04.12 CN 114330710 A 1.一种量化定点模型的训练方法，其特征在于，所述方法包括：获取标准浮点训练数据和标准定点训练数据；通过深度学习浮点模型对所述标准浮点训练数据进行训练，得到所述深度学习浮点模型各隐藏层的第一浮点输出数据，获取各隐藏层的第一浮点输出数据对应的第一波动表征数据；通过初始深度学习定点模型对所述标准定点训练数据进行训练，得到所述初始深度学习定点模型各隐藏层的第一定点输出数据，获取各隐藏层的第一定点输出数据对应的第二波动表征数据；根据各所述第一波动表征数据、各所述第二波动表征数据，确定预设构造函数的第一结果；根据所述深度学习浮点模型的各隐藏层的第一浮点输出数据、所述初始深度学习定点模型的各隐藏层的第一定点输出数据，确定预设相似度计算函数的第二结果；根据所述第一结果和所述第二结果对所述初始深度学习定点模型的权重参数进行调整，得到修正深度学习定点模型；根据所述修正深度学习定点模型、所述第一波动表征数据、所述标准浮点训练数据和所述标准定点训练数据确定所述预设构造函数的第三结果和所述预设相似度计算函数的第四结果；若所述第一结果与所述第三结果的第一变化趋势为降低趋势，且所述第二结果与所述第四结果的第二变化趋势为降低趋势，则将所述修正深度学习定点模型确定为所述深度学习浮点模型对应的量化定点模型。 2.根据权利要求1所述的方法，其特征在于，所述根据所述修正深度学习定点模型、所述第一波动表征数据、所述标准浮点训练数据和所述标准定点训练数据确定所述预设构造函数的第三结果和所述预设相似度计算函数的第四结果，包括：通过所述修正深度学习定点模型对所述标准定点训练数据进行训练，得到所述修正深度学习定点模型各隐藏层的第二定点输出数据，获取各隐藏层的第二定点输出数据对应的第三波动表征数据；根据各所述第一波动表征数据、各所述第三波动表征数据，确定预设构造函数的第三结果；根据所述深度学习浮点模型的各隐藏层的第一浮点输出数据、所述修正深度学习定点模型的各隐藏层的第二定点输出数据，确定预设相似度计算函数的第四结果。 3.根据权利要求1所述的方法，其特征在于，所述获取标准浮点训练数据和标准定点训练数据，包括：通过高斯函数随机产生初始浮点训练数据，将所述初始浮点训练数据转换为初始定点训练数据；通过深度学习浮点模型对所述初始浮点训练数据进行训练，得到所述深度学习浮点模型各隐藏层的第二浮点输出数据，获取各隐藏层的第二浮点输出数据对应的第四波动表征数据；通过初始深度学习定点模型对所述初始定点训练数据进行训练，得到所述初始深度学习定点模型各隐藏层的第三定点输出数据，获取各隐藏层的第三定点输出数据对应的第五波动表征数据；权　利　要　求　书 1/4 页 2 CN 114330710 A 2根据各所述第四波动表征数据、各所述第五波动表征数据，确定预设构造函数的第五结果；根据所述深度学习浮点模型的各隐藏层对应的第二浮点输出数据、所述初始深度学习定点模型的各隐藏层的第三定点输出数据，确定预设相似度计算函数的第六结果；通过所述高斯函数随机产生修正浮点训练数据，将所述修正浮点训练数据转换为修正定点训练数据；所述修正浮点训练数据的方差和标准差分别属于所述第四波动表征数据对应的方差范围和标准差范围；通过深度学习浮点模型对所述修正浮点训练数据进行训练，得到所述深度学习浮点模型各隐藏层的第三浮点输出数据，获取各隐藏层的第三浮点输出数据对应的第六波动表征数据；通过初始深度学习定点模型对所述修正定点训练数据进行训练，得到所述初始深度学习定点模型各隐藏层的第四定点输出数据，获取各隐藏层的第四定点输出数据对应的第七波动表征数据；根据各所述第六波动表征数据、各所述第七波动表征数据，确定预设构造函数的第七结果；根据所述深度学习浮点模型的各隐藏层的第三浮点输出数据、所述初始深度学习定点模型的各隐藏层的第四定点输出数据，确定预设相似度计算函数的第八结果；若所述第五结果与所述第七结果的第三变化趋势、所述第六结果与所述第八结果的第四变化趋势为降低趋势，则将所述修正浮点训练数据和所述修正定点训练数据分别确定为标准浮点训练数据和标准定点训练数据。 4.根据权利要求1所述的方法，其特征在于，所述第一波动表征数据包括第一均值及第一方差，所述第二波动表征数据包括第二均值及第二方差，所述根据各所述第一波动表征数据、各所述第二波动表征数据，确定预设构造函数的第一结果，包括：分别计算各所述第一均值与各所述第二均值的第一二范数、各所述第一均值与各所述第二均值的第二二范数；根据各所述第一二范数及各所述第二二范数确定所述第一结果。 5.根据权利要求1所述的方法，其特征在于，所述根据所述深度学习浮点模型的各隐藏层的第一浮点输出数据、所述初始深度学习定点模型的各隐藏层的第一定点输出数据，确定预设相似度计算函数的第二结果，包括：计算所述深度学习浮点模型的各隐藏层的第一浮点输出数据、所述初始深度学习定点模型的各隐藏层的第一定点输出数据之间KL散度数据，计算所述深度学习浮点模型的输出层的第一浮点输出数据、所述初始深度学习定点模型的输出层的第一定点输出数据之间的余弦距离数据；根据所述KL散度数据及所述余弦距离数据确定所述第二结果。 6.一种量化定点模型的训练装置，其特征在于，所述装置包括：获取模块，用于获取标准浮点训练数据和标准定点训练数据；第一训练模块，用于通过深度学习浮点模型对所述标准浮点训练数据进行训练，得到所述深度学习浮点模型各隐藏层的第一浮点输出数据，获取各隐藏层的第一浮点输出数据对应的第一波动表征数据；第二训练模块，用于通过初始深度学习定点模型对所述标准定点训练数据进行训练，得到所述初始深度学习定点模型各隐藏层的第一定点输出数据，获取各隐藏层的第一定点权　利　要　求　书 2/4 页 3 CN 114330710 A 3

专利 量化定点模型的训练方法、装置及电子设备

专利量化定点模型的训练方法、装置及电子设备