专利一种基于联邦学习与注意力机制的生产线调度方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111564034.X (22)申请日 2021.12.20 (71)申请人湖南大学地址 410082 湖南省长沙市岳麓区麓山南路2号 (72)发明人杨科华　张曼　赵欢　李俐璇　 (74)专利代理机构长沙永星专利商标事务所 (普通合伙) 43001 代理人周咏　米中业 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06Q 50/04(2012.01) G06N 3/04(2006.01) G06N 20/20(2019.01)H04L 9/08(2006.01) H04L 9/40(2022.01) (54)发明名称一种基于联邦学习与注意力机制的生产线调度方法 (57)摘要本发明公开了一种基于联邦学习与注意力机制的生产线调度方法，包括获取若干个零件厂家的历史生产零件数据；采用长短期记忆网络，生成各个零件厂家的生产零件数据模型；通过加密和纵向联邦学习，将各个零件厂家的生产零件数据模型进行协同训练；采用注意力机制，求解作业车间调度问题，并采用生成的结果进行生产线调度。本发明在预测准确率较高的前提下保证了本生产线数据的私密与安全，防止了数据的泄露；且由于预测数据较为准确，可以避免生产过剩等造成资源的浪费。使用联邦学习进行共同建模，不仅可以使各参与方获得数据保护的同时，也实现共同提升模型效果的目的，且模型无损失，不会出现负迁移，使得生产线调度更接近实际情况，更准确。权利要求书4页说明书10页附图5页 CN 114219159 A 2022.03.22 CN 114219159 A 1.一种基于联邦学习与注意力机制的生产线调度方法，其特征在于包括如下步骤： S1.获取若干个零件厂家的历史生产零件数据； S2.采用长短期记忆网络，生成各个零件厂家的生产零件数据模型； S3.通过加密和纵向联邦学习，将各个零件厂家的生产零件数据模型进行协同训练，获得全局生产零件数据模型； S4.将获得的全局生产零件数据模型作为原始输入序列，通过注意力机制求解作业车间调度问题，生成调度序列，并采用生成的结果进行生产线调度。 2.根据权利要求1所述的基于联邦学习与注意力机制的生产线调度方法，其特征在于所述的步骤S2，包括如下步骤： A1.采用历史生产零件数据，对历史生产零件数据进行预处理；生成训练集和测试集； A2.采用长短期记忆网络，建立初始生产零件数据模型，并初始化参数；包括将当前输入和前一个状态输出的门控拼接训练得到四个状态，对当前的输入有选择的进行记忆和忘记，并将选择的记忆和忘记合并输入，对输出进行选择后采用损失函数优化； A3.采用步骤A1生成的训练集对初始生产零件数据模型进行训练，并校验结果是否满足预测精度要求；若校验结果不满足预测精度要求，则继续训练；若校验结果满足预测精度要求，则生成训练好的生产零件数据模型，采用测试集进行预测，同时根据正规化过程将数据转换为原值；参与的第三方传递训练参数和损失函数及其参数。 3.根据权利要求2所述的基于联邦学习与注意力机制的生产线调度方法，其特征在于所述的步骤A1，包括如下步骤： B1.对历史生产零件数据进行预处理；预处理包括：对历史生产零件数据进行归一化处理，加速训练速度；将数据进行标准化处理；将历史生产零件数据设置为数据数列；设置时间步，并根据设置时间步的数据预测之后的数据； B2.根据滑动窗口的大小构造训练集；具体包括根据滑动窗口的大小将历史零件数据依次输入长短期记忆网络模型的输入层。 4.根据权利要求3所述的基于联邦学习与注意力机制的生产线调度方法，其特征在于所述的步骤S3，包括如下步骤： D1.将加密样本对齐，在系统层面进行加密样本对齐，将各个参与方在本地生成的生产零件数据模型进行加密，生成加密样本；对各个加密样本进行处理，使各个参与方的样本对齐； D2.各个参与方分别在本地的生产零件数据模型进行训练对齐的加密样本； D3.由第三方服务器创建加密对，向各个参与方发送公钥，用于加密需要传输的数据； D4.各个参与方分别计算与其相关的特征中间结果，并加密交互，用于求得各个参与方的梯度和损失； D5.各个参与方分别计算本身加密后的梯度并添加掩码发送给第三方服务器，同时有标签点数据的参与方计算加密后的损失发送给第三方服务器，计算目标函数，并加入正则项；标签数据持有方计算梯度损失，并在加密后回传； D6.第三方服务器收集来自无标签数据持有方和标签数据持有方的加密梯度及损失后进行模型更新；对来自各个参与方的模型参数采用不同的权重比例对其进行整合，以获得服务器更新后的联邦模型；权　利　要　求　书 1/4 页 2 CN 114219159 A 2D7.第三方服务器解密梯度和损失后回传给各个参与方，各个参与方去除掩码并更新生产零件数据模型，获取更新生产零件数据模型；对第三方服务器在聚合后增加一个逻辑判断，判断接收的各参与方本地计算结果质量，若计算结果质量好，则训练终止，联合建模结束，建立好的全局生产零件数据模型保留在第三方服务器中；否则继续迭代进行模型训练。 5.根据权利要求4所述的基于联邦学习与注意力机制的生产线调度方法，其特征在于步骤S4中，所述的作业车间调度问题包括一条加工流水线上有若干台机器，若干待加工作业；其中，作业包含若干工序数；设作业的总工序数为每个作业工序数之和；其中每个作业的各个工序的加工时间已确定，并且每个作业必须按照规定的工序的先后顺序进行加工；调度的任务是安排确定工件的加工顺序以及每阶段工件在机器上的分配情况，求解约束条件被满足的同时，使得最大完工时间极小化。 6.根据权利要求5所述的基于联邦学习与注意力机制的生产线调度方法，其特征在于约束条件包括：约束一：同一时刻、同一机器只能加工一道工序；约束二：每道工序在指定的机器上加工，且在其前一道工序完成后才能开始加工；约束三：同一个作业的工序先后顺序有约束，不同作业加工工序之间没有先后顺序约束；约束四：各作业的工序顺序和加工时间已确定，不随加工排序该变而改变；约束五：不同工件之间的优先级是相同的。 7.根据权利要求6所述的基于联邦学习与注意力机制的生产线调度方法，其特征在于所述的步骤S4，包括如下步骤： E1.将获得的全局生产零件数据模型作为原始输入序列，初始化原始输入序列，加载作业车间调度问题的输入数据；对输入序列进行编码；将注意力扩展到单个输入序列之外的存储网络； E2.加载注意力基质网络，包括：第一阶段根据作业车间调度问题和工序计算两者的向量Cosine相似性；第二阶段引入SoftMax计算方法对第一阶段的得分进行数值转换；通过加权获取注意力值； E3.通过注意力值绕过步骤D7获取的全局生产零件数据模型的顺序处理，对输出序列进行解码，并输出求解到的序列，用于生产线的调度。 8.根据权利要求7所述的基于联邦学习与注意力机制的生产线调度方法，其特征在于所述的数据数列为， X(n)＝[x(1),x(2), …,x(n‑1),x(n)]； x(n)表示特征x的第 n个时刻的观测值；所述的步骤A 2，包括如下步骤： C1.将当前输入xt和前一个状态输出的ht‑1拼接训练得到四个状态，包括z,zf,zi,zo，其中， z表示将结果通过tanh激活函数转换的值； zf,zi,zo表示由拼接向量乘以权重矩阵后，再通过一个sigmoid激活函数转成0到1之间的数值作为门控状态， zf表示忘记门控； zi表示记忆门控； zo表示输出门控； C2.忘记阶段，对上一个节点传进来的输入进行选择性忘记；通过计算得到的zf作为忘记门控，用于选择上一状态的ct‑1忘记的部分， ct‑1表示上一时刻的神经元状态，权　利　要　求　书 2/4 页 3 CN 114219159 A 3

专利 一种基于联邦学习与注意力机制的生产线调度方法

专利一种基于联邦学习与注意力机制的生产线调度方法