专利一种公平可信的联邦学习激励方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111647692.5 (22)申请日 2021.12.2 9 (71)申请人广东优算科技有限公司地址 528314 广东省佛山市顺德区陈村镇赤花社区广隆工业园兴业四路18号顺联机械城22座四层42 2-19 申请人广东创亿源智能科技有限公司 (72)发明人冼允廷　赵搏文　毛茹　曾策冲　沈强　解先旭　 (74)专利代理机构广州圣理华知识产权代理有限公司 4 4302 代理人李唐明 (51)Int.Cl. G06N 20/00(2019.01) (54)发明名称一种公平可信的联邦学习激励方法 (57)摘要本发明公开了一种联邦学习激励方法，包括服务器和n个参与者，该方法包括步骤： S1.系统初始化； S2.参与者提交报价信息； S3.执行逆向拍卖操作； S4.计算后验收益；该方法结合逆向维克里拍卖机制和后验价格机制，通过逆向维克里拍卖使得参与者诚实地提交其报价信息以实现最大化收益，且该方法以参与者拥有的数据量作为报价，当参与者通过一轮逆向维克里拍卖诚实地提交其报价后，再利用后验价格机制为每个参与式计算一个公平的收益，其具有可信度高、兼容性强等诸多优点。权利要求书2页说明书5页附图2页 CN 114330747 A 2022.04.12 CN 114330747 A 1.一种联邦学习激励方法，其特征在于，包括服务器和n个参与者，所述方法包括以下步骤：步骤S1.系统初始化：服务器初始化联邦学习任务，并招募n个拥有训练数据的参与者，其中，所述联邦学习任务在形式上表示为：其中，表示初始化模型， typ e表示需要的数据类型， t表示联合训练迭代的次数， B 是每次迭代过程中所有参与者的总收益；步骤S2.参与者提交报价信息：参与者根据拥有的type类型数据的数据量d，提交报价信息d*，其中， d*＜d或d*＞d或d*＝d；步骤S3.执行逆向拍卖操作：服务器收到n个参与者的报价信息后，确定竞拍成功者，并计算竞拍成功者的收益；若第i个参与者竞价成功，则为的最小值，竞价成功的参与者的收益为：其中，是的最小值； α 是控制参数，用于控制竞价成功者的收益；步骤S4.计算后验收益：服务器收到n个参与者的报价信息后，根据参与者提交的报价，为每个参与者计算收益；其中，每个参与者的报价与其收益呈正相关；参与者j的收益在形式上表示为： 2.根据权利要求1所述的联邦学习激励方法，其特征在于，在所述步骤S3中，所述服务器按照逆向维克里拍卖确定竞拍成功者，并按照第二价原理计算竞拍成功者的收益。 3.根据权利要求1所述的联邦学习激励方法，其特征在于，在所述步骤S1中，所述服务器确认联合训练所需要的数据类型type后，服务器初始化初始模型和迭代次数t，并确定每次迭代的收益B；在每次模型训练迭代过程中，服务器向各个参与者共同分配收益B。 4.根据权利要求1所述的联邦学习激励方法，其特征在于，在所述步骤S2中，参与者根据其拥有的type类型的数据量确定报价信息，并发送至服务器；当参与者提交的报价信息 d*＝d时，参与者获得最大收益。 5.根据权利要求1所述的联邦学习激励方法，其特征在于，在所述步骤S3中，设定则当时，参与者i获得最大收益；所述服务器判断l是否小于di，以确定参与者i的收益。 6.根据权利要求5所述的联邦学习激励方法，其特征在于，若l≥di，则按照以下方式确定收益：若则判断为参与者i赢得竞拍，且其收益为α ·(l‑di)；若则判断为参与者i输掉竞拍，其收益为零；若l＜di，则按照以下方式确定收益：若则判断为参与者i赢得竞拍，且其收益为 α·(l‑di)＜0；若则判断为参与者i输掉竞拍，其收益为零。 7.根据权利要求1所述的联邦学习激励方法，其特征在于，在所述步骤S3中，设置报价权　利　要　求　书 1/2 页 2 CN 114330747 A 2最低的参与者为竞拍成功者，竞拍成功者的收益正相关于第二低报价与竞拍成功者报价的差值，即其中，是中的最小值，是中的最小值， α 是正控制参数，满足 8.根据权利要求1所述的联邦学习激励方法，其特征在于，当迭代次数为1时，竞价成功者的收益为竞价失败的参与者的收益为当迭代次数≥2时，所述参与者的收益为 9.一种存储装置，该存储装置中存储有多条指令，其特征在于，所述指令适用于由处理器加载并执行如权利要求1 ‑8任一所述联邦学习激励方法的步骤操作。 10.一种智能终端，包括用于执行各指令的处理器和用于存储多条指令的存储装置，其特征在于，所述指令适用于由所述处理器加载并执行如权利要求1 ‑8任一所述联邦学习激励方法的步骤操作。权　利　要　求　书 2/2 页 3 CN 114330747 A 3

专利 一种公平可信的联邦学习激励方法

专利一种公平可信的联邦学习激励方法