全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111647692.5 (22)申请日 2021.12.2 9 (71)申请人 广东优算科技有限公司 地址 528314 广东省佛山市顺德区陈村镇 赤花社区广隆工业园兴业四路18号顺 联机械城22座四层42 2-19 申请人 广东创亿 源智能科技有限公司 (72)发明人 冼允廷 赵搏文 毛茹 曾策冲  沈强 解先旭  (74)专利代理 机构 广州圣理华知识产权代理有 限公司 4 4302 代理人 李唐明 (51)Int.Cl. G06N 20/00(2019.01) (54)发明名称 一种公平可信的联邦学习激励方法 (57)摘要 本发明公开了一种联邦学习激励方法, 包括 服务器和n个参与者, 该方法包括步骤: S1.系统 初始化; S2.参与者提交报价信息; S3.执行逆向 拍卖操作; S4.计算后验收益; 该方法结合逆向维 克里拍卖机制和后验价格机制, 通过逆向维克里 拍卖使得参与者诚实地提交其报价信息以实现 最大化收益, 且 该方法以参与者拥有的数据量作 为报价, 当参与者通过一轮逆向维克里拍卖诚实 地提交其报价后, 再利用后验价格机制为每个参 与式计算一个公平的收益, 其具有可信度高、 兼 容性强等诸 多优点。 权利要求书2页 说明书5页 附图2页 CN 114330747 A 2022.04.12 CN 114330747 A 1.一种联邦学习激励方法, 其特征在于, 包括服务器和n个参与者, 所述方法包括以下 步骤: 步骤S1.系统初始化: 服务器初始化联邦学习任务, 并招募n个拥有训练数据的参与 者, 其中, 所述联邦学习任务在形式上表示 为: 其中, 表示初始化模型, typ e表示需要的数据类型, t表示联合训练迭代的次数, B 是 每次迭代过程中所有参与者的总收益; 步骤S2.参与者提交报价信息: 参与者根据拥有的type类型数据的数据量d, 提交报价 信息d*, 其中, d*<d或d*>d或d*=d; 步骤S3.执行逆向拍卖操作: 服务器收到n个参与者的报价信息 后, 确定竞拍 成功者, 并计算竞拍成功者的收益; 若第i个参与者竞价成功, 则 为 的最小值, 竞价成功的参与者的收益 为: 其中, 是 的最小值; α 是控制参数, 用于控制竞 价成功者的收益; 步骤S4.计算后验收益: 服务器收到n个参与者的报价信息 后, 根据参与者提 交的报价, 为每个参与者计算收益; 其中, 每个参与者的报价与其收益呈正相关; 参与者j的 收益在形式上表示 为: 2.根据权利要求1所述的联邦学习激励方法, 其特征在于, 在所述步骤S3中, 所述服务 器按照逆向维克 里拍卖确定竞拍成功者, 并按照第二 价原理计算 竞拍成功者的收益。 3.根据权利要求1所述的联邦学习激励方法, 其特征在于, 在所述步骤S1中, 所述服务 器确认联合训练所需要的数据类型type后, 服务器初始化初始模型 和迭代次数t, 并确 定每次迭代的收益B; 在每次模型训练迭代过程中, 服 务器向各个参与者共同分配收益B。 4.根据权利要求1所述的联邦学习激励方法, 其特征在于, 在所述步骤S2中, 参与者根 据其拥有的type类型的数据量确定报价信息, 并发送至服务器; 当参与者提交的报价信息 d*=d时, 参与者获得最大收益。 5.根据权利要求1所述的联邦学习激励方法, 其特征在于, 在所述步骤S3中, 设定 则当 时, 参与者i获得最大收益; 所述服务器判断l是否小于di, 以确定参 与者i的收益。 6.根据权利要求5所述的联邦学习激励方法, 其特征在于, 若l≥di, 则按照以下方式确 定收益: 若 则判断为参与者i赢得竞拍, 且其收益为α ·(l‑di); 若 则判断为参 与者i输掉竞拍, 其收益 为零; 若l<di, 则按照以下方式确定收益: 若 则判断为参与者i赢得竞拍, 且其收益为 α·(l‑di)<0; 若 则判断为 参与者i输掉竞拍, 其收益 为零。 7.根据权利要求1所述的联邦学习激励方法, 其特征在于, 在所述步骤S3中, 设置报价权 利 要 求 书 1/2 页 2 CN 114330747 A 2最低的参与者为竞拍成功者, 竞拍成功 者的收益正相关于第二低报价与竞拍成功者报价的 差值, 即 其中, 是 中的最小值, 是 中的最小值, α 是正控制参数, 满足 8.根据权利要求1所述的联邦学习激励方法, 其特征在于, 当迭代次数为1时, 竞价成功 者的收益为 竞价失败的参与者的收益为 当迭代 次数≥2时, 所述 参与者的收益 为 9.一种存储装置, 该存储装置中存储有多条指令, 其特征在于, 所述指令适用于由处理 器加载并执 行如权利要求1 ‑8任一所述联邦学习激励方法的步骤操作。 10.一种智能终端, 包括用于执行各指令的处理器和用于存储多条指令的存储装置, 其 特征在于, 所述指令适用于由所述处理器加载并执行如权利要求1 ‑8任一所述联邦学习激 励方法的步骤操作。权 利 要 求 书 2/2 页 3 CN 114330747 A 3

.PDF文档 专利 一种公平可信的联邦学习激励方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种公平可信的联邦学习激励方法 第 1 页 专利 一种公平可信的联邦学习激励方法 第 2 页 专利 一种公平可信的联邦学习激励方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:27:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。