(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210612879.X (22)申请日 2022.05.31 (71)申请人 西安翔迅科技有限责任公司 地址 710077 陕西省西安市锦业 二路15号 中航工业西安计算技术研究所1号厂 房112室 (72)发明人 吴树丽 李刚  (74)专利代理 机构 西安智邦专利商标代理有限 公司 6121 1 专利代理师 王少文 (51)Int.Cl. G06F 21/62(2013.01) G06F 21/60(2013.01) (54)发明名称 一种基于联邦学习的目标检测标签自动标 注方法 (57)摘要 本发明涉及一种人工智能的自动标注方法, 具体涉及一种基于联邦学习的目标检测标签自 动标注方法。 解决了现有自动标注方法存在参与 方部署模型的准确度和泛化性不够理想, 导致标 签自动标注效果差的技术问题。 本发 明自动标注 方法包括以下步骤: 1)待标注的参与方选 取少量 样本进行人工标注; 2)分别利用初版预训练模型 进行训练, 得到本地模型权重; 3)分别将本地模 型权重加密并发送给中央服务器; 4)进行安全聚 合操作, 得到更新权重并下发给各参与方; 5)通 过下发的更新权重对本地模型权重进行更新; 6) 循环步骤3)至步骤5), 直至得到最终目标检测模 型; 7)待标注的参与方利用最终目标检测模型对 全部待标注数据进行自动标注。 权利要求书2页 说明书6页 附图2页 CN 115081014 A 2022.09.20 CN 115081014 A 1.一种基于联邦学习的目标检测标签自动标注方法, 其特 征在于, 包括以下步骤: 步骤1)待标注的参与方从所有待标注样本中选取占比为5%~10%的样本, 要求选取 的样本与所有待标注样本保持独立同分布, 然后对选取 的样本进行人工标注; 其余参与方 的所有样本事先均已经 过人工标注; 步骤2)各参与方分别利用 初版预训练模型对人工标注的样本进行训练得到本地模型 权重; 步骤3)各参与 方分别使用加密技术对本地模型权重进行加密, 并将加密信息发送给中 央服务器; 步骤4)中央服务器对收到的本地模型权重通过改进的联邦学习方法进行安全聚合操 作, 得到安全聚合后的更新权 重并下发给 各参与方; 步骤5)各参与 方对收到的安全聚合后的更新权重进行解密, 以解密的安全聚合后的更 新权重为预训练模型, 使用本地数据执行梯度下降, 更新本地模型权重, 并计算更新后的损 失函数; 步骤6)循环步骤3)至步骤5), 直至损失函数收敛或达到预设迭代次数, 得到最终目标 检测模型; 步骤7)待标注 的参与方利用得到的最终目标检测模型对全部待标注数据进行自动标 注。 2.根据权利要求1所述的一种基于联邦学习的目标检测标签自动标注方法, 其特征在 于: 步骤4)中, 所述改进的联邦学习方法为: 为安全聚合后的更新权 重; K为总的参与方个数, K≥2; k 为参与方序号, 1≤k≤K; qk=(1‑pk)pk; nk为第k个参与方的样本数量, n 为总的样本数量; 为第k个参与方的本地模型权 重; t为更新轮次。 3.根据权利要求2所述的一种基于联邦学习的目标检测标签自动标注方法, 其特征在 于: 步骤2)中, 所述初版 预训练模型的获取 方式为, 各参与方分别从中央服 务器下载得到。 4.根据权利要求3所述的一种基于联邦学习的目标检测标签自动标注方法, 其特征在 于: 步骤6)中, 所述预设迭代次数由当前待标注的参与 方与其它参与方的样本数量关系确 定: a、 如果待标注的参与方的样本量与其它所有参与 方的样本量没有数量级上的差别, 则 预设迭代次数应≥2; b、 如果待标注 的参与方的样本量与其它参与方中任意一个的样本量之间有数量级上 的差别, 则预设迭代次数应≥3;权 利 要 求 书 1/2 页 2 CN 115081014 A 2所述数量级上的差别是指待标注的参与方的样本量与其它任意一个参与方的样本量 差距在10倍以上。权 利 要 求 书 2/2 页 3 CN 115081014 A 3

.PDF文档 专利 一种基于联邦学习的目标检测标签自动标注方法

安全报告 > 其他 > 文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于联邦学习的目标检测标签自动标注方法 第 1 页 专利 一种基于联邦学习的目标检测标签自动标注方法 第 2 页 专利 一种基于联邦学习的目标检测标签自动标注方法 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生2024-02-07 20:38:56上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。