说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111680113.7 (22)申请日 2021.12.3 0 (71)申请人 深圳云天励飞技 术股份有限公司 地址 518000 广东省深圳市龙岗区园山 街 道龙岗大道8288号深圳大运软件小镇 17栋1楼 (72)发明人 袁瑾 肖嵘 王孝宇 (74)专利代理 机构 北京三聚阳光知识产权代理 有限公司 1 1250 专利代理师 林韵英 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 模型蒸馏方法、 装置及电子设备 (57)摘要 本发明实施例涉及一种模型蒸馏方法、 装置 及电子设备, 该方法包括: 对第i个未标记数据进 行第一泛化处理后, 分别输入到至少两个教师网 络模型中, 获取一组第一识别结果; 根据一组第 一识别结果, 获取第二识别结果; 当至少一个备 选标签中第一备选标签的预测概率大于或者等 于预设概率阈值时, 将第一备选标签 设定为未标 记数据的伪标签; 对第i个未标记数据进行第二 泛化处理后, 输入到学生网络模型中, 获取第三 识别结果; 根据第二识别结果、 第三识别结果, 以 及伪标签, 对学生网络模型进行优化, 直至学生 网络模型符合预设标准时结束。 通过该方式, 大 大降低人力标记的成本 。 权利要求书2页 说明书10页 附图4页 CN 114519416 A 2022.05.20 CN 114519416 A 1.一种模型蒸馏方法, 其特 征在于, 所述方法包括: 对第i个未标记数据进行第 一泛化处理后, 分别输入到至少两个教师网络模型中, 获取 一组第一识别结果; 根据一组所述第 一识别结果, 获取第 二识别结果, 其中第 二识别结果包括第 i个所述未 标记数据的至少一个备选标签, 以及每一个所述备选标签对应的预测概 率; 当至少一个所述备选标签中第 一备选标签的预测概率大于或者等于预设概率阈值 时, 将所述第一备选标签设定为所述未标记数据的伪标签, 其中, 所述第一备选标签为至少一 个所述备选标签中概 率最大的标签; 对第i个所述未标记数据进行第 二泛化处理后, 输入到学生网络模型中, 获取第 三识别 结果; 根据所述第二识别结果、 所述第 三识别结果, 以及所述伪标签, 对所述学生网络模型进 行优化, 直至所述学生网络模型符合预设标准时结束, 其中, i 为正整数。 2.根据权利要求1所述的方法, 其特征在于, 对第 i个未标记数据进行第 一泛化处理后, 分别输入到 至少两个教师网络模型中, 获取一组第一识别结果, 具体包括: 分别对第i个所述未 标记数据执 行不同类型的弱增广处 理; 将经过不同类型的弱增广处理后的未标记数据, 对应输入到不同的教师网络模型中, 获取一组所述第一识别结果。 3.根据权利要求1或2所述的方法, 其特征在于, 所述第 一识别结果包括与第 i个所述未 标记数据对应的至少一个备选标签, 以及每一个所述备选标签对应的第一 候选概率; 所述根据一组所述第一识别结果, 获取第二识别结果, 具体包括: 分别获取一组所述第一识别结果中相同备选标签对应的第一候选概率的第一概率平 均值; 所述第一识别结果中的至少一个备选标签, 以及每一个备选标签对应的第 一概率平均 值构成所述第二识别结果, 其中每一个备选标签对应的第一概率平均值, 即为所述第二识 别结果中与所述备选标签对应的预测概 率。 4.根据权利要求1所述的方法, 其特征在于, 所述对第i个所述未标记数据进行第二泛 化处理后, 输入到学生网络模型中, 获取第三识别结果, 具体包括: 分别对第i个所述未 标记数据进行强增广处 理; 将经过强增广处理后的未标记数据, 输入到所述学生网络模型中, 获取所述第三识别 结果。 5.根据权利要求1、 2或4任一项所述的方法, 其特征在于, 所述第三识别结果中包括: 第 i个所述未标记数据的至少一个备选标签中每一个备选标签对应的第二候选概率, 与第i个 所述未标记数据对应的目标 标签; 所述根据所述第 二识别结果、 所述第 三识别结果, 以及所述伪标签, 对所述学生网络模 型进行优化, 具体包括: 根据所述第 二识别结果中每一个备选标签对应的第 一概率平均值, 以及所述第 三识别 结果中每一个备选标签对应的第二 候选概率, 确定第一损失函数; 根据所述伪标签以及所述目标 标签, 确定第二损失函数; 根据所述第一损失函数和所述第二损失函数, 对所述学生网络模型进行优化。权 利 要 求 书 1/2 页 2 CN 114519416 A 26.一种多模型蒸馏装置, 其特 征在于, 所述装置包括: 处理模块, 用于对第i个未标记数据进行第一泛化处理后, 分别输入到至少两个教师网 络模型中, 获取一组第一识别结果; 根据一组所述第一识别结果, 获取第二识别结果, 其中 第二识别结果包括第i个所述未标记数据的至少一个备选标签, 以及每一个所述备选标签 对应的预测概 率; 设定模块, 用于当至少一个所述备选标签中第 一备选标签的预测概率大于或者等于预 设概率阈值时, 将所述第一备选标签设定为所述未标记数据的伪标签, 其中, 所述第一备选 标签为至少一个所述备选标签中概 率最大的标签; 所述处理模块, 还用于对第 i个所述未标记数据进行第 二泛化处理后, 输入到学生网络 模型中, 获取第三识别结果; 优化模块, 根据所述第二识别结果、 所述第三识别结果, 以及所述伪标签, 对所述学生 网络模型进行优化, 直至所述学生网络模型符合预设标准时结束, 其中, i 为正整数。 7.根据权利要求6所述的装置, 其特 征在于, 所述处 理模块, 具体用于: 分别对第i个所述未 标记数据执 行不同类型的弱增广处 理; 将经过不同类型的弱增广处理后的未标记数据, 对应输入到不同的教师网络模型中, 获取一组所述第一识别结果。 8.根据权利要求6或7所述的装置, 其特征在于, 所述第 一识别结果包括与第 i个所述未 标记数据对应的至少一个备选标签, 以及每一个所述备选标签对应的第一 候选概率; 所述处理模块, 具体用于: 分别获取一组所述第一识别结果中相同备选标签对应的第 一候选概率的第一 概率平均值; 所述第一识别结果中的至少一个备选标签, 以及每一个备选标签对应的第 一概率平均 值构成所述第二识别结果, 其中每一个备选标签对应的第一概率平均值, 即为所述第二识 别结果中与所述备选标签对应的预测概 率。 9.一种电子设备, 其特征在于, 包括处理器、 通信接口、 存储器和通信总线, 其中, 处理 器, 通信接口, 存 储器通过通信总线完成相互间的通信; 存储器, 用于存放计算机程序; 处理器, 用于执行存储器上所存放的程序时, 实现权利要求1 ‑5任一项所述的模型蒸馏 方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现如权利要求1 ‑5任一项所述的模型蒸馏方法的步骤。权 利 要 求 书 2/2 页 3 CN 114519416 A 3
专利 模型蒸馏方法、装置及电子设备
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 21:51:15
上传分享
举报
下载
原文档
(676.0 KB)
分享
友情链接
GB-T 26119-2010 绿色制造 机械产品生命周期评价 总则.pdf
T-CVMA 38—2020 猫杯状病毒实时荧光RT-PCR检测方法.pdf
GB-T 4831-2016 旋转电机产品型号编制方法.pdf
GB-T 4842-2017 氩.pdf
GB-T 28159-2011 电子级磷酸.pdf
CSA 面向IAM的零信任原则与指南.pdf
GB-T 40656.1-2021 智慧城市 运营中心 第1部分:总体要求.pdf
GB-T 24354-2023 公共地理信息通用地图符号.pdf
T-CASME 661—2023 绿色建筑节能设计技术文件编制规范.pdf
T-SHSPTA 004—2023 药品DTP 模式服务质量体系建设导则.pdf
QIAC 量子安全技术白皮书 2020.pdf
ISO TS 44006 2023 Collaborative business relationship management — Guidelines for.pdf
DB63-T1868-2020 市场监管信息系统运维规范 青海省.pdf
T-ZAWS 002—2023 弧焊设备 物联控制终端 模组 技术要求.pdf
T-CESA 1036—2019 信息技术 人工智能 机器学习模型及系统的质量要素和测试方法.pdf
GB-T 24403-2023 金枪鱼罐头质量通则.pdf
DB23-T 3291—2022 党政机关办公用房管理平台使用指南 黑龙江省.pdf
T-ZZB 1837—2020 氟塑料衬里不锈钢球阀.pdf
DB44-T 2328-2021 慢性肾脏病中医健康管理技术规范 广东省.pdf
GB-T 41884-2022 车用甲醇燃料作业安全规范.pdf
1
/
3
17
评价文档
赞助2.5元 点击下载(676.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。