全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210044102.8 (22)申请日 2022.01.14 (71)申请人 福建技术师范学院 地址 350300 福建省福州市福清市融城镇 校园新村1号 (72)发明人 林为伟 张泽清  (74)专利代理 机构 北京易捷胜知识产权代理事 务所(普通 合伙) 11613 专利代理师 陈秀琴 (51)Int.Cl. G06V 20/62(2022.01) G06V 30/10(2022.01) G06V 10/44(2022.01) G06V 10/80(2022.01) G06V 10/764(2022.01)G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 一种基于知识蒸馏的场景文本检测方法及 装置 (57)摘要 本发明提供的一种基于知识蒸馏的场景文 本检测方法及装置, 通过设置ResNet18网络的基 准方法为DBNet, 进行剪枝得到PrunedNet网络, 并设置相应的TeacherNet网络; 对TeacherNet网 络进行训练, 并通过知 识蒸馏提取得到相应的特 征映射图; 设置损失函数, 并根据所述损失函数 和特征映射图对PrunedNet网络进行训练, 得到 训练好的PrunedNet网络对场景文本进行检测, 在速度和准确度之间进行平衡, 在不影 响特征融 合网络的情况下剪枝得到一个简化的Pru nedNet 网络, 更加敏捷高效, 并通过知识蒸馏的方式提 升该PrunedNet网络的检测性能, 使得检测性能 更加优异。 权利要求书2页 说明书7页 附图2页 CN 114463732 A 2022.05.10 CN 114463732 A 1.一种基于知识蒸馏的场景文本检测方法, 其特 征在于, 包括 步骤: S1、 设置ResNet18网络的基准方法为DB Net, 进行剪枝得到PrunedNet网络, 并设置相应 的TeacherNet网络; S2、 对Teac herNet网络进行训练, 并通过知识蒸馏提取 得到相应的特 征映射图; S3、 设置损失函数, 并根据所述损失函数和特征映射图对PrunedNet网络进行训练, 得 到训练好的PrunedNet网络对场景文本进行检测。 2.根据权利要求1所述的基于知识蒸馏的场景文本检测方法, 其特征在于, 所述的剪枝 得到PrunedNet网络得 过程具体为: 获取ResNet18网络每 个残差块的第一个BN层; 获取每个BN层的缩放因子构成集 合A={γ1, γ2, γ3, γ4…γm}; 通过剪枝比Pr对所述集合A进行排序, 取第K 大的缩放因子γk, 遍历所有的BN层, 若存在γi<γk, 则删除上下层对应的卷积核, 得到PrunedNet网络 。 3.根据权利要求1所述的基于知识蒸馏的场景文本检测方法, 其特征在于, 所述的设置 相应的Teac herNet网络具体为: 设置相应的Teac herNet网络为ResNet5 0网络。 4.根据权利要求1所述的基于知识蒸馏的场景文本检测方法, 其特征在于, 步骤S3具体 为: 设置特征映射图损失函数和概率损失函数, 并根据 所述特征映射图损失函数和概率损 失函数对PrunedNet网络进行训练, 得到训练好的PrunedNet网络对场景文本进行检测。 5.根据权利要求4所述的基于知识蒸馏的场景文本检测方法, 其特征在于, 所述的特征 映射图损失函数Lf公式为: 其中, W, H, C表示特征映射图的宽、 高以及通道数, yi,j,k表示TeacherNet网络中某点的 特征值, xi,j,k表示PrunedNet网络中某点的特 征值。 6.根据权利要求4所述的基于知识蒸馏的场景文本检测方法, 其特征在于, 所述的概率 损失函数Lp公式为: 其中, X表示PrunedNet网络的输出 预测图, Y表示Teac herNet网络的输出 预测图。 7.一种基于知识蒸馏的场景文本检测装置, 包括存储器、 处理器及存储在存储器上并 可在处理器上运行的计算机程序, 其特 征在于, 所述处 理器执行所述程序时实现以下步骤: S1、 设置ResNet18网络的基准方法为DB Net, 进行剪枝得到PrunedNet网络, 并设置相应 的TeacherNet网络; S2、 对Teac herNet网络进行训练, 并通过知识蒸馏提取 得到相应的特 征映射图; S3、 设置损失函数, 并根据所述损失函数和特征映射图对PrunedNet网络进行训练, 得 到训练好的PrunedNet网络对场景文本进行检测。权 利 要 求 书 1/2 页 2 CN 114463732 A 28.根据权利要求1所述的基于知识蒸馏的场景文本检测装置, 其特征在于, 步骤S3具体 为: 设置特征映射图损失函数和概率损失函数, 并根据 所述特征映射图损失函数和概率损 失函数对PrunedNet网络进行训练, 得到训练好的PrunedNet网络对场景文本进行检测。 9.根据权利要求4所述的基于知识蒸馏的场景文本检测装置, 其特征在于, 所述的特征 映射图损失函数Lf公式为: 其中, W, H, C表示特征映射图的宽、 高以及通道数, yi,j,k表示TeacherNet网络中某点的 特征值, xi,j,k表示PrunedNet网络中某点的特 征值。 10.根据权利要求4所述的基于知识蒸馏的场景文本检测装置, 其特征在于, 所述的概 率损失函数Lp公式为: 其中, X表示PrunedNet网络的输出 预测图, Y表示Teac herNet网络的输出 预测图。权 利 要 求 书 2/2 页 3 CN 114463732 A 3

.PDF文档 专利 一种基于知识蒸馏的场景文本检测方法及装置

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识蒸馏的场景文本检测方法及装置 第 1 页 专利 一种基于知识蒸馏的场景文本检测方法及装置 第 2 页 专利 一种基于知识蒸馏的场景文本检测方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:12:21上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。