全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210151878.X (22)申请日 2022.02.18 (71)申请人 海尔数字科技 (上海) 有限公司 地址 201615 上海市 漕河泾开发区松江高 科技园莘砖公路6 68号202室-7 7 申请人 海尔数字科技 (青岛) 有限公司   青岛海尔工业智能研究院有限公司 (72)发明人 张玥 徐鹏 谈晟 盛国军  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 谢百韬 臧建明 (51)Int.Cl. G06V 10/80(2022.01) G06V 10/764(2022.01) G06V 20/56(2022.01)G06V 10/82(2022.01) G06T 7/73(2017.01) G06N 3/04(2006.01) (54)发明名称 目标检测方法及图片检测模型的训练方法 (57)摘要 本申请实施例提供一种目标检测方法及 图 片检测模型的训练方法, 包括: 将待检测图片输 入图片检测模型中的swin网络中, 通过swin网络 中的线性变换模块和与线性变换模块对应的第 一swin transformer模 块, 提取待检测图片中的 多个第一特征信息, 并通过swin网络中的至少一 个分块合并模块 以及与各分块合并模块对应的 第二swin  transformer模 块, 对多个第一特征信 息进行合并与提取, 得到第二特征信息; 将第二 特征信息输入图片检测模型中的transformer编 码网络中, 得到编码信息; 将编码信息输入图片 检测模型中的transformer解码网络中, 得到待 检测图片中目标的类别和位置信息。 本申请提供 的目标检测方法及图片检测模型的训练方法能 够提高对图片中的目标进行检测的精度。 权利要求书2页 说明书12页 附图6页 CN 114529792 A 2022.05.24 CN 114529792 A 1.一种目标检测方法, 其特 征在于, 包括: 将待检测图片输入图片检测模型中的swin网络中, 通过所述swin网络中的线性变换模 块和与所述线性变换模块对应的第一swin  transformer模块, 提取所述待检测图片中的多 个第一特征信息, 并通过所述swin网络中的至少一个分块合并模块以及与各所述分块合并 模块对应的第二swin  transformer模块, 对所述多个第一特征信息进行合并与提取, 得到 第二特征信息; 将所述第二特征信息输入所述图片检测模型中的transformer编码网络中, 得到编码 信息; 将所述编码信息输入所述图片检测模型中的transformer解码网络中, 得到所述待检 测图片中目标的类别和位置信息 。 2.根据权利要求1所述的方法, 其特征在于, 将所述编码信 息输入所述图片检测模型中 的transformer解码网络中, 得到所述待检测图片中目标的位置信息, 包括: 将所述编码信息输入所述图片检测模型中的transformer解码网络中, 得到所述目标 的边框的坐标信息; 通过加权边界框融合方法对所述边框的坐标信息进行处理, 得到所述目标的位置信 息。 3.根据权利要求1或2所述的方法, 其特征在于, 所述swin网络中的分块合并模块的数 量为多个, 多个所述分块 合并模块对应的分辨 率参数不同。 4.根据权利要求1或2所述的方法, 其特征在于, 所述通过所述swin网络中的线性变换 模块和与所述线性变换模块对应的第一swin  transformer模块, 提取所述待检测图片中的 多个第一特 征信息, 包括: 通过所述线性变换模块, 将所述待检测图片转换为张量信息; 通过所述第一sw in transformer模块 提取所述张量信息中的多个第一特 征信息。 5.一种图片检测模型的训练方法, 其特 征在于, 包括: 将样本图片输入初始图片检测模型中的初始swin网络中, 通过所述初始swin网络中的 初始线性变换模块和与所述初始线性变换模块对应的第一初始swin  transformer模块, 提 取所述待检测图片中的多个第一样本特征信息, 并通过所述初始swin网络中的至少一个初 始分块合并模块以及与各所述初始分块合并模块对应的第二初始swin  transformer模块, 对所述多个第一样本特 征信息进行合并与提取, 得到第二样本特 征信息; 对所述第二样本特征信 息和所述样本图片中目标的标注信 息进行特征融合处理, 得到 融合特征; 根据所述融合特 征, 调整所述初始图片检测模型中的模型参数, 得到图片检测模型。 6.根据权利要求5所述的方法, 其特征在于, 所述根据所述融合特征, 调整所述初始图 片检测模型中的模型参数, 得到图片检测模型, 包括: 将所述融合特征输入所述初始图片检测模型中的初始transformer编码网络中, 得到 样本编码信息; 将所述样本编码信息输入所述初始图片检测模型中的初始transformer解码网络中, 得到所述样本图片中目标的类别和位置信息; 根据所述标注信息、 所述样本 图片中目标的类别和位置信息, 调整所述初始图片检测权 利 要 求 书 1/2 页 2 CN 114529792 A 2模型中的模型参数, 得到图片检测模型。 7.一种目标检测装置, 其特 征在于, 包括: 第一特征提取模块, 用于将待检测图片输入图片检测模型中的swin网络中, 通过所述 swin网络中的线性变换模块和与所述线性变换模块对应的第一swin  transformer模块, 提 取所述待检测图片中的多个第一特征信息, 并通过所述swin网络中的至少一个分块合并模 块以及与各所述分块合并模块对应的第二swin  transformer模块, 对 所述多个第一特征信 息进行合并与提取, 得到第二特 征信息; 第一编码模块, 用于将所述第二特征信息输入所述图片检测模型中的transformer编 码网络中, 得到编码信息; 第一解码模块, 用于将所述编码信息输入所述图片检测模型中的transformer解码网 络中, 得到所述待检测图片中目标的类别和位置信息 。 8.一种电子设备, 其特 征在于, 包括: 处 理器, 以及与所述处 理器通信连接的存 储器; 所述存储器存储计算机执 行指令; 所述处理器执行所述存储器存储的计算机执行指令, 以实现如权利要求1至6任一项所 述的方法。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 执行指令, 所述计算机执行指令被处理器执行时用于实现如权利要求1至6任一项 所述的方 法。 10.一种计算机程序产品, 其特征在于, 包括计算机程序, 该计算机程序被处理器执行 时实现权利要求1至 6任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114529792 A 3

.PDF文档 专利 目标检测方法及图片检测模型的训练方法

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 目标检测方法及图片检测模型的训练方法 第 1 页 专利 目标检测方法及图片检测模型的训练方法 第 2 页 专利 目标检测方法及图片检测模型的训练方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:23:10上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。