说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221071625 0.X (22)申请日 2022.06.22 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 武文琦  (74)专利代理 机构 北京恒博知识产权代理有限 公司 11528 专利代理师 范胜祥 (51)Int.Cl. G06V 10/40(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) G06T 7/73(2017.01)G06V 20/40(2022.01) (54)发明名称 目标检测方法、 目标检测装置、 介质、 设备及 产品 (57)摘要 本说明书实施例提供一种目标检测方法、 目 标检测装置、 计算机可读存储介质、 电子设备及 计算机程序产品, 该方法包括: 对待检测图像进 行特征处理, 得到包含多个特征的待测特征组; 将该待测图像对应的待测特征组中的特征输入 至目标检测模 型的编码器, 并通过模 型中的编码 器的自注意力机制对上述待测特征组中的特征 进行增强处理, 得到多个待测增强特征。 进一步 地, 将关于目标类别对象 的目标增强特征与上述 多个待测增强特征输入至上述目标检测模型的 解码器, 以确定出上述多个待测增强特征中关于 目标类别对象的特征; 最终根据上述多个待测增 强特征中关于目标类别对象 的特征, 确定目标类 别对象在上述待检测图像中的位置信息 。 权利要求书2页 说明书13页 附图4页 CN 115147608 A 2022.10.04 CN 115147608 A 1.一种目标检测方法, 其中, 所述方法包括: 对待检测图像进行 特征处理, 得到包 含N个特征的待测特 征组, N为正整数; 将所述待测特征组中的N个特征输入至目标检测模型的编码器, 并通过所述编码器的 自注意力机制对所述待测特 征组中的N个特 征进行增强处 理, 得到N个待测 增强特征; 将关于目标类别对象的目标增强特征与 所述N个待测增强特征输入至所述目标检测模 型的解码器, 以确定出 所述N个待测增强特征中关于所述目标类别对象的特 征; 根据所述N个待测增强特征中关于所述目标类别对象的特征, 确定所述目标类别对象 在所述待检测图像中的位置信息 。 2.根据权利要求1所述的方法, 其中, 所述对待检测图像进行特征处理, 得到包含N个特 征的待测特 征组, 包括: 对所述待检测图像进行 特征提取处 理, 得到N个深度特 征; 对所述待检测图像的N个深度特 征分别进行位置编码, 得到所述待测特 征组; 其中, 所述待测特征组中的第i个特征包含: 第i个深度特征以及所述第 i个深度特征在 所述待检测图像中的位置信息, i取值 为1至N且 包含1和N的整数。 3.根据权利要求1所述的方法, 其中, 所述编码器包含特征金字塔结构和/或密集连接 的神经网络结构; 通过所述编码器的自注意力机制对所述待测特征组中的N个特征进行增强处理, 得到N 个待测增强特征, 包括: 基于所述特征金字塔结构和/或所述密集连接的神经网络结构, 对所述待测特征组中 的N个特征进行特征融合处理, 以及通过所述编码器的自注意力机制对所述待测特征组中 的N个特征进行增强处 理, 得到N个待测 增强特征。 4.根据权利要求1所述的方法, 其中, 在所述将关于目标类别对象的目标增强特征与 所 述N个待测增强特征输入至所述目标检测模型的解码器之前, 所述方法还 包括: 对包含所述目标类别对象的目标图像进行 特征处理, 得到目标 特征组; 将所述目标特征组输入至目标检测模型的编码器, 并通过所述编码器的自注意力 机制 对所述目标 特征组中的特 征进行增强处 理, 得到关于所述目标类别对象的目标增强特 征。 5.根据权利要求4所述的方法, 其中, 所述对包含所述目标类别对象的目标图像进行特 征处理, 得到目标 特征组, 包括: 对包含所述目标图像进行特征提取处理, 得到关于所述目标类别对象的M个深度 特征, M个正整数; 对所述目标图像的M个深度特征分别进行位置编码, 得到所述目标特征组; 其中, 所述 目标特征组中的第j个特征包含: 第j个深度特征以及所述第j个深度特征在所述待检测图 像中的位置信息, j取值 为1至M且包含1和M的整数。 6.根据权利要求4所述的方法, 其中, 所述通过所述编码器的自注意力 机制对所述目标 特征组中的特 征进行增强处 理, 得到关于所述目标类别对象的目标增强特 征, 包括: 将所述目标特征组输入至目标检测模型的编码器, 基于所述编码器中的特征金字塔结 构和/或密集连接的神经网络结构, 对 所述目标特征组中的特征进 行特征融合处理, 并通过 所述编码器的自注意力机制对所述目标特征组中的特征进 行增强处理, 得到关于所述目标 类别对象的目标增强特 征。权 利 要 求 书 1/2 页 2 CN 115147608 A 27.根据权利要求1至6 中任意一项所述的方法, 其中, 所述根据 所述N个待测增强特征中 关于所述 目标类别对 象的特征, 预测所述 目标类别对 象在所述待检测图像中的位置信息, 包括: 将所述N个待测增强特征中关于所述目标类别对象的特 征输入预测层; 通过所述预测层的回归处理, 得到所述目标类别对象在所述待检测图像中的位置信 息。 8.根据权利要求1至6中任意一项所述的方法, 其中, 所述目标检测模型采用 transformer模型。 9.一种目标检测装置, 其中, 所述装置包括: 预处 理模块、 目标检测模型以及预测模块; 其中, 所述预处理模块, 用于对待检测图像进行特征处理, 得到包含N个特征的待测特 征组, N为正整数; 所述目标检测模型的编码器用于: 在将所述待测特征组中的N个特征输入至所述编码 器之后, 通过所述编 码器的自注意力机制对所述待测特征组中的N个特征进行增强处理, 得 到N个待测 增强特征; 所述目标检测模型的解码器用于: 在将关于目标类别对象的目标增强特征与所述N个 待测增强特征输入至所述 目标检测模型 的解码器之后, 确定出所述N个待测增强特征中关 于所述目标类别对象的特 征; 所述预测模块用于: 根据 所述N个待测增强特征中关于所述目标类别对象的特征, 确定 所述目标类别对象在所述待检测图像中的位置信息 。 10.一种计算机可读存储介质, 所述计算机可读存储介质中存储有指令, 当所述指令在 计算机或处理器上运行时, 使得所述计算机或处理器执行如权利要求 1至8中任意一项所述 的目标检测方法。 11.一种电子设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器上 运行的计算机程序, 其中, 所述处理器执行所述计算机程序时实现如权利要求1至8中任意 一项所述的目标检测方法。 12.一种包含指令的计算机程序产品, 当所述计算机程序产品在计算机或处理器上运 行时, 使得 所述计算机或处 理器执行如权利要求1至8中任意 一项所述的目标检测方法。权 利 要 求 书 2/2 页 3 CN 115147608 A 3

.PDF文档 专利 目标检测方法、目标检测装置、介质、设备及产品

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 目标检测方法、目标检测装置、介质、设备及产品 第 1 页 专利 目标检测方法、目标检测装置、介质、设备及产品 第 2 页 专利 目标检测方法、目标检测装置、介质、设备及产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:53:00上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。