全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210205615.2 (22)申请日 2022.03.03 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 杨黔生  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 鄢功军 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/25(2022.01) G06V 10/80(2022.01) G06K 9/62(2022.01) (54)发明名称 检测模型的训练方法、 目标检测方法、 装置、 设备和介质 (57)摘要 本公开提供了一种检测模型的训练方法, 涉 及人工智能技术领域, 尤其涉及计算机视觉、 图 像识别、 深度学习和增强现实技术领域, 可应用 于智慧城市和智 能交通场景。 具体实现方案为: 将样本图像输入检测模型, 得到输出结果, 其中, 输出结果包括样本图像的关系图, 关系图中的边 用于表征样本图像中多个关键点之间的关系信 息; 根据样本图像的标签与输出结果, 得到差异 值; 以及根据差异值, 训练检测模型。 本公开还提 供了一种目标检测方法、 装置、 电子设备和存储 介质。 权利要求书3页 说明书10页 附图6页 CN 114581730 A 2022.06.03 CN 114581730 A 1.一种检测模型的训练方法, 包括: 将样本图像输入检测模型, 得到输出结果, 其中, 所述输出结果包括所述样本图像的关 系图, 所述关系图中的边用于表征样本图像中多个关键点之间的关系信息; 根据所述样本图像的标签与所述输出 结果, 得到 差异值; 以及 根据所述差异值, 训练所述检测模型。 2.根据权利要求1所述的方法, 其中, 所述输出结果还包括所述样本图像的热图和所述 样本图像的深度图, 所述标签包括热图子标签、 深度图子标签和关系图子标签, 所述根据所述样本图像的标签与所述输出 结果, 得到 差异值包括: 根据所述热图和所述热图子标签, 得到第一损失值; 根据所述深度图和所述深度图子标签, 得到第二损失值; 根据所述关系图和所述关系图子标签, 得到第三损失值; 以及 根据所述第一损失值、 所述第二损失值和所述第三损失值, 得到所述差异值。 3.根据权利要求2所述的方法, 其中, 所述根据所述深度图和所述深度图子标签, 得到 第二损失值包括: 针对所述深度图中的至少一个关键点, 根据与 所述至少一个关键点中每个关键点对应 的局部深度图和局部深度图子标签, 得到至少一个第二子损失值, 其中, 所述局部深度图子 标签是根据所述每 个关键点和所述深度图子标签确定的; 以及 根据所述至少一个第二子损失值, 得到所述第二损失值。 4.根据权利要求2所述的方法, 其中, 所述根据所述关系图和所述关系图子标签, 得到 第三损失值包括: 针对所述关系图中的至少一个关键点, 根据与 所述至少一个关键点中每个关键点对应 的局部关系图和局部 关系图子标签, 得到至少一个第三子损失值, 其中, 所述局部 关系图子 标签是根据所述每 个关键点和所述关系图子标签确定的; 以及 根据所述至少一个第三子损失值, 得到所述第三损失值。 5.根据权利要求2所述的方法, 其中, 所述根据所述第一损 失值、 所述第二损 失值和所 述第三损失值, 得到所述差异值包括: 根据所述第一损失值、 所述第 二损失值和所述第 三损失值, 进行加权求和, 得到所述差 异值。 6.一种目标检测方法, 包括: 对目标图像进行目标检测, 得到目标检测结果, 其中, 所述目标检测结果包括所述目标 图像的关系图, 所述关系图中的边用于表征所述 目标图像中多个关键点之间的关系信息; 以及 根据所述目标检测结果, 确定所述目标图像中的多个关键点的目标信息 。 7.根据权利要求6所述的方法, 其中, 所述目标检测结果包括所述目标图像的热图和所 述样本图像的深度图, 所述根据所述目标检测结果, 确定所述目标图像中的多个关键点的目标信息包括: 将所述多个关键点中K个关键点的位置信 息和所述K个关键点的深度信息 融合, 得到第 一融合信息, 其中, 所述K个 关键点的位置信息是根据所述热图确定的, 所述K个关键点的深 度信息是根据所述深度图确定的, K为大于或等于1的整数; 以及权 利 要 求 书 1/3 页 2 CN 114581730 A 2将所述第一融合信息和所述K个关键点的偏移信息融合, 得到所述目标信息, 其中, 所 述K个关键点的偏移信息是根据所述关系图确定的, 每个关键点的偏移信息用于表征所述 每个关键点与所述多个关键点之间的偏移量。 8.根据权利要求7所述的方法, 其中, 所述将所述第一融合信息和所述K个关键点的偏 移信息融合, 得到所述目标信息包括: 对所述第一融合信息进行升维处 理, 得到升维后的第一融合信息; 将所述升维后的第一融合信息和所述K个关键点的偏移信息进行融合, 得到第二融合 信息; 以及 基于所述K个关键点中每个关键点的置信度, 对所述第 二融合信 息进行降维处理, 得到 所述目标信息 。 9.一种检测模型的训练装置, 包括: 第一获得模块, 用于将样本图像输入检测模型, 得到输出结果, 其中, 所述输出结果包 括所述样本图像的关系图, 所述关系图中的边用于表征样本图像中多个关键点之 间的关系 信息; 第二获得模块, 用于根据所述样本图像的标签与所述输出 结果, 得到 差异值; 以及 训练模块, 用于根据所述差异值, 训练所述检测模型。 10.根据权利要求9所述的装置, 其中, 所述输出结果还包括所述样本图像的热图和所 述样本图像的深度图, 所述标签包括热图子标签、 深度图子标签和关系图子标签, 所述第二获得模块包括: 第一获得子模块, 用于根据所述热图和所述热图子标签, 得到第一损失值; 第二获得子模块, 用于根据所述深度图和所述深度图子标签, 得到第二损失值; 第三获得子模块, 用于根据所述关系图和所述关系图子标签, 得到第三损失值; 以及 第四获得子模块, 用于根据 所述第一损失值、 所述第 二损失值和所述第 三损失值, 得到 所述差异值。 11.根据权利要求10所述的装置, 其中, 所述第二获得子模块包括: 第一获得单元, 用于针对所述深度图中的至少一个关键点, 根据与所述至少一个关键 点中每个关键点对应的局部深度图和局部深度图子标签, 得到至少一个第二子损失值, 其 中, 所述局部深度图子标签是根据所述每 个关键点和所述深度图子标签确定的; 以及 第二获得 单元, 用于根据所述至少一个第二子损失值, 得到所述第二损失值。 12.根据权利要求10所述的装置, 其中, 所述第三获得子模块包括: 第三获得单元, 用于针对所述关系图中的至少一个关键点, 根据与所述至少一个关键 点中每个关键点对应的局部关系图和局部关系图子标签, 得到至少一个第三子损失值, 其 中, 所述局部关系图子标签是根据所述每 个关键点和所述关系图子标签确定的; 以及 第四获得 单元, 用于根据所述至少一个第三子损失值, 得到所述第三损失值。 13.根据权利要求10所述的装置, 其中, 所述第四获得子模块包括: 第五获得单元, 用于根据 所述第一损失值、 所述第 二损失值和所述第 三损失值, 进行加 权求和, 得到所述差异值。 14.一种目标检测装置, 包括: 目标检测模块, 用于对目标图像进行目标检测, 得到目标检测结果, 其中, 所述目标检权 利 要 求 书 2/3 页 3 CN 114581730 A 3

.PDF文档 专利 检测模型的训练方法、目标检测方法、装置、设备和介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 检测模型的训练方法、目标检测方法、装置、设备和介质 第 1 页 专利 检测模型的训练方法、目标检测方法、装置、设备和介质 第 2 页 专利 检测模型的训练方法、目标检测方法、装置、设备和介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:22:43上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。