(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210471505.0
(22)申请日 2022.04.28
(71)申请人 腾讯科技 (深圳) 有限公司
地址 518057 广东省深圳市南 山区高新区
科技中一路腾讯大厦3 5层
(72)发明人 谷枫
(74)专利代理 机构 北京励诚知识产权代理有限
公司 11647
专利代理师 高杨丽
(51)Int.Cl.
G06V 30/413(2022.01)
G06V 30/19(2022.01)
G06V 30/18(2022.01)
G06V 10/764(2022.01)
G06V 10/82(2022.01)G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06T 7/73(2017.01)
(54)发明名称
对象识别方法、 模型训练方法、 设备及计算
机介质
(57)摘要
本申请公开一种对象识别方法、 模 型训练方
法、 设备及计算机介质, 可应用于人工智能、 计算
机视觉、 图像语义理解、 图像处理、 云技术、 智慧
交通、 辅助 驾驶等场景。 对象识别方法包括: 获取
待识别图像; 根据所述待识别图像的特征信息,
确定所述待识别图像对应的多个第一特征图, 所
述第一特征图由所述特征信息融合得到; 根据多
个第一特征图中确定待识别图像对应的第一二
值化特征信息; 对多个第一特征图进行分析, 得
到待识别图像对应的第一检测结果; 利用第一二
值化特征信息与第一检测结果确定待识别图像
中的第一目标对象的识别结果, 既能保证较高的
第一目标对象在待识别图像中的区域的确定准
确度, 又能识别出第一目标对象的类型信息 。
权利要求书4页 说明书27页 附图7页
CN 115131805 A
2022.09.30
CN 115131805 A
1.一种对象识别方法, 其特 征在于, 所述方法包括:
获取待识别图像;
根据所述待识别图像的特征信息, 确定所述待识别图像对应的多个第一特征图, 所述
第一特征图由所述特 征信息融合得到;
根据所述多个第一特征图中对应的感受野最大的第 一目标特征图, 确定所述待识别图
像对应的第一 二值化特征信息;
对所述多个第一特征图进行分析, 得到所述待识别图像对应的第一检测结果, 所述第
一检测结果包括: 所述待识别图像中包含的第一 目标对象的第一类型信息, 与所述第一 目
标对象在所述待识别图像中的第一 位置信息;
利用所述第一二值化特征信息与所述第一检测结果确定所述待识别图像中的第一目
标对象的识别结果。
2.根据权利要求1所述的方法, 其特征在于, 所述根据所述待识别图像的特征信息, 确
定所述待识别图像对应的多个第一特 征图, 包括:
对所述待识别图像进行特征提取, 得到所述待识别图像对应的多个第二特征图, 所述
第二特征图包含所述待识别图像的特 征信息;
对所述多个第 二特征图中的至少部分第 二特征图进行特征融合, 得到所述待识别图像
对应的多个第一特 征图。
3.根据权利要求2所述的方法, 其特征在于, 所述对所述待识别图像进行特征提取, 得
到所述待识别图像对应的多个第二特 征图, 包括:
对所述待识别图像进行 下采样, 得到所述待识别图像对应的第三特 征图;
将所述第三特 征图添加至第一图集;
根据所述第一图集确定所述待识别图像对应的多个第二特 征图。
4.根据权利要求3所述的方法, 其特征在于, 所述根据所述第 一图集确定所述待识别图
像对应的多个第二特 征图, 包括:
对所述第三特 征图进行 下采样, 得到所述待识别图像对应的第四特 征图;
将所述第四特 征图添加至所述第一图集;
确定针对所述第一图集执行下采样的次数是否大于第一预设阈值, 若是, 则将所述第
一图集中的多个特 征图作为所述多个第二特 征图;
若否, 则将所述第四特征图作为第三特征图, 控制针对所述第一图集执行下采样的次
数增一, 直至确定针对所述第一图集执行下采样的次数大于第一预设阈值时, 将所述第一
图集中的多个特 征图作为所述多个第二特 征图。
5.根据权利要求2所述的方法, 其特征在于, 所述对所述多个第 二特征图中的至少部分
第二特征图进行 特征融合, 得到所述待识别图像对应的多个第一特 征图, 包括:
从所述多个第二特 征图中, 确定出对应的感受野最小的第二目标 特征图;
对所述第二目标 特征图做卷积处 理, 得到对应的第一中间特 征图;
根据所述多个第二特征图、 所述第 一中间特征图确定所述待识别图像对应的多个第 一
特征图。
6.根据权利要求5所述的方法, 其特征在于, 所述根据所述多个第二特征图、 所述第一
中间特征图确定所述待识别图像对应的多个第一特 征图, 包括:权 利 要 求 书 1/4 页
2
CN 115131805 A
2将所述第一中间特 征图添加至第二图集;
对所述第一中间特 征图进行 上采样, 得到第一待融合图像;
获取所述第 二目标特征图对应的第 二待融合图像, 所述第 二目标特征图由对所述多个
第二特征图中的第二待融合图像进行 下采样得到;
叠加所述第一待融合图像与所述第二待融合图像, 得到第一目标融合图像;
将所述第一目标融合图像添加至所述第二图集;
根据所述第二图集确定第一待合并图集;
对所述第一中间特 征图进行 下采样, 得到第五特 征图;
将所述第五特 征图添加至第三图集;
根据所述第三图集确定第二待合并图集;
基于所述第一待合并图集与所述第二待合并图集确定所述多个第一特 征图。
7.根据权利要求6所述的方法, 其特征在于, 所述根据所述第 二图集确定第 一待合并图
集, 包括:
确定针对所述第二图集执行上采样的次数是否大于第二预设阈值, 若是, 则将所述第
二图集作为第一待合并图集;
若否, 则将所述第一目标融合图像作为第一中间特征图, 控制针对第二图集执行上采
样的次数增一, 直至确定针对第二图集执行上采样的次数大于第二预设阈值时, 将所述第
二图集作为第一待合并图集。
8.根据权利要求7所述的方法, 其特征在于, 所述根据所述第 三图集确定第 二待合并图
集, 还包括:
确定针对所述第三图集执行下采样的次数是否大于第三预设阈值, 若是, 则将所述第
三图集作为所述第二待合并图集;
若否, 则将所述第五特征图作为第一中间特征图, 控制针对第三图集执行下采样的次
数增一, 直至确定针对第三图集执行下采样的次数大于第三预设阈值时, 将所述第三图集
作为所述第二待合并图集。
9.根据权利要求1所述的方法, 其特征在于, 所述利用所述第 一二值化特征信 息与所述
第一检测结果确定所述待识别图像中的第一目标对象的识别结果, 包括:
根据所述第一二值化特征信息与所述第一目标对象在所述待识别图像中的第一位置
信息, 从所述待识别图像中提取 出所述第一目标对象;
输出所述第一目标对象的第一类型信息 。
10.一种模型训练方法, 其特 征在于, 所述方法包括:
获取样本图像;
将所述样本图像输入初始识别模型, 得到所述样本图像中的第二目标对象的识别结
果; 其中, 所述初始识别模型包括: 初始特征确定网络、 初始分割网络, 以及初始检测网络;
将所述样本图像输入预设的初始识别模型, 得到所述样本图像中的第二目标对象的识别结
果包括: 通过所述初始特征确定网络根据所述样本图像的特征信息, 确定所述样本图像对
应的多个第六特征图, 所述第六特征图由所述特征信息融合得到; 通过所述初始分割网络,
根据所述多个第六特征图中对应的感受野最大的第三目标特征图, 确定所述样本图像对应
的第二二值化特征信息; 通过所述初始检测网络, 对所述多个第六特征图进行分析, 得到所权 利 要 求 书 2/4 页
3
CN 115131805 A
3
专利 对象识别方法、模型训练方法、设备及计算机介质
文档预览
中文文档
39 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共39页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 09:51:57上传分享