专利 对象识别方法、模型训练方法、设备及计算机介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210471505.0 (22)申请日 2022.04.28 (71)申请人腾讯科技（深圳）有限公司地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦3 5层 (72)发明人谷枫　 (74)专利代理机构北京励诚知识产权代理有限公司 11647 专利代理师高杨丽 (51)Int.Cl. G06V 30/413(2022.01) G06V 30/19(2022.01) G06V 30/18(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06T 7/73(2017.01) (54)发明名称对象识别方法、模型训练方法、设备及计算机介质 (57)摘要本申请公开一种对象识别方法、模型训练方法、设备及计算机介质，可应用于人工智能、计算机视觉、图像语义理解、图像处理、云技术、智慧交通、辅助驾驶等场景。对象识别方法包括：获取待识别图像；根据所述待识别图像的特征信息，确定所述待识别图像对应的多个第一特征图，所述第一特征图由所述特征信息融合得到；根据多个第一特征图中确定待识别图像对应的第一二值化特征信息；对多个第一特征图进行分析，得到待识别图像对应的第一检测结果；利用第一二值化特征信息与第一检测结果确定待识别图像中的第一目标对象的识别结果，既能保证较高的第一目标对象在待识别图像中的区域的确定准确度，又能识别出第一目标对象的类型信息。权利要求书4页说明书27页附图7页 CN 115131805 A 2022.09.30 CN 115131805 A 1.一种对象识别方法，其特征在于，所述方法包括：获取待识别图像；根据所述待识别图像的特征信息，确定所述待识别图像对应的多个第一特征图，所述第一特征图由所述特征信息融合得到；根据所述多个第一特征图中对应的感受野最大的第一目标特征图，确定所述待识别图像对应的第一二值化特征信息；对所述多个第一特征图进行分析，得到所述待识别图像对应的第一检测结果，所述第一检测结果包括：所述待识别图像中包含的第一目标对象的第一类型信息，与所述第一目标对象在所述待识别图像中的第一位置信息；利用所述第一二值化特征信息与所述第一检测结果确定所述待识别图像中的第一目标对象的识别结果。 2.根据权利要求1所述的方法，其特征在于，所述根据所述待识别图像的特征信息，确定所述待识别图像对应的多个第一特征图，包括：对所述待识别图像进行特征提取，得到所述待识别图像对应的多个第二特征图，所述第二特征图包含所述待识别图像的特征信息；对所述多个第二特征图中的至少部分第二特征图进行特征融合，得到所述待识别图像对应的多个第一特征图。 3.根据权利要求2所述的方法，其特征在于，所述对所述待识别图像进行特征提取，得到所述待识别图像对应的多个第二特征图，包括：对所述待识别图像进行下采样，得到所述待识别图像对应的第三特征图；将所述第三特征图添加至第一图集；根据所述第一图集确定所述待识别图像对应的多个第二特征图。 4.根据权利要求3所述的方法，其特征在于，所述根据所述第一图集确定所述待识别图像对应的多个第二特征图，包括：对所述第三特征图进行下采样，得到所述待识别图像对应的第四特征图；将所述第四特征图添加至所述第一图集；确定针对所述第一图集执行下采样的次数是否大于第一预设阈值，若是，则将所述第一图集中的多个特征图作为所述多个第二特征图；若否，则将所述第四特征图作为第三特征图，控制针对所述第一图集执行下采样的次数增一，直至确定针对所述第一图集执行下采样的次数大于第一预设阈值时，将所述第一图集中的多个特征图作为所述多个第二特征图。 5.根据权利要求2所述的方法，其特征在于，所述对所述多个第二特征图中的至少部分第二特征图进行特征融合，得到所述待识别图像对应的多个第一特征图，包括：从所述多个第二特征图中，确定出对应的感受野最小的第二目标特征图；对所述第二目标特征图做卷积处理，得到对应的第一中间特征图；根据所述多个第二特征图、所述第一中间特征图确定所述待识别图像对应的多个第一特征图。 6.根据权利要求5所述的方法，其特征在于，所述根据所述多个第二特征图、所述第一中间特征图确定所述待识别图像对应的多个第一特征图，包括：权　利　要　求　书 1/4 页 2 CN 115131805 A 2将所述第一中间特征图添加至第二图集；对所述第一中间特征图进行上采样，得到第一待融合图像；获取所述第二目标特征图对应的第二待融合图像，所述第二目标特征图由对所述多个第二特征图中的第二待融合图像进行下采样得到；叠加所述第一待融合图像与所述第二待融合图像，得到第一目标融合图像；将所述第一目标融合图像添加至所述第二图集；根据所述第二图集确定第一待合并图集；对所述第一中间特征图进行下采样，得到第五特征图；将所述第五特征图添加至第三图集；根据所述第三图集确定第二待合并图集；基于所述第一待合并图集与所述第二待合并图集确定所述多个第一特征图。 7.根据权利要求6所述的方法，其特征在于，所述根据所述第二图集确定第一待合并图集，包括：确定针对所述第二图集执行上采样的次数是否大于第二预设阈值，若是，则将所述第二图集作为第一待合并图集；若否，则将所述第一目标融合图像作为第一中间特征图，控制针对第二图集执行上采样的次数增一，直至确定针对第二图集执行上采样的次数大于第二预设阈值时，将所述第二图集作为第一待合并图集。 8.根据权利要求7所述的方法，其特征在于，所述根据所述第三图集确定第二待合并图集，还包括：确定针对所述第三图集执行下采样的次数是否大于第三预设阈值，若是，则将所述第三图集作为所述第二待合并图集；若否，则将所述第五特征图作为第一中间特征图，控制针对第三图集执行下采样的次数增一，直至确定针对第三图集执行下采样的次数大于第三预设阈值时，将所述第三图集作为所述第二待合并图集。 9.根据权利要求1所述的方法，其特征在于，所述利用所述第一二值化特征信息与所述第一检测结果确定所述待识别图像中的第一目标对象的识别结果，包括：根据所述第一二值化特征信息与所述第一目标对象在所述待识别图像中的第一位置信息，从所述待识别图像中提取出所述第一目标对象；输出所述第一目标对象的第一类型信息。 10.一种模型训练方法，其特征在于，所述方法包括：获取样本图像；将所述样本图像输入初始识别模型，得到所述样本图像中的第二目标对象的识别结果；其中，所述初始识别模型包括：初始特征确定网络、初始分割网络，以及初始检测网络；将所述样本图像输入预设的初始识别模型，得到所述样本图像中的第二目标对象的识别结果包括：通过所述初始特征确定网络根据所述样本图像的特征信息，确定所述样本图像对应的多个第六特征图，所述第六特征图由所述特征信息融合得到；通过所述初始分割网络，根据所述多个第六特征图中对应的感受野最大的第三目标特征图，确定所述样本图像对应的第二二值化特征信息；通过所述初始检测网络，对所述多个第六特征图进行分析，得到所权　利　要　求　书 2/4 页 3 CN 115131805 A 3

专利 对象识别方法、模型训练方法、设备及计算机介质

专利对象识别方法、模型训练方法、设备及计算机介质