(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210590467.0
(22)申请日 2022.05.26
(71)申请人 腾讯科技 (深圳) 有限公司
地址 518057 广东省深圳市南 山区高新区
科技中一路腾讯大厦3 5层
(72)发明人 蔡德 叶虎 马兆轩 肖凯文
周彦宁 韩骁
(74)专利代理 机构 北京三高永信知识产权代理
有限责任公司 1 1138
专利代理师 祝亚男
(51)Int.Cl.
G06V 10/774(2022.01)
G06V 10/764(2022.01)
G06V 10/762(2022.01)
G06V 10/72(2022.01)G06N 20/00(2019.01)
G06T 1/00(2006.01)
G06T 3/40(2006.01)
(54)发明名称
图像分类模型的训练方法、 装置、 设备、 存储
介质及产品
(57)摘要
本申请公开了一种图像分类模型的训练方
法、 装置、 设备、 存储介质及产品, 属于人工智能
技术领域。 该方法包括: 从多个样本切片图像中
确定至少两个尺度的多张难例图像, 样本切片图
像是样本切片的图像, 样本切片中包含样本细
胞, 难例图像是含难例细胞的图像; 基于至少两
个尺度的多张难例图像, 生成目标切片图像, 每
个目标切片图像中包含至少一个尺度的难例图
像; 基于目标切片图像, 训练图像分类模 型, 图像
分类模型用于预测输入的切片图像所属的类别。
该方法可以提高图像分类模型对于难例样本以
及新样本的预测性能。
权利要求书5页 说明书27页 附图8页
CN 115115902 A
2022.09.27
CN 115115902 A
1.一种图像分类模型的训练方法, 其特 征在于, 所述方法包括:
从多个样本切片图像中确定至少两个尺度的多 张难例图像, 所述样本切片图像是样本
切片的图像, 所述样本切片中包 含样本细胞, 所述难例图像是含 难例细胞的图像;
基于所述至少两个尺度的多张难例图像, 生成目标切片图像, 每个所述目标切片图像
中包含至少一个尺度的难例图像;
基于所述目标切片图像, 训练图像分类模型, 所述图像分类模型用于预测输入的切片
图像所属的类别。
2.根据权利要求1所述的方法, 其特征在于, 所述从多个样本切片图像中确定至少两个
尺度的多张难例图像, 包括:
将多个所述样本切片图像输入所述图像分类模型, 得到所述图像分类模型输出的样本
预测结果, 所述样本预测结果至少包括多个所述样本切片图像所属的预测类别;
基于所述样本预测结果和所述样本切片图像对应的标注类别, 从多个所述样本切片图
像中确定所述至少两个尺度的多张难例图像。
3.根据权利要求2所述的方法, 其特征在于, 所述至少两个尺度的多 张难例图像包括细
胞尺度的难例细胞区域图像, 所述样本预测结果还包括所述样本细胞对应细胞特征的特征
权重, 所述特 征权重和所述细胞 特征用于确定所述样本切片图像的图像特 征;
所述基于所述样本预测结果和所述样本切片图像对应的标注类别, 从多个所述样本切
片图像中确定所述至少两个尺度的多张难例图像, 包括:
基于所述样本切片图像对应的所述标注类别, 从多个所述样本切片图像中确定第 一切
片图像, 所述第一切片图像中包 含的样本切片图像的所述标注类别为第一类别;
基于所述第 一切片图像中所述细胞特征的所述特征权重, 从所述第 一切片图像中确定
第一细胞区域图像, 所述第一细胞区域图像是第一类细胞在所述第一切片图像中所占据区
域的图像, 所述第一类细胞是所述特征权重在所述第一切片图像中位于前m个特征权重的
样本细胞, m为 正整数;
基于所述第 一细胞区域图像对应的所述特征权重, 从所述第 一细胞区域图像中确定所
述难例细胞区域图像。
4.根据权利要求3所述的方法, 其特征在于, 所述基于所述第 一细胞区域图像对应的所
述特征权重, 从所述第一细胞区域图像中确定所述难例细胞区域图像, 包括:
对所述第一细胞区域图像对应的所述特征权重按照由低到高进行排序, 得到第 一图像
序列; 将位于所述第一图像序列的前n个第一细胞区域图像, 确定为所述难例细胞区域图
像, n为正整数;
或,
将所述特征权重低于第 一权重阈值的所述第 一细胞区域图像, 确定为所述难例细胞区
域图像。
5.根据权利要求2所述的方法, 其特征在于, 所述至少两个尺度的多 张难例图像包括细
胞尺度的难例细胞区域图像, 所述样本预测结果还包括所述样本细胞对应细胞特征的特征
权重, 所述特 征权重和所述细胞 特征用于确定所述样本切片图像的图像特 征;
所述基于所述样本预测结果和所述样本切片图像对应的标注类别, 从多个所述样本切
片图像中确定所述至少两个尺度的多张难例图像, 包括:权 利 要 求 书 1/5 页
2
CN 115115902 A
2基于所述标注类别和所述预测类别, 从多个所述样本切片图像中确定第二切片图像,
所述第二切片图像对应的所述预测类别和所述标注类别不同, 且所述第二切片图像中包含
的样本切片图像的所述标注类别为第二类别;
基于所述第 二切片图像中所述细胞特征的所述特征权重, 从所述第 二切片图像中确定
第二细胞区域图像, 所述第二细胞区域图像是第二类细胞在所述第二切片图像中所占据区
域的图像, 所述第二类细胞是所述特征权重在所述第二切片图像中位于前i个特征权重的
样本细胞, i 为正整数;
基于所述第 二细胞区域图像对应的所述特征权重, 从所述第 二细胞区域图像中确定所
述难例细胞区域图像。
6.根据权利要求5所述的方法, 其特征在于, 所述基于所述第 二细胞区域图像对应的所
述特征权重, 从所述第二细胞区域图像中确定所述难例细胞区域图像, 包括:
对所述第二细胞区域图像对应的所述特征权重按照由高到低进行排序, 得到第 二图像
序列; 将位于所述第二图像序列的前j个第二细胞区域图像, 确定为所述难例细胞区域图
像, j为正整数;
或,
将所述特征权重高于第 二权重阈值的所述第 二细胞区域图像, 确定为所述难例细胞区
域图像。
7.根据权利要求2所述的方法, 其特征在于, 所述至少两个尺度的多 张难例图像包括切
片尺度的难例切片图像;
所述基于所述样本预测结果和所述样本切片图像对应的标注类别, 从所述多个样本切
片图像中确定所述至少两个尺度的多张难例图像, 包括:
基于所述样本预测结果和所述标注类别, 确定多个所述样本切片图像对应的预测损
失;
基于所述预测损失, 从多个所述样本切片图像中确定所述难例切片图像。
8.根据权利要求7所述的方法, 其特征在于, 所述基于所述预测损 失, 从多个所述样本
切片图像中确定所述难例切片图像, 包括:
对多个所述样本切片图像按照所述预测损 失由高到低进行排序, 得到第三图像序列;
将所述第三图像序列中的前k个样本切片图像, 确定为所述难例切片图像, k 为正整数;
或,
将所述预测损失高于损失阈值的所述样本切片图像, 确定为所述难例切片图像。
9.根据权利要求1至8任一所述的方法, 其特征在于, 所述基于所述至少两个尺度的多
张难例图像, 生成目标切片图像, 包括如下至少一种:
从所述至少两个尺度的多 张难例图像中选取至少两张难例图像, 以及对至少两张所述
难例图像进行图像拼接处 理, 生成一张所述目标切片图像;
从所述至少两个尺度的多 张难例图像中选取至少一张所述难例图像, 以及对至少一张
所述难例图像和至少一张所述样本切片图像进 行图像拼接处理, 生成一张所述目标切片图
像。
10.根据权利要求9所述的方法, 其特征在于, 所述至少两个尺度的多张难例图像包括
细胞尺度的难例细胞区域图像和 切片尺度的难例切片图像;权 利 要 求 书 2/5 页
3
CN 115115902 A
3
专利 图像分类模型的训练方法、装置、设备、存储介质及产品
文档预览
中文文档
41 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共41页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:35:09上传分享