全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211148611.1 (22)申请日 2022.09.21 (71)申请人 京东方科技 集团股份有限公司 地址 100015 北京市朝阳区酒仙桥路10号 (72)发明人 胡玉兰 张振中 姜晓天  (74)专利代理 机构 北京正理专利代理有限公司 11257 专利代理师 张帆 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/74(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 医疗影像 分类模型的训练方法和装置、 预测 方法和装置 (57)摘要 本发明公开了一种医疗影像分类模型的训 练方法和装置、 预测方法和装置, 其中一实施例 的训练方法包括: 使用包括多个已标注样本的第 一训练样 本集训练医疗影像分类模 型, 使用医疗 影像分类模型对包括未标注样本的第二训练样 本集进行特征提取并选择第一数量的未标注样 本作为待标注样本, 响应于医疗专家对待标注样 本的标注更新第一训练样本集和第二训练样本 集; 使用更新的第一训练样本集训练医疗影像分 类模型, 响应于医疗影像分类模 型不满足预设置 的性能指标对第二训练样本集进行特征提取并 生成特征向量, 直至医疗影像分类模 型满足预设 置的性能指标。 本发明提供的训练方法能够在标 注样本较少的情况下训练并提高医疗影像分类 模型的预测准确度。 权利要求书3页 说明书14页 附图5页 CN 115457349 A 2022.12.09 CN 115457349 A 1.一种医疗影 像分类模型的训练方法, 其特 征在于, 包括: 使用第一训练样本集训练医疗影像分类模型, 所述第 一训练样本集由多个已标注样本 组成; 使用所述医疗影像分类模型分别对第二训练样本集和所述第一训练样本集的各样本 进行特征提取并生成特 征向量, 所述第二训练样本集由多个未 标注样本组成; 根据各已标注样本和未标注样本的特征向量, 从所述第 二训练样本集中选择预设的第 一数量的未标注样本作为待标注样本, 响应于医疗专家对所述待标注样本的标注更新所述 第一训练样本集和第二训练样本集; 使用更新的第 一训练样本集训练所述医疗影像分类模型, 响应于所述医疗影像分类模 型不满足预设置的性能指标跳转到所述使用所述医疗影像分类模型分别对第二训练样本 集和所述第一训练样本集的各样本进 行特征提取并生成特征向量, 直至所述医疗影像分类 模型满足预设置的性能指标。 2.根据权利 要求1所述的训练方法, 其特征在于, 所述医疗影像分类模型基于Triple网 络。 3.根据权利要求2所述的训练方法, 其特征在于, 所述第 一训练样本集包括第 一分类样 本和第二分类样本, 所述第一分类样本和 第二分类样本的样本数量大于等于预设的第二数 量, 所述使用第一训练样本集训练医疗影 像分类模型进一 步包括: 根据所述第一分类样本和第二分类样本形成所述医疗影像分类模型所需的三元组训 练样本集, 所述三元组训练样本集的样本数量大于所述第一分类样本或所述第二分类样本 的样本数量的至少一个数量级; 使用所述 三元组训练样本集训练所述医疗影 像分类模型。 4.根据权利要求2所述的训练方法, 其特征在于, 所述根据 各已标注样本和未标注样本 的特征向量, 从所述第二训练样本集中选择预设的第一数量的未标注样本作为待标注样 本, 响应于医疗专家对所述待标注样本的标注更新所述第一训练样本集和 第二训练样本集 进一步包括: 根据各已标注样本和未标注样本的特征向量, 分别计算各所述未标注样本与 各已标注 样本的向量距离; 按照距离从近及远对所述向量距离进行排序, 选择距离最近的向量距离对应的所述第 一数量的未 标注样本作为待标注样本; 响应于医疗专家对所述待标注样本的标注, 将已标注样本增加到所述第 一训练样本集 以更新所述第一训练样 本集、 将已标注样本从所述第二训练样本集删除以更新所述第二训 练样本集。 5.根据权利要求4所述的训练方法, 其特征在于, 所述医疗影像分类模型的损失函数 为: Lloss=max(0,d(G(xm),G(xn))‑d(G(xm),G(xk))+ ε ) 其中, xm,xn为第一分类样本, xk为第二分类样本, G(.)为特征向量, d(.)为特征向量之 间的欧式距离, ε为损失阈值, ε>0; 所述使用更新的第 一训练样本集训练所述医疗影像分类模型, 响应于所述医疗影像分 类模型不满足预设置的性能指标跳转到所述使用所述医疗影像分类模型分别对第二训练权 利 要 求 书 1/3 页 2 CN 115457349 A 2样本集和所述第一训练样本集的各样本进 行特征提取并生成特征向量, 直至所述医疗影像 分类模型满足预设置的性能指标进一 步包括: 使用更新的第一训练样本集训练所述医疗影像分类模型, 所述损 失函数连续n次变化 小于预设置的变化阈值, 其中, n大于等于 3。 6.根据权利要求4所述的训练方法, 其特征在于, 所述第 一训练样本集还包括由多个已 标注样本组成的验证集, 所述使用更新的第一训练样本集训练所述医疗影像分类模型, 响 应于所述医疗影像分类模型不满足预设置的性能指标跳转到所述使用所述医疗影像分类 模型分别对第二训练样本集和所述第一训练样本集的各样本进行特征提取并生成特征向 量, 直至所述医疗影 像分类模型满足预设置的性能指标进一 步包括: 使用所述验证集验证所述医疗影像分类模型, 所述医疗影像分类模型的预测准确率大 于等于预设置的准确率阈值。 7.根据权利要求4所述的训练方法, 其特征在于, 所述第 二训练样本集的初始样本数量 为x, 更新后的第二训练样本集的样本数量 为y; 所述使用更新的第 一训练样本集训练所述医疗影像分类模型, 响应于所述医疗影像分 类模型不满足预设置的性能指标跳转到所述使用所述医疗影像分类模型分别对第二训练 样本集和所述第一训练样本集的各样本进 行特征提取并生成特征向量, 直至所述医疗影像 分类模型满足预设置的性能指标进一步包括: y≤z%*x, 其中, x为大于等于1000的整数; y 为小于x的整数; z大于等于 50。 8.根据权利要求1 ‑7中任一项所述的训练方法, 其特征在于, 在所述使用更新的第一训 练样本集训练所述医疗影像分类模型, 响应于所述医疗影像分类模型不满足预设置的性能 指标跳转到所述使用所述医疗影像分类模型分别对第二训练样本集和所述第一训练样本 集的各样本进 行特征提取并生成特征向量, 直至所述医疗影像分类模型满足预设置的性能 指标之后, 所述训练方法还 包括: 存储训练后的所述医疗影 像分类模型、 以及第一训练样本 。 9.一种应用如权利要求1 ‑8中任一项所述的训练方法的训练装置, 其特征在于, 包括训 练单元、 样本选择和更新单 元、 以及控制器, 其中, 所述控制器 被配置为: 通过所述训练单元利用第 一训练样本集训练医疗影像分类模型, 所述第 一训练样本集 由多个已标注样本组成; 使用所述医疗影像分类模型分别对第二训练样本集和所述第一训练样本集的各样本 进行特征提取并生成特 征向量, 所述第二训练样本集由多个未 标注样本组成; 通过所述样本选择和更新单元根据 各已标注样本和未标注样本的特征向量, 从所述第 二训练样本集中选择预设的第一数量的未标注样本作为待标注样本, 响应于医疗专家对所 述待标注样本的标注更新所述第一训练样本集和第二训练样本集; 通过所述训练单元利用更新的第 一训练样本集训练所述医疗影像分类模型, 响应于所 述医疗影像分类模型不满足预设置的性能指标跳转到所述使用所述医疗影像分类模型分 别对第二训练样本集和所述第一训练样本集的各样本进行特征提取并生成特征向量, 直至 所述医疗影 像分类模型满足预设置的性能指标。 10.一种使用如权利要求1 ‑8中任一项所述的训练方法训练的医疗影像分类模型的预 测方法, 其特 征在于, 包括:权 利 要 求 书 2/3 页 3 CN 115457349 A 3

PDF文档 专利 医疗影像分类模型的训练方法和装置、预测方法和装置

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 医疗影像分类模型的训练方法和装置、预测方法和装置 第 1 页 专利 医疗影像分类模型的训练方法和装置、预测方法和装置 第 2 页 专利 医疗影像分类模型的训练方法和装置、预测方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:29上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。