全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210188398.0 (22)申请日 2022.02.28 (71)申请人 来康生命科技有限公司 地址 065001 河北省廊坊市开发区金源道 艾力枫社中区 (72)发明人 胡素黎 李力 刘则军 鲍新平  (74)专利代理 机构 北京众允专利代理有限公司 11803 专利代理师 沈小青 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/764(2022.01) G06V 10/77(2022.01) G06V 10/74(2022.01)G06V 10/82(2022.01) G06T 7/00(2017.01) G06T 7/90(2017.01) G06K 9/62(2022.01) (54)发明名称 特征校正的小样 本学习标注方法、 装置及分 类识别方法 (57)摘要 本发明提供了特征校正的小样本学习标注 装置, 包括通过对Dbase训练的小样本学习模型, 使得该模型对Dnovel的支撑集S提取到的特征与 对应标签的映射关系, 可以预测Dnovel中查询集Q 的对应标签。 本发明适用标注数据量少,手工标 注人工耗费时间太久, 容易因人而异出现标注不 准确的情况,使用小样本学习的方法实现对大规 模舌色数据进行 预分类标注。 权利要求书2页 说明书7页 附图1页 CN 114842283 A 2022.08.02 CN 114842283 A 1.特征校正的小样本 学习标注装置, 其特征在于, 包 括通过对Dbase训练的小样本 学习模 型, 使得该模型对Dnovel的支撑集S提取到的特征与对应标签的映射关系, 可以预测Dnovel中 查询集Q的对应标签; 其中Dbase:大量有标签样本集共有W类; Dnovel:少量由标签样本(支撑集S)和无标签样本 集(查询集 Q), 共有K类别, 2.一种特 征校正的小样本学习标注装置的标注方法, 其特 征在于, 包括以下步骤: 专家投票选出一批7类标准舌色数据作为Dnovel, 以标准舌色数据 进行小样本学习, 对训 练集Dbase得到的基本分类器Res10对舌色数据进行特征提取, 使用PT变换对提取的特征进 行拟合; 计算标准舌色数据的方差及均值对提取到的舌色特征进行归一化校正, 使用FCN ‑EMD 实现对舌色无标签数据的度量标准, 多次随机抽取标准舌色数据对样本进行标注, 最后使 用投票作为标注结果, 从而实现对舌色数据的标注; deepEMD方法假设提取到的特征和训练集提取的特征都默认符合数据分布, 数据归一 化采用的是 特征的均值。 3.根据权利要求2所述的一种特征校正的小样本学习标注装置的标注方法, 所述标注 流程包括模型训练阶段: 使用大规模数据集ImageNet预训练小样本学习 Res10基本分类器, 进行特征提取获取 小样本学习基本特 征提取器; 对训练集合 的特征使用Power  transform(PT)进行特征转换, 使得大规模数据集 的同 类数据的特 征符合高斯分布, PT具体 计算如下: 其中 x∈Dtonguecolor, ε=1e‑6, 为Res10提取的特 征向量; (1)幂变换 具有减少分布偏斜的功能, 由β 调整, (2)单位方差投影将特 征缩放到相同的区域, 以便大 方差特征不会主导 其他特征; 大规模数据集的每类特征进行PT变换后, 计算每一类特征的均值xμ和方差xσ对特征x进 行归一化xscale。 最后使用E MD计算匹配代价向量得到样本相似度, 训练端到端网络 。 4.根据权利要求3所述的一种特征校正的小样本学习标注装置的标注方法, 所述标注 流程还包括小样本标注阶段: 1)舌色数据微调基本分类器Res10, 对基本分类器Res10提取的舌色特征进行Power   transform变换, 使得舌色特征符合高斯变换, 计算每个舌色类别样 本提取特征的均值和方 差, 对待标注舌色数据使用有标签舌色数据的均值和方差进行均值 化;权 利 要 求 书 1/2 页 2 CN 114842283 A 22)微调FCN ‑EMD权重 其中si,dj分别为标准舌色支持集样本ui和未标注舌色测试样本vj经过基本网络Res10 提取特征进行PT转换后归一 化的特征的权重向量, Cij为ui和vj的匹配代价向量; 利用交叉索引机制生成特征向量的权重为 该值为特征向量的平均权重向量, 其中H,W分别为Res10特取的特征维 度, 其中S(u,v)表示两个样本ui和vj之间的相似度。 5.一种特征校正的小样本学习标注装置的分类识别方法, 其特征在于, 包括以下步骤: 在舌色数据标注过程中, 对应小样本问题的N ‑way,K‑shot问题, 舌色标准数据有N类, 每类 有K张, 因照明环境及颜色标准多样化, 标准舌色数据每类的样本个数为M张, M远大于K, 每 次标注的过程中, 每类 舌色样本随机抽取k张, 迭代抽取Niters=100次舌色支持集样本, 每次 迭代标注中, 批量对未 标注的舌色查询集样本Nbatches进行标注。权 利 要 求 书 2/2 页 3 CN 114842283 A 3

.PDF文档 专利 特征校正的小样本学习标注方法、装置及分类识别方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 特征校正的小样本学习标注方法、装置及分类识别方法 第 1 页 专利 特征校正的小样本学习标注方法、装置及分类识别方法 第 2 页 专利 特征校正的小样本学习标注方法、装置及分类识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:22:58上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。