全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211135861.1 (22)申请日 2022.09.19 (71)申请人 北京数慧时空信息技 术有限公司 地址 100070 北京市丰台区海鹰路1号院1 号楼二层201 (72)发明人 陈婷 段红伟 李洁 董铱斐  邹圣兵  (51)Int.Cl. G06V 20/10(2022.01) G06V 20/70(2022.01) G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/762(2022.01) (54)发明名称 基于地学信息和主动学习的遥感样本标注 方法 (57)摘要 本发明公开了一种基于地学信息和主动学 习的遥感样本标注方法, 属于遥感图像分类领 域, 包括: 获取遥感样本集; 对遥感样本集进行地 学计算, 得到地学信息; 根据地学信息对遥感样 本集进行聚类; 结合主动学习方法得到已标注样 本集和未标注样本集; 通过已标注样本集对第一 分类器模型进行模型训练, 将未标注样本集输入 第一分类器模 型进行预测, 并结合地学信息和样 本查询策略进行筛选, 得到价值样本集; 将价值 样本集交由专家进行标注后, 将专家标注的价值 样本集加入已标注样本集; 通过第一分类器模型 对未标注样本集进行标注, 得到标注结果。 本发 明的标注方法能够提高标注的准确率。 权利要求书3页 说明书9页 附图1页 CN 115272870 A 2022.11.01 CN 115272870 A 1.一种基于地学信息和主动学习的遥感样本标注方法, 其特 征在于, 包括以下步骤: S1获取遥感样本集, 遥感样本集由多个遥感样本组成, 遥感样本分为未标注样本和已 标注样本; S2对遥感样本集进行地学计算, 得到地学信息, 其中, 所述地学信息包括高程信息、 光 谱信息、 纹 理信息、 形状信息、 统计 计量信息; S3根据地学信息对遥感样本集进行聚类, 得到k个聚类簇和k个聚类 中心, 其中, 每个聚 类簇均包括 一个聚类中心, k≥1; S4计算每个聚类中心与对应聚类簇 中遥感样本之间的距离, 每个聚类簇均选取离聚类 中心最近的遥感样本和最远的遥感样本, 得到2k个遥感样本; S5将2k个遥感样本中的未标注样本交给专家进行标注, 将专家标注的结果和遥感样本 集中的已标注样本组成已标注样本集, 并将遥感样本集分为已标注样本集和未标注样本 集; S6通过已标注样本集对第 一分类器模型进行模型训练, 并判断是否满足第 一分类器模 型训练终止的条件: 若满足, 结束训练, 执 行步骤S9; 若不满足, 执 行步骤S7; S7将未标注样本集输入第 一分类器模型进行预测, 并结合地学信 息和样本查询策略进 行筛选, 得到价 值样本集; S8将价值样本集交由专家进行标注后, 将专家标注 的价值样本集加入已标注样本集, 并更新未 标注样本集后返回至步骤S6; S9通过第一分类 器模型对未 标注样本集进行 标注, 得到标注结果。 2.如权利要求1所述的一种基于地学信息和主动学习的遥感样本标注方法, 其特征在 于, 步骤S3包括: S31获取每个遥感样本的位置信息, 并根据地学信 息构建距离计算策略, 距离计算策略 包括空间距离方法和特 征距离方法; S32基于距离计算策略得到k个初始聚类中心; S33结合遥感样本的位置信息和距离计算策略对k个初始聚类 中心进行迭代优化, 得到 k个聚类簇和k个聚类中心。 3.如权利要求2所述的一种基于地学信息和主动学习的遥感样本标注方法, 其特征在 于, 步骤S32包括: S321从遥感样本集中随机选择一个遥感样本, 将该遥感样本作为初始聚类中心, 并加 入到初始聚类中心集; S322基于距离计算策略计算单个遥感样本分别与所有的初始聚类 中心之间的距离, 将 最大的距离作为该遥感样本的第一距离, 将所有遥感样本的第一距离按从大到小排序, 选 择第一距离最大的遥感样本作为 新的初始聚类中心, 并加入初始聚类中心集; S323 重复步骤S32 2, 直至初始聚类中心集中的初始聚类中心个数达 到k个。 4.如权利要求3所述的一种基于地学信息和主动学习的遥感样本标注方法, 其特征在 于, 步骤S3 3包括: S331根据遥感样本的位置信息得到 遥感样本的坐标值;权 利 要 求 书 1/3 页 2 CN 115272870 A 2S332基于距离计算策略计算单个遥感样本分别与k个初始聚类中心之间的距离, 将最 小的距离作为该遥感样本的第二距离; S333将单个初始聚类中心以及与该初始聚类中心的距离为其第二距离的遥感样本形 成一个初始的聚类簇, 并将该初始聚类中心作为该聚类簇的初始的聚类中心, 得到初始的k 个聚类簇和初始的k个聚类中心; S334在当前的单个聚类簇内, 对所有 的遥感样本的坐标值求平均值, 并计算每个遥感 样本的坐标值与 平均值之 间的差值, 将差值最小的坐标值对应的遥感样本作为新的聚类中 心, 得到新的k个聚类中心; S335将单个新的聚类中心以及与该聚类中心的距离为其第二距离的遥感样本形成一 个新的聚类簇, 得到新的k个聚类簇; S336根据距离计算策略计算每个遥感样本与对应的新的聚类 中心之间的距离, 并计算 所有距离的平方和, 得到新的k个聚类簇的误差平方和; S337 迭代执行步骤S334 ‑S336, 每次迭代均得到k个聚类簇及其k个聚类中心、 该k个聚 类簇的误差平方和, 根据相邻两次迭代的误差平方和计算变化值, 判断变化值是否满足迭 代停止条件, 若满足, 则停止迭代, 得到最终的k个聚类簇和k个聚类中心。 5.如权利要求2所述的一种基于地学信息和主动学习的遥感样本标注方法, 其特征在 于, 所述距离计算策略为: 选定两个待计算的遥感样本, 作为第一样本和第二样本; 根据空间距离方法得到第一样本和第二样本之间的空间距离 ; 根据特征距离方法得到第一样本和第二样本之间的特 征距离 ; 将 和 进行归一化处理, 得到归一化处理结果 和 , 其中 和 的范围均 为[0,1]; 计算 和 的和, 作为第一样本和第二样本的距离 。 6.如权利要求5所述的一种基于地学信息和主动学习的遥感样本标注方法, 其特征在 于, 所述空间距离方法为: 根据遥感样本的位置信息构建Delaunay三角网{Del}, {Del}包括多个Delaunay三角 形, 每个Delaunay三角形均包括 三个顶点和相邻边; 获取第一样本和第二样本在Delaunay三角网{Del} 中的Delaunay三角形Del1和Del2; 获取Del1在其相邻边上的顶点集合{Node1}, 获取Del2在其相邻边上的顶点集合 {Node2}; 根据{Node1}和{Node2}中每个顶点的坐标得到空间位置最远的两个顶点Node1和 Node2; 根据空间拓扑关系计算 Node1和Node2的距离, 作为第一样本和第二样本的空间距离 。 7.如权利要求6所述的一种基于地学信息和主动学习的遥感样本标注方法, 其特征在 于, Delaunay三角形的相邻边为该Delaunay三角形与其他Delaunay三角形共享的边, 且每 个Delaunay三角形的相邻边的数量 不尽相同。 8.如权利要求5所述的一种基于地学信息和主动学习的遥感样本标注方法, 其特征在 于, 所述特 征距离方法为:权 利 要 求 书 2/3 页 3 CN 115272870 A 3

PDF文档 专利 基于地学信息和主动学习的遥感样本标注方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于地学信息和主动学习的遥感样本标注方法 第 1 页 专利 基于地学信息和主动学习的遥感样本标注方法 第 2 页 专利 基于地学信息和主动学习的遥感样本标注方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。