全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111354918.2 (22)申请日 2021.11.16 (71)申请人 中国科学院空天信息创新研究院 地址 100101 北京市朝阳区大屯路甲20号 北 申请人 中国科学院空天信息 研究院海南研 究院 (72)发明人 孟庆岩 钱江康 张琳琳  (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 代理人 陈霁 (51)Int.Cl. G06N 20/00(2019.01) G06Q 10/04(2012.01) G06N 3/08(2006.01)G06F 16/29(2019.01) (54)发明名称 一种基于机器学习的多源人为热时空量化 方法 (57)摘要 人为热对城市气候和空气质 量具有显著影 响, 但目前缺少针对多源人为热的精 准高效的估 算方法。 本发明改进了人为热建模的流程, 提出 了一种基于机器学习的多源人为热时空量化方 法。 该方法包括如下步骤: 步骤1)基于能源消耗 和社会经济数据计算县级年均人为热通量 (Anthropogenic  heat flux,AHF); 步骤2)利用 替代数据为不同来源的人为热进行时间维的降 尺度处理, 得到县级月均AH F; 步骤3)计算人为热 相关多源数据的每月县级平均值作为解释变量, 与对应的AHF构成训练样本; 步骤4)基于梯度提 升回归树和Cubist两种机器学习算法训练模型 并进行误差分析, 为不同热源选择最优的算法建 模; 步骤5)将特定的栅格数据输入至最优模型中 计算特定时间特定区域的多 源人为热通 量。 权利要求书2页 说明书3页 附图2页 CN 114139719 A 2022.03.04 CN 114139719 A 1.一种基于机器学习的多源人为热时空量化方法, 该方法主要通过以下技术步骤实 现: 步骤1)基于能源消耗数据和社会经济数据, 采用自上而下的能源消耗清单法计算县级 年均人为热通 量(Anthropogen ic heat flux, AHF); 步骤2)利用替代数据为不同来源的人为热进行时间维的降尺度处理, 得到县级月均 AHF; 步骤3)预处理与人为热相关的多源数据集, 计算每月县级平均值作为解释变量, 与对 应的AHF构成训练样本; 步骤4)基于梯度提升回归树和Cubist两种机器学习算法训练模型, 进行误差分析, 为 不同热源选择最优的算法建模, 同时将 基于夜间灯光的简单线性回归模型用作 精度提升的 参考; 步骤5)将特定的栅格数据输入至最优模型中计算特定时间特定区域的人为热通量, 输 出栅格结果。 2.如权利要求书1所述的方法, 其特征在于, 所述步骤1): 人为热包含工业、 建筑、 交通 和人类代谢四个来源。 基于能源清单法依次估算省 级、 市级和县级的年均 AHF。 在市级AHF降 尺度至县级时, 工业热根据区县内的工业POI数量占全市比例计算, 交通热和建筑热均根据 区县人口占比计算, 而代谢 热则直接通过区县人口数量进行估算。 3.如权利 要求书1所述的方法, 其特征在于, 所述步骤2): 每月AHF根据替代数据的时间 变化计算, 这是自上而下 的能源清单方法中常用的时间降尺度规则。 在研究区域没有供暖 的情况下, 每月建筑热和工业热基于每月电力消 耗量估算, 每月交通热基于每月货运量估 算, 而代谢 热固定, 同建筑热作为整体参与模型训练。 具体 计算如下 所示: 其中, 代表类型S的热源第m月的A HF, i代表地级市, j代表区县; 为相应热源第m 月的排放占比(%); 分别为工业交通和 建筑的年度热排放量(J)。 Aj为区 县面积(m2); Ty为一年的时间(s)。 该过程可使用Python和R语言编程实现, 也可直接利用 Excel进行计算。 4.如权利要求书1所述的方法, 其特征在于, 所述步骤3): 道路、 铁路和工业POI均以 1000米的搜索半径建立密度栅格, 同时计算距离栅格, 可分别使用ArcGIS中的点密度工具 和欧式距离工具进行计算。 此处, 道路和 铁路为交通热的特殊变量, 工业POI和铁路为工业 热的特殊变量, 而建筑面积占比则作为建筑代谢热 的特殊变量。 公共变量同时参与三种 热 源的估算, 处理如下: 遥感数据(地表温度、 NDVI等)、 气象数据(气温、 湿度、 风速)和地形数 据(DEM、 坡度)均通过Google  earth engine(GEE)进行数据筛选、 按月合成、 裁剪、 重投影和 重采样; 最后, 在ArcGIS中对上述栅格进行分区统计, 输出解释变量表格, 并添加所属区域 和月份两个分类 变量, 与每月县级AHF一同构成训练样本 。 5.如权利要求书1所述的方法, 其特征在于, 所述步骤4): 将训练样本导入R中, 随机选 取80%的样本用于训练和测试, 其余样本用于模型验证。 GBDT和Cubist均含有较多的超参权 利 要 求 书 1/2 页 2 CN 114139719 A 2数可以调节, 在R中调用caret、 gbm和Cubi st包, 按不同的AH F来源分别训练GBDT和Cubist模 型, 使用重复10次的10折交叉验证进行调参, 根据最小化训练/测试误差的原则选择最优的 模型参数, 构建多源人为热时空量化模型(GBDT及Cubist), 最终根据验证误差确定每种热 源建模所使用的算法(GBDT或Cubist); 基于夜间灯光的简单线性回归模型(Simple  linear  regression, SLR)作为参考, 用于检验这两种复杂 算法的精度提升。 以上过程均可在R中完 成。 6.如权利要求书1所述的方法, 其特征在于, 所述步骤5): 在R中调用raster包, 将栅格 形式的解释变量转化为数据框格式, 构建简单 的分类回归树模型填补缺失的变量; 调用训 练完成的模型预测结果, 并构建栅格输入预测结果, 最终输出栅格形式的多源人为热时空 分布。权 利 要 求 书 2/2 页 3 CN 114139719 A 3

.PDF文档 专利 一种基于机器学习的多源人为热时空量化方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于机器学习的多源人为热时空量化方法 第 1 页 专利 一种基于机器学习的多源人为热时空量化方法 第 2 页 专利 一种基于机器学习的多源人为热时空量化方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 18:59:35上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。