全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111566834.5 (22)申请日 2021.12.21 (71)申请人 中船重工 (武汉) 凌久高科有限公司 地址 430000 湖北省武汉市洪山区关山 街 珞瑜路718号 (72)发明人 杨志祥 刘鑫 程佳斌 郭朝霞  范俊甫 许雷 皮辉 蔡烨彬  谢倩  (74)专利代理 机构 武汉泰山北斗专利代理事务 所(特殊普通 合伙) 42250 代理人 董佳佳 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/06(2012.01) G06F 16/215(2019.01)G06F 16/2458(2019.01) G06F 16/28(2019.01) G06N 3/08(2006.01) (54)发明名称 一种基于深度学习的相同模式能耗大数据 预测方法 (57)摘要 本发明适用于人工智能和大数据技术领域, 提供一种基于深度学习的相同模式能耗大数据 预测方法, 包括有效样本选择步骤、 有效属性选 择步骤、 相同模式选择步骤以及预测步骤, 各步 骤过程算法简单、 易于理解和实施, 通过三轮样 本数据处理, 从亿级能耗原始数据经过有效筛选 后缩小为千万级, 然后通过敏感因素属性筛选后 进一步降为百万级样本集, 最后通过能耗模式选 择形成多个能耗模式的十万级样 本, 形成最优的 深度学习预测样本, 实现数据规模与算法适用性 的匹配度, 从而保证能够有效提高预测的时间效 率和预测精度。 权利要求书1页 说明书6页 附图1页 CN 113935557 A 2022.01.14 CN 113935557 A 1.一种基于深度学习的相同模式能耗大数据预测方法, 其特征在于, 所述预测方法包 括下述步骤: 步骤S1、 获取待分析的能耗大数据集, 通过预处理操作进行数据清洗并去掉异常数据, 得到一次样本数据集; 步骤S2、 对所述一次样本数据集进行属性关联分析, 找出影响能耗靠前的若干影响因 素, 删除其中对能耗因素变化 不敏感的样本, 得到二次样本数据集; 步骤S3、 建立小样本集并找到能耗模式, 按照能耗模式将二次样本数据集中的样本抽 取出来分类, 得到若干能耗模式样本集, 并删除其中的异常样本; 步骤S4、 针对每个能耗模式样本集, 按照时间戳, 将部分样本作为训练集进行深度 学习 时间序列预测, 剩余样本作为验证集并设计能耗减少决策, 精度达到条件后进 行能耗预测, 根据预测结果产生相应能耗政策减少能耗。 2.如权利要求1所述基于深度 学习的相同模式能耗大数据 预测方法, 其特征在于, 所述 步骤S1具体包括下述 步骤: S101、 获取目标场合待分析的能耗大 数据集, 通过sql 规则剔除异常数据; S102、 将能耗大数据集按照时间戳形成时间序列数据集, 所述能耗大数据集分为训练 数据集、 验证数据集以及测试数据集共三种类型数据集, 每种类型 的数据集均包括样本编 号、 能耗属性、 时间戳信息; S103、 利用基础统计方法去掉数据集中的异常数据, 得到一次样本数据集。 3.如权利要求2所述基于深度 学习的相同模式能耗大数据 预测方法, 其特征在于, 所述 步骤S2具体包括下述 步骤: S201、 对重点能耗设备类型进行分类, 确定能耗影响因素, 能耗影响因素分为区域变化 的影响因素和时间变化的影响因素; S202、 能耗目标以电表 功率计算, 结合所述影响因素, 建立区域时间影响能耗分析表; S203、 对所述影响能耗分析表无量纲化处理, 求影响因素与能耗间关联因子, 然后 计算 得出影响因素与能耗的关联度, 最后对关联度进行排序, 取排序靠前 的若干的影响因素为 敏感影响因素; S204、 统计一次样本数据集中能耗属性为敏感影响因素的样本, 删除不敏感样本, 得到 二次样本数据集。 4.如权利要求3所述基于深度 学习的相同模式能耗大数据 预测方法, 其特征在于, 所述 步骤S3具体包括下述 步骤: S301、 对二次样本数据集中每个设备的能耗数值进行抽样并进行聚类划分, 得到小样 本集; S302、 按照忙闲事时段、 工作日节假日、 平时时段和政策限制时段对小样本集打上标 签, 通过机器学习分类方法推理出能耗模式; S303、 从二次样本数据集将每个能耗模式的样本抽取出来分类, 得到若干能耗模式样 本集, 并删除其中的异常样本 。权 利 要 求 书 1/1 页 2 CN 113935557 A 2一种基于深度学习的相同 模式能耗大数据预测方 法 技术领域 [0001]本发明属于人工智能和大数据技术领域, 尤其涉及一种基于深度学习的相同模式 能耗大数据预测方法。 背景技术 [0002]随着城市化进程的加快和信息化管理的发展, 出现了能源急剧消耗的同时, 各种 能耗数据也呈现迅猛增长的趋势。 如何利用这海量的能源消耗大数据来更好地把握能耗规 律, 为用能单位和部门决策提供辅助参考, 进一步实现节能减排的目标, 是当前业内专家学 者高度关注的问题。 借助大数据技术的相关方法可以更加智能地探究区域单位的用能规律 和合理优化资源配置, 科学地提高水电能源使用效率。 传统的机器学习方法, 在面对亿级海 量数据会出现计算中的维数爆炸问题; 采用深度学习方法进行处理, 也会出现噪声数据过 大问题。 [0003]利用深度学习技术进行能耗大数据预测是解决问题的关键, 例如LSTM、 Se q2Seq等 深度学习时间序列预测方法, 有 人已经在公开的air  quality和AEP能耗数据集证明预测效 果显然好于一般的传统的时间序列方法ARIMA等。 即便如此, 面对机场等亿级海量能耗数 据, 深度学习方法还是出现了计算时间过长以及精度低等问题, 核心问题变成了如何有效 发现有效样本的问题。 [0004]有效样本 的获取, 包括两个方面, 一是剔除无效样本, 二是减少样本的属性个数。 其中剔除无效样本除了传统的预处理方法, 还有统计和机器学习方法; 减少样本的属 性个 数一般的有效方法是找到 贡献度大的属性。 因此, 可以利用以上方法找到一种有效的方法, 按照样本越大, 剔除样本的计算逻辑越简单 的思路, 形成一个方法流程找到最有利于深度 学习预测得到时间又 快精度又高的预测结果。 发明内容 [0005]鉴于上述问题, 本发明的目的在于提供一种基于深度学习的相同模式能耗大数据 预测方法, 旨在解决现有深度学习能耗时间序列模型 预测的效率和精度较低的技 术问题。 [0006]本发明采用如下技 术方案: 所述基于深度学习的相同模式能耗大 数据预测方法包括下述 步骤: 步骤S1、 获取待分析的能耗大数据集, 通过预处理操作进行数据清洗并去掉异常 数据, 得到一次样本数据集; 步骤S2、 对所述一次样本数据集进行属性关联分析, 找出影响能耗靠前的若干影 响因素, 删除其中对能耗因素变化 不敏感的样本, 得到二次样本数据集; 步骤S3、 建立小样本集并找到能耗模式, 按照能耗模式将二次样本数据集中的样 本抽取出来分类, 得到若干能耗模式样本集, 并删除其中的异常样本; 步骤S4、 针对每个能耗模式样本集, 按照时间戳, 将部分样本作为训练集进行深度 学习时间序列预测, 剩余样本作为验证集并设计能耗减少决策, 精度达到条件后进行能耗说 明 书 1/6 页 3 CN 113935557 A 3

.PDF文档 专利 一种基于深度学习的相同模式能耗大数据预测方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于深度学习的相同模式能耗大数据预测方法 第 1 页 专利 一种基于深度学习的相同模式能耗大数据预测方法 第 2 页 专利 一种基于深度学习的相同模式能耗大数据预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:06:32上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。