专利一种基于深度学习的相同模式能耗大数据预测方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111566834.5 (22)申请日 2021.12.21 (71)申请人中船重工（武汉）凌久高科有限公司地址 430000 湖北省武汉市洪山区关山街珞瑜路718号 (72)发明人杨志祥　刘鑫　程佳斌　郭朝霞　范俊甫　许雷　皮辉　蔡烨彬　谢倩　 (74)专利代理机构武汉泰山北斗专利代理事务所(特殊普通合伙) 42250 代理人董佳佳 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/06(2012.01) G06F 16/215(2019.01)G06F 16/2458(2019.01) G06F 16/28(2019.01) G06N 3/08(2006.01) (54)发明名称一种基于深度学习的相同模式能耗大数据预测方法 (57)摘要本发明适用于人工智能和大数据技术领域，提供一种基于深度学习的相同模式能耗大数据预测方法，包括有效样本选择步骤、有效属性选择步骤、相同模式选择步骤以及预测步骤，各步骤过程算法简单、易于理解和实施，通过三轮样本数据处理，从亿级能耗原始数据经过有效筛选后缩小为千万级，然后通过敏感因素属性筛选后进一步降为百万级样本集，最后通过能耗模式选择形成多个能耗模式的十万级样本，形成最优的深度学习预测样本，实现数据规模与算法适用性的匹配度，从而保证能够有效提高预测的时间效率和预测精度。权利要求书1页说明书6页附图1页 CN 113935557 A 2022.01.14 CN 113935557 A 1.一种基于深度学习的相同模式能耗大数据预测方法，其特征在于，所述预测方法包括下述步骤：步骤S1、获取待分析的能耗大数据集，通过预处理操作进行数据清洗并去掉异常数据，得到一次样本数据集；步骤S2、对所述一次样本数据集进行属性关联分析，找出影响能耗靠前的若干影响因素，删除其中对能耗因素变化不敏感的样本，得到二次样本数据集；步骤S3、建立小样本集并找到能耗模式，按照能耗模式将二次样本数据集中的样本抽取出来分类，得到若干能耗模式样本集，并删除其中的异常样本；步骤S4、针对每个能耗模式样本集，按照时间戳，将部分样本作为训练集进行深度学习时间序列预测，剩余样本作为验证集并设计能耗减少决策，精度达到条件后进行能耗预测，根据预测结果产生相应能耗政策减少能耗。 2.如权利要求1所述基于深度学习的相同模式能耗大数据预测方法，其特征在于，所述步骤S1具体包括下述步骤： S101、获取目标场合待分析的能耗大数据集，通过sql 规则剔除异常数据； S102、将能耗大数据集按照时间戳形成时间序列数据集，所述能耗大数据集分为训练数据集、验证数据集以及测试数据集共三种类型数据集，每种类型的数据集均包括样本编号、能耗属性、时间戳信息； S103、利用基础统计方法去掉数据集中的异常数据，得到一次样本数据集。 3.如权利要求2所述基于深度学习的相同模式能耗大数据预测方法，其特征在于，所述步骤S2具体包括下述步骤： S201、对重点能耗设备类型进行分类，确定能耗影响因素，能耗影响因素分为区域变化的影响因素和时间变化的影响因素； S202、能耗目标以电表功率计算，结合所述影响因素，建立区域时间影响能耗分析表； S203、对所述影响能耗分析表无量纲化处理，求影响因素与能耗间关联因子，然后计算得出影响因素与能耗的关联度，最后对关联度进行排序，取排序靠前的若干的影响因素为敏感影响因素； S204、统计一次样本数据集中能耗属性为敏感影响因素的样本，删除不敏感样本，得到二次样本数据集。 4.如权利要求3所述基于深度学习的相同模式能耗大数据预测方法，其特征在于，所述步骤S3具体包括下述步骤： S301、对二次样本数据集中每个设备的能耗数值进行抽样并进行聚类划分，得到小样本集； S302、按照忙闲事时段、工作日节假日、平时时段和政策限制时段对小样本集打上标签，通过机器学习分类方法推理出能耗模式； S303、从二次样本数据集将每个能耗模式的样本抽取出来分类，得到若干能耗模式样本集，并删除其中的异常样本。权　利　要　求　书 1/1 页 2 CN 113935557 A 2一种基于深度学习的相同模式能耗大数据预测方法技术领域 [0001]本发明属于人工智能和大数据技术领域，尤其涉及一种基于深度学习的相同模式能耗大数据预测方法。背景技术 [0002]随着城市化进程的加快和信息化管理的发展，出现了能源急剧消耗的同时，各种能耗数据也呈现迅猛增长的趋势。如何利用这海量的能源消耗大数据来更好地把握能耗规律，为用能单位和部门决策提供辅助参考，进一步实现节能减排的目标，是当前业内专家学者高度关注的问题。借助大数据技术的相关方法可以更加智能地探究区域单位的用能规律和合理优化资源配置，科学地提高水电能源使用效率。传统的机器学习方法，在面对亿级海量数据会出现计算中的维数爆炸问题；采用深度学习方法进行处理，也会出现噪声数据过大问题。 [0003]利用深度学习技术进行能耗大数据预测是解决问题的关键，例如LSTM、 Se q2Seq等深度学习时间序列预测方法，有人已经在公开的air quality和AEP能耗数据集证明预测效果显然好于一般的传统的时间序列方法ARIMA等。即便如此，面对机场等亿级海量能耗数据，深度学习方法还是出现了计算时间过长以及精度低等问题，核心问题变成了如何有效发现有效样本的问题。 [0004]有效样本的获取，包括两个方面，一是剔除无效样本，二是减少样本的属性个数。其中剔除无效样本除了传统的预处理方法，还有统计和机器学习方法；减少样本的属性个数一般的有效方法是找到贡献度大的属性。因此，可以利用以上方法找到一种有效的方法，按照样本越大，剔除样本的计算逻辑越简单的思路，形成一个方法流程找到最有利于深度学习预测得到时间又快精度又高的预测结果。发明内容 [0005]鉴于上述问题，本发明的目的在于提供一种基于深度学习的相同模式能耗大数据预测方法，旨在解决现有深度学习能耗时间序列模型预测的效率和精度较低的技术问题。 [0006]本发明采用如下技术方案：所述基于深度学习的相同模式能耗大数据预测方法包括下述步骤：步骤S1、获取待分析的能耗大数据集，通过预处理操作进行数据清洗并去掉异常数据，得到一次样本数据集；步骤S2、对所述一次样本数据集进行属性关联分析，找出影响能耗靠前的若干影响因素，删除其中对能耗因素变化不敏感的样本，得到二次样本数据集；步骤S3、建立小样本集并找到能耗模式，按照能耗模式将二次样本数据集中的样本抽取出来分类，得到若干能耗模式样本集，并删除其中的异常样本；步骤S4、针对每个能耗模式样本集，按照时间戳，将部分样本作为训练集进行深度学习时间序列预测，剩余样本作为验证集并设计能耗减少决策，精度达到条件后进行能耗说　明　书 1/6 页 3 CN 113935557 A 3

专利 一种基于深度学习的相同模式能耗大数据预测方法

专利一种基于深度学习的相同模式能耗大数据预测方法