全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221096182 2.0 (22)申请日 2022.08.11 (71)申请人 广西大学 地址 530004 广西壮 族自治区南宁市大 学 东路100号 申请人 润建股份有限公司 (72)发明人 郑含博 唐钰本 杜齐 胡永乐  郭文豪 陈俊江 万海斌 覃团发  (74)专利代理 机构 武汉维盾知识产权代理事务 所(普通合伙) 42244 专利代理师 蒋悦 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/06(2012.01) G06F 30/27(2020.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于聚类和双向LSTM的光伏发电预测 方法 (57)摘要 一种基于聚类和双向LSTM的光伏发电预测 方法, 属于光伏发电领域, 本方法使用Pearson相 关系数分析和主成分分析提取出影响光伏发电 功率的环境变量因子特征, 使用K ‑means++聚类 算法进行聚类, 将原始数据集划分为多个类别, 再使用双向LSTM模型分别建立光伏发电与预处 理后输入变量、 历史发电数据的关系, 减少了预 测所需输入 数据和计算时间, 提高了光伏发电预 测模型精度。 权利要求书2页 说明书7页 附图3页 CN 115330049 A 2022.11.11 CN 115330049 A 1.一种基于聚类和双向LSTM的光伏发电预测方法, 其特 征在于包括以下步骤: S1, 对输入数据进行预先处理, 采取箱型图的方法进行筛选异常值, 设置为缺省值; 针 对缺省值使用线性插值的方法进行填补; 所述的输入数据包括气象和光伏发电历史数据; 箱型图通过设置异常值识别标准来识别异常值, 设置方法为: 设上四分位与下四分位 的插值为IQR, 上界设为U+1.5IQR, 下界设为L ‑1.5IQR, 超 出上界或下界的数值即为异常值; 其中, U表示上四分位, L表示上四分位; 将异常值重新设定为缺省值, 使用极大似然估计法插补所有的缺省值, 完成数据预处 理; S2, 使用Pearon相关系数P(x, y)分析输入 自变量之间的相关性, 根据P(x, y)的计算结 果, 去除自变量中强相关性的变量, 保留 自变量极强相关的变量; 其中x和y表 示两个输入自 变量, 输入自变量 为输入数据; S3, 使用主成分 分析法对输入自变量进行降维处 理, 用于提取主成分; S4, 使用K ‑means++算法对筛 选后的主成分进行聚类: 定义样本之间的距离d(xi,xj)为: 式中, xi, xj表示样本值; 在所有样本的数据点中随机选择一个中心点ui, 并对未被选中其他数据点x, 分别计算 即x与已经选择 的最近中心点的距离; 使用加权概率分布随机选择一个新的数 据点作为 新中心, 其中选择的点x的概 率与 成正比, 直至 完成选择k个中心点; 将已经选择的k个中心点作为初始均值向量, 计算样本与各均值向量的距离, 根据样本 距离最近的均值向量, 将样 本划入相应的簇并计算聚内平均值, 将均值向量更新; 重复计算 各点与各均值向量的距离, 直到每 个簇的中心不再移动, 或到 达迭代次数设置上限; S5, 使用双向LSTM神经网络针对聚类结果的不同类型, 分别进行训练, 得到预测模型。 2.根据权利要求1所述的一种基于聚类和双向LSTM的光伏发电预测方法, 其特征在于: 所述步骤S2中, 根据P(x, y)的计算结果, 设定P(x, y)大于0.6时x与y为强相关, P(x, y)大于0.8时x与y 为极强相关; 分别对输入量进行相关性分析, 去除自变量中强相关性的变量; 式中, xi表示输入自变量x中的样本值, yi表示输入自变量y中的样本值, 表示输入自 变量x中的平均值, 表示输入自变量y中的平均值。 3.根据权利要求1所述的一种基于聚类和双向LSTM的光伏发电预测方法, 其特征在于: 步骤S3中筛选主成分的过程为: 将输入自变量输入至矩阵中, 将每一维代表的行数据进行 均值归一 化处理, 计算出均值和标准差, 将出均值和标准差统一至同一数量级; 求出协方差矩阵特征值以及对应的特征向量, 将特征向量基于特征值从大到小的顺利权 利 要 求 书 1/2 页 2 CN 115330049 A 2由上到下进行排列进行新的矩阵, 回带计算得到降维后的新矩阵, 提取主成分; 特征向量重排后, 提取 方差累计贡献率超过85%的前k个主成分。 4.根据权利要求1所述的一种基于聚类和双向LSTM的光伏发电预测方法, 其特征在于: 所述步骤S4中, 采用轮廓系数 作为评估指标; 公式中, a表示样本与同一类中所有其他点之间的平均距离, b表示样本与下一个最近 聚类中所有其他点之间的平均距离; 一组样本的轮廓系数作为每个样本的轮廓系数的平均 值给出。 5.根据权利要求1所述的一种基于聚类和双向LSTM的光伏发电预测方法, 其特征在于: 步骤S5的过程为: 针对具有时间周期性的变量, 选择步长, 根据主成分分析结果, 将输入变 量转为对应降维后的数据; 将历史数据集70%划分为训练集, 30%划分为测试集, 输入时根 据K‑means++聚类结果 为数据增 加对应类型的标签; 遗忘门中选择使用si gmoid函数进行激活, 输入门中选择使用tanh函数进行激活, 输出 门选择使用sigmoid激活函数; 设定预测范围m, 隐含层层数和神经元数量等参数, 为估计点 预测的统计质量, 计算预测与实际观测值的对应程度, 进行误差分析; 训练神经网络, 基于测试 结果误差重新更新隐含层 层数和神经元数量, 完成模型。 6.根据权利要求5所述的一种基于聚类和双向LSTM的光伏发电预测方法, 其特征在于: 所述步骤S5中, 步长根据输入变量时间粒度调整, 预测范围根据预测时间长度调整。 7.根据权利要求6所述的一种基于聚类和双向LSTM的光伏发电预测方法, 其特征在于: 所述步骤S5中, 采用均方根 误差、 平均绝对误差和平均绝对百分比误差用作误差度量。权 利 要 求 书 2/2 页 3 CN 115330049 A 3

.PDF文档 专利 一种基于聚类和双向LSTM的光伏发电预测方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于聚类和双向LSTM的光伏发电预测方法 第 1 页 专利 一种基于聚类和双向LSTM的光伏发电预测方法 第 2 页 专利 一种基于聚类和双向LSTM的光伏发电预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:36:38上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。