(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111411218.2
(22)申请日 2021.11.25
(71)申请人 合肥工业大 学
地址 230009 安徽省合肥市包河区屯溪路
193号
(72)发明人 何耀耀 周京京 张婉莹 朱创
刘玉婷 洪晓宇
(74)专利代理 机构 安徽省合肥新 安专利代理有
限责任公司 34101
代理人 陆丽莉 何梅生
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 50/06(2012.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)G06K 9/62(2022.01)
(54)发明名称
基于均值漂移聚类的WOA-QRLSTM水库入库
流量概率性预测方法
(57)摘要
本发明公开了一种基于均值漂移聚类的
WOA‑QRLSTM水库入库流量概率性预测方法, 包
括: 1对收集到的水库入库流量及其影响因子进
行预处理; 2对预处理后的数据集用均值漂移聚
类算法对其进行聚类, 并把数据划分为训练集和
测试集; 3将训练集数据放入鲸鱼算法优化的分
位数回归长短期神经网络WOA ‑QRLSTM预测模型
进行训练, 测试集数据放入训练好的W OA‑QRLSTM
预测模型, 得到不同分位点下水库入库流量预测
值; 4不同分位点下水库入库流量预测值通过核
密度估计计算得到未来水库入库流量的概率密
度。 本发明能提高水库入库流量预测的准确性,
从而为水库运行调度提供有效水库入库流量预
测信息。
权利要求书2页 说明书6页 附图1页
CN 113935550 A
2022.01.14
CN 113935550 A
1.一种基于均 值漂移聚类和WOA ‑QRLSTM预测模型的水库入库 流量概率预测方法, 其特
征是按如下步骤进行:
步骤1、 采集水库入库流量数据和影响水库入库流量的因子数据并进行预处理, 得到处
理后的数据集Dataset={[W(t),Gm(t)]|t=1,2,...,T; m=1,2,...,M}, 其中, W(t)表示第
t日的水库入库流量; M表示水库入库流量的因子种类数, Gm(t)表示第m个影响因子在第t日
的数值; T表示采集总天数;
步骤2、 以一定时间周期D为时间间隔, 对预处理后的数据 集Dataset进行划分, 得到I组
样本数据{Datagruopi|i=1,2,...,I}, 且I满 足[T/D], 其中, Datagroupi表示第i组样本数
据, 且Datagroupi=[W′(i),G′m(i)], G′m(i)=(Gm(d×(i‑1)+1),Gm(d×(i‑1)+2),...,Gm(d
×i))T为第i组样本数据的第m个影响因子, Gm(d×i)表示在第d ×i日的第m个影响因子, W ′
(i)=(W(d ×(i‑1)+1),W(d ×(i‑1)+2),...,W(d ×i))T为第i组样本数据的水库入库流量,
W(d×i)表示在第d ×i日的水库入库流 量, i=1,2,...,I;
步骤3、 将I组样 本数据{Datagruopi|i=1,2,...,I}划分为训练集Train={Datagr oupi
|i=1,2,...,p}和测试集Test={Datagroupi|i=p+1,p+2,...,I}, 则训练集Train中含有
p组样本数据, 测试集Test中含有I ‑p组样本数据;
使用均值漂移聚类分别对训练集Train和测试集Test进行聚类, 得到K类样本数据, 包
括: K类训练集样本{Traink|k=1,2, ...,K}和K类测试集样本{Testk|k=1,2,...,K}; 其中,
表示第k类的训练集, Ak为训练集Tr ain的p组样本数据
中属于第k类训练集Traink的样本数据的序号集合,
为第k类训练集第i组样本数据的第m个影响因子,
表示在第d ×i日的第m个影响因
子, Wk(i)=(Wk(d×(i‑1)+1),Wk(d×(i‑1)+2),...,Wk(d×i))T为第k类训练集第i组样本数
据 的 水 库 入 库 流 量 ,Wk( d×i ) 表 示 在 第 d×i 日 的 水 库 入 库 流 量 ;
为第k类的测试集; Bk为测试集Test的I ‑p组样本数
据中属于第k类测试集Testk的样本数据的序号 集合;
步骤4、 利用K类样本数据对鲸鱼算法优化的分位数 回归长短期神经网络WOA ‑QRLSTM预
测模型进行训练和优化;
步骤4.1、 第k类训练集Traink中第i组样本数据的第t日的样本数据Dataset ′i={[W′i
(t),G′i,m(t)]|t=1,2,...,D; m=1,2,...,M}, W ′i(t)表示第k类训练集Traink中第i组样本
数据的第t日的水库入库流量, G ′i,m(t)表示第k类训练集Traink中第i组样本数据第m个影
响因子在第t日的数值;
以第D天的水库入库流量W ′i(D)作为第i组样本 数据的响应变量; 以M个 水库入库流量影
响因子在第D天的数值{G ′i,m(D)|m=1,2,...,M}和第k类训练集Traink中第i组样本数据剩
余的D‑1个样本数据Dataset ″i={[W′i(t),G′i,m(t)]|t=1,2,...,D ‑1; m=1,2,...,M}共同
作为第i组样本数据的解释变量, 从而构建包含有M+D ‑1个解释变量和一个响应变量的数据
集, 记作
表示第k类训练集Traink中第i组样本数据的解
释变量; 且
是第k类训练集Traink中的权 利 要 求 书 1/2 页
2
CN 113935550 A
2第i组样本数据的第β 个解释变量,
是第k类训练集Traink中构建的第i组样本数据的
响应变量;
步骤4.2、 按照 步骤4.1的过程, 对第k类测试集Testk也构建出包括M+D ‑1个解释变量和
一个响应变量的数据集, 记作
其中,
是第k类测试集Testk
中构建的第i组样本数据的解释变量,
是第k类测试集Testk中构建的第i组样本数据
的响应变量;
步骤4.3、 利用式(1)构建WOA ‑QRLSTM预测模型, 并基于第 k类训练集Traink中构建的数
据集
对WOA‑QRLSTM预测模型进行训练, 并不断调整W OA‑QRLSTM预
测模型的权 重和偏置, 直到 达到最大迭代次数, 从而得到训练好的WOA ‑QRLSTM预测模型;
式(1)中,
代表第z个分位点, 且z=1,2, …,Z, Z为分位点的数量; N代表第k类
训练集Traink中样本数据的组数; U( τz)表示在第z个分位点下的权重参数矩阵集合; V( τz)
表示在第z个分位 点下的连接偏置向量 集合;
步骤4.4、 利用 第k类测试集Testk中构建的数据集
中的第i组
样本数据的解释变量
输入最优WOA ‑QRLSTM预测模型中, 从而得到K类测试集样本
{ T e s tk| k = 1 ,2 , . . . ,K } 中 数 据 集 分 别 在 Z 个 分 位 点 下 的 条 件 分 位 数
其中,
表示第k类测试集Testk第i
组数据在第z个分位 点下的条件分位数;
步骤5、 将Z个分位点下的条件分位数
作为高斯核函数的输入, 利用式 (2)计算得到第k类测试集Testk中的数据集
中任意一天e的水库入库流 量概率密度预测结果
式(2)中, h为窗宽, K( ·)为高斯核函数。权 利 要 求 书 2/2 页
3
CN 113935550 A
3
专利 基于均值漂移聚类的WOA-QRLSTM水库入库流量概率性预测方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 03:17:49上传分享