(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111582553.9
(22)申请日 2021.12.2 2
(71)申请人 国网江苏省电力有限公司营销服 务
中心
地址 210019 江苏省南京市 建邺区奥体大
街9号
(72)发明人 周玉 陈霄 邵雪松 高凡 李悦
崔高颖 周超 穆卓文
(74)专利代理 机构 北京智绘未来专利代理事务
所(普通合伙) 11689
代理人 梁庆丰 郭红燕
(51)Int.Cl.
G06F 30/27(2020.01)
G06K 9/62(2022.01)
G06Q 10/04(2012.01)G06Q 50/06(2012.01)
(54)发明名称
基于局部加权偏最小二乘的计量设备运行
性能预测分析方法
(57)摘要
本申请公开了基于局部加权偏最小二乘的
计量设备运行性能预测分析方法, 包括: 获取待
预测计量设备的历史运行数据集并预处理数据
集, 将数据集划分为训练集与测试集; 采用K ‑
Means聚类算法将训练集聚类成若干个子训练
集, 并计算每个子训练集的质 心; 评价模型的预
测精度和性能; 获取运行数据, 将运行数据与每
个子训练集结合, 利用局部加权偏最小二乘建模
算法对每个子训练集进行子模型建模, 并得到每
个子模型下运行数据对应的采集成功率预测值,
根据该运行数据点到各个子训练集质心的距离
对子模型预测值加权计算出该运行数据点对应
的最终的采集成功率预测值。 本发 明具有较高的
预测精度, 可以有效应用于气候因素下的计量设
备运行性能预测分析中。
权利要求书4页 说明书9页 附图3页
CN 114357870 A
2022.04.15
CN 114357870 A
1.基于局部加权偏最小二乘的计量设备运行性能预测分析 方法, 其特 征在于:
所述方法包括以下步骤:
步骤1: 获取待预测计量设备的历史运行数据集并预处理数据集, 将数据集划分为训练
集与测试集, 训练集用于训练模型, 测试集用于测试 所得模型的预测精度;
步骤2: 采用K ‑Means聚类算法将训练集聚类成若干个子训练集, 并计算每个子训练集
的质心;
步骤3: 将测试集与每个子训练集结合, 利用局部加权偏最小二乘建模算法对每个子训
练集进行子模型建模, 并得到每 个子模型 下测试集对应的采集成功率预测值;
步骤4: 根据测试集中的样本数据点到各个子训练集质心 的距离对各子模型预测结果
进行加权, 集成得到最 终的采集成功 率预测值, 结合测试集中真实的采集成功 率数据, 评价
模型的预测精度和性能;
步骤5: 实时获取一组新的运行数据, 将运行数据与每个子训练集结合, 利用局部加权
偏最小二乘建模算法对每个子训练集进行子模型建模, 并得到每个子模型下运行数据对应
的采集成功 率预测值, 再根据该运行数据点到各个子训练集质心的距离对子模型预测值加
权计算出该运行数据点对应的最终的采集成功率预测值, 实现计量设备运行性能预测分
析。
2.根据权利要求1所述的基于局部加权偏最小二乘的计量设备运行性能预测分析方
法, 其特征在于:
步骤1中, 所述计量设备历史运行数据集为: 待预测计量设备历史采集成功率随气候因
素变化的数据集;
所述数据集包括待预测计量设备的近三年内的每日采集成功率以及近三年内所在台
区范围下的每日最高温度、 每日最低温度、 每日平均温度、 每日相对湿度和每日降水量。
3.根据权利要求2所述的基于局部加权偏最小二乘的计量设备运行性能预测分析方
法, 其特征在于:
所述数据集中, 每日最高温度、 每日最低温度、 每日平均温度、 每日相对湿度和每日降
水量作为自变量, 每日采集成功率处理为去除百分号后的采集不成功率100*(100% ‑y)后
作为因变量, 然后将数据集按照7:3的比例划分得到训练集与测试集。
4.根据权利要求1或3所述的基于局部加权偏最小二乘的计量设备运行性能预测分析
方法, 其特 征在于:
步骤2中, 设置聚类个数k的取值范围为[1,10], 采用Elbow与WCSS结合的方法确定训练
集的最佳聚类 个数k, 将其聚类成k个子训练集。
5.根据权利要求1或3所述的基于局部加权偏最小二乘的计量设备运行性能预测分析
方法, 其特 征在于:
步骤2中, 子训练集r的质心为该子训练集中所有样本数据点各个维度的算术平均值, r
=1,2,…,k, k为子训练集数量。
6.根据权利要求3所述的基于局部加权偏最小二乘的计量设备运行性能预测分析方
法, 其特征在于:
所述局部加权偏最小二乘建模算法中, 假设某个子训练集中自变量的矩阵为X∈RN*M,
因变量矩阵为Y∈RN*L, 子训练集的第n个自变量输入和因变量输出分别表示 为:权 利 要 求 书 1/4 页
2
CN 114357870 A
2xn=[xn1,xn2,…,xnM]T (1)
yn=[yn1,yn2,…,ynL]T (2)
式中: N代表输入和输出样本数, 即子训练集中的样本数, M代表子模型输入变量的维
度, L代表子模型输出变量的维度;
当需要对测试集中的第q个自变量输入 xq对应的因变量输出yq进行预测时;
首先要计算测试集中第q个自变量输入xq和子训练集中的第n个自变量输入xn(n=0,
1,…,N)之间的相似性;
然后根据相似性的大小确定测试集中第q个自变量输入xq中各个自变量的权重值, 最后
进行输出 预测值。
7.根据权利要求6所述的基于局部加权偏最小二乘的计量设备运行性能预测分析方
法, 其特征在于:
步骤3具体包括以下步骤:
1)确定自变量中的主成分个数 K, 设置初始值K=1;
2)计算相似性矩阵, 确定相似性样本wn:
Ω=diag{w1,w2,…,wN} (3)
式中: diag(·)代表取对角矩阵;
3)数据预处理, 分别 对子训练集中自变量输入、 训练集中因变量输出和测试集中第q个
自变量输入进行处 理, 分别计算Xk, Yk和xq,k。
式中, IN∈RN为全为1的列向量;
4)令测试集第q个因变量输出
即子训练集下对应的测试集第
q个自变量对应的原 始因变量预测值;
5)计算子训练集X的第k个主成分:
tk=Xkwk (11)
式中, wk是
的最大特征值对应的特 征向量;
wk的计算方式为:
6)计算子训练集X的第k个负载向量pk和回归系数向量qk:
权 利 要 求 书 2/4 页
3
CN 114357870 A
3
专利 基于局部加权偏最小二乘的计量设备运行性能预测分析方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 02:08:41上传分享