(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111552871.0
(22)申请日 2021.12.17
(71)申请人 国网江西省电力有限公司南昌供电
分公司
地址 330000 江西省南昌市昌东大道70 07
号
申请人 国家电网有限公司
(72)发明人 李卿鹏 康水平 王煜晗 彭飞
李勇平 杨琴 尹士豪
(74)专利代理 机构 南昌丰择知识产权代理事务
所(普通合伙) 36137
代理人 吴称生
(51)Int.Cl.
G06K 9/62(2022.01)
G06Q 50/06(2012.01)
(54)发明名称
一种基于主成分分析和密度峰值聚类的用
户用电行为分析方法
(57)摘要
本发明公开了一种基于主成分分析和密度
峰值聚类的用户用电行为分析方法, 将降维后的
数据归一化处理, 输入样本邻近个数K; 然后计算
样本间的欧氏距离dij; 计算出样本i的局部密度
ρi和样本i的K近邻距离
建立决策图, 选取
类簇中心; 计算出样本i与 样本j的共享近邻相似
度S(i,j); 获得样本的相似度矩阵; 最后通过相
似性矩阵对所有已分配的样本寻找相似度最高
的未分配样 本, 将未分配样本分配给已分配样本
所在类簇; 循环该操作直至所有剩余样本分配完
毕; 输出最终聚类结果。 本发明用样本邻近个数K
取代dc, 容易确定取值; 并引入
调节各样本对
当前样本的密度贡献, 使获得的类簇中心更加准
确; 通过共享近邻相似度计算局部密度, 更易区
分决策图中的类 簇中心与非类 簇中心。
权利要求书2页 说明书7页 附图3页
CN 114417972 A
2022.04.29
CN 114417972 A
1.一种基于主成分分析和密度峰值聚类的用户用电行为分析方法, 其特征是: 步骤如
下:
步骤1: 对用户的用电负荷数据进行 预处理, 对缺失数据进行插补, 剔除无效数据;
步骤2: 采用PCA技 术对负荷数据进行降维, 计算特 征矩阵, 提取其主成分;
步骤3: 输入降维后的数据, 并将数据归一 化处理, 输入样本邻近个数 K;
步骤4: 根据归一 化是数据设置样本i与样本j, 计算样本i与样本j间的欧氏距离dij;
步骤5: 结合样本K近邻信息和高斯核函数定义样本的局部密度, 计算出样本i的局部密
度ρi和样本i的K近邻距离
步骤6: 计 算所有样本的ρi和
用 ρi作为横坐 标,
作为纵坐标, 建立决策图, 选取ρi和
都较大的点作为类簇中心即密度峰值;
步骤7: 将样本i的K个最近样本组成集合KNN(i), 样本j的K个最近样本组成集合KNN
(j), KNN(i)与KN N(j)的交集 为样本i与样本j的共享近邻SN N(i,j);
步骤8: 根据样本i的K近邻集合KNN(i)分布特征与样本j的K近邻集合KNN(j)分布特征,
对样本i与样本j的共享近邻SNN(i,j)进行加权, 得到样本i与样本j的共享近邻相似度S(i,
j);
步骤9: 将确定的密度峰值标记为已分配样本, 计算样本间的共享近邻相似度S(i,j)
后, 获得样本的相似度矩阵;
步骤10: 通过相似性矩阵对所有已分配的样本寻找相似度最高的未分配样本, 将未分
配样本分配给已分配样本所在类簇, 循环步骤10中的分配策略直至所有剩余样本分配完
毕;
步骤11: 输出最终聚类结果。
2.根据权利要求1所述的一种基于主成分分析和密度峰值 聚类的用户用电行为分析方
法, 其特征是: 步骤2中PCA技术降维方法为: 假设有n个样本{X1,X2,...,Xn}, 每个样 本有p维
特征
每一个特 征xj都有各自的特 征值;
PCA首先对数据每个特征进行零均值化处理, 即减去这一特征的均值, 如公式
所示;
其后计算协方差矩阵:
式中,
求解公式如
下:
在计算完协方差矩阵C后, 求解该协方差矩阵C的特征值和对应特征向量, 如公式Cu=λ
u所示, 式中, λ为特征值, 每个特征值λi对应一个特征向量ui, 选择特征值最大的k个特征向
量ui按列叠加, 形成矩阵U;权 利 要 求 书 1/2 页
2
CN 114417972 A
2将原始特征投影到选取的特征向量上, 得到降维后的新k维特征, 新特征的计算公式
为:
对于每一个样本Xi, 原来的特征是
投影之后
的新特征是
即将样本Xi由p维降至k维。
3.根据权利要求1所述的一种基于主成分分析和密度峰值 聚类的用户用电行为分析方
法 , 其 特 征 是 : 步 骤 5中 ,
的 计 算 公 式 为
ρi的 计 算 公 式 为
式中KNN(i)表示样本i的K个近邻构成的集合,
为样本i的K近邻距
离。
4.根据权利要求1所述的一种基于主成分分析和密度峰值 聚类的用户用电行为分析方
法, 其特征是: 步骤7中, 共享近邻SN N(i,j)的计算公式为
SNN(i,j)=KN N(i)∩KN N(j)。
5.根据权利要求1所述的一种基于主成分分析和密度峰值 聚类的用户用电行为分析方
法, 其特征是: 步骤8中, 共享近邻相似度S(i,j)的计算公式为
式中
表征样本i的K近邻
样本对样本j的隶属度,
表征样本j的K近邻样本对样本i的隶属度, 将两隶属度
之和为权值对共享近邻SNN(i,j)进行加权, 得到两样本的共享近邻相似度, |SNN(i,j)|表
示样本i和样本j的共享近邻集 合内的元 素个数。
6.根据权利要求1所述的一种基于主成分分析和密度峰值 聚类的用户用电行为分析方
法, 其特征是: 步骤6 中, 类簇中心还可以通过决策值γi选取, γi的定义如式γi=ρi×δi所
示。
7.根据权利要求1所述的一种基于主成分分析和密度峰值 聚类的用户用电行为分析方
法, 其特征是: 步骤1中, 缺失数据时刻的前后两个时刻数据的求和平均值 修复缺失数据。权 利 要 求 书 2/2 页
3
CN 114417972 A
3
专利 一种基于主成分分析和密度峰值聚类的用户用电行为分析方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 02:06:13上传分享