全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111552871.0 (22)申请日 2021.12.17 (71)申请人 国网江西省电力有限公司南昌供电 分公司 地址 330000 江西省南昌市昌东大道70 07 号 申请人 国家电网有限公司 (72)发明人 李卿鹏 康水平 王煜晗 彭飞  李勇平 杨琴 尹士豪  (74)专利代理 机构 南昌丰择知识产权代理事务 所(普通合伙) 36137 代理人 吴称生 (51)Int.Cl. G06K 9/62(2022.01) G06Q 50/06(2012.01) (54)发明名称 一种基于主成分分析和密度峰值聚类的用 户用电行为分析方法 (57)摘要 本发明公开了一种基于主成分分析和密度 峰值聚类的用户用电行为分析方法, 将降维后的 数据归一化处理, 输入样本邻近个数K; 然后计算 样本间的欧氏距离dij; 计算出样本i的局部密度 ρi和样本i的K近邻距离 建立决策图, 选取 类簇中心; 计算出样本i与 样本j的共享近邻相似 度S(i,j); 获得样本的相似度矩阵; 最后通过相 似性矩阵对所有已分配的样本寻找相似度最高 的未分配样 本, 将未分配样本分配给已分配样本 所在类簇; 循环该操作直至所有剩余样本分配完 毕; 输出最终聚类结果。 本发明用样本邻近个数K 取代dc, 容易确定取值; 并引入 调节各样本对 当前样本的密度贡献, 使获得的类簇中心更加准 确; 通过共享近邻相似度计算局部密度, 更易区 分决策图中的类 簇中心与非类 簇中心。 权利要求书2页 说明书7页 附图3页 CN 114417972 A 2022.04.29 CN 114417972 A 1.一种基于主成分分析和密度峰值聚类的用户用电行为分析方法, 其特征是: 步骤如 下: 步骤1: 对用户的用电负荷数据进行 预处理, 对缺失数据进行插补, 剔除无效数据; 步骤2: 采用PCA技 术对负荷数据进行降维, 计算特 征矩阵, 提取其主成分; 步骤3: 输入降维后的数据, 并将数据归一 化处理, 输入样本邻近个数 K; 步骤4: 根据归一 化是数据设置样本i与样本j, 计算样本i与样本j间的欧氏距离dij; 步骤5: 结合样本K近邻信息和高斯核函数定义样本的局部密度, 计算出样本i的局部密 度ρi和样本i的K近邻距离 步骤6: 计 算所有样本的ρi和 用 ρi作为横坐 标, 作为纵坐标, 建立决策图, 选取ρi和 都较大的点作为类簇中心即密度峰值; 步骤7: 将样本i的K个最近样本组成集合KNN(i), 样本j的K个最近样本组成集合KNN (j), KNN(i)与KN N(j)的交集 为样本i与样本j的共享近邻SN N(i,j); 步骤8: 根据样本i的K近邻集合KNN(i)分布特征与样本j的K近邻集合KNN(j)分布特征, 对样本i与样本j的共享近邻SNN(i,j)进行加权, 得到样本i与样本j的共享近邻相似度S(i, j); 步骤9: 将确定的密度峰值标记为已分配样本, 计算样本间的共享近邻相似度S(i,j) 后, 获得样本的相似度矩阵; 步骤10: 通过相似性矩阵对所有已分配的样本寻找相似度最高的未分配样本, 将未分 配样本分配给已分配样本所在类簇, 循环步骤10中的分配策略直至所有剩余样本分配完 毕; 步骤11: 输出最终聚类结果。 2.根据权利要求1所述的一种基于主成分分析和密度峰值 聚类的用户用电行为分析方 法, 其特征是: 步骤2中PCA技术降维方法为: 假设有n个样本{X1,X2,...,Xn}, 每个样 本有p维 特征 每一个特 征xj都有各自的特 征值; PCA首先对数据每个特征进行零均值化处理, 即减去这一特征的均值, 如公式 所示; 其后计算协方差矩阵: 式中, 求解公式如 下: 在计算完协方差矩阵C后, 求解该协方差矩阵C的特征值和对应特征向量, 如公式Cu=λ u所示, 式中, λ为特征值, 每个特征值λi对应一个特征向量ui, 选择特征值最大的k个特征向 量ui按列叠加, 形成矩阵U;权 利 要 求 书 1/2 页 2 CN 114417972 A 2将原始特征投影到选取的特征向量上, 得到降维后的新k维特征, 新特征的计算公式 为: 对于每一个样本Xi, 原来的特征是 投影之后 的新特征是 即将样本Xi由p维降至k维。 3.根据权利要求1所述的一种基于主成分分析和密度峰值 聚类的用户用电行为分析方 法 , 其 特 征 是 : 步 骤 5中 , 的 计 算 公 式 为 ρi的 计 算 公 式 为 式中KNN(i)表示样本i的K个近邻构成的集合, 为样本i的K近邻距 离。 4.根据权利要求1所述的一种基于主成分分析和密度峰值 聚类的用户用电行为分析方 法, 其特征是: 步骤7中, 共享近邻SN N(i,j)的计算公式为 SNN(i,j)=KN N(i)∩KN N(j)。 5.根据权利要求1所述的一种基于主成分分析和密度峰值 聚类的用户用电行为分析方 法, 其特征是: 步骤8中, 共享近邻相似度S(i,j)的计算公式为 式中 表征样本i的K近邻 样本对样本j的隶属度, 表征样本j的K近邻样本对样本i的隶属度, 将两隶属度 之和为权值对共享近邻SNN(i,j)进行加权, 得到两样本的共享近邻相似度, |SNN(i,j)|表 示样本i和样本j的共享近邻集 合内的元 素个数。 6.根据权利要求1所述的一种基于主成分分析和密度峰值 聚类的用户用电行为分析方 法, 其特征是: 步骤6 中, 类簇中心还可以通过决策值γi选取, γi的定义如式γi=ρi×δi所 示。 7.根据权利要求1所述的一种基于主成分分析和密度峰值 聚类的用户用电行为分析方 法, 其特征是: 步骤1中, 缺失数据时刻的前后两个时刻数据的求和平均值 修复缺失数据。权 利 要 求 书 2/2 页 3 CN 114417972 A 3

.PDF文档 专利 一种基于主成分分析和密度峰值聚类的用户用电行为分析方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于主成分分析和密度峰值聚类的用户用电行为分析方法 第 1 页 专利 一种基于主成分分析和密度峰值聚类的用户用电行为分析方法 第 2 页 专利 一种基于主成分分析和密度峰值聚类的用户用电行为分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:06:13上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。