全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111530412.2 (22)申请日 2021.12.15 (71)申请人 国网福建省电力有限公司营销服 务 中心 地址 350013 福建省福州市晋安区沁园支 路9号 申请人 国网福建省电力有限公司 (72)发明人 张颖 魏晓莹 陈慧 詹文 林华  李建新 曹舒 陈适 郭银婷  (74)专利代理 机构 福州元创专利商标代理有限 公司 35100 代理人 张灯灿 蔡学俊 (51)Int.Cl. G06F 16/215(2019.01) G06F 17/18(2006.01)G06K 9/62(2022.01) G06Q 50/06(2012.01) (54)发明名称 一种基于正则自动编码器的电量数据清洗 方法及系统 (57)摘要 本发明涉及一种基于正则自动编码器的电 量数据清洗方法及系统, 该方法包括以下步骤: S1、 读入台区智能电表的原始数据; S2、 计算用户 的日用电量数据; S3、 剔除异常的用户日用电量 数据; S4、 将用户电量数据以28天为一个周期, 从 周一开始, 到周日结束, 进行数据的分割; S5、 建 立基于正则自动编码器的数据填补模型; S6、 统 计用户日用电量的缺失天数, 若缺失百分比小于 设定阈值, 进行步骤S7, 否则, 不对该用户进行数 据填补工作; S7、 将缺失的用户数据输入到所述 基于正则自动编码器的数据填补模 型, 修正填补 该用户的电量数据; S8、 实现缺失数据的填补。 该 方法及系统对于电量数据修补的误差小, 改善了 数据质量。 权利要求书2页 说明书5页 附图1页 CN 114168583 A 2022.03.11 CN 114168583 A 1.一种基于正则自动 编码器的电量数据清洗方法, 其特 征在于, 包括以下步骤: S1、 读入台区智能电表的原 始数据; S2、 计算用户的日用电量数据; S3、 剔除异常的用户日用电量数据; S4、 将用户电量数据以28天为 一个周期, 从周一 开始, 到周日结束, 进行 数据的分割; S5、 建立基于正则自动 编码器的数据填补模型; S6、 统计用户日用电量的缺失天数, 若缺失百分比小于设定阈值, 进行步骤S7, 否则, 不 对该用户进行 数据填补工作; S7、 将缺失的用户数据输入到所述基于正则自动编码器的数据填补模型, 修正填补该 用户的电量数据; S8、 实现缺失数据的填补。 2.根据权利要求1所述的一种基于正则自动编码器的电量数据清洗方法, 其特征在于, 所述步骤S2具体包括以下步骤: S21、 依据用户编号区分不同用户的电表数据; S22、 对每一个用户的电表数据按日期进行排序; S23、 判断后一天与前一天的电表资产号是否一致, 若不一致, 表示该用户更换了电表, 用户当天的智能电表显示数据即为用户的当日用电量, 若一 致, 执行步骤S24; S24、 判断用户前后两天是否都存在数值, 若有一个或者两个缺失, 将用户当天的用电 量置为空, 即数据缺失, 若两个数据都存在, 执 行步骤S25; S25、 将智能电表后一天减去前一天的正向有功, 得到用户的日用电量数据。 3.根据权利要求1所述的一种基于正则自动编码器的电量数据清洗方法, 其特征在于, 所述步骤S3具体包括以下步骤: S31、 根据步骤S2得到的用户日用电量数据, 若数据为负值, 视为数据异常, 该用户当日 用电量数据置空; S32、 根据步骤S2得到的用户日用电量数据, 若当日所有用户的电量数据均存在, 但在 设定误差范围内的求和数值不等于总电量, 即认定当日所有用户的电量数据错误, 所有用 户当日用电量数据都置空。 4.根据权利要求1所述的一种基于正则自动编码器的电量数据清洗方法, 其特征在于, 所述步骤S5具体包括以下步骤: S51、 对自动编码器的损失函数施加规则约束, 嵌入正交约束和L2 1范数, 实现自编码器 的正则化, 则待优化的正则自动 编码器的目标函数表达式如下: 式(1)中, N为样本总数, x为输入数据, 为重构数据, v为正则自动编码器的层数, σ 为 L21范数的系数, β 为 正交约束的系数, I 为单位矩阵, W 为模型的权 重; S52、 建立包 含各类用户的用电数据训练集; S53、 利用训练集训练正则自动编码器的参数; 根据公式(1)计算用电数据x与重构数据 的损失函数, 判断误差是否符合预期, 若符合, 保存正则自动编码器的参数, 若不符合, 更权 利 要 求 书 1/2 页 2 CN 114168583 A 2新参数重新进行编码和解码工作; S54: 保存最佳的正则自动 编码器的参数, 得到基于正则自动 编码器的数据填补模型。 5.根据权利要求1所述的一种基于正则自动编码器的电量数据清洗方法, 其特征在于, 所述步骤S6中, 设定阈值 为总天数的40%。 6.一种基于正则自动编码器的电量数据清洗系统, 其特征在于, 包括存储器、 处理器以 及存储于存储器上并能够被处理器运行的计算机程序指令, 当处理器运行该计算机程序指 令时, 能够实现如权利要求1 ‑5所述的方法步骤。权 利 要 求 书 2/2 页 3 CN 114168583 A 3

.PDF文档 专利 一种基于正则自动编码器的电量数据清洗方法及系统

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于正则自动编码器的电量数据清洗方法及系统 第 1 页 专利 一种基于正则自动编码器的电量数据清洗方法及系统 第 2 页 专利 一种基于正则自动编码器的电量数据清洗方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:06:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。