全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111544742.7 (22)申请日 2021.12.16 (71)申请人 南方电网数字电网研究院有限公司 地址 510700 广东省广州市黄埔区中新广 州知识城 亿创街1号 406房之86 (72)发明人 张文瀚 詹卫许 谢辉 胡如乐  喻芸 王舒杨  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 代理人 缪成珠 (51)Int.Cl. G06K 9/62(2022.01) G06Q 10/06(2012.01) G06Q 50/06(2012.01) (54)发明名称 母线负荷异常数据识别方法、 装置、 设备、 介 质和产品 (57)摘要 本申请涉及电力技术领域, 提供了一种基于 半监督学习的母线负荷异常数据识别方法、 装 置、 设备、 介质和产品。 本申请能够实现提高母线 负荷异常数据识别的准确性。 该方法包括: 获取 原始数据集并进行空零值和连续恒值识别得到 标识数据集, 根据切比雪夫不等式法将该数据集 进行显著异常数据识别得到显著异常数据集, 根 据显著异常数据标识将该数据集划分为标记和 未标记数据集并将标记数据集划分为训练和测 试数据集, 利用训练数据集训练半监督学习算法 模型的分类器, 利用分类器对未标记数据集预测 得到预测结果, 选取预测结果大于阈值的数据形 成伪标签数据集, 若基于测试数据集和 伪标签数 据集的匹配度得到的准确度满足条件则根据上 述数据集得到识别结果。 权利要求书2页 说明书12页 附图5页 CN 114254702 A 2022.03.29 CN 114254702 A 1.一种基于半监 督学习的母线负荷异常数据识别方法, 其特 征在于, 所述方法包括: 获取母线负荷的原 始数据集; 将所述原始数据集进行空零值识别处理和连续恒值识别处理, 在所述原始数据集中标 识异常数据, 得到标识 异常数据的数据集; 根据切比雪夫不等式法, 将所述标识异常数据的数据集进行显著异常数据识别处理, 在所述标识异常数据的数据集中标识显著异常数据, 得到标识异常数据及显著异常数据的 数据集; 根据显著异常数据标识, 将所述标识异常数据及显著异常数据的数据集划分为标记数 据集以及未 标记数据集, 并将所述标记数据集划分为训练数据集和 测试数据集; 利用所述训练数据集训练半监督学习算法模型的分类器, 并利用所述分类器对所述未 标记数据集进行 数据预测, 得到所述未 标记数据集中各 数据的数据预测结果; 选取所述未标记数据集中对应于所述数据预测结果大于预设阈值的数据形成伪标签 数据集; 基于所述测试 数据集和伪标签数据集的匹配度, 得到所述分类 器的准确度; 若所述准确度满足预设的准确度条件, 则根据所述标识异常数据的数据集、 标记数据 集和伪标签数据集, 得到所述母线负荷的异常数据识别结果。 2.根据权利要求1所述的方法, 其特征在于, 所述选取所述未标记数据集中对应于所述 数据预测结果大于预设阈值的数据形成伪标签数据集之后, 所述方法还 包括: 将所述伪标签数据集迁移至所述训练数据集。 3.根据权利要求1所述的方法, 其特征在于, 所述根据所述标识异常数据的数据集、 标 记数据集和伪标签数据集, 得到所述母线负荷的异常数据识别结果, 包括: 检测所述未标记数据集中是否存在未添加到所述伪标签数据集的伪标签数据; 所述伪 标签数据为所述对应于所述数据预测结果大于预设阈值的数据; 若否, 则根据所述标识异常数据的数据集、 标记数据集和伪标签数据集, 得到所述母线 负荷的异常数据识别结果。 4.根据权利要求3所述的方法, 其特 征在于, 所述方法还 包括: 若是, 则执行所述利用所述训练数据集训练半监督学习算法模型的分类器, 并利用所 述分类器对所述未标记数据集进 行数据预测, 得到所述未标记数据集中各数据的数据预测 结果的步骤。 5.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 若所述准确度不满足所述准确度条件, 则执行所述利用所述训练数据集训练半监督学 习算法模型 的分类器, 并利用所述分类器对所述未标记数据集进行数据预测, 得到所述未 标记数据集中各 数据的数据预测结果的步骤。 6.根据权利要求1至5任意一项所述的方法, 其特征在于, 所述半监督学习算法模型的 分类器采用逻辑回归算法。 7.一种基于半监 督学习的母线负荷异常数据识别装置, 其特 征在于, 所述装置包括: 原始数据集获取模块, 用于获取母线负荷的原 始数据集; 异常数据标识模块, 用于将所述原始数据集进行空零值识别处理和连续恒值识别处 理, 在所述原 始数据集中标识 异常数据, 得到标识 异常数据的数据集;权 利 要 求 书 1/2 页 2 CN 114254702 A 2显著异常数据标识模块, 用于根据切比雪夫不等式法, 将所述标识异常数据的数据集 进行显著异常数据识别处理, 在所述标识异常数据的数据集中标识显著异常数据, 得到标 识异常数据及显著 异常数据的数据集; 标记数据集划分模块, 用于根据显著异常数据标识, 将所述标识异常数据及显著异常 数据的数据集划分为标记数据集以及未标记数据集, 并将所述标记数据集划分为训练数据 集和测试数据集; 数据预测结果得到模块, 用于利用所述训练数据集训练半监督学习算法模型的分类 器, 并利用所述分类器对所述未标记数据集进行数据预测, 得到所述未标记数据集中各数 据的数据预测结果; 伪标签数据集形成模块, 用于选取所述未标记数据集中对应于所述数据 预测结果大于 预设阈值的数据形成伪标签数据集; 准确度得到模块, 用于基于所述测试数据集和伪标签数据集的匹配度, 得到所述分类 器的准确度; 异常数据识别结果得到模块, 用于若所述准确度满足预设的准确度条件, 则根据所述 标识异常数据的数据集、 标记数据集和伪标签数据集, 得到所述母线负荷的异常数据识别 结果。 8.一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序时实现权利要求1至 6中任一项所述的方法的步骤。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被 处理器执行时实现权利要求1至 6中任一项所述的方法的步骤。 10.一种计算机程序产品, 包括计算机程序, 其特征在于, 该计算机程序被处理器执行 时实现权利要求1至 6中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114254702 A 3

.PDF文档 专利 母线负荷异常数据识别方法、装置、设备、介质和产品

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 母线负荷异常数据识别方法、装置、设备、介质和产品 第 1 页 专利 母线负荷异常数据识别方法、装置、设备、介质和产品 第 2 页 专利 母线负荷异常数据识别方法、装置、设备、介质和产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:09:13上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。