全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111578578.1 (22)申请日 2021.12.2 2 (71)申请人 杭州意能电力技 术有限公司 地址 310012 浙江省杭州市西湖区文三路 253号9楼902室 申请人 国网浙江省电力有限公司电力科 学 研究院 (72)发明人 苏烨 张新胜 陈巍文 孙坚栋  蔡钧宇 丁俊宏 李泉 郑可轲  丁伟聪 华丽云  (74)专利代理 机构 浙江翔隆专利事务所(普通 合伙) 33206 代理人 许守金 张建青 (51)Int.Cl. G06K 9/62(2022.01)G06Q 50/06(2012.01) (54)发明名称 一种基于AHC-GP混合模型的热工过程报警 数据过滤方法及系统 (57)摘要 本发明公开了一种基于AHC ‑GP混合模型的 热工过程报警数据过滤方法及系统, 属于数据处 理技术领域。 现有的数据处理方案, 无法有效消 除冗余性报警, 无法及时抑制报警溢流, 加剧了 由于异常传播引发的 “报警泛滥 ”问题。 本发明提 供一种基于AHC ‑GP混合模型的热工过程报警数 据过滤方法, 能够对数据集进行预处理, 并采用 近邻传播算法确定最佳聚类数目, 再使用凝聚式 层次聚类算法对数据集进行聚类, 区分不同工 况; 其次, 利用高斯过程模型进行数据分类, 结合 后验报警概率估计值, 构建数据过滤模型, 实现 热工过程报警数据的准确过滤。 进而, 本发明可 准确定位数据集中的关键报警数据, 消除冗余性 报警; 漏检率、 误判率均较低, 具有良好的数据过 滤准确率。 权利要求书3页 说明书10页 附图2页 CN 114372515 A 2022.04.19 CN 114372515 A 1.一种基于AH C‑GP混合模型的热工过程报警数据过 滤方法, 其特 征在于, 包括以下步骤: 第一步, 获取热工过程报警数据集; 第二步, 对第一步中的热工过程报警数据集进行预处理, 采用近邻传播算法确定最佳 聚类数目, 再使用凝聚式层次聚类算法对热工过程报警数据集进 行聚类, 形成聚类数据集, 以区分不同工况; 第三步, 构建高斯过程模型, 对第二 步中的聚类数据集进行分类, 得到分类数据集; 第四步, 对第三 步中的分类数据集, 结合后验报警概 率估计值, 构建数据过 滤模型; 第五步, 利用第四步中的数据过 滤模型, 实现热工过程报警数据的准确过 滤。 2.如权利要求1所述的一种基于AHC ‑GP混合模型的热工过程报警数据过滤方法, 其特 征在于, 所述第二 步中, 近邻传播 算法确定最佳聚类数目的方法如下: 对热工过程报警数据集进行最佳聚类数目检测, 确定最佳聚类数目。 3.如权利要求1所述的一种基于AHC ‑GP混合模型的热工过程报警数据过滤方法, 其特 征在于, 所述第二步中, 凝聚式层次聚类算法为一种自底向上的层次聚类方法, 其对热工过程 报警数据集进行聚类的方法如下: 首先, 对热工过程报警数据集添加时间标签约束, 使得热工过程报警数据集在时间维 度上的连续, 以契合实际热工过程数据运行 特点; 然后, 将热工过程报 警数据集划分为初始簇, 依据簇间度量距离对簇进行合并, 直至满 足聚类要求; 并以整个热工过程报警数据集为聚类中心, 无需提前确定聚类中心, 从而其聚类结果 不会被局部最优解所影响。 4.如权利要求1所述的一种基于AHC ‑GP混合模型的热工过程报警数据过滤方法, 其特 征在于, 所述第三 步中, 高斯过程模型对聚类数据集进行分类的具体方法如下: 首先, 根据热工过程的报 警数据特点, 构建类别标签, 所述类别标签分为关键报警数据 标签和冗余报警数据标签; 然后, 建立一预测函数, 对于任意输入的聚类数据集, 有效的找到其所属的类别标签y, 将聚类数据集划分为关键报警数据和冗余报警数据; 其中, y∈{ ‑1,1}。 5.如权利要求4所述的一种基于AHC ‑GP混合模型的热工过程报警数据过滤方法, 其特 征在于, 所述分类数据集的数据点 为xi(i=1,2,…n), 对应的类别标签 变量为t=(t1,…,tn)T; 对于一个具体的分类数据集的数据点xN+1, 其类别标签为tN+1, 其后验概率分布为p(tN+1 ∣ t); 并且引入向量aN+1上的高斯过程先验, 它的分量 为a(x1),…,a(xN+1); 向量aN+1为一个高斯过程, 基于已有的研究经验及数据集特点, 高斯过程模型使用变分 推断法进行高斯近似, 采用logistic  sigmoid函数进行变换, 变换后向量aN+1为非高斯随机 过程, 向量aN+1取值变为(0,1);权 利 要 求 书 1/3 页 2 CN 114372515 A 2从而相应的确定了tN+1上的一个非高斯过程, 并通过训练数据tN, 求解分类数据集中数 据点xN+1的后验报警概 率估计值。 6.如权利要求5所述的一种基于AHC ‑GP混合模型的热工过程报警数据过滤方法, 其特 征在于, 所述aN+1上的高斯过程先验的计算公式如下: 其中, CN+1为协方差矩阵; 后验报警概 率估计值p(tN+1=1∣ tN)的计算公式如下 所示: p(tN+1∣ tN)= ∫p(tN+1=1∣ aN+1)p(aN+1∣ tN)daN+1   (21) p(tN+1=1∣ aN+1)=σ(aN+1)   (22); 其中, σ 为核参数, 表示核半径, 控制径向作用范围。 7.如权利要求1所述的一种基于AHC ‑GP混合模型的热工过程报警数据过滤方法, 其特 征在于, 第四步, 所述数据过 滤模型的构建方法如下: 首先, 计算分类数据集的各 数据点的后验报警概 率估计值; 然后根据后验报警概率估计值的大小, 对分类数据集进行筛选过滤, 得到关键报警数 据点; 所述后验报警概 率估计值的计算公式如下: p(y*={‑1,1}∣ X,y,x*)   (23) 其中, X为分类数据集, y、 y*为类别标签, x*为无标签测试集样本,p为报警概 率估计; 后验报警概 率估计值标准差σ★和均值 μ*的计算公式如下: k*=k(X,x*)   (17) k**=k(x★,x★)   (18) 其中: K为 分类数据集核矩阵, k*为新分类数据集在核 函数矩阵中的向量值, I代表一个n ×n的单位矩阵, σn为第n个数据点的标准差 。 8.如权利要求1所述的一种基于AHC ‑GP混合模型的热工过程报警数据过滤方法, 其特 征在于, 同时采用准确率、 误判率和漏检率对数据过 滤模型的过 滤效果进行评价; 所述准确率的计算公式如下: ACR=正确个数/真实报警数据个数; 所述误判率的计算公式如下: MDR=误判个数/真实报警数据个数; 所述漏检率的计算公式: MJR=漏检个数/真实报警数据个数。 9.一种基于AH C‑GP混合模型的热工过程报警数据过 滤方法, 其特 征在于, 包括以下步骤:权 利 要 求 书 2/3 页 3 CN 114372515 A 3

.PDF文档 专利 一种基于AHC-GP混合模型的热工过程报警数据过滤方法及系统

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于AHC-GP混合模型的热工过程报警数据过滤方法及系统 第 1 页 专利 一种基于AHC-GP混合模型的热工过程报警数据过滤方法及系统 第 2 页 专利 一种基于AHC-GP混合模型的热工过程报警数据过滤方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:06:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。