(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111578578.1
(22)申请日 2021.12.2 2
(71)申请人 杭州意能电力技 术有限公司
地址 310012 浙江省杭州市西湖区文三路
253号9楼902室
申请人 国网浙江省电力有限公司电力科 学
研究院
(72)发明人 苏烨 张新胜 陈巍文 孙坚栋
蔡钧宇 丁俊宏 李泉 郑可轲
丁伟聪 华丽云
(74)专利代理 机构 浙江翔隆专利事务所(普通
合伙) 33206
代理人 许守金 张建青
(51)Int.Cl.
G06K 9/62(2022.01)G06Q 50/06(2012.01)
(54)发明名称
一种基于AHC-GP混合模型的热工过程报警
数据过滤方法及系统
(57)摘要
本发明公开了一种基于AHC ‑GP混合模型的
热工过程报警数据过滤方法及系统, 属于数据处
理技术领域。 现有的数据处理方案, 无法有效消
除冗余性报警, 无法及时抑制报警溢流, 加剧了
由于异常传播引发的 “报警泛滥 ”问题。 本发明提
供一种基于AHC ‑GP混合模型的热工过程报警数
据过滤方法, 能够对数据集进行预处理, 并采用
近邻传播算法确定最佳聚类数目, 再使用凝聚式
层次聚类算法对数据集进行聚类, 区分不同工
况; 其次, 利用高斯过程模型进行数据分类, 结合
后验报警概率估计值, 构建数据过滤模型, 实现
热工过程报警数据的准确过滤。 进而, 本发明可
准确定位数据集中的关键报警数据, 消除冗余性
报警; 漏检率、 误判率均较低, 具有良好的数据过
滤准确率。
权利要求书3页 说明书10页 附图2页
CN 114372515 A
2022.04.19
CN 114372515 A
1.一种基于AH C‑GP混合模型的热工过程报警数据过 滤方法, 其特 征在于,
包括以下步骤:
第一步, 获取热工过程报警数据集;
第二步, 对第一步中的热工过程报警数据集进行预处理, 采用近邻传播算法确定最佳
聚类数目, 再使用凝聚式层次聚类算法对热工过程报警数据集进 行聚类, 形成聚类数据集,
以区分不同工况;
第三步, 构建高斯过程模型, 对第二 步中的聚类数据集进行分类, 得到分类数据集;
第四步, 对第三 步中的分类数据集, 结合后验报警概 率估计值, 构建数据过 滤模型;
第五步, 利用第四步中的数据过 滤模型, 实现热工过程报警数据的准确过 滤。
2.如权利要求1所述的一种基于AHC ‑GP混合模型的热工过程报警数据过滤方法, 其特
征在于,
所述第二 步中, 近邻传播 算法确定最佳聚类数目的方法如下:
对热工过程报警数据集进行最佳聚类数目检测, 确定最佳聚类数目。
3.如权利要求1所述的一种基于AHC ‑GP混合模型的热工过程报警数据过滤方法, 其特
征在于,
所述第二步中, 凝聚式层次聚类算法为一种自底向上的层次聚类方法, 其对热工过程
报警数据集进行聚类的方法如下:
首先, 对热工过程报警数据集添加时间标签约束, 使得热工过程报警数据集在时间维
度上的连续, 以契合实际热工过程数据运行 特点;
然后, 将热工过程报 警数据集划分为初始簇, 依据簇间度量距离对簇进行合并, 直至满
足聚类要求;
并以整个热工过程报警数据集为聚类中心, 无需提前确定聚类中心, 从而其聚类结果
不会被局部最优解所影响。
4.如权利要求1所述的一种基于AHC ‑GP混合模型的热工过程报警数据过滤方法, 其特
征在于,
所述第三 步中, 高斯过程模型对聚类数据集进行分类的具体方法如下:
首先, 根据热工过程的报 警数据特点, 构建类别标签, 所述类别标签分为关键报警数据
标签和冗余报警数据标签;
然后, 建立一预测函数, 对于任意输入的聚类数据集, 有效的找到其所属的类别标签y,
将聚类数据集划分为关键报警数据和冗余报警数据;
其中, y∈{ ‑1,1}。
5.如权利要求4所述的一种基于AHC ‑GP混合模型的热工过程报警数据过滤方法, 其特
征在于,
所述分类数据集的数据点 为xi(i=1,2,…n), 对应的类别标签 变量为t=(t1,…,tn)T;
对于一个具体的分类数据集的数据点xN+1, 其类别标签为tN+1, 其后验概率分布为p(tN+1
∣ t); 并且引入向量aN+1上的高斯过程先验, 它的分量 为a(x1),…,a(xN+1);
向量aN+1为一个高斯过程, 基于已有的研究经验及数据集特点, 高斯过程模型使用变分
推断法进行高斯近似, 采用logistic sigmoid函数进行变换, 变换后向量aN+1为非高斯随机
过程, 向量aN+1取值变为(0,1);权 利 要 求 书 1/3 页
2
CN 114372515 A
2从而相应的确定了tN+1上的一个非高斯过程, 并通过训练数据tN, 求解分类数据集中数
据点xN+1的后验报警概 率估计值。
6.如权利要求5所述的一种基于AHC ‑GP混合模型的热工过程报警数据过滤方法, 其特
征在于,
所述aN+1上的高斯过程先验的计算公式如下:
其中, CN+1为协方差矩阵;
后验报警概 率估计值p(tN+1=1∣ tN)的计算公式如下 所示:
p(tN+1∣ tN)= ∫p(tN+1=1∣ aN+1)p(aN+1∣ tN)daN+1 (21)
p(tN+1=1∣ aN+1)=σ(aN+1) (22);
其中, σ 为核参数, 表示核半径, 控制径向作用范围。
7.如权利要求1所述的一种基于AHC ‑GP混合模型的热工过程报警数据过滤方法, 其特
征在于,
第四步, 所述数据过 滤模型的构建方法如下:
首先, 计算分类数据集的各 数据点的后验报警概 率估计值;
然后根据后验报警概率估计值的大小, 对分类数据集进行筛选过滤, 得到关键报警数
据点;
所述后验报警概 率估计值的计算公式如下:
p(y*={‑1,1}∣ X,y,x*) (23)
其中, X为分类数据集, y、 y*为类别标签, x*为无标签测试集样本,p为报警概 率估计;
后验报警概 率估计值标准差σ★和均值 μ*的计算公式如下:
k*=k(X,x*) (17)
k**=k(x★,x★) (18)
其中: K为 分类数据集核矩阵, k*为新分类数据集在核 函数矩阵中的向量值, I代表一个n
×n的单位矩阵, σn为第n个数据点的标准差 。
8.如权利要求1所述的一种基于AHC ‑GP混合模型的热工过程报警数据过滤方法, 其特
征在于,
同时采用准确率、 误判率和漏检率对数据过 滤模型的过 滤效果进行评价;
所述准确率的计算公式如下:
ACR=正确个数/真实报警数据个数;
所述误判率的计算公式如下:
MDR=误判个数/真实报警数据个数;
所述漏检率的计算公式:
MJR=漏检个数/真实报警数据个数。
9.一种基于AH C‑GP混合模型的热工过程报警数据过 滤方法, 其特 征在于,
包括以下步骤:权 利 要 求 书 2/3 页
3
CN 114372515 A
3
专利 一种基于AHC-GP混合模型的热工过程报警数据过滤方法及系统
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 02:06:08上传分享