全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211378820.5 (22)申请日 2022.11.04 (71)申请人 济南奔腾时代电力科技有限公司 地址 250000 山东省济南市历下区泺源大 街6号新闻大厦附楼2层优客工厂 D222-27 (72)发明人 张超 唐守伟 唐金鹤 王新  刘海瑞  (74)专利代理 机构 北京亿知臻成专利代理事务 所(普通合伙) 16123 专利代理师 房小颖 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/06(2012.01) G06N 3/04(2006.01)G06N 20/00(2019.01) (54)发明名称 一种基于集成混合模型的电厂再热烟气挡 板操作预测方法 (57)摘要 本发明公开了一种基于集成混合模型的电 厂再热烟气挡板操作预测方法, 包括: (1)采集历 史数据、 (2)数据预处理及数据离散化、 (3)指标 关联分析、 (4)数据归一化处理, 构建模型数据 集、 (5)搭建CNN网络 结构, CNN网络 数据特征提取 及Flatten化处理、 (6)新特征数据集输入 XGBoost、 随机森林模型, 模型训练、 (7)模型结果 分析、 模型评估, 判断模型准确性, 模型分类预 测。 本发明能够有效提取再热烟气挡板调节数据 特征, 准确预测烟气挡板调节量, 对电厂运行人 员具有指导性作用, 有助于提高机组整体性能和 人员管理水平。 权利要求书2页 说明书8页 附图2页 CN 115526433 A 2022.12.27 CN 115526433 A 1.一种基于集成混合模型的电厂再热烟气挡板操作预测方法, 其特征在于, 包括以下 步骤: 步骤1、 采集历史数据: 选取电厂再 热烟气挡板控制主指标及其相关指标, 从数据库中抽取设备相关运行历史数据; 步骤2、 数据 预处理及数据离散化: 对历史数据进行异常值检测、 缺失值填充, 将烟气挡 板数值型指标转换成离 散型指标; 步骤3、 指标关联分析: 根据筛选的相关指标基于数据采用皮尔逊相关性分析和互信 息 分析进行指标关联分析, 筛 选出关联度大的指标; 步骤4、 数据归一化处理, 构建模型数据集: 对已筛选好的指标历史数据进行(0,1)归一 化处理, 构建模型 数据集, 归一 化公式为: 其中X*为数据归 一化后的值, x 为数据归 一化前的值, min为样本 数据中的最小 值, max为 样本数据中的最大值; 步骤5、 搭建CNN网络结构, CNN网络数据特征提取及Fl atten化处理: 根据模型数据 集特 征设计CNN网络结构, 将构建的模 型数据集进行卷积操作, 完成特征提取工作, 提取特征后, 将卷积操作获取的特征进行Flatten操作后与原始特征向量进行连接组成新的特征数据 集; 步骤6、 新特征数据集输入XGBoost、 随机森林模型, 模型训练: 将新特征数据集分别输 入到XGBo ost和随机森林模型中, 通过网格搜索优化两模型参数, 进行模型训练; 步骤7、 模型结果分析、 模型评估, 判断模型准确性, 模型分类预测: 经过XGBoost和随机 森林模型训练后, 对模型分类预测验证, 并将 两个模型计算的各类别概率值进 行加权平均, 对两模型 结果进行模型评估, 最后选取准确率高的模型进行分类预测。 2.根据权利要求1所述的基于集成混合模型的电厂再热烟气挡板操作预测方法, 其特 征在于, 步骤2中, 采用3σ 法则或隔离森林算法对历史数据进行异常值检测; 所述3σ 法则是 根据样本数据对 各指标进行计算处理得到平均值 μ、 标准偏 差σ, 剔除落在( μ ‑3σ, μ+3σ )之外 的数据; 所述隔离森林算法是采用多重二分法对样本数据进行分区, 通过样本的疏密程度 来判断样本是否孤立。 3.根据权利要求1或2所述的基于集成混合模型的电厂再热烟气挡板操作预测方法, 其 特征在于, 步骤2中, 采用K临近算法或回归拟合算法对历史数据进行缺失值填充; 所述K临 近算法是通过找出样本中缺 失值前后k个最近的值, 将这些值的平均值赋给该样本, 即得到 该样本对应属 性的值, 并用该值填充; 所述回归拟合算法是指根据业务规则找出和 缺失值 关联较大 的样本, 通过该关联样本的值利用拟合公式来拟合缺失值样本的值, 并用该值进 行填充。 4.根据权利要求1所述的基于集成混合模型的电厂再热烟气挡板操作预测方法, 其特 征在于, 步骤3中, 所述皮尔逊相关性分析通过皮尔逊相关系 数反应相关性, 其中皮尔逊相 关 系 数 是 指 两 个 样 本 变 量 之 间 的 协 方 差 和 标 准 差 的 商 ,计 算 公 式 为 : 5.根据权利要求1或4所述的基于集成混合模型的电厂再热烟气挡板操作预测方法, 其权 利 要 求 书 1/2 页 2 CN 115526433 A 2特征在于, 步骤3中, 所述互信息分析方法为: 设两个随机变量(X,Y)的联合分布为p(x,y), 边缘分布分别为p(x)p(y), 互信息I(X; Y)是联合分布p(x,y)与边缘分布p(x)p(y)的相对 熵, 即: 6.据权利要求1所述的基于集成混合模型的 电厂再热烟气挡板操作预测方法, 其特征 在于, 步骤5中, 所述CNN网络结构是在卷积神经网络基础上搭建 的, CNN网络结构包括输入 层、 卷积层、 池化层、 Flat ten层、 全连接层、 输出层。 7.根据权利要求1所述的基于集成混合模型的电厂再热烟气挡板操作预测方法, 其特 征在于, 步骤6中, 所述XGBoost模型属于Boosting算法, 是一种基于梯度提升决策树的改进 算法, 主要通过把许多树模 型集成在一起构成强分类器, XGBoost的核心思想是对目标函数 不断进行优化, 设其目标函数定义如下公式: 其中 表示预 测值 和真实值yi的误差, Ω(fk)表示模型复杂度的惩罚项, 为了避免模型产生过拟合现 象, XGBoost通过对代价函数进行了二阶泰勒展开, 并提取了一阶导数和二阶导数中的信 息, 同时加入正则化项降低模型的复杂度。 8.根据权利要求1或7所述的基于集成混合模型的电厂再热烟气挡板操作预测方法, 其 特征在于, 步骤6中, 所述随机森林模型是通过Bagging方法生成相互之间有差异的不同训 练样本集, 采用分类回归树作为元分类器构建集成分类器, 用简单多数投票结果作为分类 结果。 9.根据权利要求1所述的基于集成混合模型的电厂再热烟气挡板操作预测方法, 其特 征在于, 步骤 7中, 所述XGBoost模 型和随机森 林模型计算的概率值包括准确率和召回率; 概 率值的加权平均计算方法如下: XGBoost模型计算{label1, label2}的概率值为{prob11, prob12}, 随机森林模型计算{label1, label2}的概率值为{prob21, prob22}, 则{label1, label2}概 率加权平均prob={0.6 *prob11+0.4*prob12, 0.6 *prob21+0.4*prob2 2}。权 利 要 求 书 2/2 页 3 CN 115526433 A 3

PDF文档 专利 一种基于集成混合模型的电厂再热烟气挡板操作预测方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于集成混合模型的电厂再热烟气挡板操作预测方法 第 1 页 专利 一种基于集成混合模型的电厂再热烟气挡板操作预测方法 第 2 页 专利 一种基于集成混合模型的电厂再热烟气挡板操作预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:00上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。