全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111444922.8 (22)申请日 2021.11.30 (71)申请人 北京东方计量测试研究所 地址 100086 北京市海淀区知春路82号 1001室 (72)发明人 刘杰强 严明 武子科 崔健  艾婷 崔玉妹 邢景仪 李文奎  彭帅  (51)Int.Cl. G06F 30/20(2020.01) G06K 9/62(2022.01) G01N 33/00(2006.01) (54)发明名称 一种基于聚类的ARIMA算法的气体浓度预测 方法 (57)摘要 本申请为一种基于聚类的ARIMA算法的气体 浓度预测方法, 提供了一种气体浓度预测方法, 包括: S1: 采集气体浓度数据, 所述气体浓度数据 为气体实时浓度序列; S2: 数据预处理, 基于K ‑ Means聚类算法对气体浓度数据进行离群点检 测, 以剔除异常数据; S3: 利用ARIMA算法建立 ARIMA预测模型; S4: 将预处理后的气体浓度数据 输入ARIMA预测模型中, 以进行气体浓度预测。 权利要求书1页 说明书5页 附图3页 CN 114386228 A 2022.04.22 CN 114386228 A 1.一种气体浓度预测方法, 包括: S1: 采集气体浓度数据, 所述气体浓度数据为气体实时浓度 序列; S2: 数据预处理, 基于K ‑Means聚类算法对气体浓度数据进行离群点检测, 以剔除异常 数据; S3: 利用ARIMA算法建立ARIMA预测模型; S4: 将预处 理后的气体浓度数据输入ARIMA预测模型中, 以进行气体浓度预测。 2.根据权利要求1所述的方法, 其中, 在数据 预处理之前, 还包括数据清洗步骤, 在数据 清洗步骤中, 将存在缺 失值的数据进 行处理, 选择用缺 失值邻近的数值取平均作为替代, 来 填充缺失值。 3.根据权利要求1所述的方法, 其中数据预处 理步骤包括: a.将气体浓度数据按数据量分为K个 类别, 选择 K个类别对应的K个初始中心点; b.对任一样本点, 在每一轮的迭代中, 求取该样本点到K个 中心点的欧式距离, 然后, 将 样本点归 入距其最近的中心点所对应的类别; c.通过求各类期望值点对K个中心点进行迭代, 对各类别的中心点取平均, 更新中心 点; d.对每一个聚类中心点, 重 复b、 c两个步骤, 当各个类别的中心点的移动距离符合某一 阈值要求时, 迭代结束, 分类任务完成。 4.根据权利要求1所述的方法, 其中, 当各个类别的中心点的移动距离大于一设定值 时, 迭代结束, 分类任务完成。 5.根据权利要求1所述的方法, 其中, 选择 K个类别对应的K个初始中心点的方法包括: 遍历所有样本点对求距离, 选择其中距离最远的两个点; 当初始中心点达到K个, 则终止, 否则, 在余下样本中, 选一个样本C3, 挑选该样本点的目 标为: 据此, 可以一 直对第n(n≥4)个初始中心点进行选择。 6.根据权利要求1所述的方法, 其中, 在步骤S3中, 对数据进行平稳性判定, 通过差分完 成ARIMA模型初期所要求的序列平稳化处 理。 7.根据权利 要求1所述的方法, 其中, 将预处理后的数据输入A RIMA预测模型中, 进行模 型识别和定阶。 8.根据权利要求1所述的方法, 其中, 步骤S4还包括: 将预测出的气体浓度数据进行差 分逆运算, 完成预测结果的输出。 9.根据权利要求1所述的方法, 其中, 通过极大似然估计法对ARIMA模型内的各项参数 进行确定, 以实现气体浓度趋势的预测。 10.一种其上存储有软件指令的计算机可读存储介质, 所述软件指令在被执行时实施 根据权利要求1 ‑9中任一项所述的方法。权 利 要 求 书 1/1 页 2 CN 114386228 A 2一种基于聚类的ARIMA算法的气体浓度预测方 法 技术领域 [0001]本申请涉及一种基于聚类的ARIMA算法的气体浓度预测方法。 背景技术 [0002]工业原料在车间长期储存的过程中, 存在诸多不安全因素。 工业原料的添加、 转 运、 长期储存的过程中很难避免泄漏情况的发生, 并且这些气体常常伴 随着剧毒、 易燃、 易 爆等特点, 一旦泄漏事故发生, 后果不堪设想, 不仅严重影响工程进度, 甚至危害人员的生 命财产安全。 且 该问题的维护与管 理成本较高, 难度较大。 基于此, 气体泄漏情况、 扩散状态 等情况, 需要通过及时有效地对环境参数信号 实时监测来判断评估, 实现预防为主、 及早 发 现、 有序处置 。 [0003]对于气体 泄漏情况的预警, 可以将气体浓度序列抽象为单变量时间序列。 ARIMA模 型(差分整合自回归滑动平均模型)作为常用的时间序列预测模型, 具有轻量、 易于实现、 准 确率高且易于配置等特点。 但是, 传 统的ARIMA模型只能预测 趋势, 对于输入信号的噪声控 制存在一定的局限性, 进而影响到输出结果的预测准确度。 实际应用中, 研究院、 高校、 企业 等单位根据应用场景的不同, 通过对ARIMA模型进行必要的改进, 实现时间序列的预测。 发明内容 [0004]鉴于上述的情况, 本申请提供一种能解决上述问题的低噪声、 高精度、 轻量化及参 数可灵活配置的气体浓度预测方法, 具体而言本发明提供一种基于聚类的ARIMA算法 的气 体浓度预测方法, 基于K ‑Means聚类算法剔除异常数据, 并利用ARIMA算法建模进行浓度预 测、 输出结果。 [0005]本申请的至少一个目的在于提供一种气体浓度预测方法, 包括: [0006]S1: 采集气体浓度数据, 所述气体浓度数据为气体实时浓度 序列; [0007]S2: 数据预处理, 基于K ‑Means聚类算法对气体浓度数据进行离群点检测, 以剔除 异常数据; [0008]S3: 利用ARIMA算法建立ARIMA预测模型; [0009]S4: 将预处 理后的气体浓度数据输入ARIMA预测模型中, 以进行气体浓度预测。 [0010]根据本申请的一个实施例, 其中, 在数据预处理之前, 还包括数据清洗步骤, 在数 据清洗步骤中, 将存在缺 失值的数据进 行处理, 选择用缺 失值邻近的数值取平均作为替代, 来填充缺失值。 [0011]根据本申请的一个实施例, 其中, 数据预处 理步骤包括: [0012]a.将气体浓度数据按数据量分为K个 类别, 选择 K个类别对应的K个初始中心点; [0013]b.对任一样本点, 在每一轮的迭代中, 求取该样本点到K个中心点的欧式距离, 然 后, 将样本点归 入距其最近的中心点所对应的类别; [0014]c.通过求各类期望值点对K个中心点进行迭代, 对各类别的中心点取平均, 更新中 心点;说 明 书 1/5 页 3 CN 114386228 A 3

.PDF文档 专利 一种基于聚类的ARIMA算法的气体浓度预测方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于聚类的ARIMA算法的气体浓度预测方法 第 1 页 专利 一种基于聚类的ARIMA算法的气体浓度预测方法 第 2 页 专利 一种基于聚类的ARIMA算法的气体浓度预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 05:02:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。