(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111488229.0
(22)申请日 2021.12.07
(71)申请人 天翼数字生活科技有限公司
地址 200072 上海市 静安区万 荣路1256、
1258号1423室
(72)发明人 夏慧维 陆涛 田武星 谢辉
(74)专利代理 机构 上海专利商标事务所有限公
司 31100
专利代理师 杨洁 亓云
(51)Int.Cl.
H04L 41/147(2022.01)
H04L 41/14(2022.01)
H04L 43/0876(2022.01)
G06K 9/62(2022.01)
G06N 20/00(2019.01)
(54)发明名称
一种网络流 量预测方法和系统
(57)摘要
本发明公开了一种网络流量预测方法和系
统。 对原始数据进行清洗转换和缺失值填充等预
处理后, 从中提取流量特征, 构建加权XGBoost ‑
Bagging网络流量预测模型, 来预测测试数据。 通
过使用加权 XGBoost‑Bagging算 法模型提升了网
络流量预测的准确度, 相比现有网络流量预测方
法而言在空间复杂度几乎不变的情况下具有更
低的时间 复杂度。
权利要求书2页 说明书5页 附图3页
CN 114915563 A
2022.08.16
CN 114915563 A
1.一种基于加权XGBo ost‑Bagging的网络流 量预测方法, 包括:
流量数据预处 理;
基于时空分布和历史流 量数据进行流 量特征提取;
加权XGBo ost‑Bagging网络流 量预测模型构建; 以及
利用所构建的网络流 量预测模型来预测 测试数据。
2.如权利要求1所述的网络流 量预测方法, 其特 征在于, 所述 流量数据预处 理包括:
数据清洗, 去除异常值、 重复值和无用数据;
数据转换, 将数据标准 化, 转换成能够被模型识别的数据格式; 以及
基于统计特性进行缺失值 填充。
3.如权利要求1所述的网络流 量预测方法, 其特 征在于, 所述 流量特征提取包括:
时间特征提取, 包括 提取日期信息以及与所述日期信息相关的时间特 征;
空间特征提取, 包括将地区信息的文本信息转换为 二进制编码; 以及
周期性特征提取, 利用移动窗口平均法提取周期性特征, 根据时间序列逐项推移, 依次
计算出包 含一定项数的平均值。
4.如权利要求1所述的网络流量预测方法, 其特征在于, 所述网络流量预测模型构建包
括:
利用Bagging策略的自助采样法, 通过从训练数据有放回地随机采样来抽取K组训练样
本;
求取所述训练样本占所述训练数据的百分比;
重复训练XGBo ost学习器K次, 计算每 个XGBoost学习器的重要性权 重; 以及
将经训练的K个带权 重的XGBo ost学习器进行组合。
5.如权利要求4所述的网络流量预测方法, 其特征在于, 所述重复训练学习器包括: 用
所抽取的训练数据训练每个XGBoost学习器, 而用所抽取的训练样本之外的袋外数据作为
验证数据来对每 个经训练的XGBo ost学习器进行评估。
6.如权利要求4所述的网络流量预测方法, 其特征在于, 所述预测测试数据包括计算出
经训练的K个带权重的XGBoost学习器的组合中XGBoost学习器的加权平均值得到最终流量
预测值输出。
7.如权利要求4所述的网络流量预测方法, 其特征在于, 所述求取所述训练样本占所述
训练数据的百分比包括基于以下计算抽取 未被选中的样本的概 率:
其中N是样本容 量。
8.一种基于加权XGBo ost‑Bagging的网络流 量预测系统, 包括:
流量数据预处 理模块;
用于基于时空分布和历史流 量数据进行流 量特征提取的流 量特征提取模块;
流量预测模型构建模块, 包括训练模块、 评估 模块、 组合模块; 以及
用于利用所构建的网络流 量预测模型来预测 测试数据的流 量预测模块。
9.如权利要求8所述的网络流 量预测系统, 其特 征在于,
所述训练模块利用Bagging策略自助采样从训练数据集当中抽取训练样本集来训练每权 利 要 求 书 1/2 页
2
CN 114915563 A
2个XGBoost学习器;
所述评估模块用所抽取的训练样本集之外的袋外数据对每个经训练的XGBoost学习器
进行评估, 计算出每 个XGBoost学习器的重要性权 重; 以及
所述组合模块将经训练带权 重的XGBo ost学习器进行组合。
10.如权利要求8所述的网络流量预测系统, 其特征在于, 所述流量数据预处理模块包
括:
用于对原 始流量数据进行清洗的清洗模块;
将数据标准 化, 转换成能够被模型识别的数据格式的转换模块; 以及
基于统计特性进行缺失值 填充的缺失值 填充模块。权 利 要 求 书 2/2 页
3
CN 114915563 A
3
专利 一种网络流量预测方法和系统
安全报告 >
其他 >
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 01:20:35上传分享