(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111509168.1 (22)申请日 2021.12.10 (71)申请人 广东工业大 学 地址 510090 广东省广州市越秀区东 风东 路729号 申请人 中通服建设有限公司 (72)发明人 凌捷 康健豪 罗玉 黄慧武  区奕宁 区旸 刘艺彬  (74)专利代理 机构 广州粤高专利商标代理有限 公司 44102 代理人 禹小明 (51)Int.Cl. H04L 9/40(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于深度学习的加密网络流量识别及 分类方法 (57)摘要 本发明公开了一种基于深度学习的加密网 络流量识别及分类方法, 所述识别方法包括以下 步骤: S1: 获取加密网络流量数据并进行预处理 得到若干单独的会话; S2: 对于预处理后的流量 数据进行统计特征的选择; S3: 对预处理后的流 量数据进行有效载荷截取; S4: 将统计特征和有 效载荷进行特征整合并进行特征标准化; S5: 利 用整合后的特征对识别模型进行训练, 得到训练 好的识别模型; S6: 利用训练好的识别模型对加 密网络流量进行识别和分类。 本发 明提高了加密 网络流量识别及分类的准确度, 实现了更高的分 类性能, 并且能够对细粒度的加密网络流量进行 识别和分类同时具有更强的场景适用性。 权利要求书2页 说明书7页 附图2页 CN 114257428 A 2022.03.29 CN 114257428 A 1.一种基于深度学习的加密网络流 量识别方法, 其特 征在于, 包括以下步骤: S1: 获取加密网络流 量数据并进行 预处理得到若干单独的会话; S2: 对于预处 理后的流 量数据进行统计特 征的选择; S3: 对预处 理后的流 量数据进行有效载荷截取; S4: 将统计特 征和有效载荷进行 特征整合并进行 特征标准化; S5: 利用整合后的特 征对识别模型进行训练, 得到训练好的识别模型; S6: 利用训练好的识别模型对加密网络流 量进行识别。 2.根据权利要求1所述的一种基于深度 学习的加密网络流量识别方法, 其特征在于, 步 骤S1所述的获取加密网络流 量数据并进行 预处理具体步骤为: 利用网络抓包工具收集网络通信工具通信的加密网络流 量; 对格式为pcap的原 始流量文件进行清洗; 将清洗后的原 始流量切分成多个单独的会话。 3.根据权利要求1所述的一种基于深度 学习的加密网络流量识别方法, 其特征在于, 步 骤S2所述的对于预处 理后的流 量数据进行统计特 征的选择 具体步骤为: 利用网络流 量特征提取工具提取每 个会话的统计特 征; 删除Flow  ID、 Src IP、 Dst IP、 Timestamp 这4个与分类无关的特征, 保留其余网络流量 统计特征作为识别模型训练的输入之一。 4.根据权利要求1所述的一种基于深度 学习的加密网络流量识别方法, 其特征在于, 步 骤S3所述的对预处 理后的流 量数据进行有效载荷截取 具体步骤为: 截取每条切分后的流量会话中密文形式的有效载荷前945个字节, 若不足945个字节, 则使用0进行填充补齐至945, 将其作为模型训练的输入之一。 5.根据权利要求1所述的一种基于深度 学习的加密网络流量识别方法, 其特征在于, 步 骤S4所述将统计特 征和有效载荷进行 特征整合并进行 特征标准化具体步骤为: 将步骤S2选择的统计特 征和步骤S3得到的有效载荷字节整合成固定 长度的特 征向量; 使用min‑max标准化方法将每个特征缩放至0 ‑1之间, 计算方法为 其中x* 为标准化后的特 征, x为输入特 征, min和max分别对应输入特 征的最小值和最大值。 6.根据权利要求1所述的一种基于深度学习的加密网络流量识别方法, 其特征在于, S5 所述的利用整合后的特 征对识别模型进行训练, 得到训练好的识别模型 具体过程 为: 将整合后的特 征转换成预设的格式输入Mogrifier  LSTM中进行全局时序特 征提取; 将Mogrifier  LSTM输出的特征矩阵输入至SKCNN网络进行空间局部特征提取, 得到空 间局部特 征的特征图; 利用全连接分类对得到的特征进行分类, 经由softmax输出预测结果, 最后, 使用 CBFocalLoss计算损失值, 利用反向传播更新权 重, 优化模型。 7.根据权利要求6所述的一种基于深度 学习的加密网络流量识别方法, 其特征在于, 输 入至SKCN N网络的特 征矩阵处 理过程为: 特征矩阵中的特征图依次经过5 ×5的卷积、 最大池化、 两次5 ×5卷积、 一个SK卷积、 一 次1×1卷积和最后的全局平均池化, 最 终得到一个长度为8的特征向量; 所述SK卷积为一种 卷积神经网络的注意力机制, 用于对通道加权, 具体包括Split, Fuse, Select三个操作, 其权 利 要 求 书 1/2 页 2 CN 114257428 A 2中: Split: 将输入的加密网络流 量特征图通过两个的卷积核变换 得到两个分支 和 Fuse: 将两个分支输出的逐个元素进行相加, 即 然后, 对两个输出U进行全 局平均池化操作 得每个通道上的全局信息s, 即 最 后, 对输出s做全连接获得每个通道的权重z, 即 其中δ为relu激活 函数, 为批量归一 化(batchnorm); Select: 生 成的权重z经由softmax运算得到权重a, 再计算权重b= 1‑a, a和b分别对应 和 的权重, 两两对应相乘得到U1和U2, 计算Uout=U1+U2, Uout为最终加权后的输出的特 征图。 8.根据权利要求6所述的一种基于深度学习的加密网络流量识别方法, 其特征在于, CBFocalLoss计算损失值表达式为: Z为softmax输出的预测结果, y是样本标签, 超参数β∈[0,1), ny为加密流量的类别数 量, 9.根据权利要求1所述的一种基于深度 学习的加密网络流量识别方法, 其特征在于, 步 骤S6所述的利用训练好的识别模型对加密网络流 量进行识别具体为: 将预先人工识别并标记的网络流量数据其作为训练数据, 重复训练模型直至最优, 保 存最优模型; 向保存的最优模型中输入未识别的网络流量数据, 自动识别出加密网络流量 并进行标记。 10.一种基于深度学习的加密网络流 量分类方法, 其特 征在于, 包括以下步骤: S1: 获取加密网络流 量数据并进行 预处理得到若干单独的会话; S2: 对于预处 理后的流 量数据进行统计特 征的选择; S3: 对预处 理后的流 量数据进行有效载荷截取; S4: 将统计特 征和有效载荷进行 特征整合并进行 特征标准化; S5: 利用整合后的特 征对识别模型进行训练, 得到训练好的识别模型; S6: 利用训练好的识别模型对加密网络流 量进行分类。权 利 要 求 书 2/2 页 3 CN 114257428 A 3

.PDF文档 专利 一种基于深度学习的加密网络流量识别及分类方法

安全报告 > 其他 > 文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于深度学习的加密网络流量识别及分类方法 第 1 页 专利 一种基于深度学习的加密网络流量识别及分类方法 第 2 页 专利 一种基于深度学习的加密网络流量识别及分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常2024-03-18 22:37:26上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。