(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211057313.1
(22)申请日 2022.08.31
(71)申请人 中国联合网络通信集团有限公司
地址 100033 北京市西城区金融大街21号
(72)发明人 王智明 徐雷 陶冶
(74)专利代理 机构 北京天昊联合知识产权代理
有限公司 1 1112
专利代理师 邓伯英 罗建民
(51)Int.Cl.
H04L 9/40(2022.01)
G06N 20/00(2019.01)
(54)发明名称
一种黑产 识别方法、 装置及计算机可读存储
介质
(57)摘要
本发明提供一种黑产识别方法、 装置及计算
机可读存储介质, 所述方法包括: 获取终端发送
的黑产识别请求, 所述黑产识别请求携带IP地址
和互联网流量数据; 采用基于 人工智能AI自主学
习规则的互联网黑产识别模型对所述IP地址和
互联网流量数据进行分析, 得到所述IP地址和互
联网流量数据是否为黑产的识别结果; 将所述识
别结果返回给终端。 该方法、 装置及计算机可读
存储介质能够解决现有的黑产识别方法存在识
别准确率低、 覆盖率低的问题。
权利要求书3页 说明书9页 附图3页
CN 115426167 A
2022.12.02
CN 115426167 A
1.一种黑产识别方法, 其特 征在于, 包括:
获取终端发送的黑产识别请求, 所述 黑产识别请求携带IP地址和互联网流 量数据;
采用基于人工智能AI自主学习规则的互联网黑产识别模型对所述IP地址和互联网流
量数据进行分析, 得到所述 IP地址和互联网流 量数据是否为 黑产的识别结果;
将所述识别结果返回给终端。
2.根据权利要求1所述的方法, 其特征在于, 所述获取终端发送的黑产识别请求之前,
所述方法还 包括:
获取一个或多个威胁情 报中黑产数据对应的种子数据;
利用所述种子数据验证所述互联网黑产识别模型识别的准确率和覆盖率;
若所述互联网黑产识别模型识别的准确率或覆盖率不满足预设的阈值, 则采用所述种
子数据对所述互联网黑产识别模型进行迭代优化训练。
3.根据权利要求1所述的方法, 其特征在于, 所述采用基于人工智能AI自主学习规则的
互联网黑产 识别模型对所述IP地址和互联网流量数据进 行分析, 得到所述IP地址和互联网
流量数据是否为 黑产的识别结果, 具体包括:
S1: 设置迭代初始参数和最大迭代次数;
S2: 基于识别准确率和识别覆盖率对所述IP地址和互联网流量数据进行分析, 并基于
最大估计得到匹配度最优的互联网黑产识别方案;
S3: 判断所述匹配度最优的互联网黑产识别方案是否满足预设的评估条件, 如果满足,
则转到步骤S6; 如果 不满足, 则转到步骤S4;
S4: 对所述识别准确率和识别覆盖率进行深度半监 督学习;
S5: 将迭代次数加1, 并判断当前迭代次数是否小于所述最大迭代次数, 若是, 返回执行
步骤S2, 若否, 则执 行步骤S6;
S6: 将所述匹配度最优的互联网黑产识别方案作为最终的互联网黑产识别方案, 得到
所述IP地址和互联网流 量数据是否为 黑产的识别结果。
4.根据权利要求3所述的方法, 其特征在于, 所述基于识别准确率和识别覆盖率对所述
IP地址和互联网流量数据进 行分析, 并基于最大估计得到匹配度最优的互联网黑产识别方
案中, 所述 最大估计根据以下计算公式得到:
式中, k为迭代次数, i、 j和t为维度; m、 n和p分别为i、 j和t的最大维度值,
为第k次
迭代时的最大估计,
为第k次迭代时的识别覆盖率, CGmax为历史最大黑产识别覆盖率,
为第k次迭代时的识别准确率, WGmin为历史最大黑产识别准确率。
5.根据权利要求3所述的方法, 其特征在于, 所述判断所述匹配度最优的互联网黑产识
别方案是否满足预设的评估条件, 具体根据以下公式进行判断:权 利 要 求 书 1/3 页
2
CN 115426167 A
2式中, k为迭代次数, i、 j和t为维度, m、 n和p分别为i、 j和t的最大维度 值;
为第k次迭
代时的识别覆盖率,
为第k次迭代时的识别准确率, P为概率,
为第k次迭代时的
最大估计,
为第0次迭代时的最大估计。
6.根据权利要求5所述的方法, 其特征在于, 所述对所述识别准确率和 识别覆盖率进行
深度半监 督学习, 具体根据以下公式进行深度半监 督学习:
式中,
主要包含
三方面的信息向量,
为第k+1次迭代时的
识别覆盖率, κ 为调整系数,
为第k+1次迭代时的识别准确率, Bijtk+1为第k+1次迭代时的
深度半监 督学习因子;
其中, 深度半监 督学习因子Bijtk+1根据以下公式得到:
式中, CGmax为历史最大黑产识别覆盖率, WGmin为历史最大黑产识别准确率。
7.一种黑产识别装置, 其特 征在于, 包括:
识别请求获取模块, 用于获取终端发送的黑产识别请求, 所述黑产识别请求携带IP地
址和互联网流 量数据;
分析识别模块, 与所述识别请求获取模块连接, 用于采用基于人工智能AI自主学习规
则的互联网黑产识别模型对 所述IP地址和互联网流量数据进 行分析, 得到所述IP地址和互
联网流量数据是否为 黑产的识别结果;
识别结果发送模块, 与所述分析识别模块连接, 用于将所述识别结果返回给终端。
8.根据权利要求7 所述的装置, 其特 征在于, 所述装置还 包括:
种子数据获取模块, 用于获取一个或多个威胁情 报中黑产数据对应的种子数据;权 利 要 求 书 2/3 页
3
CN 115426167 A
3
专利 一种黑产识别方法、装置及计算机可读存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:05:32上传分享