说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210936701.0 (22)申请日 2022.08.05 (71)申请人 福建警察学院 地址 350007 福建省福州市仓山区首山路 59号 (72)发明人 陈旖 陈淑珍 金华松 翁武焰  许发见 张美璟 徐会军 程仲汉  张华 郑清安 黄云峰 丁强  (74)专利代理 机构 福州盈创知识产权代理事务 所(普通合伙) 35226 专利代理师 李明通 (51)Int.Cl. G06F 16/958(2019.01) G06F 16/951(2019.01) G06F 16/31(2019.01)G06F 16/33(2019.01) G06F 40/211(2020.01) G06F 40/247(2020.01) G06F 40/289(2020.01) G06N 20/00(2019.01) H04L 9/40(2022.01) (54)发明名称 一种针对境外网络攻击威胁情报的识别与 处理方法及系统 (57)摘要 本申请提供一种针对境外网络攻击威胁情 报的识别与处理方法及系统, 具体应用于文本处 理领域, 包括: 采集新增页面, 采用多种分析引擎 得到多种结构化文本数据; 合并后得到新增情报 记录; 采用情报质量评价算法对新增情报记录评 分, 得到评分结果; 将新增情报记录和相应的评 分结果添加至情报数据库; 进而生成每日简报并 更新搜索引擎索引。 由此能够及时有效地识别境 外网络攻击威胁情 报, 提升网络安全性。 权利要求书2页 说明书9页 附图2页 CN 115470430 A 2022.12.13 CN 115470430 A 1.一种针对境外网络攻击威胁情 报的识别与处 理方法, 其特 征在于, 包括: 步骤S1: 每日预设时段采集任一网站的多个新增页面; 步骤S2: 初始化文本队列; 步骤S3: 依次提取所述新增页面中的文本数据, 并将所述文本数据依次缓存至所述文 本队列中; 步骤S4: 依次提取 所述文本队列中的文本数据, 通过 预处理得到标准 化文本数据; 步骤S5: 分别采用多种分析引擎识别所述标准 化文本数据, 得到多种结构化文本数据; 步骤S6: 将所述多种结构化文本数据合并, 得到新增情报记录; 将所述新增 情报记录依 次添加至情 报数据库; 步骤S7: 依次读取所述情报数据库中的新增情报记录, 采用情报质量评价算法对所述 新增情报记录进行评分, 得到 评分结果; 步骤S8: 根据所述新增情报记录和所述评分结果的对应关系, 将所述评分结果依次添 加至所述情 报数据库。 2.根据权利要求1所述的针对境外网络攻击威胁情报的识别与处理方法, 其特征在于, 所述步骤S1: 每日预设时段采集任一网站的多个新增页面, 具体包括: 每日预设时段从配置文件中读取任一网站的目录地址; 基于所述目录地址 爬取该网站对应的多个页面 地址; 将所述多个页面 地址与情 报数据库匹配; 若匹配, 则剔除该页面地址对应的页面; 若不匹配, 则该页面地址对应的页面是新增页 面。 3.根据权利要求1所述的针对境外网络攻击威胁情报的识别与处理方法, 其特征在于, 所述通过预处理得到标准 化文本数据, 具体包括: 将所述文本队列中的文本数据中的繁体字转换为简体字, 并过滤特殊符号, 得到初步 文本内容; 对所述初步文本内容进行分句、 分词, 得到分词结果; 对所述分词结果进行同义词替换处 理, 得到标准 化文本内容。 4.根据权利要求1所述的针对境外网络攻击威胁情报的识别与处理方法, 其特征在于, 所述步骤S 5: 分别采用多种分析引擎识别所述标准化文本数据, 得到多种结构化文本数据, 具体包括: 分别采用正则表达式、 启发式算法 以及机器学习算法构建第一分析引擎、 第二分析引 擎和第三分析引擎; 分别采用所述第一分析引擎、 所述第 二分析引擎和所述第 三分析引擎识别所述标准化 文本数据, 得到第一结构化文本数据、 第二结构化文本数据和第三结构化文本数据。 5.根据权利要求4所述的针对境外网络攻击威胁情报的识别与处理方法, 其特征在于, 所述步骤S6: 将所述多种结构化数据合并, 得到新增情 报记录, 具体包括: 合并所述第一结构化文本数据、 所述第二结构化文本数据和所述第三结构化文本数 据, 得到新增情 报记录。 6.根据权利要求4所述的针对境外网络攻击威胁情报的识别与处理方法, 其特征在于, 采用机器学习算法构建第三分析引擎包括:权 利 要 求 书 1/2 页 2 CN 115470430 A 2将专业术语库、 地 域术语库、 地 域习语库以及地 域流行词库 作为训练集; 采用机器学习算法对第三分析引擎进行训练和优化。 7.根据权利要求1所述的针对境外网络攻击威胁情报的识别与处理方法, 其特征在于, 所述情报质量评价 算法包括: 将专业术语库、 地 域术语库、 地 域习语库以及地 域流行词库 作为训练集; 对所述情 报质量评价 算法的参数进行优化。 8.根据权利要求1所述的针对境外网络攻击威胁情报的识别与处理方法, 其特征在于, 该方法还包括: 读取所述情报数据库中当日新增情 报记录和对应的评分结果; 按照预设模板, 将所述 新增情报记录和所述评分结果 转换为每日简报; 通过网页附件或邮件的形式发布所述每日简报。 9.根据权利要求8所述的针对境外网络攻击威胁情报的识别与处理方法, 其特征在于, 该方法还包括: 搜索引擎读取 所述情报数据库中当日新增情 报记录和对应的评分结果; 更新所述搜索引擎索引。 10.一种针对境外网络攻击威胁情 报的识别与处 理系统, 其特 征在于, 包括: 页面采集模块, 用于每日预设时段采集任一网站的多个新增页面; 队列初始化模块, 用于初始化文本队列; 缓存模块, 用于依次提取所述新增页面中的文本数据, 并将所述文本数据依次缓存至 所述文本队列中; 数据预处理模块, 用于依次提取所述文本队列中的文本数据, 通过预处理得到标准化 文本数据; 数据结构化模块, 用于分别采用多种分析引擎识别所述标准化文本数据, 得到多种结 构化文本数据; 数据库操作模块, 用于将所述多种结构化文本数据合并, 得到新增情报记录; 将所述新 增情报记录依次添加至情 报数据库; 评分模块, 用于依次读取所述情报数据库中的新增情报记录, 采用情报质量评价算法 对所述新增情报记录进行评分, 得到 评分结果; 所述数据库操作模块, 进一步用于根据所述新增情报记录和所述评分结果的对应关 系, 将所述评分结果依次添加至所述情 报数据库。权 利 要 求 书 2/2 页 3 CN 115470430 A 3

PDF文档 专利 一种针对境外网络攻击威胁情报的识别与处理方法及系统

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种针对境外网络攻击威胁情报的识别与处理方法及系统 第 1 页 专利 一种针对境外网络攻击威胁情报的识别与处理方法及系统 第 2 页 专利 一种针对境外网络攻击威胁情报的识别与处理方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:27:40上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。