(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221095214 4.1 (22)申请日 2022.08.09 (71)申请人 国网浙江省电力有限公司绍兴供电 公司 地址 312099 浙江省绍兴 市胜利东路58号 (72)发明人 沈健 张磊 袁誉峰 钱一宏  张永建 胡利辉 张晓峰 周金邢  施光南 蒋安杰 韩保礼 王雪颖  (74)专利代理 机构 杭州华鼎知识产权代理事务 所(普通合伙) 33217 专利代理师 王旭峰 (51)Int.Cl. G06F 16/215(2019.01) G06N 20/20(2019.01) G06Q 50/06(2012.01)G16Y 10/35(2020.01) G16Y 20/20(2020.01) (54)发明名称 一种基于 Xgboost集成学习的物联 终端类型 识别方法 (57)摘要 本发明涉及物联终端类型识别技术领域, 尤 其为一种基于Xgboo st集成学习的物联 终端类型 识别方法, 包括如下步骤: 对数据进行 终端识别, 基于流处理, 通过以MAC为中心的设备唯一识别 方法, 识别出网络中的终端, 并赋 予唯一的ID; 进 行终端类型识别, 通过特征提取、 特征筛选、 特征 转换、 类型预测, 识别出 终端的类型; 进行 纵向行 为画像, 在时间的维度, 对终端的公共行为、 特殊 行为进行画像: 进行横向行为画像, 以相同类型 的终端行为为基准, 对比当前终端的行为。 本发 明通过构建针对性强的行为画 像, 考虑了终端的 行为问题、 终端类型的问题、 终端的互补问题, 因 此特征处理和行为画像更加贴合物联网的终端 场景。 权利要求书2页 说明书6页 附图3页 CN 115510041 A 2022.12.23 CN 115510041 A 1.一种基于Xgbo ost集成学习的物联终端类型识别方法, 其特 征在于: 包括如下步骤: S1.1: 对数据进行终端识别, 基于流处理, 通过以MAC为 中心的设备唯一识别方法, 识别 出网络中的终端, 并赋予唯一的ID; S1.2: 进行终端类型识别, 通过特征提取、 特征筛选、 特征转换、 类型预测, 识别出终端 的类型; S1.3: 进行纵向行为画像, 在时间的维度, 对终端的公共行为、 特殊行为进行画像: S1.4: 进行横向行为画像, 以相同类型的终端行为 为基准, 对比当前终端的行为。 2.根据权利要求1所述的基于Xgboost集成学习的物联终端类型识别方法, 其特征在 于: 所述步骤S1.2中, 所述特 征提取包括数据清洗、 数据规范化和特 征衍生与提取。 3.根据权利要求1所述的基于Xgboost集成学习的物联终端类型识别方法, 其特征在 于: 所述步骤S1.2中, 所述特 征筛选采用过 滤法、 包装法和嵌入法。 4.根据权利要求1所述的基于Xgboost集成学习的物联终端类型识别方法, 其特征在 于: 通过对比模型对特征分布的要求、 模型的鲁棒性、 模型 的资源消耗情况、 模型的可更新 性、 模型的样本 外准确率, 选择基于Bo osting和树形模型的XGBo ost模型。 5.根据权利要求4所述的基于Xgboost集成学习的物联终端类型识别方法, 其特征在 于: 所述XGBo ost模型流 程如下: S2.1: 判断是否有主动扫描任务, 判断的同时进行旁路解析生成流量日志; 若有主动扫 描任务, 则根据用户指 定IP范围, 通过主动扫描任务 获取更多设备信息并生成日志, 否则采 集日志数据, 生成日志流并送入流处 理模型; S2.2: 判断设备是否存在, 设备存在则生成设备信息 并形成设备行为画像, 设备不存在 则更新设备信息和设备 行为画像; 同时对机器学习进行在线学习 、 改变模型成熟度 ∝d; S2.3: 设备行为画像进入设备画像流处理模块获得p d, 设备行为画像进入机器学习流 处理模块获得qd; S2.4: 得到最终判定rd。 6.根据权利要求5所述的基于Xgboost集成学习的物联终端类型识别方法, 其特征在 于: 所述步骤S2.3中, qd形成数据反馈 至模型成熟度 ∝d。 7.根据权利要求5所述的基于Xgboost集成学习的物联终端类型识别方法, 其特征在 于: 所述步骤S2.4中, rd形成用户反馈 至模型成熟度 ∝d。 8.根据权利要求5所述的基于Xgboost集成学习的物联终端类型识别方法, 其特征在 于: 所述模型建立完成后, 将终端行为画像送入训练好的模型中, 预测终端的类型, 取概率 最大的类型识别为终端的类型。 9.根据权利要求8所述的基于Xgboost集成学习的物联终端类型识别方法, 其特征在 于: 当模型判断的终端类型与用户的预期不符时, 用户通过在交互页面上简单地更新终端 的类型, 修 正该终端的类型, 同时更新模型。 10.根据权利要求9所述的基于Xgboost集成学习的物联终端类型识别方法, 其特征在 于: 所述模型 更新逻辑如下: S3.1: 判断用户是否更新了终端的类型; 若用户更新了终端类型, 记录该设备不同时间 段的行为画像; S3.2: 当行为画像数据积累到一定程度, 在原模型的基础上, 进一步训练模型, 且提高权 利 要 求 书 1/2 页 2 CN 115510041 A 2最新行为画像数据的权 重; S3.3: 保存训练好的新模型, 并将新模型应用到后续的预测中。权 利 要 求 书 2/2 页 3 CN 115510041 A 3

.PDF文档 专利 一种基于Xgboost集成学习的物联终端类型识别方法

安全报告 > 其他 > 文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于Xgboost集成学习的物联终端类型识别方法 第 1 页 专利 一种基于Xgboost集成学习的物联终端类型识别方法 第 2 页 专利 一种基于Xgboost集成学习的物联终端类型识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常2024-03-18 13:35:35上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。