全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211228653.6 (22)申请日 2022.10.08 (71)申请人 浙江网安信创电子技 术有限公司 地址 315000 浙江省宁波市海曙区丽园南 路501号609-611/613-615室 (72)发明人 刘晶 唐梓文 王淳  (74)专利代理 机构 杭州奇炬知识产权代理事务 所(特殊普通 合伙) 33393 专利代理师 贺心韬 (51)Int.Cl. G06N 20/00(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 结合因果关系推断、 机器学习深度学习的异 常检测方法 (57)摘要 本发明公开了结合因果关系推断、 机器学习 深度学习的异常检测方法, 具体涉及数据异常检 测领域, 具体检测步骤如下: S1、 读取数据集, 并 将数据集分为特征数据和标签数据; S2、 使用因 果关系推断算法提取特征数据中的最优特征等。 本发明在保证模型精确率损失在可控范围的前 提下, 为提高异常检测模型的鲁棒性、 可解释性 和抗对抗攻击的能力, 先使用因果关系推断提取 数据的马尔可夫毯特征变量, 设计深度学习模型 提取非马尔可夫毯特征变量数据的信息, 融合马 尔可夫毯特征变量数据与提取的非马尔可夫毯 特征变量数据的信息, 基于融合的新数据集使用 机器学习/深度学习模型进行学习、 检测, 摆脱了 以往基于机器学习检测方法缺乏鲁棒性、 可解释 性的不足。 权利要求书2页 说明书6页 附图1页 CN 115545212 A 2022.12.30 CN 115545212 A 1.结合因果关系推断、 机器学习深度 学习的异常检测方法, 其特征在于: 具体检测步骤 如下: S1、 读取数据集, 并将数据集分为特 征数据和标签数据; S2、 使用因果关系推断算法提取 特征数据中的最优特 征; S3、 设计深度学习子模型提取 特征数据中的非最优特 征信息; S4、 融合S2中最优特 征数据与S3中提取的信息, 形成新特 征数据集; S5、 设计/使用机器学习/深度学习模型对融合后的新特 征数据集进行 学习; S6、 基于学习的模型进行异常检测。 2.根据权利要求1所述的结合因果关系推断、 机器学习深度 学习的异常检测方法, 其特 征在于: 所述步骤S1中读取的数据集设置为DGraph金融风控脱敏数据集, 该数据集包含 3700500个采样数据, 含17个特 征列以及1个标签列。 3.根据权利要求2所述的结合因果关系推断、 机器学习深度 学习的异常检测方法, 其特 征在于: 所述 步骤S2具体包括: S2.1、 基于IAMB算法编写Pytho n代码: S2.11:首先编写变量间条件独立判断函数, 阀值设为0.01, 如果变量是离散变量, 则 使 用G平方独立 性检验方法; 如果变量是 连续性变量, 则使用费舍尔条件独立 性检验方法; S2.12:其次, 编写IAMB主函数, 该函数分为前向阶段和后向阶段, 在前向阶段, 循环数 据集各个特征数据变量, 调用条件独立判断函数判断各个特征数据变量在给定阀值条件下 是否与标签数据变量条件独立, 得到前向阶段的特征数据变量集; 在后向阶段, 针对前向阶 段的特征数据变量集, 再次调用条件独立判断函数对这些变量相互间的独立性进行判断, 如果某特 征数据变量 不独立于其它特 征数据变量, 则从拷贝的特 征数据变量 集中删除; S2.13:输出最终的与标签数据变量相互独立的特征数据变量列表, 即标签数据变量的 马尔可夫毯特征; S2.2:使用编写IAMB算法代码, 将特征列数据作 为输入, 经计算得到标签数据变量的马 尔可夫毯特征为第1、 2、 7、 15列, 共4列特 征。 4.根据权利要求3所述的结合因果关系推断、 机器学习深度 学习的异常检测方法, 其特 征在于: 所述步骤S3中针对第3、 4、 5、 6、 8~14、 16、 17共13列非马尔可夫特征列, 设计深度学 习子模型, 并基于PyTorch机器学习计算框架, 编写代码提取其信息, 最终输出1列特征, 具 体步骤是: S3.1: 提取非马尔可夫特征列数据赋给变量without_mb_data, 调用reshape函数, 将 该 数据维度转换为(1,3 700550,13), 然后使用torch库中fro m_numpy函数将numpy数据类型转 换为张量数据类型, 并调用permute(2,0,1)转换 数据维度; S3.2: 使用torch库中nn.Conv1  d函数创建卷积层, 具体参数为input_channels=1, out_channels=1,kernel_size=2,pad ding=’same’; S3.3: 对步骤步骤S3.2的输出使用torc h.tanh激活函数; S3.4: 使用 torch.squeeze函数对步骤S3.3的输出进行维度压缩, 参数设为1, 再使用 torch.permute函数转换维度, 参数为(1, 0), 转换后的数据作为输入给全连接层; S3.5: 全连接层使用torch.nn.Linear函数创建, 具体参数为in_features=13,out_ features= 4;权 利 要 求 书 1/2 页 2 CN 115545212 A 2S3.6: 将步骤步骤S3.4的输出使用torc h.softmax激活函数, dim 设为1; S3.7: 使用torch.detach().numpy()函数将步骤S3.6的输出转为numpy数据类型, 更 新变量without_mb_data数据。 5.根据权利要求4所述的结合因果关系推断、 机器学习深度 学习的异常检测方法, 其特 征在于: 所述步骤S4中具体步骤为直接使用拼接方法将步骤S2提取的第1、 2、 7、 15列数据 mb_data与步骤S3提取的w ithout_mb_data数据进行融合。 6.根据权利要求5所述的结合因果关系推断、 机器学习深度 学习的异常检测方法, 其特 征在于: 所述步骤S5中将步骤S4融合的新数据集输入至使用minibatch方法的图神经网络 模型, epoc hs设为100, 使用GPU 进行训练。权 利 要 求 书 2/2 页 3 CN 115545212 A 3

.PDF文档 专利 结合因果关系推断、机器学习深度学习的异常检测方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 结合因果关系推断、机器学习深度学习的异常检测方法 第 1 页 专利 结合因果关系推断、机器学习深度学习的异常检测方法 第 2 页 专利 结合因果关系推断、机器学习深度学习的异常检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:14:10上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。