说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211308160.3 (22)申请日 2022.10.25 (71)申请人 西安理工大 学 地址 710048 陕西省西安市碑林区金花 南 路5号 (72)发明人 孙钦东 王艳 王伟 杨志海 许航 (74)专利代理 机构 西安弘理专利事务所 61214 专利代理师 王奇 (51)Int.Cl. G06F 21/56(2013.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于深度学习的Android恶意程序检测 方法 (57)摘要 本发明公开了一种基于深度学习的Andr oid 恶意程序检测方法, 步骤包 括: 收集Android恶 意 AKP样本和正 常AKP样本, 通过反编工 具输出反编 译文件, 提取反编译文件权限特征、 API特征和3 ‑ Gram特征, 并转化为特征向量作为训练接样本, 对建立的CNN ‑BiLSTM‑Attention模型, 该模型过 CNN获取样本的局部 特征, BiLS TM获取全局特征, 在BiLSTM中采用注意力机制来降低噪声干扰、 突 出重要特征; 最后将两类特征进行融合训练, 之 后采用训练好的CNN ‑BiLSTM‑Attention模型进 行恶意程序检测。 本发明解决了使用单特征导致 的覆盖面不够广泛的问题, 提高模 型的预测准确 率。 权利要求书2页 说明书7页 附图3页 CN 115510445 A 2022.12.23 CN 115510445 A 1.一种基于深度学习的Andro id恶意程序检测方法, 其特 征在于, 具体步骤为: 步骤1, 收集Andro id恶意AKP样本和正常AKP样本, 通过反编工具输出反编译 文件; 步骤2, 提取反编译 文件中的权限特 征、 API特 征和3‑Gram特征, 并转化为特征向量; 步骤3, 建立CNN ‑BiLSTM‑Attention模型, 采用步骤2得到的特征向量作为样本集对 CNN‑BiLSTM‑Attention模型进行训练; 所述CNN‑BiLSTM‑Attention模型包括输入层、 词嵌入层、 融合注意力机制的双向长短 期记忆(BiLSTM)模块、 卷积层、 全 连接层、 Softmax层; 在训练模 型时首先需要在词嵌入层使 用Word2vec进行特征 向量化处理, CNN会对特征 向量矩阵进行卷积操作, 使用max ‑pooling 提取最大值并重新组成特征向量得到局部特征; 然后使用BiLSTM捕获双向依赖, 对特征向 量矩阵提取全局上下文信息, 并使用注 意力机制Attention突出重要 特征; 计算最终输出首 先要计算出上下文隐状态, 再使用 它和上一时刻的隐状态得出注意力概率, 通过概率对上 下文隐状态加权求和并经过变换后得到最终输出; 将两个模型中的特征融合, 为了使该网 络也能表达非线性映射, 需要引入激活函数, 并使用Softmax实现对应用样本的分类; 步骤4, 对于待检测的程序, 采用步骤2方法得到特征向量并输入至训练好的CNN ‑ BiLSTM‑Attention模型中进行检测, 得到检测结果。 2.如权利要求1所述的一种基于深度学习的Android恶意程序检测方法, 其特征在于, 所述步骤1具体为反编译命令apktool.bat d–f[apk文件路径][输出文件夹路径]生成包括 AndroidManifest.xml文件、 s mali文件的反编译 文件。 3.如权利要求2所述的一种基于深度学习的Android恶意程序检测方法, 其特征在于, 所述权限特征的提取方法为: AndroidManifest.xml文件的<uses ‑permission>标签中提取 包含.permis sion.的语句即为权限特 征; 所述API特 征的提取 方法为: 所述s mali文件中遍历以 “invoke‑”开头的行进行提取; 所述3‑Gram特征的提取方法为: 所述smali文件中使用Dalvik指令分类规则, 去除对分 类结果无影响的指 令, 简化为可以表达出语义的指 令, 根据指 令的功能进 行分类, 将功能相 同或相近的指令分为一类, 并用七种字母标签代表精简后的一类指令; 使用3 ‑Gram模型中 长度为3的滑动窗口来获取 数据, 将一条语句变为多个长度为 N的片段, 即为3 ‑Gram特征。 4.如权利要求1所述的一种基于深度学习的Android恶意程序检测方法, 其特征在于, 所述CNN‑BiLSTM‑Attention模型的训练过程 为: 首先, 将样本集作 为输入, 然后使用Word2vec在嵌入层将样本特征转化为特征向量; 其 次, 所述卷积神经网络选用3、 4、 5三种大小的卷积核各128个, 在卷积层中对特征向量矩阵 进行卷积处理, 使用最大池化法提取最大值并重新组成特征向量得到局部特征Cccn; 采用对 特征向量输入引入注意力机制的BiLSTM网络得到全局上下文信息特征Cblistm, 最后再全连 接层将两个特征进行融合引入激活函数, 采用梯度下降算法Adam进行训练, 使用Softmax实 现对应用样本的分类。 5.如权利要求4所述的一种基于深度学习的Android恶意程序检测方法, 其特征在于, 在所述卷积神经网络训练的过程中, 假设卷积核大小为h ×v, h为卷积核高度, v为词向量 维 度, w为权重矩阵, Xn+h‑1为向量矩阵, b为偏置项, f为激活函数, 卷积计算公式为: Ci=f(w*Xi:i+h‑1+b) 经CNN卷积处理最大池化法选取 特征向量的最大值, 最大池化计算公式为:权 利 要 求 书 1/2 页 2 CN 115510445 A 2Ccnn=max{Ci}。 6.如权利要求4所述的一种基于深度学习的Android恶意程序检测方法, 其特征在于, 使用双向长 短期记忆网络模型来提取全局上下文信息, 使得训练出来的模 型不再只和单词 自身相关, 而和语境的关系更加密切; 若 为正序LSTM, 为逆序LSTM, 则Bi LSTM的输出状态 为正逆序的组合, Bi LSTM计算公式为: 不同特征对分类的影响程度不同, 为了突出重要特征、 减弱无关特征的影响程度, 同时 引入了Attention注意力机制, 为不同的特征信息分配不同程度的注意力; 设T为输入向量 的长度, hj表示输入向量 经过解码后的隐藏层状态, 注意力概率αij表示输入词xj对当前词yi 的注意力概 率, 则分配注意力后的全局上 下文信息特 征 计算公式为: 其中 score由前一时刻状态Si‑1和hj计算得到 。权 利 要 求 书 2/2 页 3 CN 115510445 A 3
专利 一种基于深度学习的Android恶意程序检测方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:24:15
上传分享
举报
下载
原文档
(551.6 KB)
分享
友情链接
GB-T 37935-2019 信息安全技术 可信计算规范 可信软件基.pdf
DB12-T 669-2016 绿色供应链标准化工作指南 天津市.pdf
GB-T 31757-2015 户外用防腐实木地板.pdf
GB/T 36621-2018 智慧城市 信息技术运营指南.pdf
WS 373.1-2012 医疗服务基本数据集 第1部分:门诊摘要.pdf
2023数据要素生态研究报告.pdf
GB-T 40665.4-2021 中医四诊操作规范 第4部分:切诊.pdf
GM-T 0003.4-2012 SM2椭圆曲线公钥密码算法第4部分:公钥加密算法.pdf
GB-T 15780-1995 竹材物理力学性质试验方法.pdf
GB-T 38775.2-2020 电动汽车无线充电系统 第2部分:车载充电机和无线充电设备之间的通信协议.pdf
GB-T 18154-2000 监控式抑爆装置技术要求.pdf
GB-T 41793-2022 人造革合成革试验方法 潜在酚黄变的测定.pdf
GB-T 14406-2011 通用门式起重机.pdf
GB-T 40593-2021 同步发电机调速系统参数实测及建模导则.pdf
GB-T 36412-2018 力标准机的检验与校准.pdf
GB-T 21511.2-2008 纳米磷灰石-聚酰胺复合材料 第2部分:技术要求.pdf
GB-T 41389-2022 信息安全技术 SM9密码算法使用规范.pdf
DB43-T 2632.6-2023 烟叶生产收购站管理规范 第6部分:数字化管理 湖南省.pdf
DB63-T 2070-2022 自然保护区数据库建设和更新技术规范 青海省.pdf
DB42-T 2226.3-2024 自然资源政务一张图应用规范 第3部分:数据共享交换 湖北省.pdf
1
/
13
评价文档
赞助2.5元 点击下载(551.6 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。