专利 一种恶意软件检测模型的构建方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211278554.9 (22)申请日 2022.10.19 (71)申请人中国农业银行股份有限公司地址 100005 北京市东城区建国门内大街 69号 (72)发明人姚成　 (74)专利代理机构北京集佳知识产权代理有限公司 11227 专利代理师刘翠香 (51)Int.Cl. G06F 21/56(2013.01) G06K 9/62(2022.01) (54)发明名称一种恶意软件检测模型的构建方法及装置 (57)摘要本发明实施例公开了一种恶意软件检测模型的构建方法及装置，方法包括：获得包含恶意软件和安全软件的样本数据；通过软件逆向工程对所述样本数据进行处理，提取出所述样本数据中的API特征；基于Apriori算法和Fp ‑growth算法处理得到所述API特征的有用频繁集；对所述有用频繁集进行权重处理；基于权重处理后的有用频繁集构建能够识别恶意软件的第一分类器。上述内容提出了一种结合了多种算法的恶意软件检测模型的构建方案，其在检测精确度和检测效率上均有优于其他检测模型的特点。权利要求书2页说明书8页附图7页 CN 115438344 A 2022.12.06 CN 115438344 A 1.一种恶意软件检测模型的构建方法，其特征在于，包括：获得包含恶意软件和安全软件的样本数据；通过软件逆向工程对所述样本数据进行处理，提取出所述样本数据中的API特征；基于Apri ori算法和Fp ‑growth算法处理得到所述API特征的有用频繁集；对所述有用频繁集进行权重处理；基于权重处理后的有用频繁集构建能够识别恶意软件的第一分类器。 2.根据权利要求1所述的恶意软件检测模型的构建方法，其特征在于，在所述基于权重处理后的有用频繁构建能够识别恶意软件的第一分类器，包括：对所述第一分类器进行参数循环调优，得到检测准确率最高的模型参数。 3.根据权利要求1所述的恶意软件检测模型的构建方法，其特征在于，所述基于 Apriori算法和Fp ‑growth算法处理得到所述API特征的有用频繁集，包括：基于Apri ori算法和Fp ‑growth算法处理得到所述API特征的初始频繁集；过滤掉所述初始频繁集中的无用频繁集，得到有用频繁集，其中，所述无用频繁集表征安全软件样本数据的频繁集和恶意软件样本数据的频繁集中相同的频繁集。 4.根据权利要求1所述的恶意软件检测模型的构建方法，其特征在于，所述对所述有用频繁集进行权重处理，包括：基于所述有用频繁集中每一个频繁集出现的次数对所有的有用频繁集进行升序排列，其中，出现的次数越多，对应的有用频繁集的权重越高。 5.根据权利要求1所述的恶意软件检测模型的构建方法，其特征在于，所述基于权重处理后的有用频繁集构建能够识别恶意软件的第一分类器，包括：配置基于设定阈值和计算数值的比较结果输出分类结果的第一分类器，其中，所述计算输出为有用频繁集的权重和支持度相乘的结果，其中的支持度与API特征的的出现频率有关。 6.根据权利要求1所述的恶意软件检测模型的构建方法，其特征在于，还包括：通过软件逆向工程对所述样本数据进行处理，提取出所述样本数据中的权限特征；基于所述权限特征构建第二分类器，所述第二分类器包括朴素贝叶斯分类器和K最近邻分类器。 7.根据权利要求6所述的恶意软件检测模型的构建方法，其特征在于，所述基于所述权限特征构建第二分类器，包括：采用Weka工具对权限信息进行增益排序，去除冗余特征；采用Apri ori算法获得所述权限信息的频繁集；基于所述频繁集分别构建朴素贝叶斯分类器和K最近邻分类器。 8.根据权利要求6所述的恶意软件检测模型的构建方法，其特征在于，还包括：获得待测样本；将所述待测样本分别输入所述第一分类器和所述第二分类器，获得对应的第一分类结果和第二分类结果；基于所述第一分类结果和所述第二分类结果确定最终的分类结果。 9.根据权利要求1所述的意软件检测模型的构建方法，其特征在于，所述通过软件逆向工程对所述样本数据进行处理，提取出所述样本数据中的API特征，包括：权　利　要　求　书 1/2 页 2 CN 115438344 A 2采用反编译工具编写代码实现从所述样本数据中提取出API特征。 10.一种恶意软件检测模型的构建装置，其特征在于，包括：样本获得模块，用于获得包含恶意软件和安全软件的样本数据；特征提取模块，用于通过软件逆向工程对所述样本数据进行处理，提取出所述样本数据中的API特征；频繁集获得模块，用于基于Apriori算法和 Fp‑growth算法处理得到所述API特征的有用频繁集；权重处理模块，用于对所述有用频繁集进行权重处理；分类器构建模块，用于基于权重处理后的有用频繁集构建能够识别恶意软件的第一分类器。权　利　要　求　书 2/2 页 3 CN 115438344 A 3

专利 一种恶意软件检测模型的构建方法及装置

专利一种恶意软件检测模型的构建方法及装置