专利一种基于机器学习的电信诈骗潜在受害者预测方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211190624.5 (22)申请日 2022.09.28 (71)申请人联通（广东）产业互联网有限公司地址 510000 广东省广州市黄埔区(中新广州知识城)亿创街1号 406房之555 (72)发明人马成　 (74)专利代理机构广州润禾知识产权代理事务所(普通合伙) 44446 专利代理师郑永泉 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/30(2012.01) G06N 20/00(2019.01) (54)发明名称一种基于机器学习的电信诈骗潜在受害者预测方法 (57)摘要本发明涉及电信诈骗预防领域，具体涉及一种基于机器学习的电信诈骗潜在受害者预测方法，其中包括样本构建方法，将受害者和普通人在单位时间内的APP使用情况作为样本；模型构建方法：基于不同受害类型构建若干机器学习分类模型；应用所构建的样本对所述若干机器学习分类模型进行训练和验证，得到不同受害类型的电信诈骗潜在受害者预测模型。通过APP使用情况，可以全面了解用户的生活习惯和个人需求，从而更加精准地判断出潜在受害者，为事前防诈骗宣传提供了准确的目标，在进行防诈骗宣传时重点针对潜在受害者进行，提高了效率同时节约了成本。权利要求书2页说明书7页附图2页 CN 115511184 A 2022.12.23 CN 115511184 A 1.一种基于机器学习的电信诈骗潜在受害者预测的样本构建方法，其特征在于，将受害者和普通人在单位时间内的AP P使用情况作为样本。 2.根据权利要求1所述的一种基于机器学习的电信诈骗潜在受害者预测的样本构建方法，其特征在于，步骤包括： S1、采集受害者和普通人在单位时间内的APP使用情况，并根据受害者的受害类型设置不同的受害类型标签； S2、通过不同受害类型的受害者的APP使用情况得到各APP基于受害类型标签的支持度、置信度、提升度，根据支持度、置信度、提升度以及实际情况选取若干APP作为该受害类型的关联AP P； S3、根据关联APP对S1采集的APP使用情况进行处理，得到关联APP使用情况数据表，作为训练电信诈骗潜在受害者预测模型的样本。 3.根据权利要求2所述的一种基于机器学习的电信诈骗潜在受害者预测的样本构建方法，其特征在于， S1所述的单位时间为受害者报警前20天至40天。 4.根据权利要求2所述的一种基于机器学习的电信诈骗潜在受害者预测的样本构建方法，其特征在于， S2所述的通过不同受害类型的受害者的APP使用情况得到各APP基于受害类型标签的支持度、置信度、提升度，具体为：将APP名称与受害类型标签组成项集，对项集使用频繁模式挖掘算法，得到以APP名称为前件，受害类型标签为后件的关联规则，及其支持度、置信度和提升度。 5.根据权利要求2所述的一种基于机器学习的电信诈骗潜在受害者预测的样本构建方法，其特征在于， S2所述根据支持度、置信度、提升度以及实际情况选取若干APP作为该受害类型的关联APP，具体为：以提升度为主要判断指标，对各APP进行排序，并结合实际情况，选出与受害类型标签关联度最高的若干AP P作为该受害类型标签下的关联AP P。 6.根据权利要求2所述的一种基于机器学习的电信诈骗潜在受害者预测的样本构建方法，其特征在于， S3步骤具体包括： S301、根据受害者的受害类型，将受害者样本添加受害类型标签，将普通人样本添加普通人标签； S302、根据受害者样本和普通人样本构建AP P使用情况数据表； S303、根据关联APP对APP使用情况数据表进行特征选择，得到不同受害类型的关联APP 使用情况数据表； S304、去除关联APP使用情况数据表中未使用该受害类型关联APP的样本，得到不同受害类型去噪后的关联AP P使用情况数据表； S305、对去噪后的关联APP使用情况数据表进行编码，普通人标签编码为0，受害类型标签编码为1，得到不同受害类型编码后的关联AP P使用情况数据表； S306、对编码后的关联APP使用情况数据表进行降采样，使普通人样本与受害者样本数量相同，得到不同受害类型降采样后的关联AP P使用情况数据表； S307、将不同受害类型降采样后的关联APP使用情况数据表作为训练不同受害类型的电信诈骗潜在受害者预测模型的样本。 7.根据权利要求6所述的一种基于机器学习的电信诈骗潜在受害者预测的样本构建方法，其特征在于， S302所述构建APP使用情况数据表，具体为：构建以用户isdn为索引，各APP权　利　要　求　书 1/2 页 2 CN 115511184 A 2名称为字段的APP使用情况数据表，其中每一位用户使用过的APP编码为1，未使用的APP编码为0。 8.根据权利要求1所述的一种基于机器学习的电信诈骗潜在受害者预测的样本构建方法，其特征在于，还包括：将构建的样本一部分作为训练集，另一部分作为验证集。 9.一种基于机器学习的电信诈骗潜在受害者预测的模型构建方法，其特征在于，包括：基于不同受害类型构建若干机器学习分类模型；应用权利要求1 ‑8任一项所构建的样本对所述若干机器学习分类模型进行训练和验证，得到不同受害类型的电信诈骗潜在受害者预测模型。 10.一种基于机器学习的电信诈骗潜在受害者预测方法，其特征在于，包括：获取全体用户在单位时间内的APP使用情况，构建不同受害类型的关联APP使用情况数据表；将不同受害类型的关联APP使用情况数据表输入权利要求8得到的对应的受害类型的电信诈骗潜在受害者预测模型；不同受害类型的电信诈骗潜在受害者预测模型分别输出对应的预测标签，所述预测标签包括受害类型标签和普通人标签。权　利　要　求　书 2/2 页 3 CN 115511184 A 3

专利 一种基于机器学习的电信诈骗潜在受害者预测方法

专利一种基于机器学习的电信诈骗潜在受害者预测方法