全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211190624.5 (22)申请日 2022.09.28 (71)申请人 联通 (广东) 产业互联网有限公司 地址 510000 广东省广州市黄埔区(中新广 州知识城)亿创街1号 406房之555 (72)发明人 马成  (74)专利代理 机构 广州润禾知识产权代理事务 所(普通合伙) 44446 专利代理师 郑永泉 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/30(2012.01) G06N 20/00(2019.01) (54)发明名称 一种基于机器学习的电信诈骗潜在受害者 预测方法 (57)摘要 本发明涉及电信诈骗预防领域, 具体涉及一 种基于机器学习的电信诈骗潜在受害者预测方 法, 其中包括样本构建方法, 将受害者和普通人 在单位时间内的APP使用情况作为样本; 模型构 建方法: 基于不同受害类型构建若干机器学习分 类模型; 应用所构建的样本对所述若干机器学习 分类模型进行训练和验证, 得到不同受害类型的 电信诈骗潜在受害者预测模型。 通过APP使用情 况, 可以全面了解用户的生活习惯和个人需求, 从而更加精 准地判断出潜在受害者, 为事前防诈 骗宣传提供了准确的目标, 在 进行防诈骗宣传时 重点针对潜在受害者进行, 提高了效率同时节约 了成本。 权利要求书2页 说明书7页 附图2页 CN 115511184 A 2022.12.23 CN 115511184 A 1.一种基于机器学习的电信诈骗潜在受害者预测的样本构建方法, 其特征在于, 将受 害者和普通人在单位时间内的AP P使用情况作为样本 。 2.根据权利要求1所述的一种基于机器学习的电信诈骗潜在受害者预测的样本构建方 法, 其特征在于, 步骤 包括: S1、 采集受害者和普通人在单位时间内的APP使用情况, 并根据受害者的受害类型设置 不同的受害类型 标签; S2、 通过不同受害类型的受害者的APP使用情况得到各APP基于受害类型标签的支持 度、 置信度、 提升度, 根据支持度、 置信度、 提升度以及实际情况选取若干APP作为该受害类 型的关联AP P; S3、 根据关联APP对S1采集的APP使用情况进行处理, 得到关联APP使用情况数据表, 作 为训练电信诈骗潜在受害者预测模型的样本 。 3.根据权利要求2所述的一种基于机器学习的电信诈骗潜在受害者预测的样本构建方 法, 其特征在于, S1所述的单位时间为受害者报警前20天至40天。 4.根据权利要求2所述的一种基于机器学习的电信诈骗潜在受害者预测的样本构建方 法, 其特征在于, S2所述的通过不同受害类型的受害者的APP使用情况得到各APP基于受害 类型标签的支持度、 置信度、 提升度, 具体为: 将APP名称与受害类型标签组成项集, 对项集 使用频繁模式挖掘算法, 得到以APP名称为前件, 受害类型标签为后件的关联规则, 及其支 持度、 置信度和提升度。 5.根据权利要求2所述的一种基于机器学习的电信诈骗潜在受害者预测的样本构建方 法, 其特征在于, S2所述根据支持度、 置信度、 提升度以及实际情况选取若干APP作为该 受害 类型的关联APP, 具体为: 以提升度为主要判断指标, 对 各APP进行排序, 并结合 实际情况, 选 出与受害类型 标签关联度最高的若干AP P作为该受害类型 标签下的关联AP P。 6.根据权利要求2所述的一种基于机器学习的电信诈骗潜在受害者预测的样本构建方 法, 其特征在于, S3步骤具体包括: S301、 根据受害者的受害类型, 将受害者样本添加受害类型标签, 将普通人样本添加普 通人标签; S302、 根据受害者样本和普通人样本构建AP P使用情况 数据表; S303、 根据关联APP对APP使用情况数据表进行特征选择, 得到不同受害类型的关联APP 使用情况 数据表; S304、 去除关联APP使用情况数据表中未使用该受害类型关联APP的样本, 得到不同受 害类型去噪后的关联AP P使用情况 数据表; S305、 对去噪后的关联APP使用情况数据表进行编码, 普通人标签编码为0, 受害类型标 签编码为1, 得到不同受害类型编码后的关联AP P使用情况 数据表; S306、 对编码后的关联APP使用情况数据表进行降采样, 使普通人样本与受害者样本数 量相同, 得到不同受害类型降采样后的关联AP P使用情况 数据表; S307、 将不同受害类型降采样后的关联APP使用情况数据表作为训练不同受害类型的 电信诈骗潜在受害者预测模型的样本 。 7.根据权利要求6所述的一种基于机器学习的电信诈骗潜在受害者预测的样本构建方 法, 其特征在于, S302所述构建APP使用情况数据表, 具体为: 构建以用户isdn为索引, 各APP权 利 要 求 书 1/2 页 2 CN 115511184 A 2名称为字段的APP使用情况数据表, 其中每一位用户使用过的APP编码为1, 未使用的APP编 码为0。 8.根据权利要求1所述的一种基于机器学习的电信诈骗潜在受害者预测的样本构建方 法, 其特征在于, 还 包括: 将构建的样本一部分作为训练集, 另一部分作为验证集。 9.一种基于 机器学习的电信诈骗潜在受害者预测的模型构建方法, 其特 征在于, 包括: 基于不同受害类型构建若干 机器学习分类模型; 应用权利要求1 ‑8任一项所构建的样本对所述若干机器学习分类模型进行训练和验 证, 得到不同受害类型的电信诈骗潜在受害者预测模型。 10.一种基于 机器学习的电信诈骗潜在受害者预测方法, 其特 征在于, 包括: 获取全体用户在单位时间内的APP使用情况, 构 建不同受害类型的关联APP使用情况数 据表; 将不同受害类型的关联APP使用情况数据表输入权利要求8得到的对应的受害类型的 电信诈骗潜在受害者预测模型; 不同受害类型的电信诈骗潜在受害者预测模型分别输出对应的预测标签, 所述预测标 签包括受害类型 标签和普通人 标签。权 利 要 求 书 2/2 页 3 CN 115511184 A 3

.PDF文档 专利 一种基于机器学习的电信诈骗潜在受害者预测方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于机器学习的电信诈骗潜在受害者预测方法 第 1 页 专利 一种基于机器学习的电信诈骗潜在受害者预测方法 第 2 页 专利 一种基于机器学习的电信诈骗潜在受害者预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:10:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。