(19)中华 人民共和国 国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210077475.5
(22)申请日 2022.01.24
(65)同一申请的已公布的文献号
申请公布号 CN 114124576 A
(43)申请公布日 2022.03.01
(73)专利权人 成都无糖信息技 术有限公司
地址 610000 四川省成 都市高新区吉瑞三
路99号1栋1单 元20层20 01号
(72)发明人 张浩 马永霄 漆伟 张瑞冬
童永鳌 朱鹏
(74)专利代理 机构 成都为知盾专利代理事务所
(特殊普通 合伙) 51267
代理人 李汉强
(51)Int.Cl.
H04L 9/40(2022.01)G06F 16/36(2019.01)
G06F 16/25(2019.01)
G06F 16/215(2019.01)
(56)对比文件
CN 110413707 A,2019.1 1.05
CN 112200382 A,2021.01.08
CN 113254844 A,2021.08.13
CN 110290116 A,2019.09.27
CN 112073415 A,2020.12.1 1
US 2020120109 A1,2020.04.16
张奕等.基 于知识图谱的恶意 域名检测方
法. 《通信技 术》 .2020, (钓鱼 s 网站).
许振亮等.电信诈骗研究的知识图谱分析.
《中国刑警学院学报》 .2017, (诈骗 s 网站) and
(知识 s 图谱).
审查员 文华胤
(54)发明名称
一种基于知识图谱的诈骗网站关联方法及
系统
(57)摘要
本发明公开了一种基于知识图谱的诈骗网
站关联方法及系统, 本发明通过对 未知诈骗网站
数据按规则清洗,并按设计好的诈骗网站的团伙
分析结构 存入知识图谱中,然后通过知识图谱的
结构对新存入的诈骗网站进行判断是否属于已
知诈骗网站的团伙还是新的诈骗网站的团伙, 通
过对未知 的诈骗网站数据和已知 的知识图谱中
的数据进行比对和计算,判别是否为已知团伙的
诈骗网站, 更新知识图谱:对新添加的图谱数据
进行一个判别后,然后根据已知团伙和未知团伙
的方式更新图谱内的团伙信息用以后续关联分
析, 以实现在线学习的效果, 可分析诈骗网站之
间的关联关系并深入挖掘隐藏的信息线索。
权利要求书3页 说明书7页 附图3页
CN 114124576 B
2022.04.22
CN 114124576 B
1.一种基于知识图谱的诈骗网站关联 方法, 其特 征在于, 包括
数据清洗: 对原始采集到的诈骗网站数据去掉不符合分析要求的数据, 然后将符合分
析要求的数据通过设计好的知识图谱映射到图数据库中;
数据清洗具体包括:
A.通过数据统计和知识图谱设计的知识,分析采集 好的数据;
B.根据分析采集好的数据信息, 设计知识图谱的结构,用于描述数据在物理世界中的
概念;
C.根据设计好的知识图谱的结构,将采集的数据通过唯一ID表示唯一的节点和唯一的
关系的形式一一对应方式进行检测,有能相互匹配对应的则合并,没有则以导入的方式检
测数据;
D.通过上述检测方式按设计好的图谱格式导入图库,用以结构化的描述所有采集的涉
嫌人员登录数据;
E.通过上述导入的图库的结构化数据用以后续诈骗网站关系生成分析;
知识图谱团伙分析: 通过设置规则和计算生成用于辅助诈骗网站的团伙分析的关系和
节点, 并得到团伙分析的结果, 通过团伙信息将诈骗网站进 行关联后,对诈骗网站进 行关联
分析;
知识图谱团伙分析包括:
A.通过数据统计和知识图谱设计的知识,分析采集 好的数据;
B.设计知识图谱的结构,用于描述数据在物理世界中的概念;
C.生成辅助判别团伙的辅助节点和关系, 根据设计好的知识图谱的结构,将采集的数
据通过唯一ID表 示唯一的节点和唯一的关系的形式一一对应方式检测采集的数据,有能相
互匹配对应的则合并,没有则导入的方式检测数据;
D.通过以上检测方式按设计好的图谱格式导入图库,用以结构化的描述所有采集的涉
嫌人员登录数据;
E.通过导入的图库的结构化数据用以后续诈骗网站关联关系生成;
F.通过上一步生成的关系分析判别团伙,并为团伙 生成标识用以标记;
H.最后通过团伙信息将诈骗网站进行关联后,对诈骗网站进行关联分析;
未知诈骗网站判别: 基于已知诈骗网站信息判别未知网站与已知网站 的关联关系, 并
动态的更新诈骗网站的团伙信息, 以达到在线学习的效果, 以便对未知 网站进行一个团伙
的判断和进行后续的关联分析;
对已知诈骗网站关联: 通过诈骗网站之间的关联数据、 关联内容, 统计信息挖掘 深层次
的隐藏线索信息, 并可视化展示便 于后续的人工查看和分析。
2.根据权利要求1所述的一种基于知识图谱的诈骗网站关联方法, 其特征在于, 所述唯
一ID包括涉嫌人员ID、 登录IP、 登录城市、 非法网站ID、 服 务器ID。
3.根据权利要求1所述的一种基于知识图谱的诈骗网站关联方法, 其特征在于, 未知诈
骗网站判别包括
A.通过数据清洗将未知数据按流程清洗,并按设计好的诈骗网站的团伙分析结果存入
知识图谱中,然后进行团伙分析;
B.然后通过对新存入的诈骗网站和已知团伙标识下的所有诈骗网站相关信息进行对权 利 要 求 书 1/3 页
2
CN 114124576 B
2比和计算,判别是否为已知团伙诈骗网站;
C.对新添加 的图谱数据进行一个判别,然后根据已知团伙和未知团伙的方式更新图
库,方便后续关联分析,以实现在线学习的效果。
4.根据权利要求1所述的一种基于知识图谱的诈骗网站关联方法, 其特征在于, 对已知
诈骗网站关联包括
A.通过数据清洗、 知识图谱团伙分析和未知诈骗网站判别三个环节不断更新后的图
库,再对所有诈骗网站之间共有的信息进行关联,用于分析诈骗网站之间的共性;
B.对诈骗网站下的某个属性,分析和关联在已知诈骗网站中有多个也是使用该属性的
网站,用于分析诈骗网站的特征分布,建立诈骗网站惯用手段的数据库, 以实现关联的功
能;
C.诈骗网站通过属性关联到其它诈骗网站,其它诈骗网站继续关联到其它诈骗网站,
通过这样二度关联或多度关联进一 步发现隐藏有关系的诈骗网站和隐藏线索。
5.根据权利要求4所述的一种基于知识图谱的诈骗网站关联方法, 其特征在于, 诈骗网
站惯用手段的数据库包括: 多个诈骗网站的注 册公司或者邮箱相同的数据。
6.根据权利要求4所述的一种基于知识图谱的诈骗网站关联方法, 其特征在于, 诈骗网
站之间共有的信息包括使用同一 服务器IP地址、 同一 服务器机房的关联网站。
7.一种基于知识图谱的诈骗网站关联系统, 其特征在于, 该系统以实现权利要求1 ‑6任
一项所述的方法, 其包括
数据清洗模块, 对原始采集到的数据去掉不符合分析要求的数据, 然后通过设计好的
知识图谱映射到图数据库中;
数据清洗模块具体包括:
A.通过数据统计和知识图谱设计的知识,分析采集 好的数据;
B.根据分析采集好的数据信息, 设计知识图谱的结构,用于描述数据在物理世界中的
概念;
C.根据设计好的知识图谱的结构,将采集的数据通过唯一ID表示唯一的节点和唯一的
关系的形式一一对应方式进行检测,有能相互匹配对应的则合并,没有则以导入的方式检
测数据;
D.通过上述检测方式按设计好的图谱格式导入图库,用以结构化的描述所有采集的涉
嫌人员登录数据;
E.通过上述导入的图库的结构化数据用以后续诈骗网站关系生成分析;
知识图谱团伙分析模块, 通过设置规则和计算生成辅助诈骗网站的团伙分析的关系和
节点并得到团伙分析 的结果, 通过团伙信息将诈骗网站进行关联后,对诈骗网站进行关联
分析;
知识图谱团伙分析模块包括:
A.通过数据统计和知识图谱设计的知识,分析采集 好的数据;
B.设计知识图谱的结构,用于描述数据在物理世界中的概念;
C.生成辅助判别团伙的辅助节点和关系, 根据设计好的知识图谱的结构,将采集的数
据通过唯一ID表 示唯一的节点和唯一的关系的形式一一对应方式检测采集的数据,有能相
互匹配对应的则合并,没有则导入的方式检测数据;权 利 要 求 书 2/3 页
3
CN 114124576 B
3
专利 一种基于知识图谱的诈骗网站关联方法及系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:53:12上传分享