全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221097382 9.4 (22)申请日 2022.08.15 (71)申请人 广州市刑事科 学技术研究所 地址 510055 广东省广州市越秀区仓边路 30号 申请人 广州市公安局黄埔区分局   上海歆仁信息科技有限公司 (72)发明人 徐新忠 韩冰 彭风华 侯旭东  莫传莹 赵伟 寇睿 李文瑞  欧荣安 李庭轩 程瑞琪 范晨龙  轩翔宇  (74)专利代理 机构 北京至臻永信知识产权代理 有限公司 1 1568 专利代理师 杨海涛(51)Int.Cl. G06F 40/289(2020.01) G06F 16/22(2019.01) G06F 16/31(2019.01) G06F 16/36(2019.01) G06F 40/30(2020.01) (54)发明名称 电子信息数据关联关系分析方法、 装置、 设 备和存储介质 (57)摘要 本发明公开了电子信息数据关联关系分析 方法、 装置、 设备和存储介质, 所述方法包括, 构 建NLP分词模型和NLP语义模型时, 包括步骤: 对 已有的各分析对象的不同类型的电子信息数据, 进行逆向解析和/或数据转换, 生成对应的明文 文本数据; 将明文文本数据处理为结构化数据或 半结构化数据, 并根据预设的多层级的数据分类 体系结构 存储; 根据明文文本数据中的特定数据 生成关键信息并设定对应的标注信息; 构建包括 多个资料库的资料库集; 以资料库集中的关键信 息和明文文本 数据为训练语料进行NLP分词模型 的训练和NLP语义模型的训练。 本发明可以提高 针对风控或内审等场景下电子信息数据的关联、 分析和研判的效率和分析结果的准确性和有效 性。 权利要求书3页 说明书13页 附图4页 CN 115238688 A 2022.10.25 CN 115238688 A 1.一种电子信息数据关联关系分析方法, 其特征在于, 构建NLP分词模型和NLP语义模 型时, 包括 步骤: S11、 对已有的各分析对象的不同类型的电子信息数据, 进行逆向解析和/或数据转换, 生成对应的明文 文本数据; 所述电子信息数据包括 一种以上的互联网应用生成的数据; S12、 将所述明文文本数据处理为结构化数据或半结构化数据, 并根据预设的多层级的 数据分类 体系结构存 储所述明文 文本数据; S13、 根据 所述明文文本数据中的特定数据生成关键信 息并设定对应的标注信息; 所述 特定数据为能够在跨应用关联分析中发挥作用的数据; 所述关键信息包括: 实名信息、 虚拟 账号信息、 地理位置信息、 支付信息、 手机号信息、 车牌信息中的一种或多种个人信息, 以 及, 所述个人信息的属性系信息, 以及, 所述个人信息间的关联信息; S14、 对存储于特定存储位置的所述关键信息进行二次构建, 包括: 构建至少包括应用 信息资料库、 虚拟信息资料库、 实名资料库、 支付账号资料库和地理位置资料库的资料库 集; 所述资料库集中的各资料库用于分类存 储所述关键信息; S15、 以所述资料库集中的关键信息和明文文本数据为训练语料进行NLP分词模型的训 练和NLP语义模型的训练; 所述NLP分词模型和所述NLP语义模型用于从所述明文文本数据 筛选出各所述关键信息, 并根据所述关键信息间的关系属性构建三元 组信息:“实体‑关系‑ 实体”以及“实体‑属性‑实体”基本逻辑关系; 所述关系属性包括隶属关系、 关联类型、 关系 次数和关联时间中的一种多或多种。 2.根据权利要求1所述的取证数据关联关系分析方法, 其特征在于, 还包括, 根据所述 NLP分词模型和所述 NLP语义模型构建 关系图谱, 包括 步骤: S16、 在构建当前分析对象的电子信 息数据关联关系时, 获取当前分析对象的不同类型 的电子信息数据, 并对所述当前电子信息数据进 行逆向解析和/或数据转换, 生成对应的当 前明文文本数据; S17、 以所述当前明文文本数据 为输入, 根据所述NLP 分词模型和所述NLP语义模型筛选 出各所需关键信息并根据所述关键信息间的关系属性构建三元组信息: “实体‑关系‑实体” 以及“实体‑属性‑实体”基本逻辑关系; S18、 根据所述关键信息间的关系属性和 “实体‑关系‑实体”以及“实体‑属性‑实体”基 本逻辑关系, 分别构建各 所述当前分析对象的关系图谱。 3.根据权利要求3所述的电子信息数据关联关系分析 方法, 其特 征在于, 还 包括: 根据预设的评分规则确定所述关系图谱中各实名信 息之间的关系评分, 并根据关系评 分的评分结果和所述关系图谱生成分析 结果; 所述评分规则包括: 将结构化数据中直接参与的主体确定为显性结果; 将通过字段和文本分析的方式提取 的昵称、 账号、 邮箱、 联系 方式和卡号确定为半隐性结果; 将通过语义分析提取的实体和属 性确定为隐性结果; 所述主体包括实名认证信息、 AP P账户信息和关系属性。 4.根据权利要求1或2所述的取证数据关联关系分析方法, 其特征在于, 所述互联网应 用包括: 社交类应用、 出行类应用、 导航类应用、 支付类应用, 订单类应用和消费类应用中的一 类或多类。 5.根据权利要求1或2所述的 电子信息数据关联关系分析方法, 其特征在于, 所述个人权 利 要 求 书 1/3 页 2 CN 115238688 A 2信息还包括: 备注名、 昵称、 银行账户、 虚拟交易账户中的一种或多种, 以及, 具有账号属性的主体的 属性信息、 社交聊天中涉及的账号类信息和账户类信息, 交易行为中涉及的账号类信息和 账户类信息, 和, 各应用中存在的涉及主体身份的信息 。 6.一种电子信息数据关联关系分析装置, 其特征在于, 用于构建NLP分词模型和NLP语 义模型的单 元包括: 历史数据预处理单元, 用于对已有的各分析对象的不同类型的 电子信息数据, 进行逆 向解析和/或数据转换, 生 成对应的明文文本数据; 所述电子信息数据包括一种以上的互联 网应用生成的数据; 历史数据再处理单元, 用于将所述明文文本数据处理为结构化数据或半结构化数据, 并根据预设的多层级的数据分类 体系结构存 储所述明文 文本数据; 关键信息确定单元, 用于根据 所述明文文本数据中的特定数据生成关键信 息并设定对 应的标注信息; 所述特定数据为能够在跨应用关联分析中发挥作用的数据; 所述关键信息 包括: 实名信息、 虚拟账号信息、 地理位置信息、 支付信息、 手机号信息、 车牌信息中的一种 或多种个人信息, 以及, 所述个人信息的属性系信息, 以及, 所述个人信息间的关联信息; 资料库集构建单元, 用于对存储于特定存储位置的所述关键信 息进行二 次构建, 包括: 构建至少包括互联网应用资料资料库、 虚拟信息资料库、 实名资料库、 支付账号资料库和地 理位置资料库的资料库集; 所述资料库集中的各资料库用于分类存 储所述关键信息; 模型训练单元, 用于以所述资料库集中的关键信息和明文文本数据为训练语料进行 NLP分词模 型的训练和NLP语义模 型的训练; 所述NLP分词模 型和所述NLP语义模 型用于从所 述明文文本数据筛选出各所述关键信息, 并根据所述关键信息间的关系属性构建三元组信 息:“实体‑关系‑实体”以及“实体‑属性‑实体”基本逻辑关系; 所述关系属性包括隶属关系、 关联类型、 关系次数和关联时间中的一种多或多种。 7.根据权利要求6所述的取证数据关联关系分析装置, 其特 征在于, 还 包括: 当前数据预处理单元, 用于在构建当前分析对象的 电子信息数据关联关系时, 获取当 前分析对 象的不同类型 的电子信息数据, 并对所述当前电子信息数据进行逆向解析和/或 数据转换, 生成对应的当前明文 文本数据; 逻辑关系构建单元, 用于以所述当前明文文本数据为输入, 根据所述NLP分词模型和所 述NLP语义模型筛选出各所需关键信息并根据所述关键信息间的关系属性构建三元组信 息:“实体‑关系‑实体”以及“实体‑属性‑实体”基本逻辑关系; 关系图谱生成单元, 用于根据所述关键信息间的关系属性和 “实体‑关系‑实体”以及 “实体‑属性‑实体”基本逻辑关系, 分别构建各 所述当前分析对象的关系图谱。 8.根据权利要求7 所述的电子信息数据关联关系分析装置, 其特 征在于, 还 包括: 分析结果生成单元, 用于根据 预设的评分规则确定所述关系图谱中各实名信 息之间的 关系评分, 并根据关系评分的评分结果和所述关系图谱生成分析 结果; 所述评分规则包括: 将结构化数据中直接参与的主体确定为显性结果; 将通过字段和文本分析的方式提取 的昵称、 账号、 邮箱、 联系 方式和卡号确定为半隐性结果; 将通过语义分析提取的实体和属 性确定为隐性结果; 所述主体包括实名认证信息、 应用账户信息和关系属性。 9.一种取证数据关联关系分析设备, 其特 征在于, 包括:权 利 要 求 书 2/3 页 3 CN 115238688 A 3

PDF文档 专利 电子信息数据关联关系分析方法、装置、设备和存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 电子信息数据关联关系分析方法、装置、设备和存储介质 第 1 页 专利 电子信息数据关联关系分析方法、装置、设备和存储介质 第 2 页 专利 电子信息数据关联关系分析方法、装置、设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:11上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。