全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210287537.5 (22)申请日 2022.03.22 (71)申请人 浙江大华 技术股份有限公司 地址 310051 浙江省杭州市滨江区滨安路 1187号 (72)发明人 孙立业 吕晓 陈立力 周明伟  (74)专利代理 机构 深圳市威世博知识产权代理 事务所(普通 合伙) 44280 专利代理师 何倚雯 (51)Int.Cl. G06F 16/2455(2019.01) G06F 16/22(2019.01) G06F 16/2458(2019.01) G06F 16/36(2019.01) (54)发明名称 一种数据关联方法、 电子设备和计算机可读 存储介质 (57)摘要 本申请公开了一种数据关联方法、 电子设备 和计算机可读存储介质, 该数据关联方法包括: 对原始数据库中属于同一主体的要素进行关联, 得到要素关联库, 要素关联库包含不同主体的多 个要素关联表; 从要素关联库中的所有要素中选 取出第一待关联要素与第二待关联要素, 形成待 关联要素组; 基于待关联要素组, 从要素关联库 中选择出第一要素关联表与第二要素关联表; 基 于第一要素关联表与第二要素关联表, 计算第一 待关联要素与第二待关联要素的关联置信度。 通 过上述方式, 本申请能够建立待关联要素组的关 联并得到对应的关联置信度。 权利要求书2页 说明书9页 附图3页 CN 114936225 A 2022.08.23 CN 114936225 A 1.一种数据关联 方法, 其特 征在于, 包括: 对原始数据库中属于同一主体的要素进行关联, 得到要素关联库, 所述要素关联库包 含不同主体的多个要素关联表; 从所述要素关联库中的所有要素中选取出第 一待关联要素与第 二待关联要素, 形成待 关联要素组; 基于所述待关联要素组, 从所述要素关联库中选择出第 一要素关联表与第 二要素关联 表; 基于所述第 一要素关联表与 所述第二要素关联表, 计算所述第 一待关联要素与所述第 二待关联要素的关联置信度。 2.根据权利要求1所述的数据关联方法, 其特征在于, 所述要素关联表包含属于同一主 体的要素对应的要素信息, 所述基于待关联要素组, 从所述要素关联库中选择出第一要素 关联表以及第二要素关联表的步骤, 包括: 将属于同一主体且包含所述第一待关联要素与中间要素的要素关联表确定为所述第 一要素关联表; 将属于同一主体且包含所述第二待关联要素与所述中间要素的要素关联表确定为所 述第二要素关联表。 3.根据权利要求2所述的数据关联方法, 其特征在于, 所述要素关联表包含属于同一主 体的要素对应的要素信息以及 对应的要素关联信息, 所述基于所述第一要 素关联表与所述 第二要素关联表, 计算所述第一待关联要素与所述第二待关联要素 的关联置信度的步骤, 包括: 获取所述第一要素关联表中所述第一待关联要素与所述中间要素对应的第一要素关 联信息; 获取所述第二要素关联表中所述第二待关联要素与所述中间要素对应的第二要素关 联信息; 基于所述第 一要素关联信 息与所述第 二要素关联信 息, 生成所述第 一待关联要素与 所 述第二待关联要素对应的第三要素关联信息; 基于所述第三要素关联信息, 计算所述关联置信度; 基于所述关联置信度、 所述第一要素关联表以及所述第二要素关联表, 构建知识图谱。 4.根据权利要求3所述的数据关联方法, 其特征在于, 所述第 三要素关联信 息包含关联 时间、 关联地点、 关联次数以及关联地点数, 所述基于所述第一要 素关联信息与所述第二要 素关联信息, 生成所述第一待关联要 素与所述第二待关联要 素对应的第三要 素关联信息的 步骤, 包括: 计算所述第一要素关联信息对应的关联时间与所述第二要素关联信息对应的关联时 间相同的次数, 得到所述关联次数; 计算在同一时刻所述第一要素关联信息对应的关联地点与所述第二要素关联信息对 应的关联地 点相同的地 点个数, 得到所述关联地 点数。 5.根据权利要求4所述的数据关联方法, 其特征在于, 所述基于所述第三要素关联信 息, 计算所述关联置信度的步骤, 包括: 采用逻辑回归函数对所述关联次数进行计算, 得到第一数值;权 利 要 求 书 1/2 页 2 CN 114936225 A 2采用所述逻辑回归函数对所述关联地 点数进行计算, 得到第二数值; 计算所述第一数值与所述第二数值的乘积, 得到所述关联置信度。 6.根据权利要求1所述的数据关联方法, 其特征在于, 所述从所述要素关联库中的所有 要素中选取 出第一待关联要素与第二待关联要素的步骤, 包括: 从所述要素关联库中的所有 要素中任意选取一个要素作为当前要素; 判断所述当前要素 是否与所述要素关联库中的其 他要素相关联; 若否, 则返回所述从所述要素关联库中的所有要素中任意选取一个要素作为当前要素 的步骤; 若是, 则基于所述其他要素与所述要素关联库中的剩余要素, 确定所述第一待关联要 素与所述第二待关联要素。 7.根据权利要求6所述的数据关联方法, 其特征在于, 所述基于所述其他要素与所述要 素关联库中的剩余要素, 确定所述第一待关联要素与所述第二待关联要素的步骤, 包括: 在所述当前要素与 所述要素关联库中的其他要素相关联时, 判断所述其他要素是否与 所述剩余要素相关联且所述剩余要素不与所述当前要素关联; 若是, 则所述当前要素为所述第 一待关联要素, 所述剩余要素为所述第 二待关联要素, 所述其他要素为中间要素; 若否, 则返回所述从所述要素关联库中的所有要素中任意选取一个要素作为当前要素 的步骤。 8.根据权利要求1所述的数据关联方法, 其特征在于, 所述原始数据库包含多个数据 表, 所述对原 始数据库中属于同一主体的要素进行关联, 得到要素关联库的步骤, 包括: 将每个所述数据表中属于同一主体的要素进行匹配, 得到要素关联中间库; 所述要素 关联中间库包含多个要素关联中间表, 所述要素关联中间表包含属于同一主体的要素对应 的要素信息以及对应的子要素关联信息; 将所述要素信 息相同的要素关联中间表中包含的子要素关联信 息进行汇总统计, 得到 所述要素关联表。 9.根据权利要求8所述的数据关联 方法, 其特 征在于, 所述要素关联表包括所述属于同一主体的要素的要素信 息以及对应的要素关联信 息, 所述要素关联信息包含所述属于同一主体的要素关联发生的总关联天数、 总关联次数、 时 间轨迹信息以及地点轨迹信息, 所述子要 素关联信息包括所述属于同一主体的要 素关联发 生的关联时间以及关联地 点。 10.根据权利要求1所述的数据关联方法, 其特征在于, 所述对原始数据库中属于同一 主体的要素进行关联, 得到要素关联库的步骤, 包括: 对所述原 始数据库中的数据进行 标准化处理, 得到处 理后的原 始数据库; 对所述处 理后的原 始数据库中属于同一主体的要素进行关联, 得到所述要素关联库。 11.一种电子设备, 其特征在于, 包括互相连接的存储器和处理器, 其中, 所述存储器用 于存储计算机程序, 所述计算机程序在被所述处理器执行时, 用于实现权利要求1 ‑10中任 一项所述的数据关联 方法。 12.一种计算机可读存储介质, 用于存储计算机程序, 其特征在于, 所述计算机程序在 被处理器执行时, 用于实现权利要求1 ‑10中任一项所述的数据关联 方法。权 利 要 求 书 2/2 页 3 CN 114936225 A 3

.PDF文档 专利 一种数据关联方法、电子设备和计算机可读存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据关联方法、电子设备和计算机可读存储介质 第 1 页 专利 一种数据关联方法、电子设备和计算机可读存储介质 第 2 页 专利 一种数据关联方法、电子设备和计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:54:06上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。