全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210760713.2 (22)申请日 2022.06.29 (71)申请人 平安银行股份有限公司 地址 518000 广东省深圳市罗湖区深南 东 路5047号 (72)发明人 张巍  (74)专利代理 机构 深圳市沃德知识产权代理事 务所(普通 合伙) 44347 专利代理师 高杰 于志光 (51)Int.Cl. G06F 16/2455(2019.01) G06F 16/242(2019.01) G06F 9/54(2006.01) G06F 16/901(2019.01) (54)发明名称 数据血缘关系分析方法、 装置、 电子设备及 存储介质 (57)摘要 本发明涉及数据分析领域, 揭露一种数据血 缘关系分析方法, 包括: 从业务系统获取用户输 入数据查询请求对应的业务数据, 解析业务数据 中字段之间的字段血缘关系, 将业务数据保存至 消息队列后加载至本地磁盘, 在本地磁盘触发异 步线程, 以通过异步线程运行业务数据, 解析业 务数据在异步线程运行过程中字段之间的字段 继承关系; 根据字段血缘关系和字段继承关系, 构建业务数据的字段关联文件, 在字段关联文件 中标记字段之间的标识属性; 根据字段关联文件 和标识属性, 将业务数据中的数据存入图数据库 中, 以获取业务数据中数据之间的数据血缘关 系。 此外, 本发明还涉及区块链技术, 所述字段关 联文件可存储区块链。 本发明可以提高数据血缘 关系分析的效率。 权利要求书2页 说明书9页 附图2页 CN 115129753 A 2022.09.30 CN 115129753 A 1.一种数据血缘关系分析 方法, 其特 征在于, 所述方法包括: 接收用户输入的数据查询请求, 根据所述数据查询请求, 从业务系统中获取业务数据, 利用计算引擎解析所述业务数据中字段之 间的字段血缘关系, 并将所述业务数据保存至预 设的消息队列中; 将所述消息队列中的业务数据加载至本地磁盘中, 并在所述本地磁盘触发异步线程, 以通过所述异步线程运行所述业务数据, 解析所述业务数据在所述异步线程运行过程中字 段之间的字段继承关系; 根据所述字段血缘关系和所述字段继承关系, 构建所述业务数据的字段关联文件, 并 在所述字段关联文件中标记字段之间的标识属性; 根据所述字段关联文件和所述标识属性, 将所述业务数据中的数据存入图数据库中, 以获取所述业务数据中数据之间的数据血缘关系。 2.如权利要求1所述的数据血缘关系分析方法, 其特征在于, 所述根据 所述数据查询请 求, 从业务系统中获取业 务数据, 包括: 识别所述数据查询请求的查询对象和查询字段; 根据所述 查询对象和所述 查询字段, 将所述数据查询请求 转换为查询语句; 根据所述 查询语句, 向所述 业务系统的后台数据库查询业 务数据。 3.如权利要求1所述的数据血缘关系分析方法, 其特征在于, 所述利用计算引擎解析所 述业务数据中字段之间的字段 血缘关系, 包括: 利用所述计算引擎中的钩子函数捕获所述业务数据在查询过程中输入字段与输出字 段的对应关系; 根据所述对应关系, 利用所述计算引擎中的决策算法构建所述输入字段与输出字段的 决策树; 利用深度遍历算法计算所述决策树中任意两个字段的节点路径; 根据所述节点路径, 确定其对应字段的关联关系, 并将所述关联关系作为所述业务数 据中字段之间的字段 血缘关系。 4.如权利要求1所述的数据血缘关系分析方法, 其特征在于, 所述将所述消息队列中的 业务数据加载至 本地磁盘中, 包括: 对所述消息队列中的业 务数据进行序列化, 得到序列化数据; 采用先进先 出的顺序将所述序列化数据传输 至本地磁盘中。 5.如权利要求1所述的数据血缘关系分析方法, 其特征在于, 所述解析所述业务数据在 所述异步线程 运行过程中字段之间的字段继承关系, 包括: 对所述业务数据进行反序列化, 得到反序列化数据, 识别所述反序列化数据中字段之 间的调用关系; 根据所述调用关系, 识别所述反序列化数据在所述异步线程运行过程中的父类字段和 子类字段; 根据所述父类字段和子类字段, 生成所述 业务数据中字段之间的字段继承关系。 6.如权利要求1至5中任意一项所述的数据血缘关系分析方法, 其特征在于, 所述根据 所述字段 血缘关系和所述字段继承关系, 构建所述 业务数据的字段关联文件, 包括: 将所述业务数据中同时具有所述字段血缘关系和所述字段继承关系的字段作为聚类权 利 要 求 书 1/2 页 2 CN 115129753 A 2中心点; 采用概念关系 模型将所述业务数据中剩余字段与 所述聚类中心点进行连接, 形成字段 关联文件。 7.如权利要求1所述的数据血缘关系分析方法, 其特征在于, 所述标记所述字段关联文 件中字段之间的标识属性, 包括: 查询所述字段关联文件中字段之间的字段ID以及字段编号; 将所述字段ID和所述字段编号进行拼接, 得到所述字段关联文件中字段之间的标识属 性。 8.一种数据血缘关系分析装置, 其特 征在于, 所述装置包括: 血缘关系解析模块, 用于接收用户输入的数据查询请求, 根据 所述数据查询请求, 从业 务系统中获取业务数据, 利用计算引擎解析所述业务数据中字段之间的字段血缘关系, 并 将所述业务数据保存至预设的消息队列中; 继承关系解析模块, 用于将所述消息队列中的业务数据加载至本地磁盘中, 并在所述 本地磁盘触发异步线程, 以通过所述异步线程运行所述业务数据, 解析所述业务数据在所 述异步线程 运行过程中字段之间的字段继承关系; 字段关联文件构建模块, 用于根据所述字段血缘关系和所述字段继承关系, 构建所述 业务数据的字段关联文件, 并在所述字段关联文件中标记字段之间的标识属性; 血缘关系获取模块, 用于根据所述字段关联文件和所述标识属性, 将所述业务数据中 的数据存 入图数据库中, 以获取 所述业务数据中数据之间的数据血缘关系。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及, 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使 所述至少一个处理器能够执行如权利要求 1至7中任意一项 所 述的数据血缘关系分析 方法。 10.一种计算机可读存储介质, 存储有计算机程序, 其特征在于, 所述计算机程序被处 理器执行时实现如权利要求1至7中任意 一项所述的数据血缘关系分析 方法。权 利 要 求 书 2/2 页 3 CN 115129753 A 3

.PDF文档 专利 数据血缘关系分析方法、装置、电子设备及存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据血缘关系分析方法、装置、电子设备及存储介质 第 1 页 专利 数据血缘关系分析方法、装置、电子设备及存储介质 第 2 页 专利 数据血缘关系分析方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:15:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。