全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211164049.1 (22)申请日 2022.09.23 (71)申请人 中孚信息股份有限公司 地址 250101 山东省济南市高新区经十路 7000号汉峪金谷A1- 5号楼25层 (72)发明人 杨尚伟 孙焕智 李言非  (74)专利代理 机构 济南圣达知识产权代理有限 公司 372 21 专利代理师 黄海丽 (51)Int.Cl. G06F 16/215(2019.01) G06F 16/2455(2019.01) G06F 16/25(2019.01) (54)发明名称 基于元数据管理的资产数据处理方法及系 统 (57)摘要 本公开提供了一种基于元数据管理的资产 数据处理方法及系统, 其属于资产数据处理技术 领域, 包括: 获取待处理的资产数据, 基于 预先构 建的元数据规则提取框架从所述资产数据中进 行元数据提取并经数据转换后存储至元数据库 中; 基于元数据库中数据源、 数据表以及数据项 之间的关联关系, 进行数据字典的构建; 其中, 所 述数据字典 中包括数据源元数据、 数据表元数据 以及数据项元数据; 基于构建的数据字典从所述 元数据库中进行数据获取, 并基于预设约束规则 对获取的数据进行分析, 并从数据完整性、 数据 一致性以及数据准确性三个维度实现资产数据 质量评估; 基于质量评估结果, 通过元数据血缘 分析技术, 确定数据质量问题 根源并进行相应处 理。 权利要求书2页 说明书9页 附图1页 CN 115481117 A 2022.12.16 CN 115481117 A 1.一种基于元 数据管理的资产数据处 理方法, 其特 征在于, 包括: 获取待处理的资产数据, 基于预先构建的元数据规则提取框架从所述资产数据中进行 元数据提取并经 数据转换后存 储至元数据库中; 基于元数据库中数据源、 数据表以及数据项之间的关联关系, 进行数据字典的构建; 其 中, 所述数据字典中包括数据源 元数据、 数据表元数据以及数据项 元数据, 所述数据源元数 据包括连接数据库的方式、 数据库类型以及数据库地址, 通过建立连接的方式获取特定数 据源下数据表中的元 数据; 基于构建的数据字典从所述元数据库中进行数据获取, 并基于预设约束规则对获取的 数据进行分析, 并从数据完整性、 数据一致性以及数据准确 性三个维度实现资产数据质量 评估; 基于质量评估结果, 通过元数据血缘分析技术, 确定数据质量问题根源并进行相应处 理。 2.如权利要求1所述的一种基于元数据 管理的资产数据处理方法, 其特征在于, 所述元 数据规则提取框架具体为: 基于 资产数据存储方式, 从数据源进 行元数据的读取, 并利用转 换工具对获得 的元数据进行数据转换, 将元数据信息转换成元模型对 象, 并经标准化处理 后存储到元数据库中。 3.如权利要求2所述的一种基于元数据 管理的资产数据处理方法, 其特征在于, 所述元 数据包括数据库名、 编码方式、 表名、 视图、 存 储过程、 列名、 数据类型以及数据记录 。 4.如权利要求1所述的一种基于元数据 管理的资产数据处理方法, 其特征在于, 所述预 设约束规则包括属性名称、 数据类型、 数据长度以及值是否为空的约束控制。 5.如权利要求1所述的一种基于元数据 管理的资产数据处理方法, 其特征在于, 所述数 据完整性的评估, 具体采用如下公式: 其中, Sdm表示数据的总记录数; Sdr表示问题记录数的大小; Sdc表示属性列的数目; Sd1表 示违反主键约 束规则的数据数目; Sd2表示违反联合主键约 束规则的数据数目; Sd3表示违反 唯一性约束规则的数据数目; Sd4表示违反非空规则的数据数目; Sd5表示违反候选码约束规 则的数据数目; Sid表示问题 记录中空数据的数目。 6.如权利要求1所述的一种基于元数据 管理的资产数据处理方法, 其特征在于, 所述数 据一致性的评估, 具体采用如下公式: 其中, Scm表示数据的总记录数; Scr表示问题记录数的大小; Scc表示属性列的数目; Sc1表 示违反等值约 束规则的数据数目; Sc2表示违反存在约束规则的数据数目; Sc3表示违反逻辑 约束规则的数据数目; Sc4表示违反外键约束规则的数据数目; Sc5表示违反等值依赖约束规 则的数据数目; Sc6表示违反逻辑依赖约 束规则的数据数目; Sc7表示违反代码约束规则的数 据数目; Sid表示问题 记录中空数据的数目。权 利 要 求 书 1/2 页 2 CN 115481117 A 27.如权利要求1所述的一种基于元数据 管理的资产数据处理方法, 其特征在于, 所述数 据准确性的评估, 具体采用如下公式: 其中, Sam表示数据的总记录数; Sar表示问题记录数的大小; Sac表示属性列的数目; Sa1表 示违反值域约 束规则的数据数目; Sa2表示违反数据 类型约束规则的数据数目; Sa3表示违反 数据格式性约 束规则的数据数目; Sa4表示违反固定值约 束规则的数据数目; Sa5表示违反精 度约束规则的数据数目; Sid表示问题 记录中空数据的数目。 8.一种基于元 数据管理的资产数据处 理系统, 其特 征在于, 包括: 数据获取单元, 其用于获取待处理的资产数据, 基于预先构建的元数据规则提取框架 从所述资产数据中进行 元数据提取并经 数据转换后存 储至元数据库中; 数据字典构建单元, 其用于基于元数据库中数据源、 数据表以及数据项之间的关联关 系, 进行数据字典的构建; 其中, 所述数据字典中包括数据源元数据、 数据表元数据以及数 据项元数据, 所述数据源元数据包括连接数据库的方式、 数据库类型以及数据库地址, 通过 建立连接的方式获取 特定数据源下 数据表中的元 数据; 数据质量评估单元, 其用于基于构建的数据字典从所述元数据库中进行数据获取, 并 基于预设约束规则对获取 的数据进行分析, 并从数据完整性、 数据一致性以及数据准确 性 三个维度实现资产数据质量评估; 数据处理单元, 其用于基于质量评估结果, 通过元数据血缘分析技术, 确定数据质量问 题根源并进行相应处 理。 9.一种电子设备, 包括存储器、 处理器及存储在存储器上运行的计算机程序, 其特征在 于, 所述处理器执行所述程序时实现如权利要求1 ‑7任一项所述的一种基于元数据管理的 资产数据处 理方法。 10.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被 处理器执行时实现如权利要求1 ‑7任一项所述的一种基于元数据管理的资产数据处理方 法。权 利 要 求 书 2/2 页 3 CN 115481117 A 3

.PDF文档 专利 基于元数据管理的资产数据处理方法及系统

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于元数据管理的资产数据处理方法及系统 第 1 页 专利 基于元数据管理的资产数据处理方法及系统 第 2 页 专利 基于元数据管理的资产数据处理方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:02:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。