(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210449717.9 (22)申请日 2022.04.27 (71)申请人 鼎捷软件股份有限公司 地址 200072 上海市 静安区江场路137 7弄1 号楼22F (72)发明人 吴冠辉 孙国鑫  (74)专利代理 机构 北京博思佳知识产权代理有 限公司 1 1415 专利代理师 韩果 (51)Int.Cl. G06F 16/215(2019.01) G06F 16/23(2019.01) G06F 16/25(2019.01) G06F 16/907(2019.01) (54)发明名称 元数据生成系统以及元 数据生成方法 (57)摘要 本发明提供一种元数据生成系统以及元数 据生成方法。 元数据生成系统包括存储装置以及 处理器。 存储装置存储数据采集模块以及数据分 析模块。 处理器耦接存储装置。 处理器执行数据 采集模块, 以对原始数据进行数据采集, 并且取 得第一数据。 处理器执行数据分析模块, 以分析 第一数据, 并且产生第二数据。 数据分析模块对 第二数据进行样本比对, 以产生元 数据。 权利要求书2页 说明书6页 附图3页 CN 114968993 A 2022.08.30 CN 114968993 A 1.一种元 数据生成系统, 其特 征在于, 包括: 存储装置, 存储数据采集模块以及数据分析模块; 以及 处理器, 耦接所述存 储装置, 其中所述处理器执行所述数据采集模块, 以对原始数据进行数据采集, 并且取得第一 数据, 其中所述处 理器执行所述数据分析模块, 以分析 所述第一数据, 并且产生第二数据, 其中所述数据分析模块对所述第二数据进行样本比对, 以产生元 数据。 2.根据权利要求1所述的元数据生成系统, 其特征在于, 所述数据采集模块包括数据采 集器以及字段采集器, 所述数据采集器用以从所述原始数据 取得所述第 一数据, 并且所述字段采集器用以从 所述原始数据取 得用于产生所述元 数据的字段信息, 其中所述第 一数据为所述原始数据的一部分, 并且所述字段信 息为所述原始数据的另 一部分。 3.根据权利要求2所述的元数据生成系统, 其特征在于, 所述数据分析模块包括样式分 析模块, 所述样式分析模块用以对所述第一数据进行样式分析, 并且产生所述第二数据, 其中所述第 二数据包括多个字段信 息以及对应于所述多个字段信 息的多个样式信 息、 多个型态信息以及多个长度信息 。 4.根据权利要求3所述的元数据生成系统, 其特征在于, 所述原始数据为表格形式, 并 且所述处理器根据采集范围采集所述原始数据的一部分, 以取得所述第一数据, 并且所述 数据分析模块分别分析所述第一数据的多 行或多列, 以产生所述第二数据的所述多个字段 信息以及对应于所述多个字段信息的所述多个样式信息、 所述多个型态信息以及所述多个 长度信息 。 5.根据权利要求3所述的元数据生成系统, 其特征在于, 所述数据分析模块包括样式比 对模块以及数据生成模块, 所述样式比对模块借 由样式数据库比对所述第二数据, 并且所 述数据生成模块 根据比对结果以及所述字段信息产生所述元 数据。 6.根据权利要求5所述的元数据生成系统, 其特征在于, 所述样式比对模块根据 所述比 对结果更新所述第二数据, 并且所述数据生成模块根据所述字段信息 设定更新后的所述第 二数据中的所述多个字段信息, 以生成所述元 数据。 7.根据权利要求5所述的元数据生成系统, 其特征在于, 所述样式数据库用以存储对应 于不同数据规范的多个样式参考信息以及对应于所述多个样式参考信息的多个形态参考 信息、 多个长度参 考信息、 多个 类型定义 参考信息以及多个建议名参 考信息。 8.根据权利要求1所述的元数据生成系统, 其特征在于, 所述存储装置还存储数据调整 模块, 其中所述处理器执行所述数据调整模块, 以使所述数据调整模块根据调整指令调整 所述元数据。 9.根据权利要求8所述的元数据生成系统, 其特征在于, 所述元数据包括基于未符合规 范而被标记的数据, 并且所述数据调整模块根据所述调整指令调整所述元数据中的所述被 标记的数据, 以生成调整后的元 数据。 10.根据权利要求8所述的元数据生成系统, 其特征在于, 所述处理器将所述元数据输 出至人机互动接口, 并且所述人机互动接口根据所述调整元数据的调整结果, 提供所述调权 利 要 求 书 1/2 页 2 CN 114968993 A 2整指令至所述处 理器。 11.一种元 数据生成方法, 其特 征在于, 包括: 通过数据采集模块对原 始数据进行 数据采集, 并且取 得第一数据; 通过数据分析模块分析 所述第一数据, 并且产生第二数据; 以及 通过所述数据分析模块对所述第二数据进行样本比对, 以产生元 数据。 12.根据权利要求11所述的元数据生成方法, 其特征在于, 其中所述第 一数据为所述原 始数据的一部分, 并且所述字段信息为所述原 始数据的另一部分。 13.根据权利要求12所述的元数据生成方法, 其特征在于, 其中所述第 二数据包括多个 字段信息 以及对应于所述多个字段信息的多个样式信息、 多个型态信息 以及多个长度信 息。 14.根据权利要求13所述的元 数据生成方法, 其特 征在于, 所述原 始数据为表格形式, 其中取得所述第一数据的步骤 包括: 根据采集范围采集所述原 始数据的一部分, 以取 得所述第一数据; 以及 其中产生所述第二数据的步骤 包括: 分别分析所述第 一数据的多行或多列, 以产生所述第 二数据的所述多个字段信 息以及 对应于所述多个字段信息的所述多个样式信息、 所述多个型态信息 以及所述多个长度信 息。 15.根据权利要求13所述的元数据生成方法, 其特征在于, 产生所述第 二数据的步骤包 括: 借由样式数据库比对所述第二数据; 以及 根据比对结果以及所述字段信息产生所述元 数据。 16.根据权利要求15所述的元数据生成方法, 其特征在于, 产生所述第 二数据的步骤还 包括: 根据所述比对结果更新所述第二数据; 以及 其中产生所述元 数据的步骤 包括: 根据所述字段信 息设定更新后的所述第 二数据中的所述多个字段信 息, 以生成所述元 数据。 17.根据权利要求15所述的元数据生成方法, 其特征在于, 所述样式数据库用以存储对 应于不同数据规范的多个样式参考信息以及对应于所述多个样式参考信息的多个形态参 考信息、 多个长度参 考信息、 多个 类型定义 参考信息以及多个建议名参 考信息。 18.根据权利要求1 1所述的元 数据生成方法, 其特 征在于, 还 包括: 根据调整指令调整所述元 数据。 19.根据权利要求11所述的元数据生成方法, 其特征在于, 所述元数据包括基于未符合 规范而被标记的数据, 其中调整所述元 数据的步骤 包括: 根据所述调整指令调整所述元 数据中的所述被标记的数据, 以生成调整后的元 数据。 20.根据权利要求1 1所述的元 数据生成方法, 其特 征在于, 还 包括: 将所述元 数据输出至人机互动接口; 以及 通过所述人机互动接口根据所述调整元 数据的调整结果, 产生所述调整指令 。权 利 要 求 书 2/2 页 3 CN 114968993 A 3

.PDF文档 专利 元数据生成系统以及元数据生成方法

安全报告 > 其他 > 文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 元数据生成系统以及元数据生成方法 第 1 页 专利 元数据生成系统以及元数据生成方法 第 2 页 专利 元数据生成系统以及元数据生成方法 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生2024-02-24 08:49:53上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。