ICS 35.240.20 CCS L 67 黑 DB23 龙 江 省 地 方 标 准 DB23/T 3211—2022 “互联网+监管”系统大数据中心 数据质量规范 2022 - 05 - 09 发布 黑龙江省市场监督管理局 2022 - 06 - 08 实施 发 布 Ⅰ DB23/T 3211—2022 前 言 本文件按照GB/T 1.1-2020给出的规则起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本文件由黑龙江省营商环境建设监督局提出并归口。 本文件主要起草单位:黑龙江省营商环境建设监督局、黑龙江省政务大数据中心、黑龙江省标准化 研究院、天阳宏业科技股份有限公司。 本文件主要起草人:王艳、阚洪锦、姜虹、景艳馥、 彭雪松 、刘晓华、刘晨鑫、王增仁、赵成立、 郑辉、陈要武、杨大志、吕猛、王磊、李严、王艳君、刘思妤、张敬。 Ⅰ DB23/T 3211—2022 “互联网+监管”系统大数据中心数据质量规范 1 范围 本文件规范了黑龙江省“互联网+监管”系统的数据汇聚过程中对数据质量要求与非标准数据的反 馈流程。 本文件适用于黑龙江省“互联网+监管”系统大数据中心的数据质量工作。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 DB23/T 2832-2021 “互联网+监管”系统监管数据规范 第1部分:监管基础数据 DB23/T 2833-2021 “互联网+监管”系统监管数据规范 第2部分:监管行为数据 DB23/T 2834-2021 “互联网+监管”系统监管数据规范 第3部分:监管辅助数据 3 术语和定义 下列术语和定义适用于本文件。 3.1 “互联网+监管”系统大数据中心 按照国家“互联网+监管”系统相关数据标准,汇聚本省监管数据,建设监管数据中心,形成各类 监管数据库,建立数据动态更新机制,不断提高数据质量,满足数据上报、共享、分析等需要。 3.2 数据质量 在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度,确保数据的及时性、完整性、 准确性。 3.3 数据安全 数据的安全性、完整性和可用性。 4 数据质量 4.1 目标与范围 按照DB23/T 2832-2021、DB23/T 2833-2021和DB23/T 2834-2021的规定执行。对汇聚上报的数据进 行抽取、清洗、去重、比对、校核、标准化转换、关联整合等处理并且依据治理规则进行数据治理,提 升并入省“互联网+监管”系统大数据中心基础库的数据质量。 1 DB23/T 3211—2022 4.1.1 质量目标 保证数据安全,实现数据资源在省“互联网+监管”系统的各应用系统应用以及在各市(地)的数 据共享。 4.1.2 数据范围 从中省直部门、各市(地)汇聚的监管对象、监管行为、执法人员、信用信息、投诉举报、互联网 及第三方机构数据、双随机一公开计划等监管相关数据。 4.2 工作说明 数据质量的主要工作是针对接入的数据启动数据治理,对于发现的数据质量问题,要启动错误数据 反馈流程,协同中省直部门和各市(地)的数据源方共同处理。 为了中省直部门、各市(地)上报的数据完整、可用,通过数据治理处理过的数据问题,能够自动 并及时反馈给中省直部门、各市(地),中省直部门、各市(地)获取到数据质量报告后及时重新把相 应数据完善再进行上报。 4.3 工作流程 4.3.1 工作流程图 “互联网+监管”系统数据汇聚工作流程,见图1。 图1 4.3.2 数据汇聚工作流程示意图 数据采集入库 2 DB23/T 3211—2022 汇入省“互联网+监管”系统大数据中心的数据,纳入数据治理的范畴。中省直部门、各市(地) 通过省政务信息共享交换平台实现监管数据发布,省“互联网+监管”系统通过订阅获取监管数据,然 后将中省直部门、各市(地)的监管数据加载进入省“互联网+监管”系统的汇聚库。 4.3.3 数据质量核查 监管数据进入监管数据汇聚库后,对每类数据配置治理规则,对于接入的数据,启动质量核查流程。 将通过质量检核的监管数据进入大数据中心主题库和专题库,并将数据质量检核的过程及结果生成检核 结果记录表留存至省“互联网+监管”系统上;对于质量检核未通过的错误数据进行标识并生成错误数 据表,在汇聚库进行数据治理后的错误数据进入数据治理错误库。 4.3.4 数据治理核查规则 监管数据从监管数据汇聚库进入监管大数据专题库和主题库时,按照DB23/T 2832-2021、DB23/T 2833-2021和DB23/T 2834-2021规定执行。 4.3.5 错误数据反馈 治理后的的错误数据标识针对中省直部门、各市(地)通过服务注册进行数据服务发布,由相应的 中省直部门、各市(地)进行订阅。中省直部门、各市(地)订阅接收到该错误数据后,进行核对处理, 并及时再汇聚上报正确的监管数据。 4.3.6 错误数据订阅 4.3.6.1 中省直部门、各市(地)都有一张对应的数据治理错误库表,在省政务信息共享平台订阅该 数据资源目录,获取到错误数据反馈情况。监管数据治理错误表(见表 1)。生成需要治理的数据记录 后,及时完成这些错误数据的修订并再次汇聚上报到省“互联网+监管”系统。 表1 序号 字段名 1 cd_lsh 2 table_name 3 cd_id 4 中文名称 监管数据治理错误表 数据格式 必填项 备注 自增流水号 N20 是 自行插入 数据表名 C255 是 存在错误数据的数据表名 原数据主键编码 C64 是 org_code 部门编码 C50 是 数据来源部门编码 5 cd_source 数据来源系统编码 C64 是 数据来源的系统编码 6 cd_batch 数据批次号 C32 是 批次号 7 cd_time 数据增量时间 DateTime 是 错误数据入库时间 8 error_detail 错误原因 Text 是 错误数据描述信息 9 create_time 错误数据治理时间 DateTime 是 错误数据治理时间 错误数据原来的主键编码(原值),方便各部门查询到 原数据 省“互联网+监管”系统应每天统计数据治理错误库表,统计每天有多少条不符合治理规则的数据, 按照数据来源系统、部门、数据增量时间分组将统计结果存入省“互联网+监管”市(地)工作进展情 况统计表。不合格监管数据统计表(见表 2)。 3 DB23/T 3211—2022 表2 序号 不合格监管数据统计表 字段名 中文名称 数据格式 必填项 备注 1 area_number 区划编码 C6 是 数据来源部门所属区划编码 2 area_name 区划名称 C150 是 数据来源部门所属区划名称 3 org_code 部门编码 C50 是 数据来源部门编码 4 org_name 部门名称 C150 是 数据来源部门名称 5 cd_ source 数据来源系统编码 C64 是 原数据中字段 6 invalid_count 不合格数据条数 N10 是 所有数据类型的不合格数据条数总和 7 cd_time 数据增量时间 DateTime 是 原数据中字段 8 statistic_time 统计时间 DateTime 是 此条数据生成时间 4

pdf文档 DB23-T 3211—2022 “互联网+监管”系统大数据中心数据质量规范 黑龙江省

安全标准 > 国标 > 文档预览
中文文档 6 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
DB23-T 3211—2022 “互联网+监管”系统大数据中心数据质量规范 黑龙江省 第 1 页 DB23-T 3211—2022 “互联网+监管”系统大数据中心数据质量规范 黑龙江省 第 2 页 DB23-T 3211—2022 “互联网+监管”系统大数据中心数据质量规范 黑龙江省 第 3 页
下载文档到电脑,方便使用
本文档由 思安2022-09-28 23:38:39上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。