014014第2卷 第 2期 2020年6月文献与数据 学报
国内外数据治理模型对比分析*A
肖洁琼 奉国和
(华南师范大学经济与管理学院信息管理系,广州 510006)
摘 要: [目的 / 意义]数据治理是数据科学时代关注的重要问题之一,研究数据治理模型是实现数
据价值最大化和数据治理最终目标的有效且必要途径。 [方法 / 过程]采用文献调查法分别对八种数据治
理模型在内涵、要素、功能及范围四方面进行对比分析。 [结果 / 结论]归纳与总结出不同模型的优势与
不足,为数据治理工作者在选择与使用时提供参考。
关键词: 数据治理模型 数据治理内涵 数据治理要素 数据治理功能 数据治理范围
分类号: G203
DOI:10.31193/SSAP.J.ISSN.2096-6695.2020.02.02
0 引 言
当前世界正处于工业 4.0 时代,各国经济发展战略白皮书都在强调利用大数据实现工业转型,
国外有美国的《大数据研发战略》[1]和欧盟《朝向开放科学体系》[2],我国也颁布了《国务院关
于促进大数据发展的行动纲要》[3],这些政策都旨在通过大数据、云计算和人工智能等技术,促
进数据共享和利用,实现工业协作和生态创新[4,5]。
在此背景下,从各种来源获得的以 ZETTABYTES 为单位的大型复杂数据集呈指数型增长,
这些数据在政府、医疗、教育、管理和物流等不同领域都有许多应用,例如,在美国被用于预防
犯罪和反恐,在韩国被用于支持智能政府运营和战略规划[6],但使用者在数据处理和管理方面
面临巨大的问题,实施大数据战略的组织和企业都亟需一套新的数据处理政策和模型。因此,数
据治理(Data Governance,DG)作为一个新兴话题成为研究人员和行业领导者关注焦点[7]。国
内学者张宁等[8]对数据治理概念、体系、内容和应用的相关研究进行述评,指出“框架设计”
“价值探讨”是目前研究重点, “框架体系” “成熟度模型” “框架模型设计优化”是未来重点研究
领域。
* 本文系广州市科技计划基础与应用基础研究专题项目 “突发词探测理论、 方法与应用研究” (项目编号 : 202002030384) 成果之一。
[作者简介] 肖洁琼(ORCID:0000-0001-5783-2893),硕士研究生,研究方向为数据挖掘、信息计量学;奉国和(ORCID:
0000-0002-0774-1544,通讯作者),教授,博士,研究方向为信息计量学、数据挖掘,Email:ghfeng@163.com。0 引 言 015015肖洁琼,奉国和 . 国内外数据治理模型对比分析[J]. 文献与数据学报,2020,2(2):014-025.
笔者以“数据治理”或“Data Governance”或“Information Governance”为关键词检索相关
中外文文献,发现数据治理研究大致始于 2004 年,最先开始于企业实践,随后在学术界围绕模
型构建和案例分析展开讨论,主要集中于计算机技术、企业管理以及图书馆管理等领域[9]。关
于数据治理模型构建的研究,最早由大型信息咨询公司和标准化组织发起,随后延伸到学术界。
业界对于构建数据治理模型的研究成果集中在各组织机构提出的治理框架和模型,大体可以分为三类:数据治理成熟度评估模型
[10,11]、数据治理过程模型[12,13]和数据治理要素模型[14,15,16]。
相对来说,学术界对数据治理模型的研究显得分散且独立。国内包冬梅[7]对国际影响力较大的
DAMA 框架和 DGI 框架的主要内容和要素架构进行了研究,并在此基础上提出针对我国高校图
书馆数据治理的 CALib 数据治理框架;刘越男和闫慧等[17]就大数据情境下的政府数据治理展
开研究并以贵州省抢险救灾实例进行论证;杨琳[18]在分析国内外数据治理理论、方法和需求的
基础上,提出面向大数据的治理框架并列举了相应的 应用场景。国外 K.Wende[19]提出了描述和
说明企业数据治理的弹性模型,认为模型应该由角色、决策域与主要活动以及职责三部分组成;
S.Kim[20]提出将商业和 IT 技术结合来构造数据治理模型。相比于对数据治理模型的研究,分析
数据治理成功案例的研究则显得略少,夏义堃[21]对比分析部分发达国家政府数据治理政策和治
理模型,提出我国政府数据治理框架和治理内容的独特观点;K.Weber[22]基于 6 家不同类型跨
国公司有关数据治理的社区行动研究项目,提出了一个由数据质量角色、决策域和责任三部分组成的数据治理责任分担矩阵模型。此外,还有一些学者从数据治理的内涵、要素、模型等角
度进行述评,指出治理体系和治理模型的设计是未来研究的重点方向,数据治理实践是终极目
标
[8,23,24]。
结合国内外文献调查可发现,首先,在数据治理领域,学界和业界的关联并不紧密。学界和
业界对数据治理的定义并没有随着时间推移而集中发生改变或达成共识,业界各机构对数据治理
的定义更多取决于业务需求和商业竞争而不是学术界研究成果;但是,学界的研究却是随着业界
的发展产生波动,不少学术研究成果都是在业界出现新理论、新模型和新案例的基础上产生的。由此可见,在数据治理领域,业界对数据治理理论和模型的研究进度快于学术界,且研究成果被
学术界认可。其次,构建大量的数据治理模型并不能促成大批成功的数据治理案例产生,究其原
因,学 界对 于数据治理的研究与推崇并不能代表企业和组织 愿意 接受理论使用模型。组织机构想要实现数据价值 最大 化, 就需要进行数据治理,构建具有高度可操作性的模型
[20];然而,现有
研究成果并没有阐述组织机构如何进行数据治理模型的选择、实施与维护。因此,笔者从组织机构实际应用出发,选择国内外大型知名标准化组织和咨询公司相关数据治理框架模型作为研究对
象,使用文献调研法,选择深受业界和学界认可的 4 个标准化组织和 4 个咨询公司提出的 8 种数
据治理模型,并对它们的发布时间、发布机构和模型名称做了简要梳理(见表 1) 。笔者希望通过分析表 1 所列 8 种数据治理模型所体现的治理内涵、构成要素、特点、功能和使用范围,探索
不同模型优势与不足,并结合我国开展数据治理的现实环境,着重对组织结构构造数据治理模型
提出新的思考,以期为相关研究提供借鉴与参考。016第2卷 第 2期 2020年6月文献与数据 学报
016表 1 数据治理模型基本信息
机构类型 发布时间 发布机构 模型名称
标准化组织2004 年 国际数据治理研究所(DGI) DGI 数据治理框架
2008 年 9 月 国际数据管理协会(DAMA) DAMA 数据治理模型
2015 年 5 月 信息技术服务标准(ITSS)(中国) 《数据治理白皮书》模型
— 高等教育统计局(HESA)(英国) HESA 数据治理模型
咨询公司2007 年 10 月 国际商业机器公司(IBM)数据治理委员会(美国) IBM 数据治理模型
2008 年 12 月 高德纳咨询公司(Gartner)(美国) Gartner 6 阶段成熟度模型
2015 年 3 月Mustimuhw 信息解决方案公司(Mustimuhw Information
Solutions)MIS 数据治理螺旋模型
2015 年 9 月 艾比埃公司(Information Builders)(美国) IB 数据治理简易模型
1 数据治理内涵分析
不同数据治理模型对数据治理定义差异很大,本节拟从整体认识和概念构成两方面进行分
析,整理各模型白皮书中数据治理定义(见表 2) ,发现数据治理的必要条件及其对模型构建的
影响,为后续治理模型研究提供参考。
表 2 数据治理内涵
发布年份 模型名称 数据治理内涵
2004 DGI 数据治理框架[13] 数据治理是根据约定模型处理信息和实施决策的一个系统,包括实施者、
实施步骤、实施时间、实施情境以及实施途径与方法。
2007 IBM 数据治理模型[10]数据治理是一种质量控制规程,用于在管理、使用、改进和保护组织信息的过程中添加新的严谨性和纪律性;有效的数据治理可以通过促进跨组织协作和结构化策略制定来提高公司数据的质量、可用性和完整性;它平衡
了派系孤岛与组织利益, 直接影响了任何组织最关心的四个因素 : 增加收入、
降低成本、降低风险和提高数据信心。
2008DAMA 数据治理模型
[14]数据治理是数据管理的核心功能,指对数据资产管理行使权力和控制的活动集合(包括计划、监督和执行);数据治理功能指导所有其他数据管理功能的执行。数据治理在更高的层次上执行数据管理。
Gartner 6 阶段成熟度模型
[11]数据治理是 IT 治理的一部分,同时也属于公司治理的范畴,企业应该建立一个数据治理的规范流程。
2015MIS 数据治理螺旋模型
[15]数据治理是信息相关流程的决策权和责任制,根据商定的模型执行,这些模型描述了谁可以采取什么行动来处理什么信息,何时,在什么情况下使用什么方法。
IB 数据治理简易模型
[12]数据治理是新兴学科的总称,包括数据质量、数据管理、业务流程管理和风险管理等许多不同实践;其目标是确保数据以可持续的方式服务于商业目的。数据治理也可定义为人员、流程和技术的正式协调,使组织能够将
数据用作企业资产。
《数据治理白皮书》 模型
[24] 数据治理是对企业的数据管理和利用进行评估、指导和监督,通过提供不
断创新的数据服务,为企业创造价值的活动。
— HESA 数据治理模型[16]数据治理平衡了派系孤岛与组织利益,实现了公平访问所有人的数据。1
国内外数据治理模型对比分析
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2023-03-04 11:18:07上传分享