1 什么是数据治理
当前数据治理并没有一个标准的概念界定,数据治理可从微观、中观和宏观的角度分别来理解。
微观上,数据治理指的是个体的数据管理,即对数据的实用性、 可用性、完整性和安全性的整体管理。中观上,数据治理是指公共治理,即区域和国家对其主权范围内的数据质量、权属、流动机制等方面的宏观管理。宏观上,数据治理指的是全球治理,即在大数据时代,以国家、国际组织、多利益攸关方等为主体,对数据权利、流通、管理等方面的治理
国际机构和不同学者也提出了自身对数据治理的理解。国际数据治理研究所(DGI)和ECAR应用研究中心认为数据治理是对活动的每一个参与者进行角色划分,并配置行动指南,每个参与者完成行动指南,所有参与者的行动就是完整的数据治理。
2 数据治理能解决哪些问题
(1)从宏观上来看,数据治理能够优化数据质量、保障数据安全、维护数据主体权利、提高数据流通效率
①优化数据质量,发掘数据资产价值。大数据时代的数据具有5V特征(数据体量大(Volume)、数据类型多(Variety)、
处理速度快(Velocity)、价值密度低(Value)准确性 (Veracity))。数据治理能够压缩数据体量、提高价值密度,促进数据资产价值最大化。
②保障数据安全,确保国家社会稳定
③建立数据规则,维护数据主体权利。数据治理能够工业大数据、商业数据和公共数据流动保驾护航。
④降低边际成本,提高数据流通效率。日前数据掌握在诸多不同的主体中,各个主体之间信息不流通,数据无法真正得到重复利用,信息孤岛效应明显,数据治理能够有效改善这种状况。
(2)从微观上看,数据治理能够实现数据共享、数据准确和数据可用
①共享:知道公司有哪些数据。业务视角上来看,业务内部多载体(PRD、邮件、wiki、共享文档)知识记录,受入离调转的影响,“考古成本”高;公司视角:跨组织数据流通黑盒,数据不流通
②准确:业务知道该用哪个数据。数据语义记录不明晰;业务自我迭代变更过程中数据记录不同步;好多数据不知道该用哪个?业务迭代数据定义变更如何准确修改定义及触达关注方
③可用:数据质量需要保障。已经下线了文档还存在;不同数据健康状态监控;数据血缘追溯问题排查;不同数据格式导致下游消费解析成本过高;上游变更下游无感知
3 数据治理的内容
ITSS WG1认为企业数据治理包含以下几方面内容
(1) 确保信息利益相关者的需要评估,以达成一致的企业目标,这些企业目标需要通过对信息资源的获取和管理实现;
(2) 确保有效助力业务的决策机制和方向;
(3)确保绩效和合规进行监督
从技术实施角度看,数据治理包含“理”“采”“存”“管”“用”这五个步骤,即业务和数据资源梳理、数据采集清洗、数据库设计和存储、数据管理、数据使用。
来源:《赛迪智库:2019中国数据治理发展报告(46页)(景略咨询).pdf》
推荐阅读:《阿里研究院:数据生产力崛起:新动能 新治理(183页).pdf》
《中国电子技术标准化研究院:数据治理发展情况调研分析报告(32页).pdf》
《腾讯研究院:2020年数据治理年度报告(96页).pdf》