博客 谈谈中国数据治理的五大特点

谈谈中国数据治理的五大特点

   数栈君   发表于 2023-05-05 15:32  265  0
追溯我国数据管理和治理的起源可以从我国的数据管理、信息治理或数据治理的标准谈起,下面就是自2000年到现在发布的部分国家标准:
1.GB/T 34960.5-2018 信息技术服务 治理 第5部分:数据治理规范
2.GB/T 32923-2016 信息技术 安全技术 信息安全治理
3.GB/T 38667-2020 信息技术 大数据 数据分类指南
4.GB/T 42450-2023 信息技术 大数据 数据资源规划
5.GB/T 36343-2018 信息技术 数据交易服务平台 交易数据描述
6.GB/T 38555-2020 信息技术 大数据 工业产品核心元数据
7.GB/T 40094.3-2021 电子商务数据交易 第3部分:数据接口规范
8.GB/T 40094.2-2021 电子商务数据交易 第2部分:数据描述规范
9.GB/T 36625.3-2021 智慧城市 数据融合 第3部分:数据采集规范
10.GB/T 18391.4-2009 信息技术 元数据注册系统(MDR) 第4部分:数据定义的形成
11.GB/T 19488.2-2008 电子政务数据元 第2部分:公共数据元目录
12.GB/T 38664.1-2020 信息技术 大数据 政务数据开放共享 第1部分:总则
13.GB/T 19114.32-2008 工业自动化系统与集成 工业制造管理数据:资源应用管理 第32部分:资源应用管理数据的概念模型
14.GB/T 31360-2015 固定资产核心元数据
15.GB/T 39400-2020 工业数据质量 通用技术规范
16.GB/T 36073-2018 数据管理能力成熟度评估模型
17.GB/Z 18219-2008 信息技术 数据管理参考模型
18.GB/T 34079.3-2017 基于云计算的电子政务公共平台服务规范 第3部分:数据管理
19.GB/T 38667-2020 信息技术 大数据 数据分类指南
20.GB/T 38555-2020 信息技术 大数据 工业产品核心元数据
21.GB/T 32180.1-2015 财经信息技术 企业资源计划软件数据接口 第1部分:公共基础数据
22.GB/T 34045-2017 制造业信息化服务平台服务资源分类规范
21.GB/T 18219-2000 信息技术 数据管理参考模型
22.GB/T 18391.6-2001信息技术 数据元的规范与标准化 第6部分:数据元的登记
23.ISO/IEC 38500:2015 信息技术-IT治理-数据治理-第1部分
24. ISO/IEC 38505-1基于ISO/IEC 38500(IT治理)的数据治理
25. ISO/IEC TR 38505-2 数据治理对数据管理的影响
我们可以看到,在2000年左右我国就发布了数据管理参考模型以及数据元的国标,尽管GB/T 18219-2000 信息技术 数据管理参考模型和GB/T 18391.6-2001信息技术 数据元的规范与标准化 第6部分:数据元的登记标准已经废止。自2015年后各个行业也陆续下发了数据治理和管理相关的指导和规范。从以上标准的发布我们可以看出,我国数据管理和治理起步还是较早的,由于信息化的发展水平较低,区域行业发展不均衡、对数据的认识和利用不足等原因导致重视程度不够,最近因为国家把数据作为生产要素提出后又成为了当前关注的焦点。那么中国在数据治理方面有什么特点呢?
一 普遍对治理和管理不分
众所周知,数据在我国作为了生产要素之一,那数据必然要被估值定价,参与社会价值体系分配,然而数据的种种问题大大影响了数据这一要素的生产力,因此我们有必要通过数据治理规范数据管理行为,从而发挥数据资产更大价值。但是,社会中十有八九对数据治理和数据管理概念不清,笼统都叫数据治理,这就导致了数据治理难以被理解,究其原因是道听途说的比较多,很少有人静下心来看一看国际标准、国家标准、行业标准对数据治理和数据管理的定义,同时很多数据从业人员也急于求成、不求甚解,上来就想学会方法、步骤、实践开展数据治理工作。”问渠那得清如许,为有源头活水来“,不真正弄清概念和定义,在工作中就会遇到困惑、困难和失败,说不清楚、想不明白、得不到领导支持。因此,有必要搞清数据治理和数据管理的区别和联系,才能在实际中有效开展工作,磨刀不误砍柴工,切勿急功近利。
数据治理 data governance 数据资源及其应用过程中相关管控活动、绩效和风险管理的集合。[GB/T 34960.5-2018 3.1]
数据治理就是建章立制的工作,确保数据得到有效管理;数据管理就是保障数据利益相关者的需求得到满足,最大程度挖掘数据价值,所以数据管理就包括了数据架构、数据建模、主数据、元数据、数据质量、数据安全、数据目录、数据资产等管理工作。
二 政务数据治理起步较早
从政务数据治理的历程看,我国政务数据治理主要经历了三大阶段:
初步探索阶段。20世纪初期人们对政务数据还不够重视。政府IT建设的重点是IT技术和业务功能的实现,并不是以数据为中心的建设,对政务数据的认识还停留在非常粗浅的阶段。这个时期缺乏政务数据治理的方法和相关技术,政府部门对数据质量的重视程度也远远不够,数据质量较差,这也增加了后续跨部门数据汇聚整合的难度。对于政务数据的管理和存储,尚处于比较初始化的阶段,数据存储分散无序,不存在专门数据管理和归口部门,采集的数据也主要用于展示,很少进行数据分析和挖掘,数据使用和应用效率较低,这个时期的数据存而未治、治而未用的现象普遍存在。
深入认识阶段。这一时期社会对政务数据的认识不断加深,政府部门开始重视数据的质量和数据的价值,数据的收集和使用开始进行有目的的规划,并对数据进行有计划的管理。数据已被政府部门自觉地当作辅助管理和决策参考的工具。数据存储于分散的业务信息系统中,具备初步的数据标准化能力,文件的存储具备统一的格式。但是,该时期数据从业人员大部分精力还是用于数据维护、数据清洗、利用数据形成分析报告,数据分析挖掘能力偏低,数据还未实现真正的价值挖掘,相关的顶层设计和政策支持较少。
发展落地阶段。在2016年以前,仅有少量省份对政务数据治理投以关注。从2016年开始,各省(区、市)出台的相关政策文件的数量出现显著增加。政府内部建立起专门的数据管理机构,设置相应的工作岗位,聘用专业人员,利用复杂的分析技术解决业务线或者机构的运营难题,政府还为数据从业人员提供职业发展训练以及清晰的职业发展路径。截至2019年年底,我国31个省(自治区、直辖市)中,已设立专门数据管理机构的省份为22个。数据的使用已经贯穿于政府管理各个领域、各个环节和各个过程之中,依数据决策、依数据管理、依数据监督已成为常态,政府管理和决策已离不开数据的支撑。同时,整个机构中都强调通过领导和管理来提升数据质量。
政务数据治理持续和承接性较强,主要体现在:
1.数据生产要素在政策层面得到进一步明确,成为社会各界关注的热点。继《促进大数据发展行动纲要》、中央政治局第二次集体学习、十九届四中全会《决定》中提到数据要素之后,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》出台,这是中央关于要素市场化配置的第一份文件,明确提出“加快培育数据要素市场”,并强调要推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护的具体要求。
2.是高度关注数据安全和隐私保护。2021年,我国公布了《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》,并发起了《全球数据安全倡议》,旨在明确数据安全法律责任,完善监管体系,保障国家安全、公民个人隐私权益和社会安全稳定。文件中,对政务数据的安全与开放也提出了明确的要求。
3.各地政府持续设立首席数据官CDO
2021年5月,广东省印发《广东省首席数据官制度试点工作方案》,选取省公安厅、省人社厅、省自然资源厅等6个省直部门以及广州、深圳、珠海、佛山等十个地市开展试点工作,推动建立首席数据官制度。之后,江苏省工信厅发布关于在全省推行企业首席数据官制度的通知、杭州发布《杭州高新区(滨江)首席数据官制度》、绍兴发布《绍兴市首席数据官制度》,2022年,上海市静安区正式建立首席数据官制度。从目前国内试点地区方案来看,政府首席数据官制度的工作目标基本聚焦在“明确职责范围,健全评价机制,创新数据共享开放和开发利用模式,提高数据治理和数据运营能力”上,重在推进数据要素有序流通,激发数据要素潜力,释放数据要素红利,助力城市治理体系和治理能力现代化。
三 行业治理特点非常明显
政务领域领域关注的是数据资源和开放共享,盘清数据目录、数据资源目录、数据资产目录是政务领域多年的重点工作,因此我们经常会听到政务中的元数据。国家数据局的成立也表明一是管理重要核心数据的共享,一是构建数据管理的基本制度。
金融领域关注的是数据安全和隐私保护,因为金融银行业涉及的法律法规有明确规定和行业监管要求,因此我们可以发现,数据治理的组织体系在金融领域是非常完善的,不像制造业构建一个数据治理组织可能需要1-2年的论证时间。
通信领域关注的是数据质量和数据价值。通信领域具有大量的个人信息,包括通话信息、位置信息、消费信息等,数据交易往往发生在通信领域,所以数据质量和数据估值成为通信领域的焦点。
制造领域数据治理起步晚,信息化发展极不均衡,好的企业信息化已经覆盖所以有业务,不好的企业可能只有人力、财务、OA等三四个系统,同时制造业由于数据素养偏低,普遍把数据作为流程附属产物,因此数据治理工作最为复杂和难以推进。
四 治理框架的融合性较强
在国际上流行的数据治理的典型框架包括:DAMA数据管理框架、CMMI的DMM、DGI的DCAM、IBM数据治理框架、Gartner数据治理框架等,我国数据治理的框架包括38505、34960和DCMM等。以上是一些典型的数据治理框架,国外的做法是根据行业不同遵循某一框架开展,而我国的特点是研究每个框架的特点,最终形成了独具特色的框架。有些企业在不同框架间轮番使用,这个效果不好就换一个用。目前,我国主推的DCMM数据管理能力成熟度评估就是一个具有中国特色的框架,比如,DCMM中把数据架构的内容定位为数据模型、数据分布、数据集成和元数据;把数据标准定义为术语、主数据、指标数据和数据元;把数据生存周期定义为需求、方案开发、运维和退役。DCMM这个框架应该是国内众多专家集世界各个典型框架的精华汇聚、提炼、总结的结果。但是,DCMM本身的特点也决定了并不能适用于所有行业,而且其五级要求必须参加或制定行业相关数据标准,其实一个企业的数据管理能力与是否制定标准并没有直接性的决定关系;还有就是数据标准里的数据元,重所周知,数据元是数据不可拆分的最小单位,尤其我国很多企业都是购买的商业套件,既有国内的也有国外的,如何在数据元层面实现数据标准化,绝对是一个大大的难题。融合性强现了我国对数据治理的理解和发展,但是要形成真正的中国数据治理理论体现还需要较长的路要走。虽然我们看到,全域治理、全局治理、中台治理、大数据治理、复合治理等等新概念的出现,但是必须要认真研究新形势、新技术、新管理环境下,中国不同行业数据建设和发展的特色,需要更多的行业数据专家结合具体实践提出更好的数据治理理论和框架。
五 治理成效并不十分明显
各大头部企业皆在数据分析上投入庞大资源,期盼改善决策的流程和成效,范围涵盖产品研究、业务创新,到供应链管理、顾客体验和风险管理等。然而,许多高管认为,公司在数据分析方面所执行的计划与投资未获得应有的回报,而阻挡成功的障碍往往存在于内部的流程与实践中。近期由哈佛商业评论分析服务所开展的针对全球各行业744名企业高管进行的调查报告指 出,只有不到五分之一(18%)的受访者表示公司在分析方面的投资已获得足够的回报。成效不理想的背后潜藏许多原因:1)在运用分析结果、散布至实际业务方面的效率低落;2)未在现有工作流程中纳入数据分析,导致决策历经的流程无法真正影响决策者;3)核心业务端人员缺乏解读并运用数据分析的技能;4)在各部门中分析各自独立,使结果相互矛盾。此外,尽管企业拥有大量数据,却很少人认为其公司“根据数据决策”。
数据分析、数据驱动、数据应用是数据治理成效的直观体现。根据访谈和调研,我国在数据治理成效方面突出的企业并不很多,从参与DCMM评估的企业数据便可看出一二,根据中国电子信息行业联合会网站公布,DCMM评估自2020年启动,河北、天津、无锡等20余省市相继发布针对性支持政策,推动DCMM参评企业数量持续增长,截至目前已累计完成近千家企业的评估,参评企业分布于全国各地,企业类型覆盖软件和信息技术服务业、制造业、银行业、电力业、通信业等多个行业。头部企业数据管理工作已经进入深水期,但大部分企业仍处于数据管理初期。中国电子信息行业联合会DCMM评估统计结果显示,现阶段通信业、银行业、电力业数据管理能力相对领先,逐渐迈入深水区,以上3个行业DCMM评分普遍在3级以上,通信业4级占比超过了60%,银行业3级占比接近70%,电力业3级和4级累计占比达到85%。软件和信息技术业、制造业数据管理能力相对薄弱,以上两个行业集中于2级和3级,同时2级比例远高于3级,其中软件和信息技术业的2级占比是3级2倍以上,累计占比达到97%,制造业的2级占比接近3级的5倍,累计占比达到98%。。也就是说大部分企业数据管理能力是比较弱的,因此数据治理的成效应该并不明显。

免责申明:

本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!

《数据治理行业实践白皮书》下载地址:https://fs80.cn/4w2atu

《数栈V6.0产品白皮书》下载地址:
https://fs80.cn/cw0iw1

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:
https://www.dtstack.com/?src=bbs

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:
https://github.com/DTStack

0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群