博客 为什么要做数据标准?

为什么要做数据标准?

   数栈君   发表于 2023-05-19 10:16  604  0

数据标准是信息在采集、处理、交换、用户访问、传输过程中的统一规范,是实现学校信息资源共享和信息系统得到协同发展的基础。数据标准的建立是学校信息化、数字化建设的一项重要工作,各类数据必须遵循一个统一的标准进行组织,才能构成一个可流通、可共享的信息平台。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/22b1c0128e934a2c3f6e9ef545df53ae..jpg
我们可以将数据标准理解为一种各系统、各部门间用于沟通的共同语言。信通院发布的《数据标准管理实践白皮书》对其的定义是:数据标准是指保障数据的内外部使用和交换的一致性和准确性的规范性约束。“数据标准”并非是一个专有名词,而是一系列“规范性约束”的抽象。
数据标准不仅仅只是描述了一些需要大家去遵守的规范和要求的文档,而是一套由管理规范、管控流程、技术工具共同组成的体系。学校需要通过这一整套体系来确保各种重要信息,例如课程、教师、学生信息等在全校内外的使用和交换都是一致、准确的,从而实现学校的信息标准化。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/bf7ad275bf5760a43a274cca353ff6d3..jpg
长久以来,绝大多数学校的系统建设都是依据业务需求来的,没有一个整体的规划,没有考虑是否与其它系统的功能或数据存在重复的问题,而且各个系统由不同的厂商和产品搭建,所以不同系统之间数据的不一致性难以避免,也造成多种数据问题:
1、数据共享难以实现
数据存储结构不一致,调用多系统的数据时,由于某些数据在不同系统中数据存储结构不同,导致数据无法直接关联,影响不同系统之间的数据共享。

2、数据同名不同义导致错误
数据定义不一致,不同系统对数据的命名、业务含义、取值范围等定义不同,比如同名不同义、同义不同名等。

3、沟通成本增加
数据理解不一致,不同人员对数据的理解不一致,导致在数据使用时浪费很多时间来进行沟通。


4、数据来源不明
数据来源不一致,数据存在多个来源,在使用数据时,不清楚应该取哪个系统的数据。

上述问题,任何一个的出现都会让人头痛不已,但是通过数据标准的建设,却可以有效消除数据跨系统的非一致性,从根源上解决数据定义和使用的不一致问题,为学校数据建设带来诸多好处:

  • 数据标准的统一制定与管理,可保证数据定义和使用的一致性,促进单一数据视图的形成,促进信息资源共享。


  • 通过评估已有系统标准建设情况,可及时发现现有系统标准问题,支撑系统改造,减少数据转换,促进系统集成,提高数据质量。


  • 数据标准可作为新建系统参考依据,为学校系统建设整体规划打好基础,减少系统建设工作量,保障新建系统完全符合标准。


数据标准建设提供了更加完整、准确的数据,为学校老师及校领导更好的支撑经营决策、精细化管理。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/efebde8f633cdef0ea785835734fa2d2..jpg

2021年3月15日,中华人民共和国教育部发布《关于加强新时代教育信息管理化工作》,其中提到:

1. 以习近平新时代中国特色社会主义思想为指导,深入贯彻党的十九大和十九届二中、三中、四中、五中全会精神,全面贯彻落实全国教育大会精神,深化教育领域“放管服”改革,以数据为驱动力,利用新一代信息技术提升教育管理数字化、网络化、智能化水平,推动教育决策由经验驱动向数据驱动转变、教育管理由单向管理向协同治理转变、教育服务由被动响应向主动服务转变,以信息化支撑教育治理体系和治理能力现代化。


2. 加强教育数据规范管理。完善教育数据管理制度,建立数据标准体系,规范数据采集、存储传输、使用处理、开放共享等全生命周期的数据活动。基于数据应用和共享建立数据资源目录的动态更新机制,全面掌握教育数据使用情况。开展数据分类分级工作,形成数据溯源图谱,明确各类数据的数据源。按照“一数一源”的原则,根据实现处理目的最小范围,规范数据收集使用范围,优先通过共享获取数据,避免重复采集。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/5de28b3b807919b6e793c122f5c96123..jpg

为落实《国家中长期教育改革和发展规划纲要(2010-2020年)》加快教育信息化进程的要求,建立教育信息化标准体系,以保障教育信息化健康有序发展,实现数据互通、资源共享,我部研究制定了《教育管理信息 教育管理基础代码》、《教育管理信息 教育管理基础信息》、《教育管理信息 教育行政管理信息》、《教育管理信息 普通中小学校管理信息》、《教育管理信息 中职学校管理信息》、《教育管理信息 高等学校管理信息》、《教育管理信息 教育统计信息》等7个教育信息化相关标准,现作为教育部行业标准予以发布,并自发布之日起施行。

教育部关于发布《教育管理信息教育管理基础代码》等七个教育信息化行业标准的通知

数据标准建设一般都要从下述几个步骤来下手,其中任何一个步骤单拎出来看工作量都是相当庞大,像标准的落地及维护想要完全依靠人工也不太现实。对于学校而言,需要一套完善、易用且更加智能的数据标准建设方案帮助其将数据标准建设工作落地。

海彦信息的数据标准管理平台,可以有效帮助学校建立规范的数据应用标准,消除数据的不一致性,从根本上改善和解决系统的数据质量问题,实现数据有效共享,并通过智能化的管理方法,让校师生轻松享受大数据带来的便利和效益。

1. 数据标准制定

  • 标准的建设应该严格遵循计算机软件行业的各项国家标准、教育部颁布的2012 版《教育信息化数据标准》,同时参考国际上通行的软件开发标准和规范,使系统具有良好的兼容性,能够与教育部现有和即将推出的符合教育部颁标准的各种教育管理信息系统软件配合使用。

     

  • 在建设过程中需要根据学校的具体情况和实际需求,协助学校建立一套科学、实用、完善的信息化标准体系和规范。


2. 数据标准的分类

  • 数据治理对标准的需求可以划分为两类,即基础性标准和应用性标准。前者主要用于在不同系统间,形成信息的一致理解和统一的坐标参照系统,是信息汇集、交换以及应用的基础,包括数据分类与编码、数据字典、数字地图标准;后者是为平台功能发挥所涉及的各个环节,提供一定的标准规范,以保证信息的高效汇集和交换,包括主数据标准、数据交换技术规范、数据传输协议、数据质量标准等。


3. 数据标准的管理

数据标准管理主要包括信息标准子集管理、代码标准管理、学校自定义编码规范管理、交换标准管理、数据管理规范等。

  • 信息标准子集管理:数据按照统一的标准产生、存放、使用,使数据真正实现共享。建立的信息子集包括:学校基本情况信息子集、学生信息子集、教职工信息子集、教学管理信息子集、高等职院校专用信息子集及其他。各子集下应包含数据类、数据子类、数据项。


  • 代码标准管理:对标准数据代码统一进行管理,每个管理子集都对应着相应的标准代码,代码标准分国家代码标准、行业代码标准、学校代码标准,以及代码的定义与说明。


  • 学校自定义编码规范管理:制定自定义编码规范,如学号、职工号、组织机构编号等规则,根据项目实施经验可对学校提供相关规范文档,配合学校完成自定义编码工作。


  • 交换标准管理:建立统一的数据传输与数据交换规范,实现不同部门间、不同应用系统间的数据交换,具有良好的扩展性。明确学校未来加入的应用系统如何对接,制定交换数据描述、互换模型设计以及相应的对接标准。通过定义清晰而标准的交换数据接口,使得各应用之间及与共享数据服务平台之间能够实现数据交换和共享。


  • 数据管理规范:主要内容包括管理类规范(学校信息化管理规范)、信息服务类规范(信息服务的登记、管理、运行、维护各个方面建立的规范,如数据接入申请流程规范、数据使用申请流程规范)、技术类规范(从技术的角度保障网络与信息系统正常运行的规范,例如实施规范、维护规范)。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/99b61e3177b64aeb7ac9c40aaa2ec1d6..jpg

         

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/c05578d165607e784e3e07e2a9356a69..jpg

数据是学校成长过程中积累的宝贵资产,做好数据标准管理这个全局性、技术性的工程,能让数据为学校创造更大的价值。

免责申明:

本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!

《数据治理行业实践白皮书》下载地址:https://fs80.cn/4w2atu

《数栈V6.0产品白皮书》下载地址:
https://fs80.cn/cw0iw1

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:
https://www.dtstack.com/?src=bbs


同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack

0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群