数据谭 | 高校数据标准如何落地?

传说为了阻止人类联合起来兴建通天的巴别塔,上帝让人类语言不通,彼此无法沟通,计划因此失败。两千多年前,秦始皇统一六国之后也首先提出“车同轨、书同文”的重要规定。由此可见,“标准”自古以来就是一切管理工作的重中之重。时至今日,谈数据治理,我们依旧绕不开的话题就是“数据标准”。

数据标准管理是数据管理的基础性工作,是高校数据治理的首要环节,对于学校厘清数据资产、打通数据孤岛、加快数据流通、释放数据价值有着至关重要的作用。

“在校人数”这个指标,保卫处定义的是“真实在校园里的人数”,用于疫情管控场景;人事处定义的是“在岗在编人数”,用于基础数据上报等场景。再比如不同场景下学生的类型和状态,教务与学工也是标准不一致的。

所以,数据标准制定和落地的过程中需要对数据语义不清晰、数据定义和使用语境界定等情景做出规定。而高校的情况要更复杂,因为历史原因业务系统“烟囱林立”、人员的调动、院部对信息化理解的参差等,导致了高校数据标准的长期缺位和不统一。

为了解决这一问题,国家标准化管理委员会在教育领域规范了大量标准,并不断迭代更新,如近年来发布的《信息技术 学习、教育和培训教育管理基础代码》(GB/T 33782-2017)、《全国组织、干部、人事管理信息-信息分类代码集》(GB/T 14946.2-2019),及教育部发布的《教育基础数据》行标(JY/T 0633-2022)等。高校也会根据自身的发展规划符合学校信息化规范的校园标准等,这就形成了“国标+行标+校标”三位一体的数据标准格局。

数据谭 | 高校数据标准如何落地?

一套完整的数据标准体系是学校数据管理和应用的基础,有利于提高数据底层的互通性,提升数据的可用性,消除数据业务歧义。在数据标准落地的过程中,一般我们会依据国标、行标和各个高校的实际情况制定数据标准方案,在需求调研后扩展国标形成校标,在校标的基础上按照八大域进行数据建模和产品初始化形成标准框架,再经过数据治理后对校标框架落地扩充形成数据资源目录,包括数据标准、代码标准、数据记录和治理成果(如一数一源、分类分级、共享方式等)。

了解完数据标准的前世今生,我们再来谈一下咱们标准制定的详细过程。总体来说,标准的建立分为以下几个步骤:

·建标:参照国家标准、教育部行业标准,规划建立信息标准规范体系,在数据治理的过程中始终贯彻标准意识;

·升标:根据“向上靠拢”原则采用国/行标准,梳理确权后采用业务系统代码;

·对标:对存量业务系统进行标准对照,并对照结果差异进行标准转换;

·落标:坚持标准落地,即“新建系统时需要规范化标准,数据治理过程要将标准落地”

具体来说:

1、首先在需求调研的基础上,我们会以学校数据资产规划和数据中台数据模型和代码标准为目标,制定以数据标准和代码标准为主要内容的学校信息标准规范,标准规范体系如下图所示:

数据谭 | 高校数据标准如何落地?

2、在信息标准规范制定的过程中,我们还会对学校信息化系统业务域的业务数据进行细化梳理,明确业务系统中存储的数据及数据标准情况。在遵循国标、教标的前提下,对业务系统数据标准逐步分析梳理。通过业务系统源表筛选、字段对标分析、代码集对标分析、拆合表分析检查,大量完善学校业务数据的信息标准,补充学校信息标准中的校标部分,为全量数据集成提供科学完善的业务数据信息标准,以支持全量数据的整合清洗。

数据谭 | 高校数据标准如何落地?

在数据识别过程中,我们提供智能化辅助工具提升识别效率。如:文档挖掘机,支持业务系统字典表word文件一键转换,实现高效数据识别;SQL翻译机:快速实现不同数据库语句之间的一键转换,通过对比高亮的方式快速定位差异,省去人工对标转标工作。

数据谭 | 高校数据标准如何落地?

3、如果标准更新迭代了怎么办?不用担心,我们会在后台更新最新发布的信息标准,并上架至迪塔维知识库,通过消息中心进行标准迭代的“上新”通知,为项目进行在线“参照”标准升级。

具体来说,我们首先将新补充的数据标准及代码标准子类(分类)在参照标准版本中进行补充更新。

数据谭 | 高校数据标准如何落地?

补充更新迭代的数据标准、代码标准。

数据谭 | 高校数据标准如何落地?

根据“发文”中的标准,在数据中台维护新增数据标准的结构信息。

数据谭 | 高校数据标准如何落地?

代码标准还需根据“发文”中的标准,在数据中台维护新增代码标准的代码数据内容,以便在线向项目现场提供数据接口更新。

数据谭 | 高校数据标准如何落地?

至所有补充标准在标准管理中迭代完整,最新版的参照标准即形成,可向项目推送标准更新通知。

数据谭 | 高校数据标准如何落地?

4、对于现实存在的代码标准与业务标准的差异纠偏方面,我们会采用差异转换、采用校标、差异忽略等多种方式纠正差异,及时扫除差异问题,保证数据的统一规范,提升数据质量。

通过数据中台的代码纠正功能,可以实现代码标准与业务标准的差异捕获,在线对比结果并统计分析差异信息(包括但不限于标准总代码数、一致代码数、差异率等),同时提供查询、下载差异明细。

数据谭 | 高校数据标准如何落地?

5、完成以上一系列工作,最后我们会与校方进行标准更新的评审,确定更新迭代至学校的信息标准体系。

数据谭 | 高校数据标准如何落地?

好了,讲完了标准落地的全部过程,我们再来看看兄弟院校的实战效果:

湖南大学

湖南大学全域数据中心采用“摸家底、定标准、建平台,先治理、后应用”的建设思路,建立起学校各业务系统数据从采集、治理、共享及应用的全链路数据生态体系。完成了31个业务系统、958张业务表和代码表、3.2万个业务字段的数据采集、清洗、转换以及治理工作,制定了校级数据标准和代码标准,并以数据资源目录的方式展示出来。

数据谭 | 高校数据标准如何落地?

福建农林大学

作为信息化管理部门和数据治理牵头单位,我们在与现代教育技术与信息管理中心在技术工作开展的过程中,同步草拟了《福建农林大学数据管理办法(讨论稿)》、《福建农林大学信息标准规范(讨论稿)》等规范办法和制度,持续输出与校级数据资产建设相关的其他规范制度和流程办法,保证数据治理规范化、持久化、制度化。

数据谭 | 高校数据标准如何落地?

天津职业大学

在数据标准建立阶段,我们根据校级全域数据资产目录分类分级按照横向8域,纵向5级的规则进行数据资产目录划分,涵盖“学生、教工、财务、资产、教学、科研、管理和公共服务”数据资产,输出学校《数据标准规范》和《代码标准规范》,解决数据标准差异化问题,科学、规范地推动学校信息化建设工作的开展。

数据谭 | 高校数据标准如何落地?

数据标准是数据一致性、完整性、准确性的保证,是数据分析、数据集成的基础。数据标准的建立需要经过审批、发布,然后是推广和使用。同时,还需要评估数据标准的落地情况,通过评估定位数据问题并进行整改,以保证制定出的数据标准被正确使用,避免标准制定和标准执行两层皮。所以,数据标准真正落地的闭环还要有使用→整改→再使用的过程,能让标准落地真正服务于信息化建设,而不是“为了建标准而建标准”。

上一篇:

下一篇:

相关新闻