信息化视角下高校基础数据管理策略研究与实践
2022-05-30吴驰毛文卉刘雅琴
吴驰 毛文卉 刘雅琴
摘 要:随着教育信息化2.0时代的到来,高校的信息化工作也正经历着从“业务数据化”到“数据业务化”的转变。通过基础数据共享消除数据孤岛,进而提升数据质量并发挥数据价值,最终实现“智慧校园”,已成为高校信息化建设关注的热点。文章针对高校信息化建设和管理过程中面临的基础数据复杂度高、一數多源及共享交换难等问题,从基础数据的来源确定、共享途径、共享范围和有效利用等四个方面,结合数据的生命周期,提出相应的管理策略,并介绍华中科技大学基于该策略,在制度建设和具体实施方面的实践成果。实践表明,只有根据高校特点,科学制定适应信息化发展规律的管理制度,以先进的信息化技术手段为支撑,找准典型应用,才能形成学校基础数据管理的长效性策略,真正促进学校的信息化发展。
关键词:基础数据;高校信息化;数据共享;数据管理
中图分类号:TP393 文献标志码:A 文章编号:1673-8454(2022)09-0083-06
随着高校信息化的发展,历史上由各业务管理部门主导、分散建设的信息系统已无法满足学校需求,消除信息孤岛,让数据共享、系统互通已成为师生共同的强烈诉求,也是高校信息化部门工作的重中之重。而无论采用何种治理模式和技术架构,基础数据的管理都是一个必须面对的问题[1-7]。
一、基础数据的特点
高校信息化建设过程中会产生各式各样的数据,而什么样的数据才是基础数据还尚无定论。有高校从学校管理或高基表统计填报需求出发,认为反映学校教学、科研、学科、管理等各领域基本情况的数据是基础数据;有高校以教育部2012年颁布的“教育管理信息系列标准”中的相关代码和数据集作为学校基础数据标准。不论各高校对基础数据的范围或标准的定义有怎样的理解,一个普遍存在的共识是,高校基础数据存在以下一些特点。
(一)数据类型复杂多样
高校涉及管理、教学、科研、生产、生活等方方面面,随着各个方面信息化建设的发展,其产生的数据类别也更加复杂多样。
(二)各部门数据既高度依存又相对独立
数据是由业务产生的,高校业务部门在进行信息化建设的过程中,几乎不可能去考虑其他部门的需求。甚至大的业务部门内部,能做到基础数据的标准、结构等统一也并非易事。然而,各业务部门之间的数据依存关系又非常紧密和复杂。例如,几乎所有的业务部门都会用到学生的个人、学籍基础等信息 ,而学生的基础信息很有可能又分属几个部门管理产生。
(三)一数多源情况普遍存在
由于历史、管理职能交叉重叠等复杂原因,高校基础数据普遍存在权威数据源不明的情况,往往会出现领导要一个简单的全校学生总量数据,教学、学工等部门拿出的数据有差异、不统一的情况。
(四)共享和交换需求强烈
随着信息化建设的进一步推进,由原来根据管理职责条块分割的数据产生和交换模式已远远不能适应互联网时代的要求,各部门开始意识到数据共享和交换的重要性,需求日益强烈。
二、基础数据管理存在的主要问题及其应对
与其他所有事物相同,数据也有生命周期,一般可分为采集(生产)、存储、处理、传输、交换及删除(销毁),特定数据的生命周期由实际业务场景决定,并不一定所有数据都经历上述完整的周期[8]。基础数据的管理,就是要基于其生命周期特点,解决好以下几个问题。
(一)基础数据从哪里来
数据是由相关部门在各项实践活动中采集的,使用信息系统的目的是提高采集、存储和处理的效率。要解决好“从哪里来”的问题,必须首先根据“谁产生、谁负责”的原则,确定权威数据源,避免“一数多源”“有数无源”“有源无数”等问题。权威数据源的确定,是基础数据管理的第一步,也是学校信息化部门不可推卸的责任。当然,权威数据源的确定必然是一个动态而非静态的过程,既要适应学校管理的机构划分和变革,又要实事求是地确定真正“有能力产生、有意愿负责”的数据源管理部门。此外,确定权威数据源不仅仅是划分责任的过程,在把责任交给相关部门的同时,也要尊重其对数据的所有权利,如数据共享的审批权等。通过权责对等的管理,才能真正得到各部门的理解和支持。
(二)基础数据怎么来
站在学校信息化部门的角度,基础数据必须进行共享和交换才有可能打破信息孤岛。建设学校基础数据库(中心数据库),已成为绝大多数学校信息化部门的共识与职责。但从数据的生命周期来看,基础数据库中所有数据的采集(生产)过程,都是在学校其他部门而非信息化部门进行。因此,数据来源成为所有学校信息化部门必须解决的一个问题。一些高校信息化部门采用了自顶向下的方式,制定并颁布非常全面和详细的基础数据结构及标准,试图建成大而全的学校基础数据库,要求各部门将相关数据入库;另外一些高校信息化部门则借用管理全校信息化基础设施的“优势”,直接将学校各部门业务系统中的所有数据“抽取”到基础数据库中,再进行展现和分析。
无论采用上述哪种方式,在实践过程中都鲜有成功的案例,只能说“理想很丰满、现实太骨感”。究其原因,可以归结为没有解决好“怎么来”的问题。作为学校的信息化部门,优势在于掌握先进的信息化基础设施和技术手段,短板则在于不能很深入地理解相关业务。数据都是有其业务背景的,不能很好地理解数据的业务背景,数据的整合、分析、展现就无从谈起。如果对数据采用“抢来”“偷来”的方式,必定很难得到各业务部门的主动配合,要管好基础数据,基本上是不可能的。所以,基础数据的获得,一定要征得权威数据源部门的同意,其范围也必须有理有据,不能抱着“越多越好”的思想随意扩大。
(三)基础数据到哪里去
要实现基础数据的共享和交换,需要面对的另一个问题是数据到哪里去。答案似乎显而易见,应该是学校的其他部门。但“怎么去、去何处”却是学校信息化部门在这个过程中需要解决好的问题。究其根源,其实是要回答谁申请、谁审核、谁操作的问题。一个较好的解决方案是,由需要共享的部门申请,数据源负责部门同意,学校信息化管理部门审核,学校信息化技术部门负责使用技术手段操作。而且,当同一项基础数据被不同部门提出共享需求时,也应采用“一事一议”的审核方式。这样既尊重了数据源负责部门对于数据共享和使用的知情和审批权,又由学校信息化管理部门站在全校信息化建设的全局角度,对数据共享中的范围风险进行把关。
(四)基础数据怎么用
基础数据管理中需要解决的最后一个问题是“如何使用”。在使用过程中,一定要避免“泛化”和“随意”的倾向,掌握好“最少够用”的原则。基础数据的泛化、随意使用一方面会带来极大的安全风险,另一方面也会影响数据源负责部门的积极性,从而使得信息化部门在推进基础数据建设和管理过程中举步维艰。因此,作为学校基础数据库的建设管理单位,信息化部门一定要在基础数据的共享和使用上慎之又慎,谨记自己只是“数据的搬运工”而非“数据的生产者”。当然,基础数据必须“好用”,即数据质量必须良好。基础数据质量提升是一个动态的过程,基础是“通”,即必须实现学校各类基础数据的互联互通;手段是“用”,即必须在基础数据的共享使用过程中,才能真正发现数据质量的问题,从而督促数据源部门通过有效手段进行修正;目标是“准”,即基础数据最终必须完整准确。“通—用—准”是一个循环迭代的过程,能够真正长效地保障基础数据质量的不断提升。
三、华中科技大学的实践
(一)制度建设
为解决好学校基础数据管理问题,华中科技大学在“十三五”信息化规划中的“十个一”工程中明确提出,建设“数据一个库”,并于2016年5月制定并颁布了《华中科技大学基础数据库建设与管理暂行办法》(以下简称《办法》)。《办法》从以下几个方面明确了学校基础数据管理的基本策略。
1.基础数据的定义
《办法》对基础数据和基础数据库进行了明确定义。基础数据是指学校各单位在管理和服务信息化过程中产生的,具有确定的权威来源,且可被其他业务信息系统或公共信息系统使用的数据。基础数据库是学校基础数据的集合,通过统一数据交换与共享平台,实现数据共享和一致性管理,是学校重要的信息化基础资源。上述定义明确了基础数据范围以共享为基础,实事求是地反映了学校信息化建设的阶段特点,有效地杜绝基础数据库建设过程中的泛化问题,避免学校信息化部门盲目追求“大而全”的建设目标而导致的失败风险。
2.基础数据的范围
在基础数据具体范围方面,《办法》规定“基础数据主要包括组织机构、人事、学生、财务、资产、教学、科研、网络、总务、后勤等管理和服务数据。基础数据范围根据基础数据库建设进度和信息化工作需要逐步扩展,具体由网络与信息化办公室确定。”这样既明确了基础数据的具体内容,又从制度上尊重了基础数据的动态性和基础数据库建设的阶段性,为未來的发展保留了空间。
3.权威数据源的认定
在权威数据源认定方面,《办法》规定“网络与信息化办公室根据业务归属情况,负责确定基础数据的权威来源,明确其产生和维护部门”,同时还对各类基础数据的内容及责任部门进行了明确的划分。有了权威数据源负责部门及其认定部门,基础数据的来源和质量才有基本保障。
4.数据的共享和使用
在数据共享和使用方面,《办法》规定“基础数据使用单位根据业务系统需求,在严格遵循‘最少够用原则下,提出数据共享申请并提供接收数据的中间库。在经数据源产生单位审批同意后,由网络与计算中心运用数据同步工具,将共享数据推送至中间库,并由使用单位完成中间库到业务库的同步。基础数据库的同步操作仅限于校内进行,中间库必须与业务库之间逻辑隔离,不得使用校外服务器作为中间库。基础数据使用单位只能将获取的共享数据,用于经数据源产生单位审批指定的业务信息系统,不得私自扩大使用范围或作为他用。”这样既明确提出了“最少够用”的使用原则,又规定了数据的使用必须经过数据源产生部门审批同意,同时,还对信息化部门共享数据的技术手段进行详细规定。
5.数据的安全与保护
在数据的安全与保护方面,《办法》规定“基础数据的产生单位、使用单位和管理单位,应严格遵守国家、地方及学校关于信息安全和个人信息保护的相关法律规定和规章制度,制定本单位基础数据管理细则与使用规范,保障学校基础数据的使用安全,确保信息不滥用、不泄露。各单位应明确基础数据信息安全责任人及数据管理员,发生人为或技术原因导致数据泄露、窃取、破坏等信息安全事件,由该单位及相关人员负责,并应按照信息技术安全事件报告与处置流程向学校报告”。数据安全是基础数据管理的“底板”,在基础数据全生命周期都应重视并保护数据安全[9]。因此,从制度上明确责任单位、责任人员及安全事件处置流程是非常必要的。
(二)具体实施
1.基础数据服务平台
为做好基础数据库建设及基础数据的共享与交换,学校建设了基础数据服务平台。平台总体架构如图1所示,主要包含以下模块:①数据交换平台。采用ETL等技术[10][11]实现学习各业务数据库与基础数据库的共享交换,在交换过程中,通过数据清洗和转换实现基础数据的标准化。为满足不同业务场景对数据交换频率的要求,平台提供实时交换与定时交换两种模式。②数据开放平台。通过接口技术为学校各类信息系统提供基础数据调用服务,信息系统获得权限后,可通过API获得相关数据。③数据查询平台。满足学校各部门对基础数据的查询需求,平台提供拖拽式数据查询开发界面,基础数据管理人员可快速为相关部门开发所需的数据查询页面。④数据标准管理平台。对学校数据标准进行信息化管理,支撑基础数据库的运行,为各类应用数据库建设提供查询和指导。⑤数据质量管理平台。针对从各类业务数据库交换而来的数据,依照平台配置的标准,进行准确性、合规性、一致性、重复性、及时性、完整性的自动监测,并生成告警及质量报告。网络与信息化办公室依照报告,督促相关职能部门改善数据质量。⑥数据监控平台。对数据交换等业务进行实时监控,保证平台的可用性。
基础数据服务平台自建成以来,已收录人事、教务、研究生、科研、资产、财务、后勤等7大类近70万条数据记录,实现全校近160个信息系统之间基础数据的共享与交换,日均数据记录共享交换量达6千万条,有效地消灭“信息孤岛”[12]。
2.基础数据共享流程
根据基础数据管理的相关制度,学校依托“网上办事大厅”制定“基础数据共享申请审批”流程,具体如图2所示。
基础数据使用单位的具体负责人员只需登录学校网上办事大厅,根据需求并遵循“最少够用”原则,从已有的基础数据目录中,选择所需共享的数据类型及具体字段即可。如果所需数据不在目录中,则可以在流程中的“其他数据”栏目中填写和说明。流程经申请单位负责人审核并承诺合规使用后,系统根据所申请的数据类型自动分发至对应的数据源部门审核。数据源部门负责人根据申请单位填写的相关信息审核后,决定是否同意共享。如果同意共享,再由网络与信息化办公室根据学校信息化相关管理和技术规定进行审核,审核通过后,由网络中心使用学校基础数据服务平台实施共享。
3.基础数据典型应用建设——“一张表”平台
为进一步推动数据质量的提升,发挥数据价值,实现教师各类数据“最多填一次”,华中科技大学从2018年开始启动“一张表”平台建设。平台以解决重复填表为出发点、提升数据质量为目标、学院业绩考核为驱动、可视化配置平台为支撑,实现个人数据自动汇集、集中维护、可视化展现,学院考核方案个性化配置,绩效分配自动化计算,报表自动生成等功能。目前,该平台已在全校20个学院推广应用,预计2022年全校覆盖。通过“一张表”平台的实施,使得原来分散在各业务系统中的数据,以教师个人为核心进行汇集,并通过学院业绩考核等手段,由教师本人对数据进行核对、补充及完善,进一步提升了数据质量。目前,一张表平台数据已达七大类共21.5万余条。通过对这些数据的可视化展现,教师个人和学院可以全面、准确地了解和分析个人及学院发展情况,为学院提供决策依据。同时,这些数据也成为教师未来进行各项填报的基础,通过信息化手段实现校内各项业务办理时相关数据的自动填充。此外,通过“一张表”平台提供的自动报表功能,学院和学校各业务部门也能根据学科评估等各类业务的要求,基于数据自动生成相关报表。
四、结语
随着教育信息化向2.0时代迈进,高校的信息化工作也正经历着“业务数据化”到“数据业务化”的转变。如何进一步提升基础数据的共享程度、提高数据质量、发挥数据价值,已成为各高校关注的热点。华中科技大学的实践表明,只有根據高校特点,科学制定适应信息化发展规律的管理制度,以先进的信息化技术手段为支撑,找准典型应用,才能形成学校基础数据管理的长效性策略,真正促进学校的信息化发展。
参考文献:
[1]张笑琪,庞镭.高校数据共享分析与应用研究[C].中国计算机用户协会网络应用分会2018年第二十二届网络新技术与应用年会论文集,2018:3.
[2]彭雪涛.美国高校数据治理及其借鉴[J].电化教育研究,2017,38(6):76-81.
[3]周南平,贾佳.大数据背景下的高校信息化建设路径研究[J].中国电化教育,2018(9):75-80.
[4]许晓东,彭娴,周可.美国通用教育数据标准对我国高等教育数据治理的启示[J].高等工程教育研究,2019(1):103-108.
[5]许晓东,王锦华,卞良,等.高等教育的数据治理研究[J].高等工程教育研究,2015(5):25-30.
[6]余鹏,李艳.大数据视域下高校数据治理方案研究[J].现代教育技术,2018,28(6):60-66.
[7]余鹏,李艳.智慧校园视域下高等教育数据生态治理体系研究[J].中国电化教育,2020(5):88-100.
[8]吴信东,董丙冰,堵新政,等.数据治理技术[J].软件学报,2019,30(9):2830-2856.
[9]刘蓁蓁.智慧校园建设背景下高校数据安全管理的研究[J].网络安全技术与应用,2021(1):102-103.
[10]俞春,袁芳,刘乃嘉,等.高校数据共享与交换技术的应用研究[J].实验技术与管理,2012,29(11):109-112+122.
[11]孙秋瑞,陈平,黄洛颖,等.高校校务管理数据共享服务平台建设路径研究[J].中国电化教育,2016(3):69-74.
[12]毛文卉,刘雅琴,李凯,等.高校数据共享的若干实践研究[J].中国教育信息化,2021(1):39-42.
作者简介:
吴驰,副主任,高级工程师,主要研究方向为教育信息化,邮箱:wuchi@hust.edu.cn;
毛文卉,工程技术人员,硕士,主要研究方向为数据治理,数据库设计与运维,邮箱:maowh@hust.edu.cn;
刘雅琴,讲师,硕士,主要研究方向为教育信息化,邮箱:liuyaqin@hust.edu.cn。
Research and Practice of University Basic Data Management Strategy
from the Perspective of Informatization
Chi WU, Wenhui MAO, Yaqin LIU
(Network and Computation Center,Huazhong University of Science and Technology, Wuhan Hubei 430074)
Abstract: With the advent of education information age 2.0, informatization of colleges and universities is undergoing the transformation from “business data” to “data business”. It has become a hot topic for the construction of information technology in colleges and universities to eliminate the data island through basic data sharing, improve the data quality, give full play to the data value, and finally build “smart campus”. In order to solve such problems as high complexity, multiple sources and difficult sharing and exchange of basic data in the process of information construction and management in colleges and universities, this paper, combining with the life circle of data, puts forward the corresponding management strategies from four aspects, including source determination, sharing way, sharing scope and effective utilization of basic data. In addition, the practical results of this management strategy in the implementation and system construction by Huazhong University of Science and Technology are introduced. Practice shows that only by scientifically formulating the management system that adapts to the law of information development according to the characteristics of colleges and universities, taking advanced information technology as the support, and finding typical applications, can the long-term strategy of school basic data management be formed and the information development of schools be truly promoted.
Keywords: Basic data; University informatization; Data sharing; Data management
编辑:王晓明 校对:李晓萍