“七步法”助力高校走出数据融合困境实践
2021-05-21蒲飞涂旭东陈苗赵正辉
蒲飞 涂旭东 陈苗 赵正辉
摘 要:如何将数字化校园中沉淀下来的海量数据资产进行融合,是各高校在向智慧校园转型过程中的一个难点。文章通过重庆医药高等专科学校在数据治理、数据融合及数据价值挖掘中的实践,总结出高校数据融合过程不可或缺的七个环节,即“七步法”。高校的数据治理融合必须要数据标准先行,依据国标、省标建立一套适合本校的数据标准。要制定适合于本校的数据管理及使用规范制度,要提高数据管理人员素质,要对元数据质量进行管控。这样才能真正走出高校数据融合的困境,才能筑牢智慧校园数据之基础,为数据价值挖掘提供高质量的元数据。
关键词:高校;数据融合;七步法;经验与体会
中图分类号:G647 文献标志码:A 文章编号:1673-8454(2021)05-0046-04
新一代的信息技术正在逐步改变我们校园内的教育、教学及管理模式。“物联网”、“云计算”、“大数据”等技术的应用,也使各高校产生了各种新类型的数据。我们现在已经充分认识到“数据不但是学校重要资产,而且是能说话的资产”。当我们面对各种数据类型不一、质量高低不均及标准不统一的海量数据资产的时候,想要让这样的数据“开口说话”,还要说“实话”、说“真话”,并且还要利用大数据的分析来帮助学校领导层进行科学决策,并非易事。毫无疑问,必定是经过治理、质量高、能进行融合的数据才能说真话。对于该如何进行数据治理、提高数据治理水平并走出数据融合困境,每所高校虽然有不同实际情况,但面对的数据问题却是相似的。
为了解决数据融合问题,给校园智慧化的分析决策打下基础,2018年我校启动了全校性的數据治理工作,目的是完成全校性的数据融合。刚开始困难重重,但通过我们在数据建设过程中摸索总结出的“七步法”,一个一个环节逐步推进,走出了融合数据的困境。至今已实现了校内数据的初步融合,开始为各信息系统提供标准化数据服务。在这里根据我校数据在融合中遇到的问题,融合数据的思路及过程,数据融合的成效、体会与思考,结合实践总结出“数据融合七步法”,期望“七步法”能给即将进行数据治理融合的高校带来帮助。
一、学校数据融合遇到的问题
要将学校已经建成的数字化校园,推进升级到智慧校园,绕不开的就是数据。同样,我校首先在数据源部分,就遇到了挑战。由于学校以前各业务部门建设的各类系统及资源众多,造成了数据来源广并且分散,数据质量也不高,使数据融合起来困难,更难以利用,这成了智慧校园建设中的一个瓶颈。造成这个问题其实更本质的原因是由于教育与经济社会具有高度的同构性,相关资源彼此联系、信息交织汇集、数据来源多样、要素关系分散,使教育领域大数据呈现出跨时空、跨模态、跨领域等特点,并以碎片化形式广泛地分布于教育场域“三元空间”中,结构化与非结构化数据并存;加上各类数据系统顶层设计不完善、技术标准不统一、部门协同难度大、供给与需求脱节、开放共享还不能有效实现,导致教育领域数据治理面临信息孤岛化、模式碎片化、组织机构功能裂解化等现实困境。[1]只有先将这些形形色色、标准各异、孤岛化、碎片化的数据,治理并融合成能满足数据分析要求的元数据才能进行价值挖掘,才能让数据说“真话”。学校领导层决定下大力气来解决这一难题,于是结合我校数据的实际情况成立了以学校主要领导为组长、分管领导为副组长、信息化部门为牵头部门、各业务部门配合的数据治理融合领导小组,并在此基础上成立了项目组。计划以建设统一数据标准、建设数据仓库、建立常态化治理体系等内容为切入点来逐步解决数据融合问题。
二、“七步法”筑牢智慧校园数据基础
虽然找准了数据融合的切入点及建设思路,但如何落地才是真正的困难。通过反复策划,在建设过程中我们采用了“摸清家底、落地标准、搭建平台、建立规范、明确职责、共享交换、融合应用”这七个步骤逐步推进实施,然后再完成对数据的价值挖掘。其中,融合应用是整个建设过程中最难的一个步骤。
1.摸清家底
在大数据时代,数据即资产。学校到底有多少数据资产,资产管理部门不会进行数据资产盘点。由于专业上的原因,摸清数据家底的任务往往就落到了信息化部门。因此项目组对我校具体的信息化现状进行了盘点。盘点的对象判断依据是能产生数据的信息化系统。经过盘点现阶段我校纳入数据融合治理的各业务部门系统共有15个,信息化教学资源平台31个,业务数据表共10024张,原始数据7200多万条,各类资源172T。
2.落地标准
由于学校各业务系统购买于不同时期,来自于不同公司,信息标准不统一。因此数据标准先行,成了实现数据共享的前提。我们对各个部门的业务系统进行了数据编码、U/C矩阵调研,并依托已有最新的相关教育数据国标代码、省标代码的数据标准,按照“有国标用国标,无国标用省标,无省标建校标”的方法,在最大化满足上级数据标准代码的同时,建立了一套适用于本校的数据标准,现已经制定完成2235项数据标准。
3.搭建平台
在系统性梳理数据标准的基础上,建设了数据原始库、标准库和中心库。针对不同结构的数据,进行妥善的存放、处理。同时通过对信息系统、业务流程、数据流程的梳理,摸清了各个数据的信息源头、数据关系。结合我校实际情况,建立了教工、科研、财务、学生、教学和资产共6个数据主题域,65个子域,808个字段。
在底层数据平台的建设中,我们意识到传统数据的大量积累,新类型的数据层出不穷,都需要采用一个更加智能化的平台,去保证数据取得“准”、分析拿得“稳”,因此我们建设的智能大数据平台,就包含了数据的采集、数据预处理、大数据算法、大数据分析等功能。
为了保证元数据质量,建设了数据监控平台,定时提供数据质量的报告,可以有效督促各部门完善数据内容,解决了数据质量差的问题。
4.建立规范
在数据具体使用过程中,为了让数据使用者能规范合理地使用数据、防止数据的滥用造成数据增加泄露的可能性,我们建立了一系列的数据管理制度和数据使用规范,比如人事数据使用规范、贫困生数据使用规范、科研项目数据使用规范等等。以保证尽量将数据在规定的范围内,合理、合规的使用。
5.明确职责
根据学校各业务部门的数据使用情况及管理责任,我们明确了不同部门的数据职责,确立数据责任权威部门,明确数据管理职责的核心地位和权威性。比如规定教职工基本信息的权威部门在人事处、学生成绩的唯一责任部门是教务处、学生贫困生资助相关数据在学生处等。尤其对原来有多处出口的信息做了职责管理划分,比如学工系统中有学生信息,教务系统中有学生信息,招生、迎新系统中也有学生信息数据,根据我校数据流转的实际情况,将教务系统中经过学信网认证的学生学籍数据作为了唯一来源。同时为保证数据管理责任到人,每个部门配置了一个数据管理员,对数据形成常态化治理,并通过交换治理平台,实现数据的全生命周期的有效管理。因此明确职责就是明确部门数据范围管理职责、明确数据管理员工作职责。
6.共享交换
为了实现数据交换的流程化、数据治理和交换过程的常态化,确保数据交换过程的安全性,我们建设了数据共享与交换平台。我们利用经过清洗转换后的数据,通过这个数据共享交换平台,可以完成我校各个部门业务系统之间的数据交互。在共享交换的同时,为了防止数据向不相干的人泄漏,我们制定的原则是必须通过数据需求部门发起申请,经数据源头部门数据管理员提供、源头部门领导审批,需求部门才能拿到相关数据,并且有日志记载。这样形成了有条件的共享交换,通过制度来解决共享可能出现的数据安全问题。
7.融合应用
数据融合阶段是要将经过转换、清洗、治理后的合乎规范的数据,按一定分类标准,放在学校大数据库中,以方便应用。在學校各个部门的协同配合下,我校数据融合工作也取得了一定的进展。学校新的底层大数据库可向各业务系统提供相关数据。各业务系统新生成的部分数据也能存放在该数据库中。目前已经完成了11个业务系统的数据融合工作,按学校新建的数据标准重新建立了教工、科研、财务、学生、教学和资产共6个数据主题域,65个子域,808个字段。并通过这6个数据主题域将其应用到直观展示面。依据数据融合后的数据基础,我校建设完成的应用主要有:①领导驾驶舱,它可以帮助校领导和管理者及时全面了解我校基础设施、资产、教师科研成果、教师发展,以及毕业生质量分析等情况。②教务大数据,以教务系统、人事系统、科研系统等数据为基础,可以直观地展示学生学业分析、课程分析、授课教职工分析等内容,为学校教务教学评价和决策分析提供数据支持。③学工大数据,实现了学生分布、民族分布、各院部在校生人数分布、贫困学生分布、奖助学金分布、辅导员队伍等情况的展示,为学生管理者做出决策提供了数据支撑。④师资大数据,通过对人事系统数据进行采集、整合、共享及利用,将教职工人事档案可视化,直观地展示我校教职工人员结构、职级分布、学历层次分布等信息,也可以为校内人才发展规划提供数据支撑。⑤科研大数据,初步完成了我校基础科研人员库、论文库、项目库的建设,直观地展示了我校在教科研项目数量分布、论文收录、创新平台及团队、专利和著作分布的情况,通过模型算法,实现项目成果的精准查询、不同科研人员的对比分析,确定校本学科数据情况。
三、数据价值挖掘赋予校园智慧之能
通过前面七个环节完成的数据融合,实现了让各业务系统数据的互连互通,方便了数据安全规范的共享。但更重要的是能让数据“开口说话”发挥价值,而挖掘数据背后的价值才是赋校园智慧之能的必要手段。因此基于融合之后的数据,通过数据挖掘、分析,我们做了多个应用来帮助学校进行智慧管理与智慧服务。①智慧管理方面:针对个人层面,我们分别以教师和学生为中心,通过数据融合,依据科学的算法,为每一位师生构建个人画像。在对教师的画像中,我们以教师的个人信息、科研活动、获奖情况、教学质量考核等多维度数据为基础,形成教师个人画像。通过分析教师信息中的知识和规律,创新研究教师职业发展的路径,教师在自我认知的数据分析基础之上,确定个人职业发展路径。在学生画像中,我们以学生个人信息、学习、上网、经济消费、三餐规律、社交关系、作息等数据为基础,通过综合分析形成学生画像、群体画像等内容,实现学生学业预警、经济消费异常预警、失联预警、过宅/网瘾预警等,方便教师和领导及时介入并给予疏导和帮助,帮助学生走出困境,规避学生可能面临的风险。②智慧服务方面:依靠数据融合为我校一站式网上办事大厅提供的底层数据,实现了校内业务系统、资源平台的统一身份认证。目前已上线的服务流程有65个,而通过对服务流程办结所花时间、使用频率高低、个人环节审批时长等方面数据的分析、挖掘,也可为人员或者部门工作考核评估提供数据支撑。
四、数据融合推进中的经验与体会
通过对我校数据融合工作两年多的建设实践,取得成绩的同时,也获得了一些经验与体会。
1.“一把手工程”是项目实施效果的保障
数据融合项目涉及全校各个部门的工作,数据涵盖了全校所有的业务系统,仅靠信息部门是无法推进的,属于绝对的“一把手”工程。除此之外,还需要分管领导强力推进,并配套激励政策来促使各业务部门紧密配合。我校在项目建设之初,明确了党政主要领导为数据治理融合项目双组长,而信息化分管校领导为常务副组长,同时兼任项目建设办公室主任,在组织上保证了项目组的意见可以得到执行。分管校领导严格执行每周四的项目工作例会及时解决项目中的问题。为保证各部门的配合,在政策配套上,学校对该项目实行了三个纳入,即“纳入部门考核”、“纳入部门领导考核”、“纳入重大工作绩效考核”,极大激励了各部门领导及数据管理员的工作热情。
2.信息化项目预审制度是后续数据打通的保证
由于在数据治理的两年多的时间内,既有老的信息化系统在升级,也有信息系统在新建。因此在学校的信息项目预审会上,预审技术小组都会按照数据治理组的数据标准对新建系统提出要求、做出规范。并对接入校本数据平台的接口,预先给出接口技术规范并写入标书,以保证新建系统能顺利地与校内大数据平台实现数据交互共享。
3.培训一支数据管理员队伍是数据质量的保证
校本数据平台的数据来源于各业务系统,各业务系统的数据管理水平的高低,不仅决定着数据来源的数量,还决定着质量。因此学校融合数据的过程中,应该选择有一定计算机基础知识的人员作为部门级的数据管理员,并保持人员稳定性,着重培训他们的业务素养,提高其数据管理能力,保证进入平台的数据质量。
4.校本数据标准是新旧业务系统数据转换的桥梁
各业务信息系统来源于不同的公司,执行的是不同的数据标准。要想实现数据融合,必须先建立校本数据标准。校本数据标准的建立,应按照“有国标用国标,无国标用省标,无省标建校标”的模式。这样可以在减少建立校标工作量的同时,也能尽量增加采用国标与省标信息系统的融合度。在采用国标与省标的过程中,也应尽量采用最新版本,以保证标准可以在未来几年不过时。如果任由数据平台中存在各业务系统各行其是的标准,最终一定会导致数据融合失败。
5.不能忽视数据管理制度的制定
2020年6月28日全国人大颁布的《数据安全法草案》,主要内容包括:确立数据分级分类管理以及风险评估、监测预警和应急处置等数据安全管理各项基本制度;明确开展数据活动的组织、个人的数据安全保护义务,落实数据安全保护责任;坚持安全与发展并重,规定支持促进数据安全与发展的措施;建立保障政务数据安全和推动政务数据开放的制度措施。[2]同样,当学校全量数据收集汇集在大数据库中之后,数据的安全存储、安全转换、安全使用等多方面的保护,涉及数据管理制度的制定,是必须要面对的一个问题。在融合过程中,应该同步建设各类权威数据管理责任、数据流转等管理制度,而且应该基于数据的全生命周期管理来成体系成套进行建设,最好是按照即将实行的《数据安全法》,建设校级数据分级分类管理以及风险评估、监测预警和应急处置等各项数据安全管理基本制度;明确开展数据活动的部门、个人的数据安全保护义务,落实数据安全保护责任,这些都应该以学校文件的形式明确下来,以提高数据质量,保证数据安全。
6.各方技术人员配合是今后数据平台正常运行的保障
数据融合工作不是所谓“交钥匙”工程,在部署实施的过程中,信息化部门的技术人员与相关公司技术人员需要紧密、深度配合才行。一方面公司技术人员需要信息化部门技术人员帮助进行需求调研、数据调研,另一方面信息化部门技术人员也需要从公司技术人员处学习数据平台管理的相关技术,提升其专业化水平,以能保障未来平台正常运行。
两年多的从学校数据治理到融合再到价值挖掘的工作过程,其实就是“盘资产、建标准、搭平台、立规范、明职责、享交换、融应用”的过程。这个过程也是为高校数据挖掘而筑牢数据基础、提高数据质量的过程。只有这七个环节做好之后,才能保证供给价值挖掘的数据是可靠的,也才能保证挖掘出来的价值是可信的,否则面对不可靠的元数据,无论多优秀、多先进的算法都不能达到效果。
解决数据融合的“七步法”是我校融合数据过程中实践结果的总结。虽然是七个步骤,但是涉及面较广。既有技术层面,比如涉及数据标准、清洗、转换、存储、接口、数据平台等,也有管理层面,比如涉及数据管理制度、使用规范、数据管理员工作激励政策等。从参与人员来看,涉及校级领导、部门领导、各部门数据管理员、信息化部门人员、平台建设人员等诸多干系人。因此要想做好学校数据融合工作,应该是全校一盘棋。数据工作要作整体规划、统筹安排、统一行动、互相配合、协调共享;只有通过多维度大数据治理场景的有机耦合,才能为教育领域数据治理的创新发展提供有效的数据系统支持。也只有这样才能建设真正有用的校本大数据平台,才能真正将各业务系统的数据融合到底层大数据库中,为价值挖掘提供有效数据源。
当前,我国各高校数据治理融合尚处于起步阶段,未来还有很长的路要走,而将人类价值观、角色扮演,尤其是治理主体的创意、直觉与创新精神有效嵌入教育领域数据治理大数据系统,并将呆板的运算法则和冰冷的机器变为实现科学决策、有效治理的“利器”,或许是未来实现教育领域数据治理体系和治理能力现代化的一条可行之道。[3]而数据融合是各所高校从数字化校园走向智慧校园乃至智能校园的必经之路,没有融合后的数据,一切无从谈起,只有筑牢数据之基础,才能赋予校园智慧之能。从我校的数据融合实践及取得的成效来看,应用数据融合“七步法”不失为解决高校数据融合的难点及痛点、助力高校走出数据融合困境的一种有效方法。
参考文献:
[1]南旭光,张培.智能化时代我国高等教育治理变革研究[J].中国电化教育,2018(6):1-7.
[2]法制日报.数据安全法草案:落實数据安全保护责任规定支持促进措施[EB/OL]. http://www.npc.gov.cn/npc/c30834/202006/97f149839ff04c428224f6344ead7e38.shtml.
[3]张培,夏海鹰.教育领域数据治理的基本思路与实践路径[J].现代教育技术,2020,30(5):19-25.
(编辑:王天鹏)