院校研究视角下校院两级智能数据体系构建
2022-05-30崔嘉琪
摘 要:院校研究以数据分析为基础的科学理念正逐步被我国越来越多的高校所采纳。数据是院校研究的根基和源泉,所有针对学校问题或综合评价展开的院校研究都是基于客观数据基础上的。为良好发展院校研究并解决高校实际运行管理问题,相关高校对院校研究视角下数据体系的构建提出更智能、更精准、更稳定、更高效的要求。文章首先介绍高校智能数据体系建设的必要性与发展现状,然后具体分析智能数据体系构建过程中遇到的数据治理工作模式不够完善、数据体系不够智能化、数据文化尚未成熟等难题和挑战。在此基础上,文章从制度建设、平台建设、人员培育三方面进行详细分析,提出运用校院两级模式有效推进数据体系建设的新思路,从而为高校智能数据体系建设提供有益的思路。
关键词:智能数据体系;院校研究;制度建设;平台建设
中图分类号:G46 文献标志码:A 文章编号:1673-8454(2022)10-0116-07
2020年,中共中央、国务院印发《深化新时代教育评价改革总体方案》(以下简称《总体方案》),提出要“创新评价工具,利用人工智能、大数据等现代信息技术,探索开展学生各年级学习情况全过程纵向评价、德智体美劳全要素横向评价”,同时要“严格控制教育评价活动数量和频次,减少多头评价、重复评价”[1]。这就要求广大教育工作者从实际情况出发,利用教育数据和现代化信息手段,对教育教学情况进行综合性客观分析,发现教育管理中存在的问题,从而不断提升并发展。院校研究是以数据分析为基础,全方位多角度对学校现状以及综合问题进行评价分析和研究,其核心理念与《总体方案》的要求不谋而合。院校研究所涵盖的数据来源广泛,从数据涉及的业务面角度,包含了人事数据、财务数据、教务数据、学生数据、资产数据等;从数据类型的角度,不仅包含结构性数据,也容纳文本、视频等非结构化数据。院校研究利用这些海量数据综合分析,从而对学校发展中所遇到的问题进行总体评价和研判。这样的思维视角与教育部在评价改革“破五唯”中,不单纯唯论文、唯项目等要求相契合。院校研究的概念最早由美国的相关机构提出,20世纪80年代我国学者开始关注并涉足这一领域[2]。经过40余年的研究探索,院校研究结合我国高等院校发展特色,已经逐步被更多高校所接受。一些高校按照院校研究的思路建立了相应的研究机构和数据体系。
数据是院校研究的根基和源泉,所有针对学校问题或综合评价展开的院校研究都是基于客观数据基础上的。随着研究的发展和深入,对于数据规模、数据质量、数据管理、数据使用、数据安全等都提出了相应的需求。为了更好地支撑院校研究,国内外各个高校都开始了数据体系建设工作。然而,院校研究在数据资源体系构建和数据管理上,特别是智能数据体系如何支持决策方面,仍然存在诸多建设难点,数据权限存在壁垒、校院两级数据信息不对称、数据利用和挖掘不够深入等问题仍然存在。如何基于院校研究的视角和思路,构建能够良好支撑综合评价与智能決策的数据体系,将直接影响院校研究与决策分析的可靠性与精准性,并关系到学校未来的整体发展建设。因此,笔者从院校研究视角对智能数据体系构建的问题进行分析,提出基于校院两级建设的新思路和相应举措,以期能够提升高校智能数据体系建设水平,支持新形势下的高校综合评价与分析研究。
一、高校智能数据体系建设的必要性与现状
随着大数据、数据挖掘等技术的高速发展,高校多年沉淀积累的数据资源正逐渐受到教育管理者的重视。面对师生规模不断扩张,教育教学逐步向数字化、网络化、个性化发展,以经验管理和实践决策的管理模式难以给出精准判断依据,在重要决策支撑中受到了很大挑战,高校管理者逐步从主观视角向以数据为基础和依据的理论视角转变。院校研究是针对学校自身发展中遇到的问题,通过对数据的收集和分析,为决策提供相应的理论支持[3]。
院校研究科学的理论依据和有效分析成果受到越来越多高校的认可。例如,美国斯坦福大学成立了院校研究机构,已经对学生培养、就业等关键问题进行深入分析,并依据分析提出相应的举措,改进学校资源配置,针对性帮扶“问题”学生,从而提升学生培养过程、就业等环节的表现[4];美国威斯康辛大学麦迪逊分校运用院校研究理论对学校财政数据进行分析研究,从而提升学校各项经费使用产生的效能,另外还对学校获得的捐赠进行分析,预测未来学校捐赠的趋势,并针对预测情况制定相应的鼓励政策,从而提高学校的捐赠受益[5]。运用院校研究来支撑高校的决策已经在大多数高校开展实践。数据体系作为院校研究的决定性环节,其建设工作在院校研究初期就已经开始。
基于院校研究视角的数据系统发展可以归为三类:一是国家层面的数据分析系统,如中国高校科研成果统计分析数据库、美国联邦教育统计中心高等教育综合数据系统(IPEDS)等,这类全国性质的大型数据库主要为国家政策制定、白皮书撰写等提供数据支持。二是各个高校针对自身需求建设的院校研究数据系统,该类系统中包含全校最为重要的信息数据,如人事数据、财务数据、教学数据、科研数据等,主要用于应对大型决策中数据的抽取统计,以及对于学校全貌的数据展示。三是学校针对某个专项问题而建立的分析型小型数据系统,该类系统的产生源于对一个较为具体的问题进行数据分析,如果直接在校级大型数据库中进行操作或者抽取分析,会出现耗时长效率低下的问题,因而将相关有用数据先抽取出来,形成一个相对灵活的小型数据系统,然后在此基础上进行分析。这样分析,一方面可以提高分析速度;另一方面可以让研究人员更专注于具体的问题。
从技术形式上来看,第二类和第三类数据系统在高校中会作为一个有机整体进行建设,第二类数据系统形成校级的数据仓库,第三类数据系统形成小型分析型数据库,两者共同构成了校级院校研究智能数据体系。两类数据系统之间即可相互联系、交互数据,在数据分析过程中又相对独立、互不干扰。复旦大学、华中科技大学、西北工业大学、苏州大学等高校都以此理念开展了数据体系的建设,但目前智能数据体系的建设属于初级阶段,还有很多问题需要解决和进一步探索。
从理论角度分析,院校研究数据体系的建设一般按照“自顶向下”和“自底向上”两种方法进行,在实际建设过程中,因数据体系的复杂性往往是将两种方法相结合。数据体系的建设历程可以总结为三个阶段:
第一阶段是按照“自顶向下”的思路建设。院校研究的相关研究人员提出数据需求,构架以数据填报为主的搜集型系统,并将系统的填报权限逐层授权,在全校范围内收集数据。系统中的数据大多是人为定期录入的结果性数据,该类数据不能良好反应教育教学过程中的情况,在分析复杂问题时会产生数据缺失的问题。另外,以人为录入数据为主的系统,当人员更迭时,很容易发生数据质量不一致或数据录入中断的问题。
第二阶段是融合“自顶向下”和“自底向上”两种建设方法,构建形成第二类校级数据仓库。系统的数据采集逐步走向自动化,并越来越重视过程数据的积累。计算机或物联网终端在教育教学业务发生的同时,对需要的数据进行实时采集或同时录入,这样的数据先留存在自身业务数据库中,然后根据院校研究的数据需求通过数据交换手段,将数据传递至院校研究数据系统。数据交换的手段可分为两种方式,一种是对应“自顶向下”思路的抽取式数据交换,院校研究数据系统根据自身需求从相应的业务系统抽取数据;另一种是对应“自底向上”思路的推送式数据交换,各个业务数据自愿或根据院校研究要求,将自身数据主动推送给院校研究数据系统。这样的数据交换体系可以随着业务的进展不断更新积累数据,当研究人员需要针对某个方面的问题进行分析时,只需在院校研究数据系统中进行合适的检索,即可抽取得到相应的数据。
第三阶段是在学校整体数据得到了一定量级的积累后,数据挖掘技术逐步被应用于院校研究当中。这也为更细致分析具体问题提供了手段,研究人员可以针对问题的某个方面将对应的数据单独抽取建立小型独立数据库,再通过挖掘技术对数据进行适当的预测或归类分析,从而为解决实际问题提供科学的支撑。
在第二阶段,系统就已经进入院校研究智能数据体系建设阶段,该阶段采用以数据仓库为基础的自动化数据流转、存储、处理方式。但目前大多数数据系统的建设仍处在基础统计分析的初级阶段,如何加快智能数据体系建设步伐,形成综合性的分析比对能力,完成深入数据挖掘任务的智能数据体系,仍需进行探索。
二、院校研究视角下
智能数据体系构建面临的挑战
(一)数据治理工作模式仍需改善
高校承担院校研究职责的机构形式多样,有院校研究中心、高等教育研究室、发展规划处、学科建设办公室、学校办公室等[6]。在数据体系建设中,组织形式通常为:由院校研究单位牵头,确定数据体系的整体框架和需求,由信息管理部门负责体系的技术搭建和运维,多个职能部门和各个二级单位进行配合。建设中因涉及的部门多并且较为分散,相互之间缺乏及时的沟通协作,整体建设进度缓慢是长期以来各高校的痛点问题,这其中对数据治理工作的影响尤为明显。
数据治理工作的目的是提升整个体系的数据质量,通常根据数据传递的路径和闭环治理思路展开。数据首先从各个业务系统流入数据仓库,信息管理部门的技术人员将数据进行清洗,转化为符合院校研究标准的数据。但是,在数据清洗的过程中,数据缺失、数据格式错误等问题直接影响数据的进一步使用,降低了整體数据质量。信息管理部门将数据问题通报给院校研究牵头单位,并将数据治理报告下达至业务部门,只有业务部门将业务数据库中的源头数据进行修正,才能真正解决数据问题。然而,往往因业务系统已经上线运行,无法中断系统进行数据治理,有时数据问题一拖就是几年。从牵头单位的角度来看,各个部门应各司其职,共同为学校的数据资产负责,而二级单位业务数据复杂,更关注于自身日常业务的正常运转,不愿因数据治理而大面积影响业务系统运转,就难免出现了推诿扯皮的现象。这样的治理模式令人遗憾,因为在数据有效更新、积累中,各个单位没有发挥其业务特色并对数据质量进行把控。
(二)数据体系对智能化提出更高要求
我国高校工作者经常需要上报学校各类数据报表,对于尚未建立数据体系的高校,数据分散割裂、收集时间长、统计难度大;对于已经建立校级数据体系的高校,基本数据已经可以直接从数据仓库中获取,但是当统计分析稍变复杂,系统无法直接获得结果时,工作人员只得将工作任务层层向下传达,再逐一上报汇总。在实际工作中,校内层层上报的数据因经过人工确认而被认为是更可靠的,一些数据系统逐渐荒废或未得到充分利用。随着院校研究理念在教育管理中的不断深入,简单的数据统计已经不能满足高校对实际问题分析研究的需求,横纵向联合比较分析、深度钻取式的挖掘分析被逐步提出,这也对数据体系的建设提出了新的要求。智能化数据体系的构建思路也由此产生,数据体系的建设不再是单一的数据统计和汇总,而是能够结合大数据技术进行多维度、深入灵活分析的系统,并且这样的系统简单易用,对于绝大多数院校研究人员能够提供良好的交互界面。
(三)数据文化尚未成熟
有研究者将数据文化引入高等教育管理领域,指出数据文化是一种意识,这种意识体现在高校环境与环境中的个人对待和运用数据的行为之间的一致性和相互性,它致力于寻求数据民主化,并将其提炼为信息,以服务于实现高校使命的决策制定。[7]高校数据体系建设真正走向智能化离不开成熟的数据文化,具体体现在:①数据的透明度和共享度。数据是学校的公有资产,校内的各个单位在健全的数据安全制度约束下,应具有共享数据、使用数据、分析数据的权力和责任,只有让数据获得共享、流动起来,数据的价值才能真正发挥。②重视数据,使用数据。在分析学校发展问题时,形成用数据说话、以数据为支撑、依数据进行决策的管理模式,真正认识到数据是决策的核心,智能数据体系是数据运转的必要承载体。③治理数据,信任数据。智能数据体系的核心是数据质量,数据质量不高,如缺失数据多、数据有错、数据标准不统一,会导致后续数据的使用和分析毫无说服力和价值。只有做好数据治理工作,才能让研究人员真正信任数据,乐于使用,不断深挖其中的价值。当前,随着信息化在教育教学各项业务中的普及和广泛应用,数据文化概念正逐步在高校工作者的工作思维中建立。为进一步加快智能化数据体系对高校管理工作的有效推动,一些学者认为应建立相应的“一把手”机制[8][9],以领导力推动信息化建设。但是反观互联网发展的历程,不难总结出,只有让数据具有的使用便捷性、操作灵活性和分析可靠性,普惠至高校各个单位,建立全校性的数据文化,才能形成合力,推动智能数据体系的建设工作。
三、以校院两级模式构建智能数据体系
(一)建立责权利相统一的数据体系管理制度
在智能数据体系的构建中,院校研究部门是运用数据的核心,信息管理部门是数据收集、清洗、治理的关键。更应认识到的是,学校各个二级单位是数据的源头,即产生数据、积累数据的基地。对于智能数据体系,数据治理是提升数据质量的必备环节,也是贯穿体系建设始终的工作。在数据治理的过程中,如果没有做好源头数据治理工作,而将数据治理的重点转移到信息管理部门,数据整理和清洗所带来的工作量是巨大的,加之信息管理部门的人员对具体业务并不熟悉,其处理过程是相对低效的。如果做好源头数据把控,在业务系统中对底层数据系统架构、数据标准采用、数据安全设置等方面逐一有效落实,校级数据仓库的运行效率将大大提升。这一工作思路的执行需要校院两级相配合,院校研究部门确定整体框架和数据标准,二级单位作为执行者在信息化管理部门的帮助下开展业务数据系统建设。在明确相应职责后,进一步形成制度体系,是智能数据体系进入良性循环的有力保障。
智能数据体系管理制度的建设不仅要明确校院两级单位的责任,更要确定各单位在智能数据体系使用中的权利。管理制度可从利益相关者的角度分析,充分考量院校研究部门、信息化管理部门、各职能部门、学院等二级单位,以及教师和学生的数据使用需求,通过制度规范化智能数据体系各子系统建设步骤和标准,厘清数据生产汇集、授权使用等流程,让数据生产者在产生数据的同时,还可以获得数据分析的便利,从而形成自觉维护、自觉处理、自觉校对的良好数据使用习惯。数据管理者更关注于数据体系整体运维和框架的搭建,数据使用者专注于利用数据解决院校问题,支持学校决策。建立校院两级责权利相统一的管理制度,将加快推动学校数据体系的质量建设,为数据体系走向智能化奠定坚实的基础。
(二)以数据应用促进校院两级智能数据平台建设
目前,部分国内高校按照数据支撑决策的院校研究思路,建设了校级数据仓库,并基本完成校内各大应用系统的数据入库工作,形成了基于应用系统的校级基础数据平台,从而将各个应用系统与校级数据仓库联通,完成数据的交互。[10]运用校级数据仓库的数据就可以开始相应的院校研究工作,当前决策支持性数据分析工作主要集中在学校院校研究部门,这类研究主要为学校整体决策服务。随着高校院办校管理机制的不断深化,学院逐步成为师生管理的主体,学院等二级单位领导在进行决策时也同样需要科学的数据分析支撑。与之相适应的智能数据平台建设工作也要逐步向二级单位下沉,以校院两级模式对平台进行构架是可以进行探索的一种方式。将数据的应用分析功能授权至二级单位,一方面可以在学校整体管理中形成数据研究型氛围;另一方面可以让二级单位在数据应用中发现数据问题,以用促改,提升数据质量。
可视化数据处理工具是院校研究数据分析的必备模块。将智能数据体系中的可视化数据处理工具在校院两级推广,是以院校研究思路整体推进两级数据平台建设的有益思路。可视化数据处理工具最初是操作较为复杂的基于数据库的软件模块,只有具备一定数据库基础的专业人员能够操作,而后逐步向图形化拖拽式交互模块发展。在智能化数据体系中,该功能模块应逐步发展为可自由加载不同的数据模型,并具备自动分析功能,分析人员只需提出院校研究问题,系统便可给出相应的分析结果。这样的智能数据体系将降低使用人员的信息化水平要求,让数据带来的便捷普惠至数据的所有利益相关者,从而支持全校工作的方方面面。
在此模式下建设的校院两级智能数据平台,可能会面临两方面问题:一是数据权限和数据安全问题。当数据使用的范围扩大,数据安全必须重点思考,该问题可以从数据脱敏、禁止数据下载、仅供在线分析、设置数据权限级别的方法得以解决。并在此基础上形成相应的制度约束,建立成熟的数据文化,形成规范使用、严格管理数据的意识。二是建设经费紧张问题。校院两级数据平台建设体量庞大,它集结了校内所有数据,数据存储、数据流量、數据计算所消耗的资源都需要进行相应的预算,平台搭建以及模块化功能的建设也需要充足的经费支持。由软件公司进行系统搭建的花费是巨大的,高校也可尝试探索发挥自身学术优势,联合计算机学院、软件学院的专业力量,将部分应用模块的研发工作由校内承担,从而降低成本,本校师生也能够了解校内数据情况和问题,沟通成本也随之降低。
(三)培育具有成熟数据文化的研究人员
校院两级智能数据体系的构建离不开具有专业素养的研究人员,不仅仅包含对院校研究体系和理论方法掌握的人员,也需要其他相应的数据管理、运维管理、行政协调组织人员。以美国斯坦福大学为例,为建设院校研究数据体系,该校专设院校研究机构负责全校智能数据体系建设,机构包含15位专职人员从事4个方面的运营研究工作,以保障数据采集整理的准确性、做好部门的沟通工作、完成相应的数据提取和分析任务、形成具有决策价值的数据报告等。
目前,我国各个高校都处于快速发展阶段,多数学校无法设置专门的部门和岗位,针对院校研究工作开展智能数据体系建设,同时数据体系的建设也呈现多单位联合的方式进行。在这样的发展路径下,我国高校应进一步将数据体系建设工作进行分解,以校院两级联动的方式共同推进,在形成责权利相统一制度的基础上,重视数据文化的建设和培养,将使用数据、维护数据、依数据办事决策的工作模式渗透至校院两级工作者。要以可视化数据处理工具的推广使用为抓手,让学校各个单位的一线工作者在主动贯彻科学的数据分析方法,将数据文化的理念深植研究人员的日常业务。同时,学校院校研究机构应定期组织运用数据解决实际问题的案例分享,将数据应用分析、数据管理处理的方法在校院两级单位进行培训,带动院级教师、管理人员共同运用数据解决工作实际难题。通过多方共同参与数据的治理和运维,形成数据文化的风尚,建立良性数据循环体系,在数据应用中培养数据人才,解决院校问题,实现高校内涵式发展。
四、结语
院校研究以数据分析为基础,为高校管理决策和改革发展提供了科学有效的研究方法和理论体系。为使院校研究更好地服务于高校“双一流”建设,建设能够支持院校研究的智能数据体系不可或缺。本文重点分析当前国内各个高校在建设智能数据体系中遇到的困难。面对数据质量亟待提升、数据体系不够智能化、数据文化尚未建立等问题,本文提出校院两级建设管理模式,并探索以数据应用促进数据治理、数据体系建设的新思路。针对校院两级模式如何在实际工作中“落地”,本文从制度建设、平台建设、人员培育三方面阐述智能数据体系建设的路径,为当前正在建设智能数据体系的高校提供有益的思路。
参考文献:
[1]新华社.中共中央 国务院印发《深化新时代教育评价改革总体方案》[EB/OL].(2020-10-13)[2021-08-09].http://www.gov.cn/zhengce/2020-10/13/content_5551032.htm.
[2]贾正晖,王浩.对现阶段我国开展院校研究的思考——基于中美两国大众化教育发展的比较[J].吉林省教育学院学报(学科版),2010,26(1):1-4.
[3]魏署光.美国院校研究决策支持功能探析[D].武汉:华中科技大学,2013.
[4]江艳,储祖旺.基于数据驱动的美国高校学生事务预测分析管理[J].高等教育研究,2017(12):90-95.
[5]丁国勇,程晋宽.美国高校教育数据挖掘的应用领域与推动因素[J].比较教育研究,2017(5):73-78.
[6]王秀平.“双一流”建设背景下院校研究的困境及路径分析[J].南京中医药大学学报(社会科学版),2020,21(1):58-61.
[7]张俊超,鲁梦琪.我国高校数据文化的现状及培育——兼论院校研究的作用[J].高等教育研究,2020,41(12):40-47.
[8]顾婧.数据挖掘技术在高校领导干部经济责任审计中的应用[D].南京:南京审计大学,2018.
[9]何建新.高校學科化资源特色数据库建设体系的研究——以华南农业大学为例[J].四川图书馆学报,2011(2):79-82.
[10]刘琪,方振邦.美国大学统计服务决策工作简析——以斯坦福大学为例[J].中国高等教育,2019(8):62-64.
作者简介:
崔嘉琪,助理研究员,硕士,主要研究方向为教育管理学、教育大数据、数据挖掘,邮箱:cuijiaqi@nwpu.edu.cn。
Exploration on the Construction of Two-level Intelligent Data System from the Perspective of Institutional Research
Jiaqi CUI
(Information Construction and Management Division, Northwestern Polytechnic University, Xian Shaanxi 710072)
Abstract: The scientific concept of institutional research based on data analysis is gradually being adopted by sufficient colleges and universities in China. Since data is the foundation and source of institutional research, all institutional research on school problems or comprehensive evaluation is based on objective data. In order to develop institutional research and solve the actual operation and management problems of colleges and universities, relevant colleges and universities, from the perspective of college research, put forward intelligent, accurate, stable and efficient requirements for the construction of data system . This paper first introduces the necessity and development status of intelligent data system construction in colleges and universities, then analyzes the problems and challenges encountered in the construction of intelligent data system, such as the imperfect data governance mode, the insufficient intellectualization of data system, and the immature data culture. On this basis, it makes a detailed analysis from three aspects of system construction, platform construction and personnel training, then puts forward a new idea to effectively promote the construction of data system by using the two-level model of colleges and universities, so as to provide useful ideas for the construction of intelligent data system in colleges and universities.
Keywords: Intelligent data system; Institutional research; System construction; Platform construction
编辑:王晓明 校对:李晓萍