APP下载

大数据时代下的高职院校数据采集工作思考

2017-05-10王桃红

青年时代 2017年10期
关键词:数据项教育部院校

王桃红

一、什么是大数据

大数据,是互联网行业的热词,又称为巨量数据,顾名思义是大量的数据集合在一起,而且这些数据的特点是数据巨大、结构复杂、类型众多。大数据本身没有什么意义,重要的是数据分析的结果。随着信息技术快速发展,人们的生活中充满各种各样的数据,而通过云技术能从各种各样的数据中获取有价值的信息。发达国家相当看好大数据的价值,甚至认为其价值堪比黄金,是新时代的新财富。在这个大数据时代,信息化将引起政治、经济、文化、教育、军事等各个领域的深刻变革。

二、教育领域大数据时代的表现

具体到教育领域,大数据工作就是对学校各项关键指标数据进行统计和分析。在大数据时代背景下,教育部为了掌握全国高职院校发展情况的第一手资料,加强对职业教育人才培养质量的监控与指导,对高职学校设置门槛,将学校关键指标数据是否合格与能否招生挂钩,每年都须向教育部汇报学校的综合数据,组建庞大的数据库,通过分析数据,掌握影响全国职业教育发展各项关键指标,以此分析职业教育发展的现状、瓶颈、趋势,为国家决策提供有力的支撑。

三、高职院校的数据统计

教育部利用信息技术手段开发系统,搭建一个个数据采集的平台,要求全国高职院校都要参与数据上报工作,最后将全国的数据统计进行分析,用于职业教育研究,为国家对职业教育决策提供依据。只是令高职院校苦不堪言的是,一个个评估工作接踵而至。时至今日,高职院校需一年一度采集与上报的数据系统有人才培养水平状态数据平台(以下简称数据平台)、高等教育基层统计报表(以下简称高基表)以及适应社会需求能力评估。

这三个系统的数据既有联系又有区别。先说区别,区别一在于开始采集的年份不一样,高基表大约2001年开始,数据平台2008年开始,适应社会需求能力评估是2016年开始;区别二在于某些数据项的采集时间节点不完全一样,有些是上学年9月到本学年8月,有些是按自然年采集;区别三在于某些数据项的概念和范围也不尽相同,比如高基表和数据平台的上网课程数的衡量标准不太一样;区别四在于數据上报的部门不一样,数据平台是上报到教育部职成司,高基表是上报到教育部发展规划司,社会需求能力评估是上报到国务院教育督导委员会办公室。联系体现在他们采集的数据项绝大多数都相同,而且都是一年一度进行采集,更重要的是适应社会需求能力评估中出现的所有高基表中包含的数据项均要求与高基表保持一致,而数据平台的案例分析数据中从2016年起也相应的增加了适应社会需求能力一栏,更加将三个数据紧密联系在了一起。

以上数据采集一般遵循以下几个特点:数据采集从无到有,从不方便到方便,从局部应用到全方位应用,数据项越来越细化,数据覆盖范围越来越宽。比如,截止到2016年,数据平台的数据覆盖全国1285所独立设置的高职院校,占全国同类院校总数的97.6%。

四、职业教育的数据困扰

数据平台和高基表这两项数据已经上报了十来年了,仅数据平台积累的数据记录就已经高达数十亿条,毋庸置疑,教育部对数据的连续性采集是为了进行纵向对比研究,但是适应社会需求能力评估则是去年才开始的,为什么每年要上报这么多种数据,而不是只报一种即可呢?原因有很多,主要如下。第一,教育部各个部门之间的数据没有共享,数据孤岛现象很严重,或者有些内容不相互交叉无法实现共享,导致不得不由不同的部门牵头组织全国的高职院校进行数据采集和上报。第二,高职院校各个部门数据孤岛现象也很明显。这表现在两个方面,首先是各个部门工作隔行如隔山,分管院领导也不一定是同一人,所以接到上级相关部门的文件后,各部门各自组织数据采集与上报,一开始仅仅以为只涉及到本部门工作,并未与其他部门进行交流,甚至过去了很长一段时间后才知道原来这几项工作有相通之处;其次是各个部门的数据时刻在变,并没有唯一准确的数据。比如在校生数据,当出现学生异动情况后,学籍系统若没及时更新,就做不到与现实数据同步,因此学籍系统里的学生数比现实的在校生数要多。于是,很多高职院校在统计学生数的时候遇到学生处与招生处上报的在校生数不一致等情况。

近年来,教育部负责推进数据平台的专家们,主张不要将每年的数据上报当作评估。他们似乎想让高职院校负责数据上报的人将评估二字从脑袋中去除,希望数据采集工作常态化,甚至采取了一系列措施来缓解数据采集带来的困扰,比如数据平台的专家组,多次组织平台改版升级,希望减少数据采集的繁复,甚至开发研制数据系统,想突破数据的采集与使用瓶颈,实现数据的深度应用于高效采集。但是目前而言这只是一种好的愿景,实际操作起来却是任重道远。因为没有解决关键的问题,数据采集所依据的标准,以及产生的结果决定了高职院校的选择。

专家的立场是做研究,为教育部决策提供依据,但是教育部为了让全国高职院校积极配合,给数据采集带上了紧箍咒,必须要达到文件上的指标要求,学校才具备继续招生的资格,否则就要被吃黄牌甚至红牌,面临暂停招生的危险。为了争取学校的发展空间,保证学校发展的生命线,高职院校别无选择,当然要想方设法达到文件要求。这就导致出现两种结果,第一,高职院校平时严格按照文件加强建设,力争所有数据都达到指标要求,但是事实上社会上早就有人认为高校不能一直只注重基础设施建设,应该把主要精力放在教育教学上。第二是平时建设无法完全达标,但又不得不达到文件要求,于是高职院校上报的数据难免出现泡沫,使得专家们收集的数据会有些失真。

数据平台和高基表的数据主要依据是《教育部关于印发<普通高等学校基本办学条件指标(试行)>的通知》(教发﹝2004﹞2号),这个文件相当权威,至今已经“试行”了十几年了,不可否认仍然具有广大的普适性。但是也存在一些问题,文件里关于生师比、教师人数、兼职教师的课时比例等规定明显已经跟不上形势,有悖于近年来教育部和财政部出台的国家骨干校加强兼职教师建设的文件精神。按照《关于进一步推进“国家示范性高等职业院校建设计划”实施工作的通知》(教高【2010】8号),以及《关于做好“国家示范性高等职业院校建设计划”骨干高职院校建设项目2014年验收工作的通知》(教职成厅函〔2014〕3号)都明确要求,兼职教师承担的专业课学时比例达到50%。但教发﹝2004﹞2号文却规定“原则上聘请校外教师数不超过专任教师总数的四分之一”,这好比让四分之一的专任教师上50%的课一样不合理。很明显,都是出自教育部的文件,但某些关键指标的规定却相互矛盾。

这样情况下上报不同系列的数据会产生一些什么结果呢?第一,交给不同部门上报的高职学院极有可能会出现各个部门各自上报的数据不统一,甚至数值相差很悬殊。第二,也有一开始就是将三种数据采集工作都交给一个部门去完成的高职院校,不可否认,这样的学校数据有统筹,所以能保证数据的一致性,但是在任何院校都竭尽全力达到基本办学条件的形势下,这样的数据的真实性值得商榷。第三,高职院校每年都会面临一些关键指标计算公式不统一的窘境,比如三种数据都要报的一个关键数据项生师比,但是三种数据所依据的文件不尽相同,计算公式也要求的不一样。无论怎么操作,都没法满足三个数据都达到要求。

五、思考与建议

如何解决这些数据采集问题呢?首先教育部要出台新的权威文件,所有的计算公式最好能统一,做到计算方法唯一性;其次要消除数据孤岛现象,加强部门与部门之间的沟通衔接,做到数据的唯一性;再次,要建立校本数据平台,实现数据源头采集,打散采集工作量,由现在的年度采集向过程采集转变,提高数据的真实性。

猜你喜欢

数据项教育部院校
一种多功能抽签选择器软件系统设计与实现
非完整数据库Skyline-join查询*
基于Python的Asterix Cat 021数据格式解析分析与实现
教育部召开座谈会推进一流大学和一流学科建设
教育部:高考地方性加分项目2018年减至35个
我校两教育部重大课题攻关项目开题
院校传真
院校传真
院校传真
院校传真