高等教育基层统计在大数据时代的畅想
2017-05-23刘艾林
刘艾林
统计数据是大数据的来源和基础,大数据的云计算和强大的分析功能也提升了统计数据的利用价值和空间,借助大数据的发展,期待我国高等教育统计上一个新的台阶。
随着我国高等教育事业的发展和教育改革的不断深入,高等教育中各类统计数据的作用和地位也日益显著,高等教育的改革离不开规划,规划势必成为了教育改革和发展的引领,而统计则是教育规划和科学决策的基础。以高等教育基层(事业)统计为例,它不仅仅是国家教育主管部门深入了解高等教育现状和把握未来发展的重要手段,更是高等学校内部实施科学有效的管理及制定政策和发展规划的根本依据。所以不仅仅统计指标值的设置和口径为如何指导学校优化资源配置和进行决策提供了方向,统计数据的质量和关联性的应用也显得尤为重要。
在大数据出现之前,大多数教育政策都是在缺乏实验数据的情况下制定的,甚至有些制度让人怀疑是“拍脑壳”拍出来的,而造成这种现象的主要原因有两点,一、统计数据本身的质量不高。二、对统计数据的利用和分析不够充分。
统计数据质量不高的原因:
统计指标设置不够合理或者说没有实际的统计意义,统计人员无法按指标设计或布置时的统计口径来上报数据。
基层统计部门对统计工作不够重视,多数学校未单独设置统计部门,更谈不上有专业的统计队伍,甚至都没有固定的统计人员,面对上级主管部门布置和要求的统计工作,学校往往会安排报表涉及数据较多的部门或人员来完成统计工作。甚至只要求按时完成,而缺乏对数据的正确性、合理性以及关联性进行有效分析。
对统计数据的利用和分析不够充分。原因如下:提取数据的方式较为单一和局限,大量跨部门和跨行业数据得不到共享;未充分利用数据的关联性来对数据进行三维、四维的分析或叠加。
随着计算机行业的飞速发展,云计算、云储存和虚拟化处理技术随即产生并被广泛应用,大数据时代悄然而来。虽然传统的基础统计成就了“大数据”的数据量庞大,但大数据却不仅仅是海量数据的简单堆积。以往单一的统计数据的价值往往在单一的行业或范围被应用,而现阶段拥有的更大、更快的数据存储手段和计算功能却能满足对数据全方位的叠加和关联分析的需求。大数据时代,让我们的生活和研究出现了不断的凉喜和可能。
有个大数据故事:某比萨店的电话铃响了,客服人员拿起电话
客服:您好,请问有什么需要我为您服务?
顾客:你好,我想要一份……
客服:先生,烦请先把您的会员卡号告诉我。顾客:16846146***。
客服:陈先生,您好!您是住在泉州路一号12楼120x室。请问您想要点什么?
顾客:我想要一个海鲜比萨……
客服:陈先生,海鲜比萨不适合您。
顾客:为什么?
客服:根据您的医疗记录,你的血压和胆固醇都偏高。
顾客:那你们有什么可以推荐的?
客服您可以试试我们的低脂健康比萨。
顾客:你怎么知道我会喜欢吃这种的?
客服:您上星期一在中央图书馆借了一本《低脂健康食谱》。
顾客:好。那我要一个家庭特大号比萨,要付多少钱?
客服:99元,这个足够您一家六口吃了。但您母亲应该少吃,她上个月刚刚做了心脏搭桥手术,还处在恢复期。
顾客:那可以刷卡吗?
客服:陈先生,对不起。请您付现款。因为您的信用卡已经刷爆了,您现在还欠银行4807元,而且还不包括房贷利息。
顾客:那我先去附近的提款机提款。
客服:陳先生,根据您的记录,您已经超过今日提款限额。
顾客:算了,你们直接把比萨送我家吧,家里有现金。你们多久会送到?
客服:大约30分钟。如果您不想等,可以自己骑车来。
顾客:为什么?
客服:根据我们全球定位系统的车辆行驶自动跟踪系统记录。您登记有一辆车号为SB-748的摩托车,而目前您正在解放路东段华联商场右侧骑着这辆摩托车……
这就是扑面而来的大数据时代带给我们的凉喜,那么大数据时代的高等学校教育统计是否也将会掀起一场新的教育革命呢?
将来某一天,又到了教育厅要求各高校报送《高等教育基础统计报表》的时间了,审核程序用扫面二维码的形式将某高校老师报送的《高等教育基础统计报表》做了接收,接着,审核程序用对话框的形式将提示和校验信息做出反馈:
对话框提问:“校舍情况”表中“教学科研及辅助用房”数与该校所在地城建局对该校的项目备案和施工许可数不匹配。
输入解释:有200多平米违章辅助用房建筑,正打算拆除。
对话框提示:从法院受理案件记录里看出,该校今年*月由于违规占地修建,曾被法院强制执行**万元罚款,建议尽快拆除。
对话框提问:“教学科研仪器设备”数据与该校报送的同一统计归属时间的《教学质量报告》数据不匹配,与《高校固定资产统计》的数据也不匹配,请核实。
输入解释:经核实,“教学科研仪器设备”中填列数据属“千元”和“万元”转换错误,以《教学质量报告》中数据为准。
对话框提示:请尽快更改数据。
对话框提问:“图书(万册)其中:当年新增”数据与各出版社和供货商提供的本年度供应给该校的书籍数量不匹配。提示:(1)从税务发票系统里查实,以该校为抬头的发票附件中书籍清单数与该校报送的本年书籍新增数量不一致。(2)从各民政系统的统计记录里也未发现与该校相关的书籍捐赠信息。
输入解释:今年学校50周年校庆,教职工和学生将大量书籍捐赠给学校,学校均未开具捐赠票据。
对话框提示:通过省图书馆系统提供的该校学生在各级图书馆借阅书籍记录可以分析推断,该校图书馆藏书中人文类书籍较少或远远不能满足学生需求,建议多购人人文类书籍。
对话框提问……
有了大数据,统计分析的维度更加丰富,结论更加惊喜,而针对教育基层统计,真实的基础数据统计依然是统计工作和大数据分析的保障和灵魂,而大数据全方位的数据叠加和关联分析也对传统统计学提出了进一步的要求。借着大数据发展的步伐,我们的教育统计工作也迎来新的发展机遇。