大数据时代区域教育信息化面临的挑战
2016-06-24张华
张华
近年来,以云计算、数据挖掘、移动互联网等为基础的大数据技术的出现,为教育研究带来了数据获取、存储、分析和决策等支持,技术与教育的深度融合推动了教育的变革与创新。
虽然大数据日益升温,但大数据的基本概念、特点及其要解决的核心问题,目前尚无统一认识。大数据的获取、存储、处理、分析等方面仍存在一定争议,大数据概念有过度炒作的嫌疑。本文对上述问题进行了辨析,并描述了大数据时代基础教育信息化面临的问题与挑战,最后提出了区级基础教育信息化建设的应对策略,希望为各区级教育信息化建设单位提供参考。
大数据的概念及特点
目前,大数据没有一个公认的定义,不同的定义基本都是从大数据的特征出发给出的。比如国际数据公司认为大数据应当具有价值性,大数据的价值往往呈现稀疏性的特点。IBM认为,大数据必然具有真实性。维基百科对大数据的定义为:大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集。大数据具有“4V”特点,即数据量大(Volume )、数据类型多样性(Variety)、数据处理速度快(Velocity)和数据价值密度低(Value) 。
1. 数据量大
数据规模超大,这是大数据的基本属性。数量级别从TB (1TB=1024GB)级别,跃升到PB (1PB=1024TB)、EB (1EB =1024PB)乃至ZB (1ZB =1024 EB)级别。导致数据规模激增的原因有很多,首先,随着互联网的广泛应用,使用网络的人、企业、机构增多,数据获取、分享变得相对容易。其次,各种传感器数据获取能力的大幅提升,使得人们获取的数据越来越接近原始事物本身,描述同一事物的数据量激增。再次,数据量大还体现在人们处理数据的方法和理念发生了根本的改变。在某些特定的应用领域,采样数据远不能描述整个事物,可能丢掉大量重要细节,甚至会得到完全相反的结论。因此,直接处理所有数据而不是只考虑采样数据,可以带来更高的精确性,从更多的细节来解释事物属性,同时必然使得要处理的数据量显著增多。
2. 数据类型多样
数据类型繁多、复杂多变是大数据的重要特性。在数据激增的同时,新的数据类型层出不穷,已经很难用一种或几种规定的模式来表征日趋复杂、多样的数据形式。这样的数据己经不能用传统的数据库表格来整齐地排列与表示,大数据正是在这样的背景下产生的。大数据与传统数据处理最大的不同就是,重点关注非结构化信息,大数据关注包含大量细节信息的非结构化数据,强调小众化、体验化的特性使得传统的数据处理方式面临巨大的挑战。
3. 要求更快的数据处理速度
要求数据的快速处理,是大数据区别于传统海量数据处理的重要特性之一。包含大量或实时数据分析处理的时间要求非常短,符合1秒定律。在许多应用中要求能够实时处理新增的大量数据,大数据以数据流的形式产生、快速流动、迅速消失,且数据流量通常不是平稳的,会在某些特定的时段突然激增,数据的涌现特征明显。对于大数据应用而言,很多情况下都必须在1秒钟内形成结果,否则结果就会过时和无效。在这种情况下,要求计算机快速、持续地实时处理大数据。对不断激增的海量数据的实时处理要求,是大数据与传统海量数据处理技术的关键差别之一。
4. 数据价值密度低
数据价值密度低是大数据关注的非结构化数据的重要属性。以视频为例,连续不间断的监控过程中,可能有用的数据仅有一两秒钟。尽管数据价值密度低,但商业价值高。
传统的数据库与大数据也有明显的区别,两者在数据来源、数据处理方式和数据思维等方面都有很大的变化。正像孟小峰所言,两者的区别就是“池塘捕鱼”和“大海捕鱼”的区别,前者代表着数据库时代的数据管理方式,后者则对应着大数据时代的数据管理方式,其在数据规模、数据类型、数据模式、数据对象、处理工具上都有巨大的差异。
大数据要解决的核心问题
与传统海量数据的处理流程相类似,大数据的处理也包括获取与特定的应用相关的有用数据,并将数据聚合成便于存储、分析、查询的形式;分析数据的相关性,得出相关属性;采用合适的方式将数据分析的结果展示出来等过程。大数据要解决的核心问题与相应的这些步骤相关。
1. 获取有用数据
规模巨大、种类繁多、包含大量信息的数据是大数据的基础。数据本身的优劣对分析结果有很大的影响。对于实际应用来说,并不是数据越多越好。获取大量数据的目的是,尽可能正确、详尽地描述事物的属性。对于特定的应用数据,必须包含有用的信息。拥有包含足够信息的有效数据,才是大数据的关键。
2. 数据分析
数据分析是大数据处理的关键。大量的数据本身并没有实际意义,只有针对特定的应用来分析这些数据,使之转化成有用的结果,海量的数据才能发挥作用。大数据的一类重要应用是利用海量的数据,通过运算分析事物的相关性,进而预测事物的发展。现在,随着数据的不断积累,通过简单的统计学方法就可能找到数据的相关性,找到事物发展的规律,指导人们的决策。
3. 数据显示
数据显示是将数据经过分析得到的结果以可见或可读形式输出,以方便用户获取相关信息。利用计算机图形学和图像处理的可视计算技术是大数据显示的重要手段之一。数据显示以准确、方便地向用户传递有效信息为目标,显示方法可以根据具体应用的需要来选择。
4. 实时处理数据的能力
大数据需要充分、及时地从大量复杂的数据中获取有意义的相关性,找出规律。数据处理的实时性要求是大数据区别于传统数据处理技术的重要特征之一。一般而言,传统的数据处理应用对时间的要求并不高。运行1~2天获得结果依然是可以接受的。而大数据领域相当大的一部分应用需要在1秒钟内或瞬间得到结果。
大数据时代,区级基础教育信息化面临的问题与挑战
基础教育阶段的中小学校是数据生产大户。在学校里上学的学生,从招生、学籍、成绩、考勤、选课到活动等都会产生大量的数据;教师的上课音视频、课件、实验数据等也会有庞大的数据;校务系统运行、图书馆、微博、博客等都会产生很大的数据。尤为重要的是管理和教学数据,它们是基础教育两大核心功能的重要数据来源。只有用好这些数据,才能更好地帮助教学、管理,做好招生推广、学生管理等工作。用好这些数据,无疑也将大大提高中小学校的信息化水平。大数据时代呼啸而至,在“喧嚣”背后,在人员素质、使用方法、支撑条件以及数据本身等方面还存在诸多亟待解决的问题和挑战。
第一,要解决教育管理者的数据素养与能力问题,即教育管理者必须转变观念,提高数据意识,具备必要的数据分析与运用能力。大数据时代,人才培养可采取标准化教育与个性化教育等多种方式。未来的标准化教育将主要由网络完成,学校将在学生个性化发展方面承担更重要的角色。学校教育将逐步摆脱大校、大班、统一标准与程序等工业化时代的烙印。这些都需要在教育发展中不断改革创新。
第二,数据共享的难度也是切实存在的问题。数据不融合就发挥不出数据的大价值,大数据面临的一个非技术性的重要问题就是数据的融合。我区教育均衡发展状况还不是很理想,城乡差异、区域差异、校际差异在一定程度上仍然存在,必须加强相应的硬件与软件建设,最大限度地促进和实现大数据时代的信息共享,进而促进教育管理的科学化与信息化。必须彻底打通数据孤岛,只有通过有效融合,才能形成高质量的大数据,才能发挥大数据时代基础教育信息化对学校发展的具体推动作用。
第三,大数据集成与分析对信息化建设的从业人员提出了更高的要求。大数据的多样性特点源于数据来源的广泛性、复杂性,这种数据环境给大数据的处理带来了很大的挑战,必须对多种数据来源进行抽取集成,先进行数据的清洗,经过关联和聚合,采用统一的数据结构来存储这些数据。大数据分析无疑是整个大数据时代的核心所在,因为大数据的价值就产生于数据分析过程中。
第四,大数据的存储带来资金等问题,需要研究低成本、高效率的数据存储方式。众所周知,低成本一般意味着低效率,但是在大数据时代,如果处理效率低下,大数据将毫无意义。因此,必须打破常规,处理好大数据的存储。另外,还要做好数据存储的管理问题,因为存储空间巨大,无疑给存储硬件带来压力。
大数据时代我们的应对策略
为适应大数据时代的发展,各行各业都面临着改革,教育行业也不例外。如果要在大数据发展趋势下占据有利位置,大数据人才队伍建设、大数据时代的技术学习与运用、数据管理、文化建设、政府、研究机构和专业数据分析公司的合作等成为了关键问题。面对这些问题与挑战,作为区级基础教育管理者和信息化从业人员,必须坚持不懈地做好如下工作。
1. 做好大数据人才队伍建设
面对大数据这一新概念,以及大数据时代涉及的各种新兴的信息处理技术,人们越来越多地关注信息技术和资源提升的重要性,但在教育信息化建设的过程中,最重要的还是“人”。即使再好的资源、再先进的系统,没有懂得运用和支配的实施者,对于教育资源也是一种浪费。实施者必须提高自身的软实力,引入优秀的信息人才,加强人才素质提升,做好合理的人才规划部署。教育信息化的发展对于教育管理者和教师提出了更高层次的要求,这就需要建立庞大的教学信息化培训体系,培养出具有更高教学和管理水平,可以将信息化更加熟练地应用于教学和管理工作中的人才队伍。
2. 做好大数据时代的技术学习与运用
教育信息化建设的从业者应该努力学习大数据时代的基础平台和支撑技术。了解这些技术,方便我们实现大数据低成本、高效率的存储,也方便我们对存储进行管理。
3. 做好大数据时代的数据管理
大数据时代的数据管理不是采用以前大型关系型数据库的管理方式,而是以NoSQL为代表的新型数据模型的一类技术。这种改变是因为关系型数据模型不能应对大数据时代的种种挑战,而新型的数据模型就是为了迎合多样性、异构性等这些大数据时代的数据特征而出现的。当然,新的数据模型是与以往截然不同的理论。这就需要我们数据管理者积极学习,应对挑战。同时,要积极升级、改造相关存储设备,以满足大数据时代的要求。
4. 做好区级基础教育系统内数据文化建设
在区级基础教育信息化建设过程中,关键在于通过在教育系统内形成数据文化,来建立一套持久运作的收集和分析数据及将数据分析结果转换成教育决策和实践的体系。数据文化是指一个教育组织或系统内部,崇尚数据对于各个层面决策过程的重要性的环境,它包括相应的价值观、态度和行为准则。形成数据文化的学校和教育系统的一个重要特征是,其每位成员具有较高的数据素养,善于在自己的工作岗位上收集高质量的数据,并且懂得如何提出通过数据收集和分析可以解决的问题,懂得数据分析的基本原理和方法,以及数据可视化呈现的基本形式,并能够在有限的时间内,根据数据分析结果做出最合理的决策。计算机和数据分析方法只能提供技术支持,收集数据也不能是盲目的,数据的汇总和分析方法是由所要解决的教育问题所决定的。
5. 做好学校和专业数据分析公司的合作
专业数据分析公司负责软件开发并提供数据分析模型方面的支持。这其中会涉及数据安全和存储问题,尤其是学生的个人信息,大数据可以重复利用,所以在合作中必须用合同的方式来确保学生个人信息的安全,不被用作商业用途(例如学习产品广告推送),还要确定数据由谁负责存储和维护,谁有权对数据进行二次开发利用。
积极推动教育管理各项业务的深入融合,梳理业务数据,形成“大数据”,然后利用这些“大数据”进行深入、全面的分析得出高质量信息,为教育管理者的决策提供依据。总之,随着教育信息化的飞速发展,大数据时代的基础教育管理和教学给我们提出了更高的要求,有些需要科研人员进行研究,有些非技术挑战,需要我们积极努力,有效进行数据的整合、业务的整合,充分利用科研人员的最新研究成果,尽快改变传统的管理模式,应用现代化手段进行科学管理,加快基础教育信息化建设已成为现代教育需要解决的重要任务。