论大数据驱动下的教育评估特征
2017-01-27翁灵丽
翁灵丽
(杭州师范大学,杭州 311121)
论大数据驱动下的教育评估特征
翁灵丽
(杭州师范大学,杭州 311121)
大数据的力量正在积极地影响着社会,改变着人们的生活、工作和思维方式。当前教育领域的大数据正在形成,教育大数据与传统意义上的教育数据和其他领域的大数据有着不一样的特征,这些特征必将引导教育者和被教育者的思维发生变化,从而驱动教育领域进行变革与发展。以信息采集、数据分析作为其基本实现手段的教育评估也必将受到重要影响。本文通过对教育大数据的来源和特征进行分析,根据大数据对教育评估的影响,对大数据驱动下教育评估的主要特征进行研究,以期为更好地适应大数据时代而开展教育评估研究提供参考。
教育评估;大数据;数据驱动
2011年6月,麦肯锡全球研究所发布研究报告——《大数据的下一个前沿:创新、竞争和生产力》,首次提出“大数据时代”来临,认为“数据,已经渗透到当今每一个行业和业务职能领域”[1]。信息时代快速发展,大数据可能成为改变世界的一种战略资源。事实上,“由大数据催生的巨大变革,深入到经济、政治、医疗、教育等人类生活的方方面面,为社会带来前所未有的‘大利润’‘大科技’和‘大知识’等发展机遇,进而影响人们的价值体系、知识体系和生活方式”[2]。我国于2015年正式启动国家大数据战略,涵盖政府、农业、交通、教育、金融等多个领域。所谓“大数据”就是“通过对海量数据进行分析,获得巨大价值的产品和服务,或深刻的洞见,最终形成变革之力”[3]。现实世界和互联网虚拟世界每天都在产生大规模的数据,经济社会各个领域都会产生大数据,教育领域也不例外。当前,我国教育领域的大数据正在形成,如全国各高校的教学状态数据库,教学、科研、人事、学生、财务管理等活动数据,教育信息化、数字化校园建设重点从基础建设、数据积累向数据应用转移,各类网络课堂、大规模在线开放课程等。中国是世界上教育规模最大的国家,随着信息和网络的发展,海量的教育大数据将不断产生,科学利用这些数据资源必将对教育领域产生深刻的影响,有效推动教育的变革与发展。
1 教育大数据的来源与特征
1.1 教育大数据的来源
大数据是相对于小数据的一个相对概念。大数据并不是大批量的数据简单地累加而形成,它具有交叉性、融合性、流动性和跨领域等特征。教育大数据就是在教育过程中产生的数据或者是在教育领域与教育相关的活动所产生的数据。
大数据主要有三种来源,但具体到教育领域,对应这三种来源,教育大数据类型主要分为以下三种情况[4]。
(1)来源于人。互联网教育过程中,教育者和受教育者之间直接产生文字、图片、视频等各种数据。如网络教学、线上互动、数字资源查询、网上测评、移动支付等。
(2)来源于机。计算机信息系统在教育活动过程中产生文本文档、数据表格等各类数据。如学校办学条件、师生基本信息、资产管理情况、财务运作状况等。
(3)来源于物。在实际教育活动中,由数字设备采集到的图像、音频等非结构化数据。如标准化考场摄像头采集到的考场数据、网络教室的教学数据、校园内各种监控数据、餐厅的流量检测数据等。
1.2 教育大数据的特征
大数据具有海量的数据规模(vast)、快速的数据流转和动态的数据体系(velocity)、多样的数据类型(variety)和巨大的数据价值(value)等特征[5]。当然,作为大数据的一个子集,教育大数据也同样具有这些特征。除此以外,由于教育特性,它又有着与其他领域不尽相同的一些特征。主要表现在以下几个方面。
(1)客观性。客观性是教育大数据相比于传统教育数据而言更鲜明的特征。传统教育数据的采集大都是根据需要,在大家知情的情况下进行的,这类数据获取过程中往往带有一定的刻意性和非意愿性。而教育大数据是人们在教育活动过程中或其他相关领域中自然而然产生的,是在不受主观思想主导下的原生态数据,因此更具有客观性。
(2)即时性。传统教育数据一般都是人工方式进行,基本是对某一个周期内的数据进行阶段性的采集,不能根据需要随时采集到数据,这主要还是与技术有关。互联网发展了大数据,同时也发展了数据采集技术,使得我们即时采集数据成为可能。大数据的即时采集为教育研究者带来了极大的便利,也推动了教育领域各项工作的发展和改进。
(3)连续性。教育大数据在每天的教育活动中不间断地产生着,这些数据本身就具有连续性,但在传统的教育数据采集过程中,限于技术手段,我们只能间断性地采集一部分数据。大数据时代,我们可以借助传感设备、移动终端、云计算等技术,在不影响教学活动情况下即时、连续不间断地采集到更多微观层面的过程性数据。
(4)广泛性。准确地获得全面而广泛的数据是教育管理者和研究者一直都很期待的事,但在大数据来临之前,我们所获得的数据非常有限。人们往往都是为了研究分析某一种现象或者为了某个教育决策有针对性地采集数据,一般而言,这样的数据具有片面性和不完整性。教育大数据是基于一种平台或者一个载体,将所有与教育活动有关的、与研究对象相关的数据直接或间接地供我们使用并进行研究分析。
(5)复杂性。数据的广泛性给数据收集和数据分析等工作带来较多便利性,但同时也会带来一些问题。教育活动是人类社会中一种比较特殊的实践活动,主客体关系复杂多变,教与学的活动并存,教育模式和过程复杂且具有不确定性,没有标准化样板,这些本身就造成教育数据的复杂性。再加上大数据本身就带有鱼龙混杂的特性,使得教育数据的复杂情况更为严重。
(6)细颗粒性。传统的教育数据因为大都是通过针对性地调查而获取的阶段性数据,一般数据的颗粒度都比较粗。而大数据因为它的连续性和即时性,可以记录每一个教育活动的即时情况,比如学生在某一个问题上思考的时间是多少,与教师互动的时间和次数等。这些数据的颗粒度相对来说就比较细,这就给我们深入分析和探究一些微观层面的问题带来便利。
2 基于大数据的教育评估特征
教育大数据的上述特征将使我们的观念和处理方式发生巨大的转变。这对于教育的影响是毋庸置疑的,无论是宏观上讲的教育教学理念、教育管理和决策,还是具体到微观上的教学过程与评价等方面,都将因此而发生变革。牛津大学互联网研究所教授、数据科学家维克托·迈尔-舍恩伯格指出,大数据将重塑教育,并提出大数据改善学习的三大核心要素:反馈、个性化和概率预测[6]。笔者认为,这些核心要素将为教育评估开拓新的思路,伴随着大数据时代的到来,基于大数据驱动下的教育评估会有新的特征。教育评估作为提高教育教学质量的一个重要手段,它对于加强教育与社会的联系、实现教育目标、推进教育发展等方面都将起到积极作用。
2.1 评估信息数据化
教育评估是以实现教育目标和教育理念为价值标准,以一定的评估指标体系为依据,通过系统地收集信息,运用一系列科学、可行的方法、技术和手段,对教育活动、过程及其结果进行系统的考察和价值判断,并为改革和发展教育的决策提供依据的优化教育的动态过程。信息是整个教育评估过程中最重要、最基础的依据。信息的多少、正确与否是判断事件、活动或结果的确定性的关键,将直接影响教育评估的信度。正如信息论奠基者香农所说,信息是用来消除不确定性的东西,是不定性减少的量,是两次不定性的差[7]。随着社会的不断发展,大数据时代的信息正以爆炸式的速度飞速增长,信息的存在形式也更加多样化。无疑,信息量的增多,将为教育评估工作带来很大帮助,也将推动教育评估研究更加全面深入。但是,在众多的信息中,除了少部分信息(如日常的各类教育相关数字等结构性数据)是可以进行直接测量和分析的以外,更多的是不能直接测量的,如图片、图像、音频、文档等,这就需要将其进行数据化。
数据化不是“数字化”,而是一种把现象转变为新型可分析数据的量化过程,包括数据的采集和数据的处理,也就是对某些事件或事物进行描述、记录、分析和重组,然后借助计算机技术、通信技术和高密度存储技术等,以数据的形式更高效、更准确地转变为教育评估的可视化资源。信息数据化是大数据时代最基本的特征之一。被数据化后的信息具有开放性、通用性、融合性和标准化等特点。由此,信息社会里海量的教育信息被数据化以后,将成为教育评估的重要资源,不仅会推动教育评估不断的深入和精准化,而且数据科学会丰富教育评估的内涵和理念。
2.2 评估内容综合化
在国内,教育评估种类主要有院校评估、专业评估认证以及各类专项评估、评价等。院校评估是对学校整体办学水平的评估;专业评估认证是对教育机构开设的,对具有专门职业特性的专业开展的教育教学情况进行认证评估的过程。如对“临床医学”“小学教育”等专业进行评估认证;专项评估种类很多,有针对某一时期建设需要而专门设立的评估,如为推动双一流学科建设而开展的学科专项评估;也有针对某一情况而开展的评估,如为了解学生就业情况而开展的就业调查和评估;还有针对学生学习情况和教师教学质量的评价。
无论是哪一种评估,一般而言都是在理论指导下,构建相应的评估指标体系,然后按照每一类指标采集相应的数据,根据所得数据分析出一种或多种结论。这就是“一对一”或“一对多”的评估模式。比如我们在进行专业评估时,往往只通过对课程、教材、实验室、实践基地、教改项目、师资队伍、培养质量等方面的考察,得出专业建设的优劣情况,并给出专业建设的建议。这样的评估主要是基于专业本身的单一因素,得到的结论也是一种单一评价。大数据将改变这样的情况,因为大数据采集更多强调发散性,数据多而涉及面极广,信息多元而丰富。大数据特征之一就是相关关系重于因果关系,也即可通过不同类型的数据找出它们之间的相关性,从而得出更加准确科学的结论。比如专业评估,大数据会提供我们更多被评估专业之外的数据,像相关产业的发展趋势、国内外其他同类专业的建设情况和发展趋势、已毕业学生的就业质量和发展潜力等。通过这些不同维度的数据评估,可以比较综合地给出被评估专业的点位和态势,从而比较准确地为其未来发展给出建议。这就是通过更综合的内容进行评估的“多对一”模式,它将改变传统评估中因评估内容相对单一而需借助评估者经验判断的依赖,避免因评估者个人喜好而带来的一些片面性认识。
2.3 评估方式过程化
传统的教育评估基本都是结果性、一次性的评估,也就是根据现有数据来考察目标达成度的一次总结性评估。即使是在教育活动过程中,为及时发现问题以便能调整和改进工作的形成性评估,事实上也是一种阶段性的总结评估。在教育活动过程中,开展即时性评估对于传统评估而言是较为困难的。首先,是传统评估虽然开始借助计算机信息技术,但所用的计算工具相对还是简单,不能较好地处理一些复杂繁多的数据,尤其是一些图像、音频等非结构化数据;其次,在数据采集中还面临一些困难,由于数据的开放性不够和数据保存意识的缺乏,随时采集变得不太可能,使得评估者只能借助传统方法需要时一次采集。
如前所述,教育大数据是基于一种平台或者一个载体,综合应用多种数字化设备,将所有与教育活动有关的、与研究对象相关的数据直接或间接供我们使用并进行研究分析,从而使评估者可以在不增加技术使用难度的情况下,了解被评估者在整个过程中的表现,然后用基于大数据的过程化评估引导教育活动适时调整和改进。过程化评估就是不单单考察总结性评估,更侧重积累教育活动开展过程中的生成性阶段成果。它改变以资料检查、调查访谈和印象评分为主的传统教育评估方式,而通过即时记录各种教育教学状态、表现、阶段性反馈等多种数据来源,依据客观数据的分析,用数据描述发展过程中的教育现象与问题,并对教育活动开展情况和目标达成度给出评判。例如,在某个连续的时间里将相应成果以“影像”记录下来,通过连续播放“影像”形成了一个连续的“活动”画面,评估者可以根据需要选择“连播”“回放”或“选看”。这种摄像式的过程化评估方式需要有连续性的数据作支撑,这在传统评估中通过一次或几次采集数据的方式是不可能做到的,只有在大数据时代通过信息和互联网技术才能实现。
2.4 评估手段智能化
评估手段从技术层面讲主要是指评估信息的采集、处理和分析等方面的方法。当前,教育领域的大数据正在形成,各种涉及课程教学、教学管理、学情信息、数字化校园等方面的数据与日俱增。从信息采集角度讲,随着教育大数据的形成以及互联网技术的发展,教育数据的采集将改变传统人工模式,采集的时效性和便利度将大大提高,为教育评估提供了较好的基础保障。从信息处理和分析的角度讲,正如前面所述,信息的数据化已经不成问题。然而,如何处理这些庞大而看似无序的数据需要更多的智能化技术。我们必须从那些杂乱无章的数据堆里找出有用的数据,然后经过精心的组织和概括,形成评估体系中的数据结构。
应用数据时不是漫无目标的杂乱拼凑,而应将其纳入评估理论和数据体系的相应层次。正如爱因斯坦所指出的那样,“科学是这样一种企图,它要把我们杂乱无章的感觉经验同一种在逻辑上贯彻一致的思想体系对应起来,在这个体系中,单个经验同理论结构的相互关系,必须使所得到的对应是唯一的,并且是令人信服的”[8]。因此,大数据下的教育评估就需要利用计算机技术对原始数据进行清洗、过滤和整理,去除与评估内容无关的维度,将与评估内容有关的数据进行格式化整理,以便进一步使用。数据的清洗、过滤和整理有时比较容易,比如通过教学日志分析教师教学状况,只需要把相应的维度保留,去除无关的信息即可。但对于大多数数据情况,这是很难做到的。比如,要通过百度网页了解学生对大数据的认识,内容通常都分布在不同网页中,对网页的结构、内容进行分析就成了使用大数据的先决条件,这就需要进行数据挖掘。数据挖掘是利用计算机辅助系统和数学算法,通过机器学习探索隐藏于大数据中的未知信息的过程。大数据时代的机器学习技术,就是利用大量的数据、较少的数学算法而得到的比较简单、“较粗糙”的评估分析模型。这要比小数据时代需要深度研究和高级的数学算法而得到比较复杂的模型要好得多。
教育大数据是发展智慧教育的基石[9],从数学角度讲,算法越简单越容易实现和推广,从评估目的角度讲,模型虽然简单,但基于大数据的数学模型同样可以得到比较精确的结论,从而使教育评估功能真正实现从“数据驱动决策”发展为“基于数据决策”,进而关注“数据感知决策”[10]。
[1]UN Global Pulse.Big Data for Development:Challenges&Opportu⁃ nities[EB/OL].(2014-05-10)[2017-01-10].http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_in novation.
[2]张燕南,赵中建.大数据教育应有的伦理思考[J].全球教育展望,2016(1):48-55.
[3]姜奇平.大数据的时代变革力量[J].互联网周刊,2013(1):34-37.
[4]李国杰,程学瑞.大数据研究:未来科技及经济社会发展的重大战略领域[J].中国科学院院刊,2012,27(6):647-657.
[5]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013(1):146-169.
[6]维克托·迈尔-舍恩伯格.与大数据同行——学习和教育的未来[M].赵中建,张燕南,译.上海:华东示范大学出版社,2015.
[7]香农.通信的数学理论[J].贝尔实验室技术杂志,1948(27).
[8]爱因斯坦.爱因斯坦文集(第一卷)[M].许良英,等编译.北京:商务出版社,1977:384.
[9]杨献民,唐斯斯,李冀红.发展教育大数据:内涵、价值和挑战[J].现代远程教育研究,2016(1):50-60.
[10]赵中建,张燕南.与大数据同行的学习与教育——《大数据时代》作者舍恩伯格教授和库克依先生访谈[J].全球教育展望, 2014(12):3-9.
Discussions on the Characteristics of Educational Assessment Driven by Big Data
WENG Lingli
(Hangzhou Normal University,Hangzhou 311121,China)
Big data is proactively affecting the society,and changing people’s way of living,working and thinking.Big data in education has different characteristics,compared with traditional education data,as well as big data in other fields.These characteristics will lead both educators and those who are being educated to change their way of thinking,so as to promote the reform and development of education.Educational assessment,taking information collection and data analysis as the basic means of implementation,will also be influenced significantly.By analyzing the sources and characteristics of big data in education,as well as their influence on educational assessment,this paper discusses the main characteristics of educational assessment driven by big data,and provides reference for educational assessment research launched in an era of big data.
Educational Assessment;Big Data;Data Driven
G405
A
1005-8427(2017)04-0053-5
10.19360/j.cnki.11-3303/g4.2017.04.009
(责任编辑:周黎明)
本文系全国教育科学“十三五”规划2016年度教育部重点课题“高校综合评价招生改革的理论和实践”(批准号:DIA160339)的阶段性研究成果之一。
翁灵丽(1981—),女,杭州师范大学教务处副处长,招生办副主任。