大数据在教育领域的深层应用探析
2022-01-19周伟
周伟
【摘 要】人工智能、云计算、大数据、物联网等信息技术的快速发展为解决教育难题、促进教育领域综合改革与发展提供了重要机遇和巨大的可能性。其中,大数据技术无疑是推进教育创新发展的科学力量。数据作为重要资产已获得政府与企业的一致共识,教育信息化2.0更将以数据化为基本特征。本文就笔者亲身体验美国对教育数据的开发与应用情况,结合自己的学习与思考进行阐述。
【关键词】大数据;教育管理;学习方式;教育评价
【中图分类号】G434 【文献标识码】A
【论文编号】1671-7384(2022)01-067-05
联合国在 2012 年发布的大数据白皮书Big Data for Development:Challenges & Opportunities中指出,大数据的出现将会对社会各个领域产生深刻影响[1]。美国教育部于2012年10月发布的《通过教育数据挖掘和学习分析促进教与学》中指出,通过对教育大数据的挖掘与分析,促进美国高等院校及K-12学校教学系统的变革。2015 年 9 月 5 日,国务院印发了《促进大数据发展行动纲要》,指出“数据已成为国家基础性战略资源”,并在启动的十大工程之一“公共服务大数据工程”中明确提出要建设教育大数据。2017 年2 月,国家发展和改革委员会正式批复同意由华中师范大学作为牵头单位建设教育大数据应用技术国家工程实验室,标志着教育大数据正式进入了为教育治理现代化服务的轨道。在教育部2018年4月发布的《教育信息化2.0行动计划》中,明确指出“优化教育业务管理信息系统,深化教育大数据应用,全面提升教育管理信息化支撑教育业务管理、政务服务、教学管理等工作的能力。”由此可以看出,教育信息化2.0将以数据为基础 ,参与主体、教育元素、教育行为数据化将是教育信息化 2.0 的基本特征。
教育大数据概念及内涵
1.教育大数据的定义
目前,关于大数据的概念还没有完全统一。维基百科对大数据的定义是:大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集。研究机构Gartner认为大数据是指需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。麦肯锡把大数据定义为无法在一定时间内用传统数据库工具对其内容进行获取、存储、管理和分析的数据集。
教育大数据是大数据的一个子集,特指教育领域的大数据。有学者提出,所谓教育大数据,是指整个教育活动过程中所产生的以及根据教育需要采集到的,一切用于教育发展并可创造巨大潜在价值的数据集合[2]。余胜泉、李晓庆等学者认为,教育大数据是全样本、全过程的数据,关注每一位学生的微观个性表现,包含学生学习过程中产生的数据,如学习时间、学习内容、学习活动、人际交互、学习投入与情感投入等各类数据,这些数据在日常教育业务中产生,全样本覆盖,实时收集、实时分析、实时反馈、实时改进[3]。
综上所述,教育大数据是在信息技术支持下的教育教学活动中产生的各种数据的总和,并且通过数据分析、可视化等技术进行价值挖掘的过程。
2.教育大数据的特征
关于大数据特征比较统一的说法是四V特征:数据体量大 (Volume)、类型多样化 (Variety)、价值高 (Value)、处理时效高 (Velocity)。相比传统数据,教育大数据具有教育特性。随着信息技术的发展及其在课堂教学中的广泛应用,目前可以在自然状态下无感知地轻松记录学生的学习轨迹、回答问题次数,甚至在作业题上逗留的时间等。教育大数据的数据结构更加复杂,常规的结构化数据(如学业成绩、学籍信息、体质健康信息等)依旧重要,但非结构化数据(如图片、视频、教案、教学软件、学习游戏等)将越来越占据主导地位。
3.教育大数据内容分类
教育数据有多种分类方式。从数据产生的业务来源来看,有教学类数据、管理类数据、科研类数据以及服务类数据。从数据结构化的程度来看,包括结构化数据、半结构化数据和非结构化数据。从数据产生的环节来看,还可以分为过程性数据和结果性数据。
综合目前的研究,有不同学者从不同的角度对数据进行了分类,主要包括下面几个类型。
杨现民等将教育数据分为四层,由内到外分别是基础层、状态层、资源层和行为层。其中,基础层存储国家教育基础性数据,包括教育部 2012 年发布的7个教育管理信息系列标准中提到的数据;状态层存储各种教育装备、教育环境以及教育业务的运行狀态信息;资源层存储教育过程建设或生成的各种形态的教学资源;行为层存储广大教育相关用户(教师、学生、教研员、教育管理者等)的行为数据。
孙洪涛和郑勤华将教育大数据依照不同层级的主体和教育教学活动的各项内容,分为四个层次和六大类型。四个层次包括个体、学校、区域和国家;六大类型包括基础数据、管理数据、教学数据、科研数据、服务数据、舆情数据等[4]。
李振等根据教育大数据的来源分为四种类型:管理类数据,包括学籍数据、学生成绩、上网数据、一卡通数据等,这些数据多以结构化的形式存储在关系型数据库中;资源类数据,包括媒体素材、试卷、课件、案例等;行为类数据,包括教师教学行为和学生学习行为产生的数据;评价类数据,包括学业水平考试类数据和综合素质评价类数据[5]。
大数据在教育教学中的应用初探
大数据已经在教育中产生了一些实践案例,本部分主要根据笔者的调研学习经历,以案例分析的角度来探讨教育大数据的应用可能性。维克托·迈尔-舍恩伯格在《大数据时代生活、工作与思维的大变革》中指出:“大数据的价值不再单纯来源于它的基本用途,而更多源于它的二次利用。”“大数据时代,很多数据在收集的时候并无意用作其他用途,而最终却产生了很多创新性的用途。”
笔者认为大数据在教育教学中的应用主要体现在科学化决策、精细化管理、个性化教学以及智能化评价方面,而这些方面都是体现教育现代化的核心技术指标,直接决定了教育现代化的发展进程。
1.教育大数据推动教育科学决策
传统的教育决策制定常常缺少有效的数据科学分析,存在决策者以自己有限的理解、假想、推测为出发点,依据直觉或趋势来制定政策,这种缺少数据分析依据的决策往往与实际情况相差甚远,而教育大数据正可以帮助解决这种不足。
美国作为教育大数据的积极倡导者,利用教育大数据为美国政府、教育管理部门、学校与教师做出合理的教育教学决策提供了可靠的证据。整体上,美国建立了严格的教育问责制度,包括利用州教育问责系统(State Accountability Systems)对各州教育发展情况进行全方位评价,借助于学区级评价系统(District-level Evaluation Systems)评价各学区、各学校的整体教育质量。美国联邦政府以及各州政府基于对教育大数据的分析结果评价各州或州内学区的教育进展水平,并以此作为教育投入以及教育政策制定的依据。例如,笔者深度访问的伊利诺伊州就实施“学习报告卡”(https://www.illinoisreportcard.com)系统,伊利诺伊州教育委员会每年发布年度报告,显示了州以及每所学校和地区在实现教育目标方面的进展,还提供了学生和学校表现的完整情况,如图1所示。
在报告卡中还呈现每所学校的五要素调查情况(包含卓有成效的领导、团结协作的教师、支持有力的环境、不断进取的教学、积极参与的家庭)、地区财政、学校财政、生均支出、平均班级人数、总上课天数、健康与保健(平均每周上体育课的天数)等。
类似伊利诺伊州的学习报告卡系统,加利福尼亚州为提高教学质量,与一家从事教育研究开发的知名公司签订了对学生进行数据驱动决策工具开发的合作协议。该协议涉及该州全部高校、高等教育管理者、在校的教师和学生,显示了该州高等教育主管机构为缩小学生成绩差距、改善教育管理、提高整体教学质量在标准化数据连接和评价应用方面做出的巨大努力。这些系统都基于教育大数据的分析来确定学校需要提升的关键领域、学生分班或安排相关学习支持服务、评价教师的教学质量并提出教学方式变革计划,为州、学区制定科学的教育决策,提供了有力的数据支撑。
2.教育大数据促进教育精细化管理
大数据时代,教育者将更加依赖于数据和分析,而不是直觉和经验;同样,教育大数据还将改变领导力和管理的本质。服务管理、数据科学管理将取代传统的行政管理、经验管理。技术不断发展,教育数据挖掘与分析不断深入,不仅要着眼于已有的确定关系,更要探寻隐藏的因果关系。利用大数据技术可以深度挖掘教育数据中的隐藏信息,可以暴露教育过程中存在的问题,提供决策来优化教育管理,促进精细化管理。
当然,要做到精细化管理,必须采集更为细致的数据,以便做出精准分析。如在美国2500多所学校中得以广泛应用的Learnsprout系统。该系统能够整合学生信息系统和学习管理系统的数据,对学生日常表现进行监测,通过构建模型对学生综合状况进行分析,并对管理和教学提出建议。刚才提到的伊利诺伊州实施的学生报告卡系统,包含了11000多个数据点,这些数据详细描述了伊利诺伊州852个学区中的每一所学校的概况、学术进步、学校环境、学生情况、教师情况、管理者情况、学校亮点等方面的内容,通过科目、年份、年级或者人口统计(包含多种族、性别等)等字段进行数据分析。如学习绩效散点图显示的是某学校低收入家庭的学生在数学学科上获得优秀比例的情况与州其他学校的比较,可以通过选择年份、学科或者某一类型的学生做进一步的精细化数据分析,从而提出更好的教学建议。
又如,普渡大学实施的课程信号系统(Course Signals)。通过收集分析学生个体的基本信息和学习过程数据,通过大数据算法建立预测模型,判断学生是否存在学习危机,如果判断学生存在学习危机,系统将发出预警信号,并给予及时的干预指导。
3.教育大数据变革学习方式
大数据将变革现有学习方式,促进个性化学习。对教师而言,大数据可揭示学生的特点,预测未来的表现,提供教学帮助,教师对教学过程的掌握从依靠经验转向以教育数据分析为支撑。对学生而言,对于自己学习状况的了解从模糊不清到心中有数,可以更好地认识自我、发展自我、规划自我。
如美国纽约市教育部门实施的“一人学校”(SO1,School of One)项目,以学生为中心,搭建混合式網络学习环境,满足学生的个性化学习需求。通过采用大数据分析,对学生的学习基础和历史、之前的评估数据以及教师、人员和技术等进行综合算法分析,从而确定哪些课程最适合哪种类型的学生。然后,系统会为每位学生和教师生成一张个性化的课表,引导学生进行不同方式的学习。
4.教育大数据改变教育评价方式
传统的教育评价由于缺乏高效的数据采集分析工具,难以进行多元量化评价。随着信息技术的发展,尤其是大数据技术的普及,越来越多的学校正在尝试通过多种渠道采集教育数据进行多元评价。教学评价不再仅仅由静态的考试成绩和纪律表现等教师的主观感受来决定,而由大量的数据感知得到更为公正客观的评价。
如旧金山的教师家长互动交流平台(ClassDojo),用于帮助教师实时管理教学行为。在平台上,每位学生都拥有自己的头像,通过点击学生的头像,教师可以实时输入学生的表现行为数据,包括参与、帮助他人、洞察、干扰、迟到和自定义行为。学生可以实时收到教师的反馈数据,如一个绿色徽章表示教师给予学生一次积极行为的反馈,而红色徽章则用来标记消极行为。教师可根据他们的行为适当增减学生的分数,同时也允许学生之间进行行为评价,从而培养学生对适当和不适当行为的判断,激发更好的行为。
当然,ClassDojo需要依靠教师人工点击从而获取课堂数据,这无疑增加了教师的工作量。随着数据采集技术的改进以及人工智能技术的加入,无感知数据采集将更为智能高效,是目前的发展趋势。如中庆智课系统,将课堂教学过程实时录制并将非结构化的视频数据结构化,并在平台上对课堂行为数据进行输出和分析,以期让教师更了解自己的课堂和学生,学校更了解教师的教學水平,以便做出更精准的评价和决策,如图2所示。
教育大数据建设建议与思考
可以预见,随着大数据在教育教学中的深入应用,必将掀起区域及学校管理模式的革新、教学方式的创新以及学习评价模式的变革。当然,大数据的应用不会一蹴而就,一定是基于长期数据的积淀。笔者认为当前教育大数据建设需要重点关注以下几点。
(1)构建完整的区域数据管理机制与保障体系。区域层面要建立教育领域大数据共享机制和数据治理的标准规范,并建设大数据基础平台,从技术和机制上做到能够在尽可能短的时间内完成对不同部门、不同领域的大数据汇集整合,解决目前“数据不可用、数据不够用、数据不敢用、数据不会用”的问题。
(2)学校建立完整的数据采集与应用系统。学校层面建设信息系统时在考虑平台功能的同时,一定要注重平台本身的应用数据记录,建立完整的伴随式数据采集体系,并重视在应用过程中进行数据治理工作。
(3)全面提升数据素养。注重教育从业人员数据思维与数据素养的提升,教育决策者要建立基于数据的科学决策观,培养教师良好的信息技术能力和数据素养,大力推进一线教学中的数据应用。
(4)加强区域教育大数据的研究。通过高校合作、企业参与的模式,发挥各自力量,对重点难点问题进行深入的研究。
无论区域还是学校都要做好在一段时期内没有可见成果的心理准备,要有耐得住寂寞的意志力,抽丝剥茧,潜心研究,有厚积薄发的耐心,在大量数据积淀后,方能挖掘数据背后的价值。从而制定有效政策,采取适当措施,提高教育质量,真正推进教育现代化进程。
参考文献
Big Data for Development: Challenges & Opportunities[DB/OL].2012-05-01.http://www.unglobalpulse.org/sites/default/files/BigDataforDevelopment-UNGlobalPulseJune2012.pdf.
[4] 孙洪涛,郑勤华. 教育大数据的核心技术、应用现状与发展趋势[J]. 远程教育杂志,2016(2):40-49.
余胜泉,李晓庆. 区域性教育大数据总体架构与应用模型[J]. 中国电化教育,2019(1):18-27.
李振,周东岱,刘娜,董晓晓,钟绍春.教育大数据的平台构建与关键实现技术.[J]现代教育技术,2018(1): 100-106.