基于教育大数据的学习习惯动力学研究框架
2019-05-14武法提殷宝媛黄石华
武法提 殷宝媛 黄石华
关键词:学习习惯;动力学;大数据;学习分析;规模个性化教育
中图分类号:G434 文献标识码:A
文章编号:1006-9860(2019)01-0070-07
一般来说,一个有价值的研究均会置于宏伟的时代和专业背景下,指向一个亟需解决的现实问题,而这个现实问题又具有深刻的历史和社会根源。“教育技术学定位于用新理念、新技术和新方法破解教育问题,推动教育变革的创新实践领域”。学习习惯动力学则是在当代教育诉求规模个性化教育发展的时代背景下,从学习习惯(学习者个性化的标签之一)这一微观视角切入,试图运用基于大数据的学习分析等新的理论和技术,破解学习习惯的数字化表征和学习习惯进化动力机制这两个学习习惯动力学的关键问题,从而进一步探寻技术破解教育问题,推动教育变革的宏大时代命题。
一、学习习惯动力学的研究背景
(一)规模个性化教育的时代发展新需求
教育与人的发展原理告诉我们,对于个体而言,受教育的目的之一就是使个体得到最大程度的发展,这种发展对应的结果就是个性化。古往今来,个性化教育一直是教育的理想和诉求,从“因材施教”到“个别化教育”,教育实践者做出了大量的探索,但个性化教育却仍然是教育实践的难题。尤其是进入了需要大量专业技术劳动力的工业时代后,班级授课制脱颖而出,成为了普及高效的教育模式。班级授课制虽然有利于教育的规模化发展,但也導致了教育“以班级为中心、以课堂为中心、以教材为中心”的近乎刻板的“三中心”教学模式,成为一种“同质化”教育。因此,社会开始呼吁关注个性化教育。
国家非常重视个性化教育,出台了一系列的政策和规划,如:2010年发布的《国家中长期教育改革和发展规划纲要》(2010-2020年)、2012年发布的《教育信息化十年发展规划(2011-2020年)》、2016年印发《教育信息化“十三五”规划》等文件中都有加强个性化教育的要求。这些政策和规划,充分反映了个性化教育的重要性和迫切性,同时为实施个性化教育指明了方向。然而,个性化教育一直是教育实践的难题,如何实施个性化教育、支持个性化学习,尚缺少成熟的理论和系统的方法。破解个性化教育的难题,也成为时代发展的重要命题。实施个性化教育就是要放弃以班级授课制为代表的规模化教育吗?历史的经验告诉我们,答案当然是否定的。这不仅因为个性化教育是一种教育成本很高的活动,更在于教育至少需在两个层面上进行:一是在互动层面上,不同学习者之间的互动以及学习者与教师之间的互动;二是在共同体层面上,这包括参与公共知识的社会化过程以及认识公共知识系统形成的机制,班级成员可以通过互动达成一个学习共同体。因此,我们必须放弃“非此即彼”的选择思路,探求个性化教育发展的第三条可行道路,这条道路应该在新的时代背景下,将个性化教育与规模化教育的优势结合起来,以适应信息时代的个性化发展需求,这个就是规模个性化教育。
个性化教育之所以难以破解,是因为无法对“材”进行细致的分析,并与匹配的“教”相结合。因此,个别化教育是在教育资源不充分的情况下,个性化教育的实施形态。进入了信息时代,大数据、人工智能、云计算、区块链等新技术发展与应用,为大规模个性化教育的实施创造了条件,尤其是学习分析技术的发展,我们可以通过对学生学习行为数据的采集和处理,从而对“材”进行细致分析;通过人工智能等技术,让计算机自动匹配“教”,为教育教学提供支持,从而扩大个性化教育的规模。因此,面向全体学生的规模个性化教育,是信息时代个性化教育的理想形态。新技术(尤其是大数据、学习分析等技术)的出现,为实现规模个性化教育提供了可能性,那么如何运用这些新技术来支持规模个性化教学,成为了新时代教育必须要回答的问题,这也是学习习惯动力学研究的出发点。
(二)教育研究范式由经验主义向数据驱动的科学主义转变
时代变迁呼唤教育的变革,科学技术逐渐成为教育变革的内生动力,在科学技术的助力下,教育的内容、教与学的方式、教育评价的方式、教育治理等方面均将发生巨大的变革。教育规律研究从经验主义向科学主义转变是教育变革的趋势之一,也将是教育研究范式的一个转变。
“范式是一种公认的模型和模式,是常规科学的理论基础和实践规范,是研究者在从事科学研究时共同遵守的世界观和行为方式,是共同接受的一组假说、理论、准则和方法的总和”。通常认为科学研究经历了四次范式的转变:第一范式是经验或实验科学,以观察和实验来描述自然现象;第二范式是理论科学,以建模和归纳来系统地解释现象或事实;第三范式是计算科学,以计算和模拟来解释现象或事实;第四范式是数据密集计算型范式,核心是强调计算机不仅能做模拟仿真,还能进行总结分析,形成理论。四次范式的理论虽源于自然科学的研究,但也被引入到社会科学的领域,开拓了社会科学研究的视野。
随着互联网、移动技术和信息技术的发展,人类开展社会科学研究的思维方式开始迅速演进。教育领域也是一样,“互联网+”的出现给教育领域的发展带来了新的活力。然而,“互联网+教育”作为一种新型的教育形态,与传统教育相比,在教学组织方式、师生地位、教学资源应用等方面有着很大的不同。传统教育学的解释范式无法清晰地阐释这些新的教育现象,尤其是教育大数据的出现,我们预见到未来教育获得学生全息数据的可能性,这急需一套能解释这些新的教育现象的方法体系。在数据驱动的时代,这种基于自然科学的研究范式,对于我们认识教育教学的新常态提供了新的认识思路。在这样的背景下,教育范式开始由基于经验感知的阶段转向基于数据分析的阶段发展。
(三)数字原住民学习习惯的变化
教育是什么?往简单方面说,只需一句话,就是要养成良好的习惯。人从出生就开始通过学习来了解这个世界,学习作为一种获取知识和交流的方式,已经成为人们日常生活的重要组成部分。同样,人在通过学习与世界交互的过程中,其思维习惯、生活习惯和学习习惯等方面也深受世界的影响,从而打下了时代的烙印。正如Bruce D.Perry博士所说:“不同的经历产生不同的大脑认知结构”,技术在推动人类社会由工业社会向信息社会过渡的同时,也改变着不同年代学习者的学习习惯。
20世纪80年代及以前出生的学习者,经历了互联网从无到有,被喻为数字时代的移民;20世纪90年代以后出生的学习者,因其从小就“浸润”在互联网为代表的信息技术环境中,被喻为数字原住民或数字土著。由于数字土著具有伴随信息技术成长的经历,因此造就了他们与数字移民不同的学习习惯。当前在校的中小学生均为数字土著,他们的个体学习习惯和群体学习习惯与数字移民相比,发生了很大变化,呈现出新的特征,因此,研究和探索这些新特征对于教学改革、因学施教,实现从规模化教育向规模个性化教育转变具有重要意义。
二、学习习惯动力学的研究定位
学习习惯是学习者的个性化标签,是影响个性化学习服务精准化的重要因素。因此,揭示“互联网+教育”背景下学生的个体学习习惯和群体学习习惯发展的规律和途径,是破解规模个性化教育难题的重要内容。
传统学习习惯的研究在以下三个方面取得了进展:一是学习习惯培养的方法和策略研究。研究者在长期的教学实践中积累了大量的针对具体学科、具体学段的学习习惯培养方法和策略,包括针对具体学科的学习习惯培养和概括的(不针对具体学科)学生学习习惯的培养两方面。针对具体学科的学习习惯培养,如佟士凡列举的语文学习习惯有独立思考的习惯等七种习惯等。概括的学生学习习惯的培养,如白文飞提出培养中小学生良好的学习习惯的语言激励性评价、分层激励性评价和情感激励性评价等激励性评价方法;赵丽霞从主要原则、基本环节、内容体系、测评方法方面人手探讨小学生良好学习习惯的培养对策等;二是从心理学角度分析学习习惯的形成机制,主要有目标促进论、环境促进论、态度促进论三种观点。目标促进论认为,目标在习惯形成过程中起到关键的作用,如Verplanken等提出“习惯是一种目标导向的自动化反应行为,认为行为目标的激活可以直接引发习惯行为的表现”。态度促进论认为,态度在习惯形成过程中起到重要的作用,如Aarts H等提出习惯形成模型,该模型将习惯形成分成了需求、感知(希望、社会压力、行为控制)、意图、态度、评估(经验的满意度)、形成习惯等阶段。环境促进论认为,环境对习惯行为形成有重要影响作用,如Neal等提出“直接背景触发模型”,认为只要知觉到背景特征线索就会触发联结反应;三是解构不同学段学生学习习惯的维度,如田澜对问卷调查的数据进行探索性因素分析和验证性因素分析,将小学生学习习惯分为七个维度;McDermot將青少年的学习习惯分成能力动机、学习态度、注意力或坚持性、策略或灵活性四个维度;Cakiroglu,Unal将大学生在线学习习惯分成家庭环境、目标计划、专注习惯、准备考试、通常的习惯和态度、学校环境等。
然而,以往学习习惯研究的场景,大多是基于传统的课堂教学环境,近几年开始出现基于混合环境和在线环境的研究;以往学习习惯的研究,定性研究范式一直占据着主导,定量方法仅是通过自编学习习惯问卷来测量。这种测量方式主要采取自我报告法和反应频率测量法。但自我报告法和反应频率测量法本身都存在一定的缺陷,从而导致误差。如自我报告法容易受到近因效应或突出效应的影响,从而产生一定的回忆偏差;反应频率法则需要在他人帮助下进行测量和统计被试的反应频率,这不利于个人随时随地的对习惯进行检测与管理。可见,已有的学习习惯的研究方法难以准确描述学生学习习惯的变化,也难以发掘新型学习环境下学习习惯发展的规律。因此,构建科学有效的学习习惯测量模型以描述学习习惯的动态变化,探索学习习惯进化的动力学机制以发现学习习惯形成的规律,是深层次挖掘“互联网+教育”背景下学习习惯发展规律的两个关键问题。
本研究尝试将学习分析方法和大数据分析方法融合到学习习惯研究,以破解这两个关键问题。学习分析通过收集无干预的用户轨迹数据,对学习行为进行定量化分析,提供了学习习惯诊断、预测和干预的方法。大数据分析为行为规律的挖掘提供了研究思路和技术方法,是发现学习习惯的基础和重要保障。基于此,本文提出基于大数据的学习习惯动力学,意图从学习者的学习行为分析出发,通过采集海量的学习行为轨迹数据(如:课堂表现行为轨迹、课前预习行为轨迹、作业表现行为轨迹、考试表现行为轨迹、交流讨论行为轨迹等数据类型),构建一个可重用的多粒度数据共享模型。在此基础上,融合学习分析和大数据分析方法,深层次分析数据的统计规律,构建一个六维(听课、交流、自学、作业、考试、复习)的学习习惯测量模型,并基于该学习习惯测量模型设计一个精准化的学习习惯干预模型,探索基于教育大数据的学习习惯动力学机制,溯源学生在“互联网+教育”环境下学习习惯发展的规律。
三、学习习惯动力学的研究目标和关键科学问题
(一)研究目标
本研究的目标是探索数字化学习环境下学生学习习惯发展的新规律和新途径,通过建立基于大数据的学习习惯数据采集模型,构建有效的学习习惯测量模型,探索并设计学习习惯干预模型,以揭示数字时代个体和群体学习者学习习惯形成的动力学机制,从而丰富个性化教育理论,提高教育服务的精准化水平,为实现规模个性化教育提供理论和实践支持。
(二)关键科学问题
1.学习习惯的数据化表征
学习习惯的数据化表征,即建立学习习惯的测量模型,动态表征学习习惯及其变化。数据驱动的学习习惯量化研究,与传统基于经验的定性研究范式相比,具有更高的精确性,特别是在大数据的助力下,学习习惯的数据化表征有利于建立学习习惯与其他学习变量之间的数据关系,探索学习的规律,从而使教育研究走向数据驱动的精确化、科学化研究,破解规模个性化教育的难题。
2.学习习惯进化的动力学机制
学习习惯进化的动力学机制,即在数据驱动下,探索学习习惯朝着预期方向发展的系统所包含的要素、各要素的功能及要素之间的相互关系。在“互联网+教育”环境下,探索数据作为动力能源,技术作为动力引擎的学习习惯进化的动力学机制,是建立动态实时的学习习惯模型,研究学习习惯的进化规律。
四、基于大数据的学习习惯动力学的研究内容
(一)基于大数据的学习习惯数据采集模型研究
分析数字时代的学生常态化学习的学习习惯,首先需要采集学生学习行为数据,这就需要异构数据源之间的共享和联通,而这种互连、互通的基础,需要将数据规范化,构建多粒度的数据采集模型。
如图1所示,构建学习习惯数据采集模型主要分为学习轨迹数据的监测、学习习惯数据的感知、数据的规范化、数据的形式化描述、多粒度数据模型的生成等五个阶段。第一阶段是学习轨迹数据的监测,主要利用互联网的情境感知工具监测学习情境(包括静态数据和动态数据),清洗和存储学习情境变化的相关数据;第二阶段是学习习惯数据的感知,即根据第一阶段的情境变化,运用感知设备识别学习者场景要素(如空间、行为等)的变化,并对这些要素赋予分类语义信息,便于生成规范化的数据;第三阶段是数据的规范化,主要是将采集到的数据转换为可被机器直接读取和识别的结构化、标准化的通用数据格式,生成的规范化数据,其数学公式为LC=T×L×D×E={(t,1,d,e)lt∈T,l∈L,d∈D,e∈E},其中,t为时间集合T的元素,l为位置集合L的元素,d为设备集合D的元素,e为事件集合E的元素;第四阶段是数据的形式化描述,即将规范化后的数据进行形式化描述,生成xAPI的学习记录语句,存储到学习记录库中,便于生成多粒度数据模型;第五阶段是多粒度数据共享模型的生成,主要是基于前面四个阶段的运算结果,根据不同的场景要素,构建不同维度的数据立方体,生成可共享、可重用的多粒度数据模型,以满足异构数据源之间按需传输的要求。
(二)学习习惯测量模型研究
建立学习习惯的测量模型是描绘学习习惯动态变化的基础,是对学习习惯进行诊断、预测和干预的前提。如图2所示,动态化的学习习惯建模研究分为四个环节:第一个环节是学习习惯模型维度的确定,通过收集和分析国内外关于学习习惯维度分类的文献,初步确定学习习惯维度的关键词;通过问卷访谈,补充学习习惯维度的关键词,建立学习习惯维度的关键词集;通过文本分析法和德尔菲法,初步确定学习习惯维度的构成,并用数据检验维度之间的结构效度;第二个环节是维度测量指标的划分,通过对每—个维度指标的调研分析,初步确定维度的测量指标集;通过归类分析、因子分析等方法生成最终的测量指标集;第三个环节是特征值的计算,运用分层聚类、频繁序列等挖掘算法,将测量指标集从学习习惯规范化数据集中挖掘出来,生成各个维度的频繁序列集;运用各个维度的特征值,计算方法生成各个维度的特征結果集,从而得到个体学习习惯模型;第四个环节是学习习惯模型的生成,个体学习习惯模型通过单个维度分群计算得到,群体学习习惯模型通过多个维度组合计算得到。
(三)学习习惯的干预模型研究
学习习惯的干预模型是学习习惯进化的动力引擎。模型的干预机制是根据学习习惯的诊断结果,提供不同的支持策略,具体包括两类支持策略。如图3所示,对于不良学习习惯,提供主动干预策略;对于良好学习习惯和个性化学习习惯提供自适应服务策略。主动干预策略的实施包括两个环节:学习习惯的形成机制和干预的匹配机制。学习习惯的形成机制即对于某一不良学习习惯进行描述,分析习惯的形成机制,剖析主要原因,从而生成不良学习习惯的成因集。干预的匹配机制是通过识别不良学习习惯,从策略库中选择干预策略进行适配,并提供干预的方式和干预的时机,通过一段时间的干预后,对干预的效果进行分析,如果效果不理想,再动态修正干预的策略、方式和时机。自适应服务策略实施包括两个环节:服务推送引擎和适应性内容的呈现策略。服务推送引擎根据学习者个性化的学习习惯或良好的学习习惯的特征,匹配学习资源(如:学习进度、学习内容、学习伙伴、学习活动等),在此基础上,采用Multi-agent的协同过滤推送算法,选择适配的推送策略(如:推送的时机、推送的方式、推送的内容等),生成最恰当的资源推送列表。适应性内容的呈现策略是基于生成的资源推送列表,匹配学习者的学习策略,对生成的资源列表进行汇聚重组,选择学习者适配的内容呈现策略,主动地推送给学习者合适的学习资源。
(四)学习习惯动力学机制研究
学习习惯动力学机制,即研究促进学习习惯进化的系统所包含的要素、各要素的功能及要素之间的相互关系。如图4所示,学习习惯的数据采集模型收集和存储学生学习行为的数据,给学习习惯的量化提供了原动力,是整个系统的基础;学习习惯的动态测量模型是动态描绘学习习惯发展变化的前提,是对学习习惯进行干预的保障;学习习惯的干预模型是促进学习习惯进化的动力引擎,是整个动力学机制的核心;效果分析部分给整个系统提供反馈,促使各要素动态修正,保证系统朝着正确的方向发展即学习习惯朝着预期方向进化。
五、研究意义
学习习惯动力学的研究对于探索数字时代学生学习的内在规律、提升个性化学习服务的精准度、形成规模个性化教育理论具有重要的理论和实践价值。通过挖掘学生日常学习行为数据,无干预地发现真实的学生,理解、分析、预测学生的学习习惯,为具有不同学习习惯的学习者提供个性化学习服务,并为具有不良学习习惯的学生提供有针对性的指导,从而为学生的自我学习监控、教师的教学决策和教育机构的管理决策提供科学依据。
学习习惯动力学的研究提供了认识教育教学新常态的新方法和新思路。学习习惯动力学的研究定位与传统的基于经验的教育研究范式不同,是数据驱动下的定量研究范式,这种运用建模与数据挖掘的方法描绘学习习惯发展的动态变化,为教育研究走向科学化和精准化奠定了科学基础;而数据驱动的研究范式,通过将勤奋度转化为可测量的指标,运用数据建模和挖掘算法,构建动态表征学习者学习投入状态的测量模型,并与学习结果等变量建立联系,使得分析结果更科学、更准确。
学习习惯动力学的研究为教育政策的制定提供科学的依据。“互联网+教育”环境下学习者个体和群体学习习惯的变化是推动教育变革的基础。学习习惯动力学认为,群体习惯的“爆发”其背后必有动力学机制,通过其动力学机制分析,会发现这种群体习惯爆发的原因和规律,为教育政策的制定提供科学的依据。通过描述学习习惯模型的时空偏好维度,从技术和文化变迁等角度解释其爆发的动力学机制,这对设计基于个体和群体时空偏好的学习环境(如智慧学习环境的设计)提供了重要的指导,也给教育信息化规划和教育供给侧结构性改革提供了依据。