面向学习云空间的认知投入量化研究
2020-06-22张晓峰李明喜俞建慧吴刚
张晓峰 李明喜 俞建慧 吴刚
【摘要】 在全面推进“网络学习空间人人通”的建设背景下,学习云空间的应用不断深入。但正如其他在线学习平台一样,学习云空间也存在辍学率高、学习投入不足等问题。本文聚焦学习云空间中学习主体认知投入相关数据的获取,提出了基于机器学习的认知投入量化方法。首先,分析了认知投入的构成要素,并基于班杜拉的社会认知理论,建立了面向学习云空间的认知投入模型。然后构建了围绕“数据采集-数据处理-量化实现-量化应用”的认知投入量化框架,并设计了一个基于支持向量机的认知投入量化算法。最后以世界大学城系统平台数据为支撑,通过与其他机器学习算法的对比得到研究结果,基于SVM算法具有较高的量化精确率,本研究希望能为教育领域深层认知投入量化提供一种可行的参考方案。
【關键词】 在线学习;学习分析;深层次学习;深度学习;学习投入;社会认知理论;认知学习理论;认知投入; 机器学习;支持向量机
一、引言
随着教育信息化2.0和社会交互网络的发展,在线学习成为教师教学和学生学习的重要形式,尤其是基于云计算的网络学习空间(学习云空间)的产生,真正实现了大规模资源池的共建共享,极大地促进了学习主体基于云的网络化泛在交互学习(黄昌勤, 等, 2015)。这些特性使得学习云空间成为研究者当前关注的热点问题。有研究表明,学习云空间中师生时空分离特性使得学习主体容易受到外界因素的干扰,出现学习投入不足、学习效率低等问题(韩中美, 等, 2017)。学习投入是衡量学习效率的重要指标之一,因此对学习投入进行量化研究,并给予适当的学习干预、自我诊断、学情检测等智能支持服务,是解决学习主体学习投入不足和提高学习效率的关键。
在目前针对学习投入的相关研究中,陈怡硕(Chen, 2017)研究了学习投入与学习主体的学术成就和高阶能力发展正相关。约翰逊指出(Johnson, 2014)对学习投入的及时测评和实时分析将会有效地促进学习绩效的提高;约翰(John, 1987, p.10)将学习过程分为“浅层”“深层”“目标达成”三阶段;阿达尔等(Adar, Debra, Rena, & Christian, 2018)认为学习投入是由行为投入、情感投入和认知投入三维结构组成,并且它们之间存在相互关系。李爽等(2018)基于学习管理系统采用多层回归方法对学习投入的三个维度进行测量;武法提等(2018)围绕学习行为投入发生机制和本质特征展开探索,构建学习行为投入理论模型;王洪江等(2017)基于在线学习活动实时分析学习过程,发现参与、交互等行为是影响学习行为投入的主要因素。
综上所述,现有研究多集中在学习行为投入的研究,鲜有对情感与认知投入的深入分析。认知投入作为学习投入的基本构成维度,反映学习主体在学习活动中的高阶投入。布鲁纳的认知发现学习理论认为学习是主动形成认知结构(知识经验系统)的过程,其内在认知复杂抽象,难以表征。故以往采用问卷数据进行认知投入量化的方法无法满足对多维多特征认知投入影响因素的量化研究。当前,以数据挖掘、机器学习为代表的分析方法逐步成为学习量化分析的新潮流,支持向量机(Support Vector Machine,SVM)作为一种机器学习算法,因其具备处理复杂教育数据的能力而令人瞩目,因此本研究以“认知”为着眼点采用基于SVM的机器学习方法对认知投入进行量化分析。
基于以上所述,本文聚焦学习主体的认知投入数据获取,基于社会认知理论构建了面向学习云空间的认知投入模型,并设计了以“数据采集-数据处理-量化实现-量化应用”为主线的认知投入量化框架,以期对认知投入的量化提出一种切实可行的技术方法。
二、面向学习云空间的认知投入模型构建
学习投入是学习主体学习过程的重要观测指标之一,也是学业成就的预测指标之一。其中认知投入作为学习投入中的深层次学习阶段,一直是教育学、认知心理学等领域的热点研究问题。因此,本文基于认知学习理论和社会认知理论,通过对教育场景下认知投入指标与因素的分析,首先阐述了认知投入的相关理论,进而提出了符合学习云空间交互特性的认知投入构成要素,最后构建了面向学习云空间的认知投入模型。
(一)认知投入模型构建依据
已有国内外学者对认知投入的相关理论进行了探索。弗雷德里克斯等(Fredricks, Blumenfeld, & Paris, 2004)的课堂学习投入量表将认知投入定义为深层认知策略的应用以及对学习的有效自我监控与调节两类。基于上述结论,斯米特等强调(Smit, Cornelis, Monique, & Rob, 2017),更多使用深层认知策略的学习主体比更多使用浅层认知策略的学习主体,在学习上付出更多的心理努力,并具有更好的理解水平。其中,深层认知策略主要关注的是知识间的联系和探寻学习内容的意义等,而浅层认知策略主要关注的是表面看起来非常重要的标题和要素,并对此进行机械记忆。李等人认为(Lee, Pate, & Cozart, 2015)认知投入的表现是学习主体在甄选、评价相关信息和资源时所付出的心智努力程度,在学习活动中针对认知目标应用学习策略,并主动将新知识迁移运用到不同的情境中,关注知识间的联系,探寻学习内容的意义。基于弗雷德里克斯的实验结果,国内学者(李爽, 等, 2015)编制的远程学习投入量表结合自我监控与元认知策略,将认知投入划分为认知策略、元认知策略、情感管理策略和资源管理策略四类。在其后续的研究(李爽, 等, 2016)中,认为学习挑战是认知投入的重要指标,是对知识的深度加工与创新应用。张艳梅等人(2014)基于开发的移动环境,从自主调节学习、自主学习、知识建构和生成式学习四个方面分析评测学习主体的认知投入。
还有其他一些研究文献与评测工具也为认知投入提供了分析维度。孙之元等(Sun & Rueda, 2012)的远程学习投入评价量表(Student engagement in distance education, SEDE)提出认知投入主要指完成学习任务时对学习资源的搜索、管理和学习策略的应用;迪克森(Dixson, 2010)编制的在线学习投入量表(the Online Student Engagement Scale, OSES)提出了自我管理、主动将课程内容与生活实践相关联以及将课程内容应用到实际生活这三个认知投入维度。
由于网络学习比传统面对面学习存在更大的挑战,需要学习者付出更多的心智努力才足以获得良好的学习绩效,大量文献指出认知投入与学习策略和自我监控有关(孔企平, 2002; Fredricks, Blumenfeld, & Paris, 2004; 张娜, 2012),也有研究指出(Shea, Hayes, & Smith, 2012)要着重从学生如何对自身认知进行调控的角度出发深入考虑认知投入,即元认知投入的视角。艾克和加里森(Akyol & Garrison, 2011)认为,元认知投入主要包括认知管理(主动执行学习和控制学习环境)和认知监控(学习者反思自己和对学习过程做出的改变)。因此,本研究将学习策略应用和学习自我监控作为认知投入的依据,从元认知投入的角度出发将学习自我监控细化为管理与监控两个方面,选取自我管理和自我监控与调节来表征认知投入。其中,自我管理和自我监控与调节的侧重点不同,自我管理特指学习者在主动学习意愿的前提下对学习条件与环境进行管理,而自我监控与调节则是学习者发挥主观能动性,通过改变学习过程中的内在行为以及自我反思进行调整。考虑到学习是不断追求对知识的应用与创造,作为最具影响力的学习投入测量工具,即全美学生投入调查 ( the National Survey of Student Engagement, NSSE)将学习挑战作为认知投入的重要内容,本文也将学习挑战作为认知投入的重要构成要素:学习挑战是学习者在认知形态上对更高学习成就的渴望与追求,有助于学习者高阶能力的发展。结合上述表述,本文认为认知投入是人类认知过程中的深层次心智努力活动,是学习主体在学习中所采用认知策略的具体应用,包含自我管理、自我监控与调节、学习挑战三个方面,是从被动学习到主动学习的自我知识构建过程。其中,认知策略的应用包括精加工策略、组织策略等,精加工策略是指把新旧知识联系起来从而增加新知识的意义,组织策略是将提炼出来的知识点加以构造,形成知识结构的更高水平的知识,这与本文的认知投入构成要素不谋而合。
(二)认知投入构成要素分析
布鲁纳的认知学习理论认为学习是学习主体以其原有的认知结构为基础,对外界事物进行感知、分析、归纳和总结的主动认知过程,是通过把新旧知识进行整合而逐渐构建新的认知体系的过程(毛志新, 2016)。结合此观点,鉴于认知投入的心智努力特性不可直接获取,本论文拟借助学习主体的管理和调控过程作为研究认知的直接媒介,并以认知体系蕴含学习挑战为基础建构新的认知投入研究视角,这与认知学习理论不谋而合。
网络学习云空间是学习者借助学习投入完成自我知识建构的理想场所,是新视角下认知投入研究的典型环境代表。网络学习以丰富的资源供给、便捷化和跨时空的交互支持成为当前重要的学习形态之一。在这一形态中基于网络的交互可以有效地促进学习主体掌握学习内容、实现学习挑战。同时,互联互通下的自我管理和过程调控将有利于保障交互目标的达到和认知成效的获取。云空间是云平台支持下物理空间的虚拟化延伸,因此基于云空间的网络学习——网络学习云空间,能够最大化地实现资源共享和可自定制的空间环境配置,这将极大地增强学习主体在学习过程中的交互体验,更有利于学习主体展开认知投入。
因此,以布鲁纳的认知学习理论为指导,结合认知投入模型构建的理论基础,依据学习云空间的特点和优势,本研究将认知投入解析为图1所示要素体系。
1. 自我管理
学习云空间是以学习主体为中心的典型教育应用场景,它将明确学习主体管理学习的责任,支持学习主体主动应用认知策略进行学习过程管理。在云空间中,主要表现为自主学习与对学习资源、学习时间和学习工具的管理。其中,自主学习指学习主体在认知层面上所体现出的主动学习意愿,是学习主体对云空间资源、时间和工具有效利用的前提之一。学习云空间赋予学习主体更多的自主学习管理权,可满足学习主体对学习时间、学习资源(课程、教学内容)和学习工具(评估、协作、记录等工具)的基本管理需求。对云空间中的学习资源、时间和工具的管理反映了学习主体在学习过程中有意识地进行组织与协调,以期达到高效利用资源、时间和工具的目标。
自我管理作为认知投入的基本构成要素之一,体现了学习主体在主动参与、探究新知和解决问题过程中的自我责任感与自我管理意识,是学习主体在泛在化网络中进行知识构建、个性化学习与社会化参与必不可少的认知技能。
2. 自我监控与调节
自我监控与调节是指学习主体在认知驱动下,针对认知目标对所发生的学习活动进行自我控制、修正和调整的过程。在云空间中,自我监控与调节涵盖了明确学习目标、制定学习计划、改进学习方法、定期自我评价和自我反思五个方面。
明确学习目标是学习主体为调节个体认知差异而清晰化学习目标的过程,是云空间中学习主体自我监控与调节学习活动的指挥棒。学习计划是学习主体实施学习活动的蓝图,制定弹性可行的学习计划有助于学习主体量力而行地安排学习时间和内容,是实现学习目标必不可少的方式之一。学习方法是达成学习目标的手段,在学习过程中基于对目标的监控和调节,学习主体需要对自己的学习方法进行适应和改进,以最优的学习方法提升学习效率。定期自我评价是学习主体有规律地对学习任务等做出的自我判断,促进学习主体积极参与学习过程。自我反思是学习主体深度学习的表现,是自我意识高度发展的结果。通过对自身学习、思维等认知活动的反思,学习主体可以创建丰富的认知情境来发展其认知活动,从而提升认知的理解水平。
自我监控与调节是认知投入的重要构成要素,反映了学习主体有计划地设置学习目标、调整学习计划、评价学习任务和反思学习的全过程,是促进学习主体向高水平认知迈进的关键。
3. 学习挑战
作為高层次的认知投入要素的构成部分,学习挑战是指学习主体在知识应用与创新,或在超越学习要求等更高的认知挑战中的投入,具体表现为学习策略应用、知识深度加工和知识体系建构三个方面。
学习策略应用指学习主体在具体学习过程中有意识地使用系统方法加工与处理信息,是学习者知识内化的前提之一。知识深度加工呈现了将新知识与先前知识深度组织、重构及整合的过程,有助于学习主体对知识的深度理解及迁移应用。知识体系建构是将纷繁复杂、孤立分散的知识点按其内在规律整合的过程,反映了学习主体将知识进行完整体系化的深层次认知过程。
学习挑战是认知投入的关键构成要素,体现了学习主体在认知形态上对更高学习成就的渴望与追求,是学习主体在学习过程中获取更高学习成果至关重要的认知技能。
(三)学习云空间中认知投入模型的构建
班杜拉的社会认知理论指出,学习主体围绕不同的学习环境开展不同的投入行为,而投入行为又会影响学习主体的发展(赵呈领, 等, 2016)。可见,学习环境既是主体投入行为的载体,也是影响主体行为投入的潜在因素。作为一种资源高度共享的虚拟化环境,网络学习云空间具备便捷可定制的空间支持,极大地拓展了物理学习空间的情境支持,赋能学习主体采用认知策略实施高效的行为投入。在此情境下,认知投入要素所蕴含的认知投入行为成为学习主体与认知目标的中介,它与学习环境密不可分。
根据以上分析,鉴于认知目标是教学活动的出发点,也是学习活动的归宿,本研究加入认知目标,与学习主体、学习环境和投入行为共同构建了基于学习云空间的认知投入模型(如图2所示),下文将从模型的内部认知投入过程和外层动态循环过程展开阐释。
该模型内部以学习主体在学习空间环境下的投入行为来实现认知目标为主线,反映学习主体认知投入的过程。学习主体作为学习活动中投入行为的发起者和控制者,通过投入积极、有效的行为促进认知目标的达成。模型内部核心因素包括投入行为与承载行为的学习环境。投入行为表现为人机交互、主体内省和人际交互。人机交互指学习主体在开展学习活动中人与计算机之间的信息交换的行为。人际交互是以人为媒介进行的交流行为。主体内省即学习主体的心理活动,囊括自我管理、自我监控调节以及学习挑战的认知投入行为,是本文后续量化认知投入的重点研究内容。其中,自我管理与监控调节可以保障学习活动的协调,学习挑战能够促进学习目标的实现,由此形成积极稳定的投入状态。学习环境是开展投入行为的场所,由物理环境、社会环境和心理环境组成。物理环境给予学习主体进行人机交互行为的支撑,涉及网络条件、课程资源、教学内容等;社会环境是学习主体进行人际交互行为的重要依托,涵盖人际关系、家庭背景等信息;心理环境是学习主体进行主体内省时所涉足的心理关联性情境,是学习投入活动不可或缺的支持性环境事实。
模型外层包含学习主体、投入量化、认知目标和效果测评的动态循环过程。在整个过程中,通过对比投入量化结果与认知目标之间的差距,对学习主体的认知投入进行效果评测,然后将效果评测结果反馈给学习主体,进而帮助学习主体调整认知投入要素所蕴含的认知投入行为,以期达成认知目标。其中,投入量化是采取量化手段将复杂的认知投入行为以清晰明确的方式表示(将在本文后续内容中详细阐述)。模型中,动态循环可以决定以目标为导向的主体做出的投入行为,并强调了自我管理、自我监控调节和学习挑战的作用。
三、学习云空间中认知投入量化实现
认知投入是学习主体深层次学习的有效表征之一,涉及学习全过程的方方面面,如何获取并量化多维多层次的认知投入要素成为接下来研究的重点之一。然而,现有的研究多集中于传统教育场景下以量表、问卷为主的方式量化认知投入,指标体系缺少从学习过程视角进行认知投入的描述,难以真正表征学习认知投入的水平。正因为如此,近年来快速发展的教育大数据、机器学习和云计算等新型技术一改传统的量化方式,成为助推学习认知投入量化研究发展的重要力量。鉴于此,本文首先结合已有成果建立认知投入程度指标,接着针对学习云空间的平台特点,基于机器学习方法设计了认知投入的量化框架,然后对云空间中的数据进行采集与处理,最后进行认知投入量化的实现。
(一)认知投入程度指标分析
认知投入是学习主体对知识进行加工的心智活动,其涉及的过程不可见,由此许多研究利用在线环境的行为数据来推断认知投入(Brinton et al., 2015; Kaser, Hallinen, & Schwartz, 2017),以实现通过创建行为集的方式来测量认知投入的目的。行为数据来源于行为,行为作为学习过程开展的载体,必须在一定的时间范围内借助实体空间付诸实施,因此本文将投入内容、投入依托的时间与空间作为认知投入程度指标分析的起点。鉴于时间是投入行为的必要关联因素,本文直接将时间作为认知投入的重要分析依据和表征指标。考虑到认知投入内容本身的隐蔽特性及其与所依托空间的深度融合特性,本文将两者泛指认知投入过程以及过程中所遵照、依托和创设的氛围。其中,学习目标与任务、学习对象与内容、物理环境与社会关联、学习过程与效果等都是两者交织融合的重要内容。就投入程度而言,前述重要内容显然包括深度与广度两个方面,因此认知投入还需借助深度与关联度两个指标进行表征。深度与关联度的视角不同,深度特指认知涉足内容层次的高低,关联度反映所学知识与情境的融合水平,侧重应用。综上所述,本研究选取时间、深度和关联度三个程度指标来表征认知投入要素。
时间主要是指与学习主体认知投入有关的频率、时间等能够直接从日志文件中获取的数据信息,包括次数、间隔、持续时长、及时性和规律性等信息。其中,次数是对认知投入行为频次的统计描述;间隔是相邻认知投入行为产生的时间距离;持续时长是指认知投入行为延续的时间长度;及时性表示学习主体对发布的学习任务与完成学习任务的时间差;规律性则是对及时性是否存在规律的探索。
深度作为认知投入程度分析的指标之一,是强调认知投入累积性的层次概念。依据布鲁姆的认知教育目标分类理论,本研究将学习主体的认知过程从低级到高级分为六个层次,即识记、理解、应用、分析、綜合和评价。识记指认识并记忆;理解指对知识的初步领会;应用指对所学的概念、法则和原理的运用;分析指详细阐释知识概念间的相互关系;综合指整合知识以便创造性地解决问题;评价指理性对知识价值做出判断的过程。
联通主义作为随网络发展起来的学习理论产物,该理论认为学习即连接的建立和网络的形成,着重强调建立学习主体外部知识与内部认知之间的关联,以此形成知识网络结构,促进自身认知水平的提高(王志军, 等, 2015)。一些研究(张思, 等, 2017; 梁云真, 等, 2016)将交互内容与学习主题的关联性作为衡量学习投入的重要指标,还有研究(王志军, 等, 2015)指出学习主体的认知参与包括建立概念和意义之间深度关联,最高层次的认知参与是知识创造。基于此,关联度也成为描述认知投入量化的重要指标,本研究选取了经验、情景、主题、创新和逻辑五个维度。其中,经验指学习主体从亲身活动及经历中获得的学习;情景指将新知识学以致用的情况;主题是找出新观点与学习主题之间的关系;创新是发现新想法中的潜在可能与创造知识之间的关系;逻辑则是检验新思想是否合理的对话过程。
(二)认知投入量化框架设计
基于上述学习云空间的认知投入模型,为实现面向学习云空间的认知投入的量化研究,本研究设计了如图3所示的认知投入量化框架,该框架从数据采集、数据处理、量化实现和量化应用四个模块阐释了认知投入量化的整个闭合循环过程,为后续量化应用的实施提供有力的支撑。
1. 数据采集模块
学习云空间因其丰富的共享资源和便捷的交互特性,记录并存储了关于学习主体投入行为的海量数据,主要分为三类:一是学习主体在学习过程中产生的日志数据;二是学习云空间环境中的动态数据,包含交互文本和学习成果(测试、作业及作品);三是问卷数据。采集并分析这些数据有助于了解学习主体隐藏的投入行为。因此,采集数据成为认知投入量化分析的基础,为后续研究提供数据支持。
2. 数据处理模块
学习云空间环境下采集的数据具有结构多样性。为了使各种形式的数据成为机器学习可读的数据形式,需对数据进行数据处理,其方法包括描述统計、文本分析和关联分析。数据处理是认知投入量化分析的前提,对于认知量化分析结果的准确性有着决定性作用,直接影响认知投入量化的可信度。
3. 量化实现模块
认知投入量化的实现是本文研究的重点,由上述指标分析结果可知,认知投入量化分析的影响要素具有多维性和复杂性。鉴于SVM具有快速且准确地处理多维多特征教育数据的能力,本研究采用以SVM为代表的机器学习算法为量化模型。首先,将采集的数据集分为训练集和测试集两部分,并对训练集进行聚类操作,得到学习主体认知投入分类结果;然后,根据分类结果,设计机器学习算法,再将训练集“喂”入机器学习模型中训练量化模型;最后,将测试集输入到量化模型中以测试模型的认知投入量化能力。
4.量化应用模块
服务于教与学是投入量化的最终目标,也是投入量化研究中进行反馈完善的重要阶段。由于量化应用与量化结果的层次有极大的关联性,本研究针对量化结果的三个层次(浅层、目标达成与深层)差异性地展开量化应用实践工作。在浅层和目标达成阶段,综合考虑认知投入的构成要素,我们在云空间中既对学习主体的学习过程进行干预,干预方式包括提醒警示和鼓励等,又利用认知投入的量化结果预测学习主体的学习情况,包括学业成绩预测和学情预测等。总之,认知投入量化的核心应用体现在利用认知投入量化结果来干预学习过程、预测学习情况、推荐学习资源、调整学习内容和优化学习环境等,以促进认知目标的达成和学习绩效的提升,为学习云空间下进行的学习干预和学习预测等提供一定的依据和实践参考,具体的应用在后续研究中予以呈现,限于篇幅不再赘述。
(三)数据采集与处理
基于云计算服务,“云+端”的学习云空间环境使外显的学习行为能够以海量数据的形式记录并保存。而在线学习过程中,学习主体复杂的认知投入主要通过外显的行为方式反映出来。为了更好地量化认知投入,本研究设计了数据采集处理流程图,主要包含数据采集与数据处理两部分,如图4所示。
在数据采集方面,为保障数据能够提供完整的认知投入信息,本研究用三种方式采集数据:一是从Web服务器所产生的日志文件中获取日志数据;二是从学习云空间平台的环境中捕获学习主体的动态数据,包括交互文本数据和学习成果数据;三是运用问卷工具收集学习主体的认知投入信息。
在数据处理方面,根据认知投入数据来源的不同,考虑到机器学习算法读取数据的格式要求,本研究综合多种途径对学习主体的认知投入数据进行处理。处理途径包括:利用描述性统计方法对结构化数据进行整理,从时间维度表征认知投入;通过文本分析法对非结构化数据进行处理分析,筛选出深度指标和关联度指标的数据,并从深度维度表征认知投入;通过灰色关联分析计算关联系数与关联度,从关联维度表征数据。其中,文本分析指的是对学习主体的动态数据进行处理。首先,通过对每个学习主体的动态文本进行细读归并;接着,利用NLPIR工具对文本进行分词标注、词频统计和关键词提取等操作;然后,借鉴布鲁姆教育目标分类体系和可选动词表来判断认知投入的深度层级;最后,进行人工梳理和判断学习主体达到的认知投入关联程度,并对学习主体的认知投入数据加注标签。以上对数据的采集与处理步骤为后续认知投入量化的实现提供了精准的数据支持。
(四)学习云空间中认知投入量化实现
当前,以学习主体的认知需求为核心,通过全面记录与追踪学习主体的学习动态,利用过程性的认知数据与分析算法对难以直接观察的内在认知过程进行量化研究是亟待解决的教育问题之一。因此,基于上述的认知数据处理及认知投入量化指标分析等前期工作,设计了如下面向学习云空间的认知投入量化过程,为目前量化内在认知过程提供一种新的研究思路。
1. 量化实现的环境说明
班杜拉的社会认知理论强调环境、学习主体和行为三者之间是相互动态影响的。行为是内隐认知的外在表现。同样,学习主体在学习云空间的认知过程将受到多个复杂的外在变量影响。因此,为保障对认知投入量化的精确性与可靠性,需减少无关变量或特殊情况,本文将围绕上述投入量化框架,对学习云空间的环境提出以下说明:
说明一:学习以课程为主体,课程整体存在周期,且过程数据与历史数据可查可用。
说明二:为了保证认知投入量化的连续性,目前本研究假定整个学习过程中不存在或极少存在辍学现象,而对辍学现象的研究将在未来工作中展开。
说明三:假设每个描述学习主体认知投入的数据至少包含一种认知投入构成要素(自主学习、自我反思、学习策略应用等共12个),确保每个学习主体的数据都能被应用于量化,不存在认知投入的学习主体本次研究将不予考虑。
2. 认知投入程度指标量化
对于认知投入的程度量化,本文基于以上研究结果将从时间效度、深度和关联度三个程度指标提出认知投入量化的计算公式。
根据上文中认知投入时间程度指标分析所得,可依次基于次数、间隔、持续时长、及时性、规律性五个维度构建一个五元组表征时间效度,即[T=[Tf,Tg,Ta,Tp,Tr]]。将学习主体在学习云空间的行为发生次数、活动开始时间、活动结束时间、学习任务发布时间、学习任务完成时间等服务器日志数据依次表示为tf,ts,to,tm,tc。次数Tf是指学习主体行为发生的次数,即tf。
针对认知投入量化中的深度程度指标,可依次按照识记、理解、应用、分析、综合和评价六个维度构建六元组表征深度,即[D=[D1,D2,D3,D4,D5,D6]]。对学习主体在学习云空间的交互文本进行关键词提取,实现对深度程度指标的定位,六元组[D]满足One-Hot编码,即表示在深度的6个指标中只有一个指标的值为1,其余全为0。例如:学习主体A能够“理解”学习内容,那么,学习主体A的深度可表示为:[DA=[0,1,0,0,0,0]]。
为表征关联程度指标可构建一个五元组,即[R=[R1,R2,R3,R4,R5]],R1、R2、R3、R4和R5分别表示经验、情景、主题、创新和逻辑。本文以自我反思為例,通过灰色关联分析计算认知投入构成要素与关联程度指标(经验、情景、主题、创新和逻辑)的相关关系,具体说明如图5所示。其中,自我反思的k个数据组成参考数列,关联程度指标的k个数据组成比较数列,首先计算参考数列[x0]的第k个元素与比较数列[xi]的第k个元素之间的关联系数[ξi(k)],见公式6。
基于上述对认知投入程度指标的量化,提出学习云空间中学习主体自我反思的认知投入程度量化表达式,见公式(8)。其余构成要素的程度指标量化与自我反思类似,因篇幅有限,故不在此赘述。
3. 认知投入量化实现
(1)SVM模型选择
支持向量机(SVM)是当前使用较多、效果最好的一种分类算法,能有效地从大规模、非线性、高纬度的数据集中学习到一个较精确的分类模型,因本文的认知投入量化数据集具有非线性、高维等特征,故依据Mercer定理(文孟飞, 等, 2016)为SVM选择适当的核函数,将复杂非线性特征空间映射到一个简单的高维空间,以降低SVM分类器的复杂度。SVM常用的核函数包括线性核函数、多项式核函数和高斯核函数,鉴于本文的训练数据集特征较复杂,甚至多于样本本身的数量,因此选取线性核函数作为SVM的核函数。当SVM处理多分类问题时,需要构造合适的多类分类机。其中,一类对一类法中的每个分类机只涉及两类训练样本,训练时间大幅度缩减,在针对类别较少的分类问题时整体性能优越(付旻, 等, 2018)。因此,本文采用一类对一类法进行认知投入量化,完成对SVM模型的选择。
(2)基于K-Means的认知投入聚类分析
本研究的最终目的是利用SVM模型对认知投入进行量化分类,而SVM属于机器学习中的有监督学习方法范畴,故输入至SVM模型的训练数据需要提供明确可靠的分类标签。因此,通过上述对认知投入数据的采集与归一化处理等操作,采用K-Means算法对学习主体认知投入数据进行聚类分析,通过肘部法则求解得到最佳分类数k为3。鉴于上述K-Means的聚类分析结果,可将学习主体的认知投入分为三类,这也正与教育实证研究下的认知层析分类体系不谋而合。因此,本研究将学习主体的认知投入以正态分布划分为“浅层”“深层”“目标达成”三个等级,占比分别为15.85%、68.3%、15.85%。
(3)基于SVM的认知投入量化算法设计
对训练数据的标签分类后,利用基于多分类支持向量机(multi-class SVM)的机器学习算法实现对认知投入的量化。具体思想如下:首先收集学习云空间中日志、动态数据以及问卷数据,进行数据处理得到认知投入样本数据,将样本数据分为训练集和测试集两部分,初始化数据得到认知投入数据矩阵向量;然后将训练集输入SVM模型,利用网格搜索(Gridsearch)训练得到最优的SVM量化模型(付旻, 等, 2018);最后将测试集输入训练好的模型,得到认知投入分类结果,即认知投入量化结果。图6是基于SVM的认知投入量化算法设计。
[算法1:基于SVM的认知投入量化算法
输入:学习主体认知投入样本数据集C
输出:学习主体认知投入量化结果Begin
1. 将样本数据C进行处理,将数据集分为训练集Ctrain和测试集Ctest;
2. 初始化数据,获得学习主体认知投入训练数据矩阵向量集合Ctr={Ctr1,Ctr2,…},学习主体认知投入测试数据矩阵向量集合Cte={Cte1,Cte2,…};
3. Gridsearch初始化SVM模型Msvm及其对应的参数Psvm;
4. 定义评分方法precision;
5. 将Ctr输入Msvm中,利用Gridsearch训练Msvm;
6. 基于最佳分数precision选出最佳的参数组合Pfinal,得到最优模型Mfinal;
7. 将Cte输入到Mfinal中,测试Mfinal的效果;
8. 基于模型的量化结果得到的认知投入类别标签,如深层、浅层等。
综合以上步骤,即可实现面向学习云空间的认知投入量化,最终可从SVM量化模型获得认知投入量化结果,即“浅层”“目标达成”“深层”三类认知投入。
四、量化实验验证与量化效果分析
(一)认知投入数据获取
本文所使用的数据来源于团队前期搭建的iStudy学习平台(世界大学城的空间化学习系统实验版),通过同类型的课程学习,以其中80名学习主体作为研究对象,进行为期6周的学习进程跟踪并采集相关数据,通过处理无效和缺省数据最终得到15,440条认知投入基础数据,以此数据为基础建立模型并进行模型的效果验证。
(二)量化验证及其分析
1. 实验一:不同机器学习模型下的量化准确率对比
为验证SVM量化模型的效果,分别选取逻辑回归、随机森林和k近邻算法进行实验对比分析,通过交叉验证方法得到各模型的量化准确率,如图7所示。从图7可以看出,支持向量机的平均准确率达到80%以上,而逻辑回归、随机森林和k近邻的平均准确率只有65%,并且在交叉验证的15组数据中支持向量机的结果相对稳定,有13组数据的准确率高于80%,而其他模型的准确率结果不稳定,尤其k近邻模型的最低准确率只有20%。因此,通过对比不同机器学习模型的量化准确率能够发现SVM模型具备较好的量化效果。
2. 实验二:SVM模型中基于不同核函数量化效果的对比分析
本文选取常用的线性核、高斯核及多项式核函数来解决SVM分类时维度过高、计算能力不足的问题。其中,线性核主要用于线性可分的情形,具备参数少、速度快等特征,对于一般数据分类效果较理想;高斯核主要用于线性不可分的情形,具备参数多、过程比较耗时等特征;多项式核函数也可解决非线性问题,优点是参数极少、运行速度快。通过各核函数分别计算量化准确率与运行时间来表示SVM的量化效果,具体情况见表1。结果显示:线性核函数的准确率较高,达到85%,但运行时间要比多项式核函数稍长一些。因此,通过对比不同核函数的量化准确率和运行时间,能够发现线性核函数在不耗时的同时具备较好的量化效果。
3. 实验三:不同规模训练集对量化准确率的影响程度
SVM模型量化准确率同时也受到训练集与测试集比例的影响,本文分别选取60%、65%、70%、75%、80%、85%、90%、95%的数据集作为训练集训练量化模型。结果如图8所示。随着训练集的增加,量化的准确率也在逐步提升,当训练集数据量在70%~85%之间时,准确率可达80%以上;当训练集数量达到75%时,获得最好的量化效果,准确率约为85%。因此,本文选取75%的数据做训练集,25%的数据作测试集,完成对SVM量化模型的调整。
五、研究结论与展望
随着“教育信息化2.0行动计划”的开展,在线教育发展迎来了春天,然而不论何种在线学习平台都存在着“学习投入不足”的问题。因此,在当前的在线学习研究中解决学习主体学习投入不足的问题迫在眉睫。着眼于学习过程中的认知投入问题,本文针对学习云空间的学习投入现状,利用机器学习的方法完成了认知投入的量化。首先,通过文献法探讨了认知投入的内涵及相关理论,提出了基于社会认知理论的认知投入模型。然后,设计了认知投入量化框架,利用支持向量机对认知投入进行分类操作,实现对认知投入的量化。最后,本研究设计了一系列的实验,分别从不同的机器学习模型、核函数以及训练集规模三方面验证量化模型的有效性。
但本研究仍存在以下两个主要局限:没有将基于认知过程数据的投入量化模型推广到量化应用中;学习主体的学习投入状态不仅仅体现在认知层面,也包含行为投入和情感投入两方面。
因此,今后的研究将从以下两个方面展开:扩大研究的样本,对量化算法不断修正,实现干预学习过程、预测学习情况、推荐学习资源等的应用效果分析;融合行为与情感投入进行更深入的量化研究,将發生在学习全过程的投入情况及时反馈给学习主体,促进学习主体的个性化发展。
[参考文献]
付旻,王炜,王昊,等. 2018. 多分类支持向量机在公交换乘识别中的应用[J]. 哈尔滨工业大学学报(3):26-32.
韩中美,王希哲,黄昌勤,等. 2017. 学习云空间中学习路径的情境语义标识及应用[J]. 现代教育技术(11):120-126.
黄昌勤,王希哲,张冬冬,等. 2015. 学习云空间支持下的研究性学习研究与实践[J]. 中国电化教育(8):21-28.
孔企平. 2000. “学生投入”的概念内涵与结构[J]. 外国教育资料(2):72-76.
李爽,李荣芹,喻忱. 2018. 基于LMS数据的远程学习者学习投入评测模型[J]. 开放教育研究(20):91-102.
李爽,王增贤,喻忱,等. 2016. 在线学习行为投入分析框架与测量指标研究——基于LMS数据的学习分析[J]. 开放教育研究(2):77-88.
李爽,喻忱. 2015. 远程学生学习投入评价量表编制与应用[J]. 开放教育研究(12):62-70.
梁云真,赵呈领,阮玉娇,等. 2016. 网络学习空间中交互行为的实证研究——基于社会网络分析的视角[J]. 中国电化教育(7):22-28.
毛志新. 2016. 布鲁纳认知—发现学习理论对成人教育学科建设的启示[J]. 中国成人教育(20):4-6.
王洪江,穆肃,黄洁,等. 2017. 自主学习投入度实时分析方法及应用研究[J]. 电化教育研究(10):44-50.
王志军,陈丽. 2015. 联通主义学习的教学交互理论模型建构研究[J]. 开放教育研究(5):25-34.
文孟飞,胡超,于文涛. 2016. 一种基于特征提取的教育视频资源推送方法[J]. 现代远程教育研究(3):104-112.
武法提,张琪. 2018. 学习行为投入:定义、分析框架与理论模型[J]. 中国电化教育(1):35-41.
张娜. 2012. 国内外学习投入及其学校影响因素研究综述[J]. 心理研究,5(2):83-92.
张思,刘清堂,雷诗捷,等. 2017. 网络学习空间中学习者学习投入的研究——网络学习行为的大数据分析[J]. 中国电化教育(4):24-30,40.
张艳梅,章宁,涂艳,等. 2014. 移动环境下学习者在线参与度研究[J]. 现代教育技术(11):88-96.
章宜华. 2001. 西方词典释义类型和释义结构研究[J]. 辞书研究(1):39-50.
赵呈领,梁云真,刘丽丽,等. 2016. 基于社会认知理论的网络学习空间知识共享行为研究[J]. 电化教育研究(10):14-21,41.
Adar, B. E. , Debra, M. ,& Rena, D. , et al. (2018). Investigating the multidimensionality of engagement: Affective, behavioral, and cognitive engagement across science activities and contexts. Contemporary Educational Psychology, 53(1):87-105.
Akyol, Z. , & Garrison, D. R. ( 2011). Assessing metacognitionin an online community of inquiry[J]. Internet and Higher Education, 14(3):183-190.
Brinton, C. G., Buccapatnam, S., & Chiang, M., et al. (2015). Mining MOOC clickstreams: On the relationship between learner video-watching behavior and performance. Retrieved from http://arxiv.org/pdf/1503.06489.pdf
Chen, I. S. (2017). Computer self-efficacy, learning performance, and the mediating role of learning engagement. Computers in Human Behavior, 72(2):362–370.
Dixson, M. D. (2010). Creating effective student engagement in online courses: What do students find engaging. Journal of the Scholarship of Teaching and Learning, 10(2):1-13.
Fredricks, J. A. , Blumenfeld, P. C. , & Paris, A. H. (2004). School Engagement: Potential of the Concept, State of the Evidence. Review of Educational Research, 74(1):59-109.
John, B. (1987). Student approaches to learning and studying. Study process questionnaire manual:study process questionnaire manual: catalogue no 500fk. Australian Council Educational Research. (p: 10).
Johnson, M. L. , Sinatra, G. M. (2013). Use of task - value instructional inductions for facilitating engagement and conceptual change. Contemporary Educational Psychology, 38(1):51-63.
Kaser, T., Hallinen, N. R., & Schwartz, D. L. (2017). Modeling exploration strategies to predict student performance within a learning environment and beyond. Proceedings of the seventh international learning analytics & knowledge conference (pp. 31–40). ACM.
Lee, E. , Pate, J. A. , & Cozart. D. (2015). Autonomy support for online students. Techtrends, 59(4):54-61.
Shea, P. , Hayes, S. ,Smith, S. U. , et al.(2012). Learning presence: Additional research on a new conceptual element within the community of inquiry (CoI) framework[J]. Internet and Higher Education, 15(2): 89-95.
Smit, K. , Brabander, C. J. D. , & Boekaerts, M., et al. (2017). The self-regulation of motivation: Motivational strategies as mediator between motivational beliefs and engagement for learning. International Journal of Educational Research, 82(1):124-134.
作者簡介:张晓峰,硕士研究生;吴刚,硕士研究生。华南师范大学教育信息技术学院(510631)。
李明喜,博士研究生,华南师范大学外国语言文化学院(510631)。
俞建慧,博士研究生,浙江师范大学教师教育学院(321004)。
责任编辑 郝 丹