学习者认知负荷差异化测量量表开发与验证
2022-06-30彭绍东
○高 洁 彭绍东
一、引言
现代信息技术的快速发展使在线教育孕育出巨大潜力,助力在线学习者随时随地获得学习资源。但是,由于在线教育缺乏情境线索,教师和教学设计者很难监控学习者在学习过程中的认知状态[1]。随着在线教育的低参与度问题越来越突出,急需找寻能够反映学习者认知变化的数据。认知负荷理论作为教育研究中最强大、最具影响力的研究理论之一,被广泛用于测量学习者的认知活动状态或解释实验研究[2]。但在已有研究中,大多数使用Paas主观评定量表来测量学习者的投入状态和心理努力[3]。还有研究使用客观技术,如双任务测量[4]或生理参数测量方法[5]。这些测量方式虽有一定的优点,但不足之处在于均只能测量学习者总的认知负荷水平,无法对认知负荷的三种不同类型进行差异化测量。在线学习中区分不同类型的认知负荷有助于了解学习者不同方面的认知状态[6],调整认知资源的投入比例,从而深入了解学习过程,促进学习绩效的显著提升。
二、认知负荷理论
(一)基本观点
认知负荷理论起源于认知心理学,最早开展认知负荷相关研究的是美国心理学家Miller(1956)。随后,大量研究者对认知负荷的含义、结构和测量方法进行了研究。认知负荷理论的第一个主要假设是,每个学习者的认知资源都是有限的,也就是处理信息时的工作记忆容量是有限的(7±2个组块),一旦某个学习活动所需要的总认知资源超过了学习者的认知资源限度,就会发生资源分配不足的状况[7]。认知负荷理论的第二个假设是,学习者的长期记忆是无限的,任何学习者都有能力将以前所学的大量知识进行归类,形成一个全面的体系。并且根据图式理论,知识以图式的形式组织和保留在学习者的长期记忆中[8]。一直以来,认知负荷被划分为三种独立类型的记忆负荷,即内在认知负荷、外在认知负荷和相关认知负荷[9]。
内在认知负荷由学习任务的内在复杂性引起,取决于学习任务中元素的交互性和学习者的先验知识[10]。学习任务中元素的交互性是指学习者在处理任务时在其工作记忆中必须同时处理的元素数量。因此,若元素交互性较低,意味着学习者可以按顺序处理元素;元素交互性较高,意味着必须同时处理。学习者的先验知识起着基础作用,因为新知识可以与学习者已有的图式产生联系。根据以上两个因素,本研究认为,若能够具体测量出在线学习中学习者的内在认知负荷量,将有助于重新设计教学任务,帮助学习者更好进行学习。两种减少内在认知负荷的方法如下。
1.分段原则:通过逐步呈现教学内容的方式减少元素交互性,帮助先验知识不足的学习者接受学习内容。在分段作用下,学习者每学一个知识点,将会获得更多的先验知识,帮助其更好地将已学知识与将要学习的知识联系起来,从而减少内在认知负荷[11]。2.预训练原则:通过在开始进行学习任务之前向学习者提供相关内容来减少内在认知负荷,增加学习者的先验知识来支持新知识的整合。一般来讲,若不改变学习目标,预训练原则通常很难大幅度减少内在认知负荷,因为学习者的先验知识难以在短期内得到提升,而新知识的元素交互性依旧极高[12]。
外在认知负荷由不合理的教学设计产生,不与学习任务直接相关[13]。当在线学习者必须在与学习任务本身无关的内容中投入认知资源时,就产生了外在认知负荷,如对知识进行搜索等。目前,许多研究者都在探讨如何合理降低外在认知负荷的问题,同时也总结出大量相关的多媒体设计原则。1.多媒体原则:当学习者在学习过程中使用文字与图片相结合的形式进行学习时,比只从文字中学习的表现效果更好[14]。2.模态原则:由于学习者工作记忆中的语音系统独立于视觉系统,学习者可以同时处理听觉材料和视觉材料,因此,当学习任务的一部分使用文字形式呈现后,另一部分可结合听觉形式呈现,而不是视觉。这有助于整合两种知识来源,最大限度地利用工作记忆容量[15]。3.一致性原则:建议适当省略对学习任务本身没有帮助的修饰性信息。虽然修饰性信息可能激励学习者,但它极具诱惑,容易分散学习者的注意力[16]。4.空间邻近原则:当学习者被迫整合形式上分离的学习任务时,注意力容易分散。如,当知识点以文字形式出现后,图片不在文字旁边,而在幻灯片的下一页。因此,伴随着图片或视频的文本信息应该同时出现。这也被称为时间连续原则[17]。
通过测量学习者的外在认知负荷,运用多媒体原则进行教学设计,能够帮助学习者减少负荷,释放工作记忆容量,使其将更多的必要认知资源投入学习任务本身,从而促进学习。
相关认知负荷来源于学习者在线学习过程中为构建知识架构所使用的学习手段,有助于帮助学习者建立正确的心理模型[18]。如,在阅读文本时使用下划线来帮助记忆学习内容等。因此,相关认知负荷较高,表明学习者的学习参与度较高。自解释效应能够帮助改变学习者的相关认知负荷水平。效应表明,对学习任务进行自我解释的学习者由于将新知识与已有图式进行联系和整合,投入更深层次的学习过程中,将获得更高的绩效水平。
上述研究表明,对认知负荷的三种不同类型进行测量是必要的,只有成功区分在线学习者具体在哪种认知负荷上存在较高或较低的负荷水平,才能制定针对性的解决策略。一方面,帮助教师或智能教学系统及时分析学习者的认知状态,调整教学;另一方面,也帮助学习者及时调整和分配认知资源,从而满足个性化的学习服务,实现学习者有意义的学习。
(二)认知负荷测量技术
目前常用的认知负荷测量技术包括:1.主观评定测量;2.双任务测量;3.生理参数测量。
主观评定测量认为学习者在完成任务的过程中,其认知资源占用率与个人所付出的努力和任务难度密切相关,学习者可以通过回顾认知过程,根据主观感受来评估认知负荷。最常用的主观评定量表是Paas(1994)开发的评定量表,它用来衡量任务难度和心理努力,学习者被要求使用李克特9点量表进行回答。
双任务测量要求在线学习者同时进行两项任务,它假设当主要任务(即学习任务)的负荷水平增加时,次要任务的表现就会下降[19]。实现双任务测量的方式有两种,一是在进行学习任务过程中测量主要任务的准确率和反应时间;二是测量次要任务的表现。
生理参数测量通过收集学习者在完成任务过程中的生理反应来评估其认知负荷水平。最常用的生理指标有心率、瞳孔扩张和脑电图测量等[20]。
以上三种测量方式都有各自的优点,主观评定测量方便经济、容易实现;双任务测量能够反映整个在线学习过程;生理参数测量具有客观性和实时性。但是,它们的主要缺点是,只评估了认知负荷的总量,而不能单独区分内在认知负荷、外在认知负荷和相关认知负荷,这降低了在学习过程中对其进行使用的有效性。迄今为止,还没有找到一种评估方法能够从不同方面对三种认知负荷类型进行差异化测量。为了克服这一难题,本研究开发并验证了以差异化测量方式挖掘学习者认知负荷不同类型的测量量表。
三、研究设计
在对学习者进行认知负荷测量时,有两种情况产生,一是研究对象知道并明确认知负荷的概念,二是对概念模糊或从未听过认知负荷。因此,本研究设计并开发了两种认知负荷差异化测量量表,并将研究对象能够理解并区分认知负荷概念而编制的量表称为已知评估量表,研究对象不能够理解或从未听过认知负荷概念而编制的量表称为未知评估量表。已知评估量表不用转述题项,可直接在量表中出现认知负荷的相关字样,未知评估量表需对题项进行转述,在转述过程中可能出现一定的误差。
(一)样本选取
本研究的研究对象为某高校随机抽取的80名学生,并将其随机分配到已知评估组(n=40)和未知评估组(n=40),每名研究对象都认真完成了学习任务并做好量表回答。未对研究对象的其他特征进行评估。
(二)量表编制
在编制量表时,由于量表维度的抽象性,需将其转化为具体可以观察或测量的题项。为确保题项的科学性,本研究梳理了已有认知负荷测量量表中使用率较高的相关量表,并将其作为参考依据,包括上述提及的Paas量表、Kalyuga等人开发的量表[21]和 Tabbers 等人提出的评定量表等[22]。Paas量表中仅有一个题项,与学习者的心理努力程度相关,采用李克特9点量表形式进行回答;Kalyuga的量表也只有一个题项,与学习任务的难度水平相关,采用李克特7点量表形式回答。因此,本研究结合认知负荷的三种不同类型负荷,将题项设置明确、简单,方便研究对象回答。
已知评估组中,由于研究对象明确认知负荷理论的概念,制定了四个题项,前三个题项分别与内在认知负荷、外在认知负荷和相关认知负荷相关,第四个题项包括了Paas关于学习任务中心理努力程度(即总体认知负荷的问题),具体如表1所示。
表1 已知评估量表题项
未知评估组需转述题项内容,将其设置了七个相关问题,具体如表2所示。
表2 未知评估量表题项
两种量表的题型均采用李克特7点量表形式设计,从“非常低”到“非常高”进行评估。
(三)研究步骤
一开始,所有的研究对象均被告知了实验过程并知晓可随时撤回提交的数据。随后,每名研究对象被随机分配到已知评估组和未知评估组。已知评估组的研究对象收到了一份以PPT形式呈现的认知负荷理论相关知识,包括认知负荷理论及内在、外在和相关认知负荷的概念;一份以问卷星编制的已知评估量表链接;一份以Word形式呈现的学习材料,包括9个学习任务,每3个学习任务仅在认知负荷的一种类型上有所改变,如前3个学习内容的外在认知负荷和相关认知负荷一致,将内外认知负荷(即学习任务的难度)分为高、中、低三个水平,因此将每3个学习任务归为一组。这是以认知负荷的理论解释、认知负荷的相关实证研究及上述多媒体原则为依据。未知评估组的研究对象收到一份未知评估量表链接;一份与已知评估组一致的学习材料;但未收到以PPT形式呈现的有关认知负荷的概念解释。由于研究对象需要消化认知负荷理论,因此研究给予已知评估组40分钟时间,给予未知评估组30分钟时间。研究对象均以在线形式接收资源、完成任务,作答完毕后返还已完成的学习任务材料。
四、数据分析与讨论
(一)信度与效度
为了保证量表的信度和效度,分别对两种差异化测量量表进行检验。对于已知评估量表,由于每个维度只有一个题项,因此研究分析了题项之间是否互不干预,构成单一的结构形式。结果显示,四个题项之间的Cronbach’s Alpha为0.210,表明各维度相互独立,量表信度较高。对于未知评估量表,每个维度之间包含几个题项,因此为每个维度计算其内部一致性。结果显示,在内在认知负荷维度中,Alpha=0.85;外在认知负荷维度中,Alpha=0.83;相关认知负荷维度中,Alpha=0.80。这表明量表的信度较高。
量表的效度通过比较研究对象在已知评估量表和未知评估量表中的评分与理论设计中认知负荷等级的相似性,即根据我们设计的不同水平的学习任务,调查对象对其评估分数是高还是低。因此,具有不同负荷水平的学习任务在评估分数上应该显著不同。由本研究以下数据分析可知,已知评估量表的效度较高,而未知评估量表因为在相关认知负荷上没有明显的差异性,所以效度较低。
(二)数据分析
本研究使用SPSS22.0统计软件对收集的数据进行处理和分析。将内在认知负荷作为自变量(如图1A和表3所示),两组研究对象的评估结果作为因变量,选择任务1—3的数据进行单因素方差分析。在已知评估组中,结果显示F=491.86,P<0.001,在理论设计上内在认知负荷较低的学习任务中(M=1.78,SD=0.84),研究对象的评估分数显著低于理论设计上内在认知负荷适中的学习任务(M=3.47,SD=0.98),也显著低于理论设计上内在认知负荷较高的学习任务(M=5.88,SD=1.05)。未知评估组中,结果显示 F=472.23,P<0.001,在理论设计上低内在负荷的学习任务(M=1.63,SD=0.92),研究对象的评估分数显著低于中等内在负荷的学习任务(M=3.13,SD=1.07),显著低于高内在负荷的学习任务(M=5.62,SD=0.78)。这表明在两组实验研究中,随着学习任务难度水平的改变,无论研究对象是否了解内在认知负荷的相关概念,其对于内在认知负荷的评估分数都与任务难度水平呈显著正相关。
图1 已知评估组和未知评估组在内在认知负荷(A)、外在认知负荷(B)、相关认知负荷(C)不同水平中的评估分数
表3 已知评估组和未知评估组在不同类型负荷中的数据分析结果
将外在认知负荷作为自变量(如图1B和表3所示),选择任务4—6的数据进行单因素方差分析。在已知评估组中显示F=255.39,P<0.001,理论设计上低外在认知负荷学习任务(M=1.96,SD=1.04),研究对象的评估分数显著低于理论设计上中等外在认知负荷学习任务(M=3.84,SD=1.77),也显著低于理论设计上高外在认知负荷的学习任务(M=6.02,SD=1.32)。未知评估组中显示F=362.72,P<0.001,对比表明,得出一致结论,研究对象的评估分数中,理论设计上低外在负荷学习任务的分数(M=1.57,SD=0.82),低于中等外在负荷学习任务的分数(M=4.01,SD=1.45.),低于高外在负荷学习任务的分数(M=5.86,SD=1.41)。这表明在两组实验研究中,随着教学设计的差异化(即外在认知负荷水平变化),无论研究对象是否了解外在认知负荷的相关概念,其对于外在认知负荷的评估分数都与教学设计的复杂程度呈显著正相关。
将相关认知负荷作为自变量(如图1C和表3所示),选择任务7—9的数据进行单因素方差分析。在已知评估组中显示F=253.52,P<0.001,具体为理论设计上低相关认知负荷学习任务(M=2.76,SD=0.93),研究对象的评估分数显著低于理论设计上中等相关负荷学习任务(M=4.41,SD=1.03),也显著低于理论设计上高相关认知负荷的学习任务(M=6.47,SD=1.25)。未知评估组显示 F=3.16,P=0.74,在研究对象的评估分数中,理论设计上低相关负荷学习任务为(M=4.88,SD=1.12),中等相关负荷学习任务为(M=4.65,SD=0.38),高相关负荷学习任务为(M=5.52,SD=1.43)。研究表明,在已知评估组中,研究对象对于相关认知负荷的评估分数与相关认知负荷的变化水平呈显著正相关。在未知评估组中,研究对象对于理论设计上低、中、高等相关认知负荷水平的学习任务之间评估分数均没有显著差异。
实验表明,已知评估组与未知评估组在内在认知负荷和外在认知负荷上,无论是否了解其相关概念,学习者对于学习任务复杂性和教学设计是否合理的感知能力均没有较明显的差别。对于相关认知负荷而言,已知评估组的研究对象因为了解其概念,所以更容易区分学习任务的不同手段对自身已有知识的诱导程度,这与理论设计一致;但未知评估组的研究对象在三种不同相关认知负荷水平中的评估分数接近,其无法区分随着相关认知负荷水平的改变,自身的心理投入程度是否也发生了改变,并且,未知评估组在相关认知负荷不同水平中的评估分数都非常高。本研究预测,这可能由两种原因导致:一是研究对象不了解相关认知负荷的概念;二是未知评估量表在相关认知负荷维度的题项转述上出现了误差。
因此,为了探析和验证具体原因,本研究对现有未知评估量表中相关认知负荷题项进行修订,以帮助学习者更好地区分,以此提升量表的效度。
(三)研究改进
为了避免再次出现转述歧义,本研究邀请了教育心理学领域的专家对新开发的相关认知负荷维度题项进行把关。在专家建议下,最终修订后的未知评估量表题项如表4所示,题型均采用李克特7点量表形式设计,从“非常低”到“非常高”进行评估。
表4 修订后的未知评估量表题项
研究随机选取了某高校未参与第一轮实验的研究对象共30名参与第二轮实验,第二轮实验主要目的是测量修订后的未知评估量表中相关认知负荷维度题项对相关负荷水平变化的敏感性。实验中,研究对象将收到一份修订后的未知评估量表链接;一份以Word形式呈现的学习材料,包括9个学习任务,内容与第一轮实验一致。每名研究对象都认真完成了学习任务并做好量表回答。未对研究对象的其他特征进行评估。
通过计算修订后未知评估量表中每个维度的内部一致性,结果显示,在内在认知负荷维度中,Alpha=0.86;外在认知负荷维度中,Alpha=0.88;相关认知负荷维度中,Alpha=0.83。这表明修订后的量表信度较高。并且,由以下陈述可知,修订后的未知评估量表,每个维度的题项都对特定的不同任务认知负荷水平变化感到敏感,因此可以判断修订后的未知评估量表效度较高。
对收集的数据进行处理和分析发现,若将内在认知负荷作为自变量(如图2和表5所示),结果显示F=487.63,P<0.001,在理论设计上低内在负荷的学习任务(M=1.56,SD=0.97),研究对象的评估分数显著低于中等内在负荷的学习任务(M=3.47,SD=0.86),显著低于高内在负荷的学习任务(M=5.93,SD=1.06)。表明在未知评估组中,随着学习任务难度水平的改变,研究对象对于内在认知负荷的评估分数与任务难度水平呈显著正相关。
图2 未知评估组在不同类型认知负荷水平中的评估分数
表5 修订后未知评估组在不同类型负荷水平中的数据分析结果
若将外在认知负荷作为自变量,结果显示F=294.33,P<0.001,在理论设计上低外在负荷的学习任务(M=1.74,SD=1.15),研究对象的评估分数显著低于中等外在负荷的学习任务(M=3.82,SD=1.01),显著低于高外在负荷的学习任务(M=5.95,SD=1.22)。研究表明,随着教学设计的差异化,研究对象对于外在认知负荷的评估分数与教学设计的复杂程度呈显著正相关。
若将相关认知负荷作为自变量,结果显示F=365.25,P<0.001,在理论设计上低相关认知负荷学习任务(M=1.98,SD=1.24),研究对象的评估分数显著低于理论设计上中等相关负荷学习任务(M=3.92,SD=0.63),也显著低于理论设计上高相关认知负荷的学习任务(M=6.71,SD=0.58)。研究表明,随着诱导学习者先验知识的教学手段不断变化,研究对象对于相关认知负荷的评估分数与教学手段的丰富程度呈显著正相关。
另外,由于第二轮实验与第一轮实验的研究对象不是同一批,因此,从侧面证实了量表测量结果不会因使用对象的不同而发生根本性变化,具有一定的稳定性和可靠性。
(四)讨论
根据第二轮实验研究结果能够有针对性地回答第一轮实验研究中的预测问题:在未知评估组中,导致研究对象在相关认知负荷维度的评估分数与理论设计上低、中、高等相关认知负荷水平的学习任务之间没有显著差异的原因并非研究对象不了解相关认知负荷的概念,而是先前的未知评估量表在相关认知负荷维度题项的转述中出现了相关性差异。
因此,通过两轮实验表明,本研究开发的已知评估量表与修订后的未知评估量表均具有较高的信度和效度,实验结果与理论设计一致,可以实现对三种不同类型认知负荷水平的差异化测量。由于已知评估量表在测量时需花费一定的时间使学习者掌握认知负荷理论的相关概念,其不适用于较大规模的差异化认知负荷水平测量研究中,因此本研究建议,在区分不同类型认知负荷水平的较小规模测量教学或实验中使用已知评估量表,而修订后的未知评估量表能够适用于不同场合中。
根据学习者对认知负荷概念理解的特征,本研究开发了两种类型认知负荷量表,即已知评估量表与未知评估量表,包括内在认知负荷、外在认知负荷、相关认知负荷和总认知负荷维度。通过两轮实验研究证实了量表的可靠性与有效性,这为差异化测量认知负荷的未来带来了积极意义。一方面,当不同学习者所拥有的先验知识、学习偏好、学习策略各不相同时,学习者在处理相同学习任务的过程中,会导致不同程度、不同类型的认知负荷水平,差异化测量量表能够正确识别认知负荷的不同来源,帮助学习者更好地理解认知过程、调整资源投入比例。另一方面,差异化测量能带来理论上的完善与丰富,例如,理论研究认为学习者的成绩较差一般因为某种类型的认知负荷水平较高。而实际测量得知学习者认知负荷水平较高也会在一定程度上增强学习,因此,差异化测量量表能够带来理论的改进与完善,促进认知负荷理论的长期发展。在未来研究中,将开展更大规模的教学实验,加大收集的数据量,进一步证实测量量表的稳定性与有效性。