学习任务认知负荷与测量方法研究

2009-03-13蔡艳玲

郑州大学学报(哲学社会科学版) 2009年1期

关键词：认知负荷工作记忆

蔡艳玲

摘要：由于缺乏对影响复杂学习的中介变量——认知负荷的有力测量，因而认知负荷测量成为认知负荷理论研究的新动向。本文论述认知心理学界在语言学习、数学统计、多媒体教学等领域对认知负荷所进行的测量研究，评价各种测量方法的适用性。

关键词：工作记忆；认知负荷；主观测量法

中图分类号：H310

文献标识码：A

文章编号：1001-8204(2009)01-0128-03

传统的学习理论如行为主义、建构主义是从促进学习的角度出发，说明如何帮助学习，提高学习效率。然而认知负荷理论是从学习的抑制机制着手，解释学习为什么会受到阻碍，区别了专家和新手的差异，提出学习中应该避免的问题，进而达到有效学习的目的。该理论建立于认知心理学研究中的主导范式——信息加工方法基础上，从认知资源分配的角度，对复杂学习深入研究，认为信息加工涉及人的认知体系，即容量有限的工作记忆和无限的长期记忆，两者相互作用，为教学和学习材料设计提供心理学的理论依据。

认知负荷即指工作记忆负荷过大引起认知超载，进而阻碍学习，因而为了促进学习，认知负荷应该保持在学习者可以掌控的水平。教学设计者要充分考虑人的认知结构和工作记忆特点，在教学时施加适当水平的认知负荷，促进学习者进行图式建构与自动化，即有效学习两大机制的发展。因此，评估和预测学习任务的认知负荷水平是教学设计的重要环节，也是认知负荷理论研究的一个难点。而对认知负荷理论早期的批评也来自于没有对特定的材料设计原则与学习成绩变化间的中介变量——认知负荷做客观的定量分析。

顺应这一发展要求，探索有效的认知负荷测量方法成为近年来认知负荷理论发展的最新动态。本文论述认知心理学界在语言学习、数学统计、多媒体教学等领域对认知负荷所进行的测量研究，以揭示其在复杂学习中的重要作用。

一、认知负荷概念与构成

认知负荷与信息处理过程中的信息处理量相关，人们对其定义有所不同，有的是基于任务需求与学习者的认知资源相互作用之上，也有的把任务需求看做学习者必须有效应对的一个外部独立变量。但更多的是相同点，认为认知负荷主要来自于任务，即任务对学习者的认知需求，它反映了(完成)任务对学习者认知资源多方面的需求特点。这些定义都是在信息处理框架下解释认知负荷的，综合了心理过程(包括认知、动机和情感)、知识陈述和状态(如意识状态、激活状态等)。因此，认知负荷是一个多维概念，是信息处理时学习者所感受到的施加在其认知体系——工作记忆中的载荷，也称工作记忆负荷，两者可以互用。同时认知负荷也会带来多方面的影响，它会影响学习者的行为策略和表现结果，可以导致学习者生理及心理过程的变化。

根据Paas＆van Merrienboer提出的认知负荷结构模型，决定认知负荷水平的有原因和评价因素。原因因素来自学习任务、学习者个人特性及环境干扰，反映它们之间的交互作用。任务是主要因素，任务特点有任务形式、任务复杂度、时间压力、教学节奏等，学习者特性包括学习者的专业知识水平、年龄等。评价因素反映了可以测量的因素，包括心理负荷和心理努力两部分，它们最终通过学习者任务完成的情况即学习行为表现出来。心理负荷是由任务和环境方面的要求所造成的认知负荷，心理努力是指学习者分配给任务的认知容量／认知资源。学习者的心理努力反映了认知负荷的实际水平，所以可作为认知负荷测量的指标。

二、认知负荷与个体差异

复杂学习都含有较多相互交织作用的新信息元素。在进行数学解题、多媒体学习、写作等复杂学习时，要达到学习目的，学习者的工作记忆不得不同时处理各个相关因素。由于工作记忆加工与储存容量有限，对工作记忆施加适当的认知负荷成了决定有效学习的关键，学习者会评估他们所要处理的认知需求，从而在信息处理中进行自我调节。但每个学习者对同样的教学设计，可能存在着个体差异。如果学习者先前知识丰富，很多占用工作记忆容量、相互关联的信息元融合成一个图式，作为一个处理单位储存和加工，那么就会克服工作记忆容量的限制，提高信息处理能力。一个人长期记忆中图式习得越多、规模越大、自动化程度越高，学习任务对他来说产生的认知负荷就越低。通过使用自动化了的图式来学习、组合新信息，可以投入较少的心理努力达到最佳学习结果。所以有的学生考试成绩一样，但他们在平时学习或考试中投入的心理努力可能并不相同。Sweller强调了调整认知负荷水平的重要性，即教学设计应考虑学习者的个体差异，使之与学习者的知识水平相适应。Kalyuga、Ayres、Chan-dler和Sweller观察到很多对新手有效的学习任务，对水平较高的学习者则变得不那么有效，甚至增加了不必要的认知负荷，这就是技能反向效应，体现了学习者水平和任务形式间的交互作用。材料设计中的冗余信息，由不连续的信息资源引起的分散注意效应，以及视觉－听觉的双重感观效应等对低水平学习者所产生的影响和作用，相对高水平学习者而言更大。就任务需求与学习者认知资源的关系来讲，大致有三种情况：任务需求超过学习者的认知容量而难以满足(负荷超载)；与学习者的认知容量相适应(负荷适中)；任务十分简单、对认知资源的需求太低(负荷不足)。简单任务对学生的学习促进不大，所以在学习中，任务具有一定水平的认知负荷是不可避免的，因为它提供了必要的学习动力以及学习选择。但是过度的负荷则有害于学习，应该把认知负荷调节到适当的水平，促进学习。因此，有必要对学习任务的认知负荷进行系统的测量，把对认知负荷的测量与成绩测试结合起来，更好地洞察学习者在学习进程中图式习得与自动化的程度，提高教学设计的效能。

三、认知负荷测量的评价标准及分类

虽然认知负荷测量近年来才开始，但认知心理学在负荷测量领域已经做了很多相关研究。传统上用任务分析的方法可预测认知负荷的高低，即根据权威意见和分析学习任务的难度来预测，但这种分析法过多依赖先前经验，没有考虑任务完成时的具体交互信息及学习者个体特性。目前，多数研究者使用实验方法来测量认知负荷。评价认知负荷测量方法是否有效、使用是否恰当，有以下7个评价标准：(1)敏感性。能够测量出任务难度或认知需求的变化。(2)诊断性。不仅能判定认知负荷的变化，还能判断认知负荷变化的原因。(3)效度。测量指标必须只测量认知需求的变化，而不能对其它与认知负荷不甚相关变量具有敏感性(如情感压力)。(4)干扰性。测量法不能干扰主要任务，因为其认知负荷才是评价的真正对象。(5)信度。测量法对认知负荷的测量必须具有一致性(可重复性)。(6)实施(方便性)要求。包括时间、工具和收集分析数据的软件。(7)测量对象的接受性。即测量对象对测量程序的信度、有用性的主观理解性。测量

认知负荷的实验方法一般可以归为三类：生理指标测量法、行为测量法和主观测量法。

生理指标测量法的依据是人的各种生理状态及变化过程会随认知负荷的变化而波动，它通过测量人体不同器官的生理激活反应，如大脑活跃程度、心脏跳动比率的变化、眼动次数或瞳孔扩大的差异，来测量人们在复杂学习时承受的强度。实验表明，心跳变化并不能敏感反映认知负荷的变化，而瞳孔变化则是测量认知负荷的有效工具，尤其是对年轻人。生理测量法灵敏度高，能够测出连续的生理变化数据，即使外在行为表现不明显也能对认知负荷进行测量。但该方法的使用对生理测量仪器设备要求高、费用大，对学习者完成任务有一定的干扰性，有时学习者不愿意接受用仪器在身体上测量的方法，因此不方便大规模的测试。Pass等人通过实证性研究，考察心脏血管等生理测量法与主观测量法对认知负荷测量的有效性，结果发现在教育学领域中，主观测量法在效度和敏感性方面能充分满足教学的需要，而生理测量法则不能。

行为测量法认为任务难度的加大会导致认知需求的增加，降低学习者学习成绩，所以通过学习者完成某一任务的外在行为或表现，可推断出学习者在该项任务中的认知负荷，包括主任务测量方法和次任务测量方法，也称双任务法。

主任务法一般采用测量学习结果的方法，也包括对任务完成时间的测量。例如Yeung、Jin和Sweller在实验中就使用主任务法来测量认知负荷，验证了阅读授课的有效性取决于其所施加的外在认知负荷。他们通过阅读得分和词汇得分得出学习者认知负荷水平。这种方法间接测量了学习者的心理努力，但不能从本质上测量认知负荷。而且，只有学习者在完成任务时产生足够可观察行为的情况下，主任务测量方法才适用，因此这一问题常常通过引入次任务法来弥补。

次任务测量法认为次任务的完成情况反映了主任务的认知负荷水平，因为两者使用的是同一认知资源。如果次任务完成情况较差，完成时间长、出错率高，则说明主任务施加给学习者的认知负荷较高；反之，说明主任务认知负荷较低，学习者有富裕的认知资源完成次任务。Kellogg设计了“三重任务法”用来研究学习者的认知努力与认知处理：要求学生在完成主任务时(如写作文)，尽快对听觉探示器做出反应以计算反应时间(反应任务)，同时说明自己此时被打断的认知过程(认知过程反思任务)。主任务完成过程中听觉探查会以不同的时间间隔出现，附加任务完成的好坏揭示了听觉探查时注意力资源分配给主任务的程度。

次任务测量方法具有较高的敏感性和信度，可得到实时交互信息，宜在多媒体环境中进行。Brunken、Plass和Leutner阐述在多媒体环境中对次任务的测量能准确反映出认知负荷的水平，敏感度较高。他们认为次任务法不依赖主观判断，能直接测量认知负荷，而生理指标测量法是对认知负荷的间接测量，不能排除其它因素对认知负荷的影响。但导人次任务方法本身会干扰学习者的主要学习活动，用它来测量认知负荷存在一定缺陷，所以在认知负荷理论研究中使用有限。

有鉴于此，主观测量法正成为认知负荷评价体系中的一种重要工具。主观测量方法主要根据学习者对任务难度的自我报告，将任务难度作为认知负荷大小程度的主要指标。该方法认为学习者能够反思自己的认知过程，并能报告出与任务交互作用时认知努力的程度。尽管受到一些批评，但大量研究表明人们完全可以用数字表示他们所感知的心理负担程度。主观测量方法包括一维测量法和多维测量法，其量表由一个或多个不同意义的等级量表构成，学习者可以在量表上标出自己感知到的认知负荷水平。

一维测量法有的依据对学习材料难度的评定来测量认知负荷高低，还有通过对心理努力的测量，要求学习者报告他们在理解学习材料时所投入的心理努力程度。前者称为直接法，因为难度是学习材料内部复杂性因素和外部完成条件的直接结果；后者称为间接法，因为心理努力是根据学习材料的难度要求来分配认知资源的结果，间接表示了认知负荷的大小。使用的量表一般由9点量表构成，也可使用7点量表。如Ayres就用7点量表测量了数学学习的认知负荷，结果表明认知负荷主观测量结果与数学题目出错率一致，两者高度相关，达到0.85。使用一维测量法得出的认知负荷高低可以是由任务难度引起的，也可能是由学习者个人能力水平或不同的注意分配造成的。因为一维测量法只测量一种指标，虽然是认知负荷最本质的方面，但忽略了其它因素测量的可能性。

多维测量法考察了认知负荷构成的不同方面，弥补了一维测量的单一性。更重要的是多维主观测量法可以诊断认知负荷的来源，具有其它测量法不可比拟的优点。如在任务难度的一维测量基础上，制定了多维测量表，增加了另外三个维度——能力欠缺、情感和努力，通过实证因子分析证实该主观测量法的效度，能够较好预测认知负荷的大小。

在多维测量中，主观负荷测量技术(SWAT)和NASA任务负荷指数是目前国外研究报道较多的认知负荷主观评价多维量表。

SWAT测量技术使用了组合分析程序。它从三个维度(时间负荷、努力负荷、心理紧张负荷)测量认知负荷，每个条目负荷由低到高分为三个等级，被试者根据自己任务完成时的情况先选择每一条目相应的等级，再对这3个条目的重要性进行排序，据此把被试者分为六组，然后对照量表查出分值，换算成0～100分值。分值越大，负荷越重。

NASA任务负荷指数测量使用的是六个分量表，分别显示引起认知负荷的不同方面：脑力需求、体力需求、时间需求、写作表现、努力程度、受挫程度。每个条目下都有一条11点量表，配有详细的文字说明。被试者根据任务完成情况，在分量表上与实际需求相符处做标记，并按6个条目对总负荷的贡献程度进行排序，赋予权重，计算出0～100的总负荷值。在测量具体任务的认知负荷时，可以根据需要选取测量维度，如有的任务对体力需求很小，就可以把此条目去掉。

主观测量法一般是在任务完成之后随即使用量表来测量认知负荷，对学习者的任务完成不会造成干扰。在实施上，主观测量法对实施条件要求最低，因为主观测量使用纸笔即可，不需要其它特别仪器设备，因此被试可接受性强。所以综合认知负荷测量评价标准，主观测量法尤其是多维主观测量法优越性大，使用范围广泛。相比而言，NASA任务负荷指数测量比较简便、易于操作，而SWAT测量技术较复杂，要用到组合分析程序。更主要的是NASA－TLX反映任务复杂性和其他因素相互造成的认知负荷差异，较SWAT敏感度高。在信度上，NASA－TLX测量结果与学习者的成绩表现具有更高相关性：所测出的认知负荷水平比较高时，学习者完成任务的成绩就相应较低；认知负荷水平低时，学习者的成绩相应上升。在诊断性上，NASA－TLX多维主观测量法可以诊断并提供较多的认知负荷来源等宝贵信息。

认知负荷作为学习任务和成绩变化的中介变量，是影响复杂学习成功的重要因素之一，在教学设计中发挥重要作用。从上述认知负荷测量分析和先前研究结果看，多维主观测量法在测量认知负荷水平上具有一定的优势，可以结合传统的分析法，多角度度量认知负荷。但使用时还需在信度和效度等方面进一步测试，确保每次具体测量的准确性，为了解学生的学习进程、合理安排学习任务提供科学依据。