APP下载

国内外语学习效能感测量研究综述

2021-12-21姜毅超

关键词:实验设计外语综述

张 宜,姜毅超

(1.沈阳师范大学 研究生院,辽宁 沈阳110034;2.香港中文大学 学习科学与科技中心,中国香港特别行政区999077)

一、问题提出

自我效能感(self-efficacy)作为人类动因机制中最重要的部分,影响着人们的感觉、思考、动机及行为方式[1],涉及人类行为的控制与调节等诸多方面。自我效能感的研究长期以来存在着 “一般” 与 “特殊” 两种取向的争论[2]:支持一般性自我效能感的观点认为,自我效能感是一种个性特征[3],是个体应付各种不同情境、不同任务时一种总体性的 “能力知觉” ;支持特殊性自我效能感的观点则认为,由于人们对于效能感的判断是基于特定任务和范畴的(task and domain-specific)。因此,在具体情境中基于 “一般效能感” 的测量往往得不到很明显的效果[4]。对某一任务具有较高效能感的个体在面对另一任务时,有可能会出现较低水平的效能感,所以,基于特定领域、特定任务的自我效能水平对个体的行为具有更好的预测作用[5]。

学习效能感作为一般自我效能感在学习情境中的一种具体实现,也同样存在着 “一般” 与 “特殊” 之争[2]。很明显,相对于一般生活情境的自我效能感,学习自我效能感是 “特殊” 的。而外语学习作为一个具体的学习情境,又有着特殊的学科特征。自我效能感在这一具体的学习过程中所起到的关键性作用,国内已有很多研究得到了支持性结论[6-15],但在绝大多数已有研究中对外语学习效能感的测量均缺乏科学可靠的效度验证(validation),少数尝试进行效度验证的研究大部分都将探索性方法(如探索性因子分析)误用作验证性过程,导致其结构的合理性和理论的适用性不足。另外,很多研究仅仅简单地借用国外相关量表或问卷的设计而没有充分考虑自身的研究情境,使得测量结果及结论值得商榷。基于以上,本研究拟系统综述国内外语学习效能感测量的研究现状,分析从自我效能感引入国内外语教育以来其测量研究的特点和存在的问题,为后续研究编制适合我国外语学习情境的效能感量表做出理论上的准备,从而梳理国内这一领域的研究脉络,找到相对的研究空白和有待改进的方面。

二、研究问题

为系统了解我国外语学习效能感测量的研究现状,并为后续研究编制本土化的外语学习效能感量表做好理论准备,本研究对国内外语教学领域中自我效能感的测量研究进行了系统综述(systematic review)。作为一种重要的文献综述取向,系统综述的目的在于通过对某一研究问题进行系统性的文献搜集、评价和整合,全面地掌握这一问题的研究现状[16]。通常情况下,系统综述包括以下几个部分:需要综述的研究问题、明确的文献选取原则、具体的数据检索式和人工筛选标准、文献的质量评价和研究结论的整合等。通过系统综述,不同研究者对于某一研究问题的不同研究结论可以得到全面的整合,使后续研究能够系统了解该研究问题的已有成果和主要结论、研究现状和进展,从而了解研究不足、把握研究趋势。

自我效能理论被引入我国的外语教学研究可以追溯到20世纪90年代,通过中国知网(www.cnki.net)检索发现,国内第一篇提及外语教学自我效能感研究的论文发表于1996年[17]。随后,越来越多的学者开始把目光投向自我效能感及其在外语教学中的作用。时至今日,国内公开发表的相关论文数量已颇为庞大(通过知网检索,主题包含 “英语” 或 “外语” ,并且篇名包含 “效能” 的期刊论文有883篇,学位论文有543篇)。可见,国内已存在相当规模的相关研究成果集群。然而,对检索结果的进一步分析却发现,国内目前尚没有刊登于 “北大核心” 或 “CSSCI” 期刊上关于外语学习效能感测量工具开发的相关研究,对科学测量外语学习效能感进行深入讨论的研究也不多见[18]。这一结果突显出国内该领域的研究文献、相关结论与成果尚未得到有机整合,对于自我效能感在国内外语教学中发挥的具体作用尚无深入的量化理解。因此,本研究将尝试对这一领域的现有研究进行系统综述,将要尝试回答的研究问题是:在国内现有的代表性研究中,外语学习效能感测量的研究现状如何?围绕这一问题,本研究从以下几个方面对国内外语学习效能感测量的现状进行考查,具体包括:1.我国外语学习效能感测量的相关研究的总体趋势如何?2.这些研究的研究设计有哪些特征?3.国内研究者使用的外语学习效能感的测量工具及其来源主要有哪些?其测量过程中量数的信度与效度是否被合理且充分地考量?4.现有研究从哪些维度对外语学习效能感进行了测量?其他与外语学习效能感相关联的研究变量都有哪些?它们之间的关系怎样?

三、文献筛选

研究对知网中的 “期刊” 部分进行 “专业检索” ,检索条件为:主题包含 “英语” 或 “外语”①为尽量扩大样本量,本研究并未对 “外语” 和 “英语” 进行区别。因此,下文中 “外语” 和 “英语” 的含义在多数情况下可视为相同。,并且主题包含 “效能” ;文献的 “时间范围” 不限。同时,由于综述的研究问题是关注国内的代表性研究,因而本研究将期刊的 “来源类别” 限定为 “北大核心” 和 “CSSCI” ,结果共得到211条检索记录(检索日期为2021年6月16日)。通过阅读每篇文章的标题和摘要,人工剔除不属于外语学习效能感的研究145篇(如研究讨论的是英语教师的教学效能感或研究并未涉及效能感的测量)。在初步筛选出的66篇论文中,进一步分析每篇文章的研究方法(测量工具、研究设计等)部分,剔除未使用量化研究的论文17篇,最终获得49篇论文作为系统综述的研究对象,文献筛选流程图见图1。

图1 文献筛选流程图

四、结果与讨论

(一)研究内容与对象综述

首先,国内涉及外语学习效能感测量的研究论文数量从2004年起呈现增长态势,峰值在2010年左右,随后出现逐渐下降趋势①本研究的检索日期为2021年6月16日。因此,发文数量统计仅计算到2020年,2021年的数据未列入统计。,多项式趋势线呈反U型(见图2)。其次,综述发现,已有研究存在明显的研究内容和研究对象选取的偏态。绝大部分研究(34篇,69.4%)在考查外语学习效能感与外语语言能力的关系时,都将被试的语言能力作为一个整体变量纳入研究;另有11篇研究(22.4%)专门将学习者 “写” 的能力作为研究变量;而相比之下,专门关注 “听” 和 “说” 与自我效能关系的研究仅各有2篇(各占4.1%)。最后,在研究对象维度上出现更明显的研究偏态。共有46篇研究(93.9%)以大学生为研究对象;仅3篇研究(6.1%)以中学生为研究对象。全部研究中仅有1篇研究是以俄语教学为研究情境[8],其余48篇研究都是以英语教学为研究情境,体现出在小语种的教学中对于学习效能感的关注相对不足。可见,国内多数对外语学习效能感的测量集中在高等教育的英语教学情境中,主要关注学习者的整体语言能力。相对而言,国内外语学习效能感的研究中明显缺乏的方面体现在:1.以中、小学生为研究对象的研究;2.专门针对听、说技能的研究;3.基于小语种教学的研究。

图2 国内外语学习效能感测量的相关研究论文数量分布(按年份)

研究同时按样本大小对全部论文进行分类,描述统计的结果见表1。由分布情况可知,绝大部分研究的样本数量小于500人,500人以上的调查类研究较少。样本数量最少的研究有2篇,均为31人,且其中1篇是调查研究[19],此类小规模的调查研究,其结论的可推广性从样本量的角度值得商榷。在分析论文中关于研究对象(被试)的部分时发现,没有研究明确交代其确定样本大小的科学标准(通常是以教学班级的人数为自然基础)。对于量化研究,样本的大小是需要通过综述其效果量(effect size)、配合检验鉴别力(discriminating power)的估计值、按照特定的计算公式来确定,而这一部分在现有研究中并未提及。因此,后续研究无法根据前人研究的效果量科学估计自己的研究所需的样本量。

表1 国内外语学习效能感测量的相关研究论文数量分布(按样本容量)

(二)研究设计综述

从全部49篇论文的研究设计来看:37篇研究(75.5%)采用了相关研究的设计取向,其研究方法主要以调查法为主;11篇研究(22.4%)采用了准实验(quasi-experiment)的设计方法;1篇研究(2%)采用了随机实验设计的研究方法。随机实验和准实验是科学研究领域最重要的两种因果研究方法,且一般认为,随机实验方法达成的因果推断其内部有效性(internal validity)要优于准实验的方法[20]。但本研究通过系统综述发现,某些相关研究取向的研究设计却也声称探讨自我效能感与其他学习者因素间的 “因果关系”[13]。由于没有实验设计对相关变量的控制,此类研究因果关系结论的科学性和可推广性存在很大的探讨空间。另外,准实验设计是社会科学效仿自然科学的研究范式,同时结合自身研究对象的特殊性而形成的一种比较特殊的研究设计方法,其与随机实验设计的区别之一在于 “在准实验设计中,被试并不是按照随机分配的原则进入实验组或对照组。因此,两组被试通常被认为是不对等的。研究者只有通过一定的方法控制其他干扰因素的影响,才能得到因果推断”[21],这与大多数基于学校情境的教育实验相吻合。很多时候,基于课堂的教育实验受到各方面因素的约束,没有办法采用随机实验设计的方法打破班级的限制将被试随机分配到不同的处理中。而本研究综述到的11篇准实验研究中,有7篇研究并没有清楚地区分随机实验设计与准实验设计,误将准实验设计当作随机实验设计实施并得出了结论,同时也没有控制准实验设计中可能存在的干扰变量[9][22-27]。可见,国内外语教学领域对随机实验设计和准实验设计还存在着混淆的现象,没能够清楚地区分二者并使用恰当的数据分析方法(如控制干扰变量等)对其进行研究。

准实验设计与随机实验设计的另一个主要区别在于实验中自变量所产生的效应值,即效果量。研究者通过对教育实验中效果量的综述发现[28][29],准实验设计会比随机实验设计得到显著偏高的效果量,而小样本实验会比大样本实验得到显著偏高的效果量。虽然教育实验的效果量越来越得到国际范围内教育研究者的重视,但本研究综述发现,全部12篇(准)实验类研究均以显著性检验为统计分析的理论基础,汇报了显著性差异,但遗憾的是,这些研究均未汇报实验效应的大小。因此,研究仅仅能验证自变量所引起的显著差异,但是差异的大小并无根据进行论证,后续研究也无法对同一变量在各种情境中能产生的效应大小进行量化整合。同时,这些实验类研究恰恰又是以准实验设计和小样本实验为主,因而非常有可能对外语学习效能感相关的影响效果作出过高的估计而又无从合理修正,容易导致实验结论过分强调自变量在外语学习中的作用。基于以上分析,国内研究者对学习效能感在外语教学中所起作用的准确估计不仅显得非常必要,而且也有助于更好地与国际范围内这一领域的研究进行交流,而进行这些研究的基础和前提是一个科学的外语学习效能感量表的开发与应用。

(三)测量工具综述

本研究对于全部49篇论文所提到的外语学习效能感测量工具进行了整理,结果发现,除2篇研究没有提及测量工具的来源以外,其他47篇研究测量工具的来源可分为三种情况:20篇研究(40.8%)借用了已有的问卷或量表的整体或某些维度;18篇研究(36.7%)对已有工具进行了改编或调整(文字表述的调整、维度增减等);9篇研究(18.4%)完全自行编制了所使用的测量工具。其中,63.2%的研究中借用或改编的测量工具主要集中在以下6种之中(见表2)。

表2 国内用于测量或改编的外语学习效能感的主要问卷或量表统计

通过整理发现,国内并没有公开发表于 “北大核心” 或 “CSSCI” 期刊上的可用于英语学习效能感测量的量表或问卷。虽然张日昇等在对外语焦虑、自我效能感与外语成绩关系的研究过程中,作为研究的一个部分编制了 “英语学习自我效能感量表”[6],但是,由于其研究的主要问题并非编制这一量表,因而没有提供量表开发的具体过程,也未提供量表的具体内容,因而使得后续研究无法直接借鉴。相比之下,国内使用最广泛的测量英语学习效能感的工具之一是由Schwarzer和Jerusalem于1995年开发的《一般效能感量表》(General Self-Efficacy Scale)[30]37。这一量表已被译成多国语言,其获取容易的特点使其广泛用于一般自我效能感的研究,也被证实具有较好的心理测量学指标[35],其中文版由Zhang和Schwarzer编制完成[36]。然而,正如在自我效能感的 “一般” 与 “特殊” 之争中所提到的,由于自我效能感具有很强的情境依赖性,面对不同任务时个体的自我效能感会有明显的不同。将一般效能感的测量工具用于测量外语学习情境中被试的学习效能感,所得结果在具体指导被试的外语学习时存在很多困难。另一位国内学者经常引用的外语学习效能感测量工具是《积极学习策略问卷》(Motivated Strategies for Learning Questionnaire)[31]中 所含的自我效能感子问卷部分,它虽然易于获取,但是在理论上,它仅仅是 “积极学习策略” 结构基于自我效能感形成的一个维度而已,与真正的外语学习效能感的结构存在着本质上的差异。因此,它并不能用于合理地测量外语学习效能感。借用一个完整的量表或问卷的某些维度,相当于拆解原有工具已经得以验证的结构(construct),而将其中的子结构(Substructure)用于自己的研究情境,这些子结构能否被视为目标变量的理论结构仍然值得推敲。例如,《积极学习策略问卷》的自我效能感子结构(维度)能够在理论上等同于英语学习效能感的结构吗?也就是说,我们可以认为 “积极学习策略” 的理论结构能够完全包含 “英语学习效能感” 的理论结构吗?这种简单拆解测量工具组成新测量工具的方式,需要科学可靠的效度验证来作保证,并通过结构方程模型来完成。但综述发现,只有少数研究尝试进行了简单的效验过程,而且有些效验过程还误将探索性方法(如探索性因子分析)用作验证性分析过程并直接得到 “信、效度良好的结论”[19][37-40],这种误解来自对效度及对效验过程的误解,从而导致研究中 “英语学习效能感” 的理论结构缺乏合理性。

除部分借用已有测量工具外,还有一些研究调整了已有问卷或量表的内部结构,通过修改、增加或删除题项改变原有的测量工具。例如,有研究将《小学数学学习效能感问卷》[32]改编成 “大学英语学习效能感” 的测量问卷[23][41-42],这种对原有问卷维度和结构的破坏性调整忽视了不同研究情境之间存在的巨大差异,即大学英语学习与小学数学学习存在学习者与课程(目标、实施、内容、评价)等诸多方面的不同。因此,在没有效验过程保证的情况下,通过改编而建立的理论结构难以被认为是一个符合心里测量学标准的模型,导致测量结果的有效性存在很大的疑问。

自我效能感的一般性与特殊性的争论也体现在其测量工具的编制中。边玉芳以编制一般学习效能感量表[34]为主要研究问题,经过多次尝试,编制完成了用于中小学学习情境的学习效能感量表,且效度验证过程充分。但是,由于该量表是基于基础教育中一般学习情境的,且其二阶结构相对复杂,题项数量相对较多,因而较少被国内学者应用于高等教育中外语学习效能感的测量。另外,在全部49篇研究论文中,还有11篇(22.4%)是专门研究英语写作学习及英语写作效能的论文,他们主要使用了Shell等编制的《写作效能量表》(Writing Self-Efficacy Instrument)[33]。但同样,英语写作学习与整体的英语学习之间仍然存在着一定的情境差异。因此,这一量表也仅能用于英语写作学习的效能感测量,不能够用其量化学习者整体的英语学习效能感。通过对以上国内常见的6种用于英语学习效能感测量工具的综述不难发现,国内目前确实没有公开发表的适用于量化英语学习效能感的测量工具。这一研究现状在很大程度上也佐证了国内研究者在大学英语学习效能感测量方面对一个科学且易获取的测量工具存在着迫切的需求。

(四)测量维度及关联变量综述

本研究对于49篇论文各自使用的问卷或量表所涵盖的维度进行了统计,除3篇论文(6.1%)并未提及测量工具的具体使用情境之外,25篇研究论文(51%)使用了专门用于外语学习情境的效能感测量问卷或量表,其余21篇(42.9%)使用了一般自我效能感的测量工具。对25篇基于外语学习情境的论文所使用的量表或问卷进行维度统计发现,外语语言的基本能力(听、说等分项技能)、学习问题或任务解决(任务效能、问题解决等)、学习的元认知能力(目标效能、自我控制、策略使用等)、面对消极问题的应对(挫折感、应对困难等)是最频繁出现的几个方面。这些外语学习效能感的测量维度可供后续研究在编制相应测量工具时在理论探讨、模型探索等方面加以借鉴。

除外语学习效能感本身的测量维度之外,外语学习效能感与其他研究变量之间的相关关系或因果关系也是其测量研究主要关注的问题。本研究通过数据可视化分析软件Gephi(版本号0.9.2)将所有49篇论文中涉及的与英语学习效能感相关联的全部研究变量进行了关系网络分析(见图3)。图中的节点代表目前国内所有关于英语学习效能感测量研究中所涉及的相关变量,节点的大小代表其在关系网络中的重要程度。由图3可见,绝大部分研究都围绕在 “外语学习效能感” 这一整体结构上,因而其节点最大,而在分项技能中,相比听力、口语和阅读教学,英语写作效能感的节点更大,说明其得到了相对较多的研究关注。这一结论与之前研究内容上的综述结果吻合(英语写作效能感的相关研究占全部研究的22.4%,听、说分别仅占4.1%),说明在听说方面的教学情境中,英语学习效能感的研究仍然不太充分。

图3 国内外语学习效能感测量研究的相关变量网络关系图

另外,节点间关系的强弱由节点间连线(边)的粗细程度表示,即两个节点间的关系被越多地研究探讨,它们间的连线就越粗。从分析结果可以看出,与国内外语学习效能感关系最紧密的变量包括外语成绩、自主学习能力、学习策略及一些类别变量(性别、民族、专业)等。从变量的类型上可以发现,心理情感维度的变量相对得到较多的研究关注(如学习动机、动机衰竭、考试焦虑、知觉到的教师期望、自我概念、一般效能感等),认知维度(如英语成绩、听力成绩、写作成绩、任务复杂度等)和元认知维度(如写作元认知策略、写作能力自评、目标定向、自我调节等)也能得到较充分的讨论,但从社交维度探讨外语学习效能感的研究则相对稀少(如同伴互评等)。造成这一差异的原因很有可能是因为相对社交维度的变量对研究资源的需要,另外几个方面的研究工具比较好获取,很多研究均通过各种量表(问卷)或测验收集数据进行分析,而社交维度的变量往往需要通过细致的课堂观察或社交媒体平台提供跟踪数据,以及复杂的数据集来捕捉参与者的行为数据,相对需要更多研究设计的投入,对研究者自身的科学研究能力也提出了更高要求。不过,计算机技术的发展使得很多行为数据的捕捉成为可能。因此,社交维度作为教育学等社会科学领域中一个新兴的研究取向正在得到越来越多研究者的关注。与理科等其他学科不同,社交维度在外语教学中往往作为一个直接教学目标出现在课程实施的过程中[43]。因此,基于社交维度的外语教学与相关研究很有可能逐渐成为一个重要的研究取向,从而得到更多研究者的关注。

五、结论及本研究的局限性

通过本研究的系统综述发现,在研究内容方面,国内涉及外语学习效能感测量的研究论文数量总体上呈现反U型增长,研究对象以大学生为主,研究规模以500人以下的调查研究或小规模的准实验研究为主,大部分研究都以学生整体的外语语言能力为研究变量。相对来讲,以中、小学生作为被试的研究很少,500人以上的大样本研究较少,小语种教学作为研究情境的相关研究相对不足,外语学习效能感在听说教学中的相关研究明显少于其在写作教学中的研究。

在研究设计方面,无论是(准)实验类研究还是调查类研究,都主要以显著性检验为得出结论的理论基础,尚未有研究汇报研究结果的效果量,大多数研究都以相关研究为取向对外语学习效能感进行了测量,(准)实验类研究仅占约24%。同时,随机实验设计和准实验设计的各自特点和对统计分析方法的要求没能在实验设计中得到合理的体现。

在测量工具方面,国内大多数研究对外语学习效能感的测量主要是借用或者改编于已有的6种量表或问卷,少数研究尝试了自编外语学习效能感的测量工具。然而,这些研究缺少符合心理测量学标准的效度验证,存在效度威胁,有些研究甚至将探索性研究作为效度验证过程。因此,通过综述可以发现,目前并没有适合国内教育情境的外语学习效能感量表,这在某种程度上也突显出后续研究开发符合标准的相关量表的必要性和实践意义。

一方面,外语学习效能感自身的理论结构可以总结为外语语言的基本能力、学习问题或任务解决、学习的元认知能力、面对消极问题的应对等几个维度,这些维度可以作为后续研究开发相关量表的理论建构基础;另一方面,全部49篇研究所涉及的与外语学习效能感相关联的其他外部研究变量主要汇集在情感、认知和元认知维度上,社交维度由于研究设计和数据收集的复杂程度及对研究能力的要求更高而导致论文数量稀少。但是随着网络计算机技术的发展,学习者学习行为等方面的数据将越来越容易捕获,加之外语教学的特殊性决定了其与社交维度密是不可分的。因此,社交维度在国内外语教学领域上将会越来越得到研究者的关注和重视。

本研究尝试首次以国内外语学习效能感的测量作为系统综述的问题,从以上几个方面回顾并总结了已有研究的现状,在得到一些研究结论的同时,本研究自身也存在着一些研究局限。一方面,研究仅仅综述了国内 “北大核心” 和 “CSSCI” 期刊的全部相关研究,没能将综述范围扩大到国内全部外语及教育类期刊,因而所得结论由于出版物的代表性问题有可能带来一定的效度威胁;另一方面,本研究尚未能够借鉴国际范围内外语学习效能感综述类研究的相关结论。因此,综述研究的四个方面可能并不能够完全反映这一研究领域的全部问题,后续研究在分析以上局限性的基础上,应该可以更准确地总结和评述国内现有相关研究的现状,并编制符合心理测量学理论标准的外语学习效能感量表。

六、后续研究的建议

在理论上,本研究的系统综述为后续研究开发本土化的外语学习效能感的测量工具提供了部分理论研究基础。很多实证研究已经表明,自我效能感是外语学习中一个重要的中介变量,对外语学习效能感进行科学合理的测量是相关量化研究的基础之一,复杂的中介效应研究必须基于科学合理的测量。因此,后续研究可以在本研究综述的基础上尝试进行外语学习效能感结构的探讨及相关测量工具的开发,以便为国内外语教学领域的研究者和教师所使用。

在实践上,基于本研究所发现的国内外语学习效能感的研究空白,后续研究可以更有针对性地探讨效能感在外语学习中的作用,并量化其效果量,尤其是以中、小学生为研究对象,以英语的听说技能或小语种教学为研究内容的量化研究。同时,后续研究也可以借鉴本研究综述中的理论成果对外语教学领域中其他变量的测量现状所做出的评价,找出其存在的问题并提出解决办法。

猜你喜欢

实验设计外语综述
不同的温度
有趣的放大镜
哪个凉得快?
5G应用及发展综述
无字天书
机器学习综述
NBA新赛季综述
外语教育:“高大上”+“接地气”
大山教你学外语
大山教你学外语