APP下载

区域教研对学生学业成绩影响的实证研究
——以北京市海淀区为例

2021-06-03林秀艳杨智君

关键词:区级校本教研

魏 易 罗 滨 林秀艳 杨智君 王 梦

(1. 北京大学中国教育财政科学研究所,北京 100871;2. 海淀区教师进修学校,北京 100195)

一、研究背景

教师是提高学校教育质量和学生学业成绩的关键因素,为此,各国政府都致力于提高教师素质和教学水平,从而提高学校的教育质量和学生的学业成绩。世界银行2018 年的全球发展报告指出,许多国家和地区存在一种学习危机:学生尽管在上学,但却没有进行有效的学习(World Bank,2018)。造成学习危机的主要原因包括:儿童早期教育和学前教育准备不足,学校教育资源投入不足、使用效率低,教师缺乏有效教学的知识、技能和动力等。尤其是在基础教育阶段,教师的人员支出占学校经费的四分之三左右,这是影响学生在校学习效果的关键因素。提高教师队伍质量,不仅需要吸引和留住有才能的人从事教学,还需要为在职教师提供专业发展的机会。教师专业发展活动是被广泛认可的提高教师知识技能、教学实践和学生学习成绩的关键途径,也是课程和教学改革得以落地和实现的基础(National Commission on Teaching and America’s Future,1996;Day and Sachs,2005;European Commission,2005;Darling-Hammond et al.,2009)。随着各国对教师专业发展的重视,政策制定者越来越重视教师专业发展的有效性,以促使有限的公共资源能够得到更好的分配和使用。教师专业发展的最终目的是改善和提高学生的学习,因此教师专业发展对有效提高教师教学水平和学生学习成绩至关重要。

自从1966 年《科尔曼报告》分析了学生学业成绩的差异来源之后,教育实证研究一直致力于打开教育生产的黑箱,分析学校、家庭和社会环境对学生学业成就的影响(Glewwe et al.,2011)。教师作为其中最重要的一个因素,受到了高度的关注。早期的研究在分析教师对学生学业成就的影响时,主要聚焦于教师的个人和专业背景,例如教师的教龄、学历、资格、工资和职称等。随着人们对学校和教师效能的关注,以及对教师专业发展的重视,越来越多的研究逐渐聚焦到了教师专业发展对教师和学生的影响上(Desimone,2009;Hill et al.,2013)。另一方面,随着TIMSS 和PISA 等国际测试项目的开展,学生成绩名列前茅的中国、日本、韩国、新加坡等东亚国家受到了高度的关注。在研究了这些国家的教育体系和教学组织方式之后,学者们认为这些国家的学生之所以能够取得较好的成绩与教师专业发展的组织和制度安排密切相关。例如师徒带教、集体备课、相互听课、磨课以及教学研究小组等,使教师不仅在入职阶段可以得到融入专业共同体的机会,在入职之后也能够有组织地参与到持续的专业发展活动中(Darling-Hammond et al.,2017;World Bank,2018)。

在中国,省(自治区、直辖市)、市、县(区)教研室和学校教研组的四级教研体系自建立之初就与基础教育的建设和发展紧密相连,长期以来在保障教学秩序、支持课堂教学、组织教学研究、推进课程改革等方面起到了不可替代的作用,是极具中国特色的基础教育教学研究制度。在关键时期,教研组织承担了培训教师、提高教师专业水平的重要任务,保证了我国中小学教学的基本质量。随着我国基础教育改革和中小学课改的不断发展,教研体系越来越成为推进课程教学改革、提高教学质量和教师专业发展的核心力量(丛立新,2011;梁威等,2011)。在这一过程中,教师专业发展也经历了从单一化、学历补偿式培训模式向以教师为主动学习者的教师专业发展模式的转变。学者和实践者越来越倡导以学校为本,通过教学实践和教师反思性学习实现专业发展(卢乃桂,2006;宋萑,王恒,2019)。而另一方面,相对于国外的教师专业发展活动的实证研究,目前国内相关领域的研究,尤其是教师专业发展有效性的研究相对较少。现有研究对教师专业发展活动的各方面因素有所涉及(张文静等,2010;赵健等,2013;托马斯等,2015),但尚未有研究将区域教研活动作为一个整体,将包括区级和校级在内的各类教师专业发展活动与学生的学业成绩联系起来,探讨其对学生学业成绩影响。本文基于教师专业发展的实证研究框架,以北京市海淀区为例,采用增值模型、多层线性模型和结构方程模型,分析区级和校本教研活动对教师的教学实践、自我效能和学生学业成绩的影响。

二、文献综述

本节首先回顾了国外尤其是美国从20 世纪80 年代开始的教师专业发展的实证研究如何定义、衡量和评估高质量、有效的教师专业发展活动。目前国外教师专业发展活动的实证研究主要包括三类:一是通过更加“客观”的标准,例如学生成绩,来衡量教师专业发展活动的效果;二是收集和分析教师专业发展活动的某类“特征”及其效果;三是采取“随机实验”的方法评估专业发展的效果。其次,我们对国内教师专业发展活动的实证研究进行了梳理。目前国内对于教师专业发展活动的实证研究大致可分为三类:一是描述和分析教师专业发展活动现状,包括教师专业发展活动的供给、教师的需求以及专业发展活动的地区和城乡差异;二是探讨影响教师参与专业发展活动的个人层面和组织机构层面的因素,提出教师的自我意识、教师专业共同体、学校的组织因素以及教师专业培训和教研体系特征等对教师专业发展的影响;三是检验教师专业发展是否有效影响了教师自身的知识、态度、实践以及学生的学习结果。最后,在回顾国外和国内教师专业发展活动的实证研究的基础之上,形成本文的基本分析框架。

(一)国外教师专业发展的实证研究

自《科尔曼报告》发布之后,学校投入作为教育投入的重要组成部分,首先受到了关注,形成了一系列学校效能(school effectiveness)的研究成果。早期的研究较为关注学校的类型、办学条件(例如,经费、班级规模、生师比等)的影响,而对教师的研究则主要聚焦于教师的学历、经验、工资等方面(Glewwe et al.,2011;Hanushek,1997,2003)。随着对学校和教师效能的关注,以及对教师专业发展的重视,越来越多研究逐渐聚焦到教师专业发展的投入对教师和学生的影响上。

早在20 世纪20 年代,就有学者对教师的教学活动和教师培训的要素进行研究(Charters & Waples,1929),但在如何描述教师的工作以及教师所需的知识和技能方面,并未达成共识,也未采用同一套概念进行对话。从20 世纪70 年代开始,评估教师专业发展活动有效性的实验研究开始出现(Carpenter et al.,1989)。随着对教师专业发展的重视,相关研究呈现出爆炸式的增长,但仍然只有部分研究关注教师专业发展活动对学生学习过程或结果的影响,其中采用较为严格的因果推断或者实验方法的研究则更少(Kennedy,2016)。直到1990 年,对教师专业发展活动有效性的评估还主要依靠教师自我汇报的满意度、态度和观念等方面的变化,较少关注专业发展活动的结果以及产生结果的机制和关键因素(Desimone,2009;Hill et al.,2013)。一方面,观察、访谈等质性研究方法和教师的满意度调查仍旧是评价专业发展活动效果的重要工具,基于民族志和深度案例研究的方法能够全面深入地研究教师在专业发展活动中的经历和经验。另一方面,随着政府对教师专业发展的重视和公共财政投入的增加,以及政策制定者对可复制、可推广的教师专业发展活动的需求,推动了通过教师专业发展活动提高教师教学水平和学生学习效果的趋势性、相关性和有效性的研究。

发展到现在,有关国外教师专业发展活动的实证研究主要包括三类:第一类是通过更加“客观”的标准,例如学生成绩来衡量教师专业发展活动的效果。随着标准化考试被全球各国的教育系统采纳,越来越多的国家开始采用学生的考试成绩为教育政策的制定、学校的问责、教师的考核和日常行政管理工作提供数据支持(Lingard et al.,2013)。20 世纪60 年代就有国家和地区使用增值评估的方法来评价学校教育对学生学业的影响。随着西方国家教育问责制的普遍实施,教育增值模型从学术领域进入了政策实践领域,已经成为教育问责的重要工具。例如,2002 年美国通过《不让一个孩子掉队》法案,要求各州测试学生阅读和数学成绩并对学校进行问责。于是,美国许多州开发了自己的教育增值模型,州政府采用模型评估结果对公办学校乃至教师实施问责。再例如经济合作与发展组织(OECD)主导的教育系统国际指标项目(Indicators of Education Systems)也将增值评估的方法纳入国际教育指标系统中。

第二类是收集和分析教师专业发展活动的“特征”及其效果。面对各类正式和非正式的教师专业发展活动,部分研究者主张聚焦于高质量的、有效的专业发展活动特征,进而收集相关的数据,对专业发展活动与教师教学和学生学习之间的趋势性、相关性和有效性进行描述和分析(Kennedy,1998;Garet et al.,2001;Penuel,2007;Yoon et al.,2007;Desimone,2009;Darling-Hammond et al.,2017)。尽管目前对高质量的、有效的专业发展活动的特征暂无明确统一的定义,但支持者认为根据以往的理论、质性和实证研究,已经能够总结出得到广泛认可的特征。其中,Kennedy(1998)根据专业发展活动的内容特征进行分类,分析了不同类型的专业发展活动对学生学习的影响①。此后,Yoon et al.(2007)回顾了1300 多项教师专业发展活动对学生成绩影响的研究,采用了Kennedy 对专业发展活动的分类,对其中9 项符合有效教育策略资料库(What Works Clearinghouse)标准的实验研究的有效性进行了分析。此外,也有一部分研究对某个大型的教师专业发展活动的有效性进行评估(Garet et al.,2001;Penuel,2007)。例如,Garet et al.(2001)基于对高质量专业发展活动的共识,设计了一套问卷对全国1027 名参加联邦艾森豪威尔专业发展项目(Eisenhower Professional Development Program)的教师进行调查,分析该专业发展活动的结构和核心特征的有效性②。在前期综述研究的基础上,Darling-Hammond et al.(2017)回顾了过去三十年聚焦于教师专业发展对学生学业成绩影响的实证研究,尤其是那些发现教师专业发展对学生学业有积极影响的研究,从中提炼出了七个被广泛认可的特征,包括聚焦课程内容、融入主动学习、支持协作、示范和模范、专家指导和支持、反馈和反思以及具有持续性③。

然而,此类研究存在一定的局限性。首先,由于专业发展活动的实施是有选择性的(例如,项目会选择更加积极和配合的学校和教师,或选择更加有需要的学校和教师),同时教师也会根据自身的基础和需求选择更加合适的项目,因此专业发展活动的实施效果因学校和教师本身的特质而有差异,最终的结果不完全是由专业发展活动所带来的。其次,大部分研究是基于教师自我汇报的结果,而非基于课堂观察、测试、活动日志等更加客观得出的结果,会对效果的估计造成偏差。因此,更加准确的估计就需要对同一项专业发展活动在不同学校、不同培训者和接受培训的群体之间进行比较。然而大多数有效的专业发展活动的研究项目规模不大,因此缺乏大规模推广的结果对比,也就可能导致对项目的评估结果截然不同。

第三类研究是为了解决第二类研究的局限性,采取“随机实验”的方法评估教师专业发展的效果。随机实验原本是医学研究监测药物效果的手段,其基本方法是将研究对象随机分组,对不同组实施不同的干预,以对照效果的不同。社会学领域的随机实验核心在于利用实验的操作技巧(如随机化被试、控制相关变量),来评估变量之间的因果效应,从而对现实世界所发生的事件之间的联系给出科学的检验(罗俊等,2015)。20 世纪30 年代,随机实验方法被用于农业生产领域。20 世纪下半叶,一些国家的政府开始推动大规模的社会实验。最早的一项教师专业发展活动的随机实验是20 世纪70 年代末Good et al.(1983)对美国教育学会(National Institute for Education)支持的密苏里州有效数学教学项目的评估。随后,也有其他研究者开始采用随机实验的方法评估专业发展的效果(Carpenter et al.,1989)。这些研究通过实验的方法,部分证实了之前经验研究认为的有效的教师专业发展活动特征确实起到了积极的作用。2002 年美国联邦政府通过的《不让一个孩子掉队》法案提出教育政策需要有符合科学标准的研究支持(scientifically based research),并强调优先考虑采用随机实验研究的成果。教育科学研究学会也在其教育研究基金的申请标准中加强了对教育实证研究和实验研究的导向(U.S. Department of Education,2002;IES,2012)④。受此影响,后来涌现出了一大批教师专业发展活动的研究,致力于采用随机实验的方法发现有效的、可推广的专业发展活动。

总的来说,教师专业发展有效性的实证研究方法在不断发展,研究者和实践者不满足于仅评估单个教师专业发展的效果和关键特征,还想要对项目的外部有效性以及不同项目之间的有效性进行比较。Borko(2004)在其具有较大影响的一篇文章中将教师专业发展有效性的研究分为三个阶段。第一阶段的研究主要关注单一地点实施的某一项教师专业发展活动,其主要目的是确认该专业发展活动是否具有可行性,是否有效提高教师的教学水平和学生的学习效果。第二阶段的研究主要关注多个地点同时实施的某一项专业发展活动,其主要目的是确认该项专业发展活动在不同的情境中由不同的培训者实施的时候是否能够保持有效性。第三阶段的研究关注的专业发展活动开始扩展到对多个地点实施的多个项目进行比较,其主要目标是对不同类型的专业发展活动的实施过程、效果以及所需要的资源进行比较,其结果为相关政策的制定和公共资源的配置提供支持。

为了对单项和多项教师专业发展活动进行评估和比较,需要对项目各要素和环节有更加清晰的定义,建立一个将项目各要素、过程和结果联系起来的逻辑框架。很多学者尝试构建教师专业发展如何影响教师知识、技能、观念和态度并最终影响学生学习效果的理论框架。Kennedy(1998)将专业发展活动的影响路径分为三类:第一类路径注重改变教师特定的教学行为,从而改变学生的学习;第二类路径注重改变教师的知识,从而改变教师特定的教学行为和学生的学习;与第二类路径相似,第三类路径也注重改变教师的知识和教学行为,但对教学行为不做过多详细要求。与Kennedy 归纳的第一类专业发展活动的逻辑类似,Supovitz(2001)提出高质量的专业发展活动是通过改变教师的课堂教学行为,从而促进学生的学习。Guskey & Sparks(2002)认为有效的教师发展活动不仅改变教师的行为,也改变教师的知识。Yoon et al.(2007)的研究认为教师的专业发展分两步影响学生成绩,即教师的专业发展首先是提高教师相关的知识技能,然后是提高教师课堂教学实践,最后才能提高学生成绩。在回顾以往研究的基础之上,Desimone(2009)提出了一个教师专业发展有效性研究的概念框架,该框架概括了教师专业发展的关键特征、教师知识和理念、课堂实践与学生成绩之间的相互影响的关系(图1)⑤。

图1 教师专业发展有效性研究的概念框架

首先,教师参加专业发展活动;其次,专业发展活动增长了教师的知识和技能,改变其态度和理念;再次,教师用新知识和技能或转变了的态度和理念来改善教学内容或教学方法,或两者兼而有之;最后,教学改变促进了学生的学习。该框架可以从教师的转变(如专业发展改变教师知识、理念或实践)和教学改进(如改进教学实践影响学生成绩)两方面来检验专业发展的有效性,而这两个方面对理解专业发展如何产生影响均不可或缺。除了教师专业发展的关键特征、教师知识和理念、课堂实践与学生成绩以及这四部分要素之间的相互关系之外,框架中还包括一些个人、机构和环境因素:(1)学生的个人和学术特征;(2)教师的个人、专业背景特征,也包括教师的经验、知识、信念、态度等;(3)班级、学校、学区等环境因素;(4)各层级政府和相关政策环境。

尽管对什么是有效的教师专业发展没有统一的定义,大量关于教师专业发展如何影响教师自身和学生学习的实证研究也并没有使用完全一致的影响路径,图1 的概念框架也没有囊括所有可能影响专业发展有效性的要素,例如教师专业认同、专业团体协作、校长领导力等要素在支持专业发展中的作用,但图1 的框架仍旧提供了研究之间相互探讨的基础。首先,该框架基本上包含了教师专业发展活动有效性研究的基本要素,使得研究观察和测量的指标相对一致和稳定,并为相关的实证研究提供了讨论和对话的基础。其次,该框架为聚焦教师专业发展有效性研究的计划和时间线的制定提供了一定的指导,即从教师专业发展活动到活动对教师知识、信念、态度的影响和改变,进一步改变了教师的教学实践,从而影响了学生的学习和学业成就。最后,在共同的框架和研究基础之上总结的有效专业发展的要素、特征和影响机制能够为实践者提供更多的信息,可以帮助学校和教师设计更加有效的专业发展活动。

(二)国内教师专业发展的实证研究

目前国内对教师专业发展活动的实证研究大致可分为三类:一是描述和分析教师专业发展活动现状,包括教师对专业发展活动的需求和评价、专业发展活动的供给情况以及专业发展活动的城乡和地区差异;二是探讨影响教师参与专业发展活动个人层面和组织机构层面的因素,提出教师的自我意识、教师专业共同体、学校的组织因素以及教师专业培训和教研体系特征等,都会影响教师的专业发展活动;三是将教师专业发展活动与教师知识技能、课堂教学实践以及学生学业成绩的变化联系起来,检验教师专业发展是否有效影响了教师自身的知识、态度和实践以及学生的学习结果。

1. 教师专业发展活动的需求情况

(1)教师的类型

不同类型的教师对专业发展活动的需求程度不同,穆洪华(2018)基于2014 年中国基础教育质量监测7 个省市的数据,对公办小学教师培训情况进行分析后发现:从学历来看,学历越低的教师,其对专业发展活动的需求越高;从教龄来看,新教师对培训的需求更高;从学科来看,不同学科教师的需求度也不同,就主科(语文、数学、英语、科学)而言,科学教师的需求要远远高于其他三科教师;从城乡来看,我国乡村教师对教师专业发展迫切需求的比例要高于城镇,乡村教师更加需要专业发展活动(李琼等,2018)。

(2)培训内容

大量研究表明,教师最需要的培训内容是学科教学方法。越贴近教师实践的知识与技能,越被教师认为是最需要的。李琼等人(2018)的研究发现,城乡教师对学科教学法知识方面的培训需求更大。李琼等人(2013)对北京市教师的调查发现,学科教学法与学科前沿知识是教师最需要研修的内容。同样,赵明仁等人(2009)对北京市中小学教师专业发展活动的调查发现,超过半数的教师认为自己目前最需要进修的内容是学科教学方法。陈向明和王志明(2013)对全国9 省中小学教师的调查发现,教师最希望从培训中所学到的内容是教学方法及策略。朱小虎和张民选(2017)对TALIS 数据的分析也发现,上海教师最为需要的两个专业发展内容分别为个性化学习的教学方法和学科教学能力培训。

除了学科教学方法外,教师对学生发展相关内容培训的需求也十分强烈。陈向明和王志明(2013)的研究发现,教师对学生发展和心理健康培训的需求仅次于教学方法和策略。蔡金花和曾文婕(2018)对初中教师的调查也发现,教师对于深入了解学生发展特点的培训需求相对较强。柯政和洪志忠(2011)对中学教师的调查发现,教师参加培训意愿最高的是有关学生学习和发展的专业发展活动。

(3)培训形式

教师对培训形式也存在明确的需求指向性。教师更愿意接受通过团队研讨性的活动来提升专业发展水平,教师需求最强烈的培训形式是教学观摩研讨和同事间的交流。蔡金花和曾文婕(2018)的研究发现,观摩他人教学并在课后进行研讨、与同事分享经验以及讨论问题是初中教师认为最想参加的教研活动形式。李琼等人(2013)的研究也发现,从教师对日常教研活动形式的满意度与有效性来看,教师感到最有效的是跨校、跨区教学观摩研讨,其次是同事之间的随时交流。

需要注意的是,不同阶段教师对培训形式的需求可能存在差异。蔡金花和曾文婕(2018)发现5 年以下教龄的教师对观摩他人教学、与同事分享和讨论的需求特别强烈。相比之下,5—10 年教龄的教师对于专家讲座和课题研究的需求比其他教龄的教师要强烈。这与崔允漷(2011)的研究发现一致:中高职称教师对听专家报告和做课题研究这两项专业发展活动持有较高水平的认可。

2. 教师专业发展活动的供给情况

教师最需要的专业发展活动内容是学科教学方法和学生发展,最需要的专业发展活动形式是教学观摩和研讨。而在实际供给上,从培训内容来看,供给最多的也是学科知识和教学方面的相关培训。朱小虎和张民选(2017)对TALIS 数据的分析发现,所教学科领域的知识和理解以及教学能力是上海教师专业发展活动中最为重要的内容。薛海平和陈向明(2012)通过全国范围的调查发现,教师认为自己接受最多的培训内容是教育教学理论、学科教学、教学方法及策略、班主任工作和学校及课堂教学管理。培训内容的供给基本上满足了教师需求。从培训形式来看,李琼等人(2018)的研究发现,城乡教师参与率最高的教研形式是“工作坊或日常备课和公开课研讨”。朱小虎和张民选(2017)对TALIS 数据的分析发现,上海教师参与率最高的教研形式是课程工作坊、带教和相互观摩。薛海平和陈向明(2012)通过全国范围的调查发现,在被调查者接触的培训中,最常见的几种培训方法是集中讲授、听课评课与录像观摩。培训形式的供给也能够满足教师的需求。

限于调查数据所覆盖的范围,大部分针对教师培训和专业发展的差异分析仅局限在部分省市。例如李琼等人(2018)基于5 个省的项目市县的乡村学校教师调查,采用TALIS 中的教师专业发展工具,分析教师对专业发展的需求以及影响发展有效性的因素。穆洪华(2018)基于2014 年中国基础教育质量监测7 个省市的数据分析了这些地区教师专业发展活动是否具备有效教师专业发展的特征要素。薛海平和陈向明(2012)调查全国9 省市中小学教师培训现状,采用多阶段分层随机抽样对中小学教师以及教师培训者进行了问卷调查。王艳玲和胡惠闵(2020)、谢晨和尹弘飚(2021)是少数基于全国各省的教研机构和教师调查的数据,对教研和教师专业发展活动的开展情况进行分析的研究。其中,Yin et al.(2020)基于全国范围内教研员的抽样调查,对作为教师专业发展活动的主要提供者教研员的工作特征和专业发展需求进行了分析。谢晨和尹弘飚(2021)基于全国30 个省级行政区47620 位中小学教师对本区县教研工作开展的评价,构建并计算了各省的教研工作质量指数和教研发展均衡指数,发现基于教师评价的教研和专业发展活动在地区之间存在较大差异,既有以上海、浙江、辽宁等为代表的高质量、高均衡省份,也有北京、天津、山东等高质量但均衡较低的省份,此外中西部地区还存在大量低水平、低位均衡的情况。

3. 影响教师参与专业发展活动的因素

教师参与专业发展活动面临着各类主客观因素的挑战,大致可分为教师个人因素和组织机构因素两类。例如,王双龙(2017)的研究发现,教师的自我意识会显著影响教师的专业发展水平,教师的自我意识程度越高,投入自身专业发展的积极性越高。李琼等人(2018)发现,“与工作时间冲突”是阻碍城乡教师参与专业发展活动的最重要的两个因素之一,而“项目或课程过于昂贵”是乡村教师参与专业发展活动的最大障碍。也有研究表明,个人所在的情境因素,例如学校支持氛围也会影响教师参与专业发展的意愿和程度(王双龙,2017)。谢晨和尹弘飚(2021)则从教研机构的设置、教研队伍、经费保障和工作方式等分析影响一个地区教研和专业发展活动的因素,发现教研员队伍的经验和规模以及更加专业化的领导对教研和专业发展的质量提升有显著的影响。

4. 教师专业发展活动有效性的实证研究

与国外的研究相似,针对教师专业发展活动效果的研究较多以教师本身的知识、技能、观念和自我效能为衡量效果,较少关注对学生学习效果的影响。目前,在专业发展活动有效性的研究中与本文较为相关的有三项:托马斯等人(2015)基于中国东西部三个地级市2009—2012 年303345 名普通高中毕业生、任课教师和校长的数据,检验了专业学习共同体和教师发展因素对学生学业成绩的增值影响。结果显示,教师专业发展因素和学生学习成绩之间具有正向相关性,尤其是“参加正式专业发展培训活动”“同事间非正式的改进教学的交流”“参加相关课题研究”和“参加主要教授科目教学策略和方法培训”。张文静等人(2010)以房山区42 所小学的1238 名四年级学生和42 名数学教师为研究对象,考察教师的特征变量、教学方式和教师培训三个方面对小学四年级学生数学学业成绩增长的影响。教师培训包括是否参加过新课程培训、教师间是否经常讨论教学问题、教师共同准备材料或者备课、教师间相互听课/评课、教师参与教研活动的频繁程度。结果显示,与教师培训相关的变量和学生学业成绩的增长几乎没有显著关系。赵健等人(2013)基于对我国教师专业共同体导向的专业发展实践的关注,在5 个城市的59 所学校、119 个班级、5066 名学生的成绩和问卷数据以及581 名教师问卷数据的基础上,考察教师专业发展实践特征及其与学生学业成绩的关系。基于“教师专业发展即参与学习共同体”的假设,作者主要关注备课、培训参与、听评课和教科研参与四个方面的教师专业发展实践⑥。研究通过描述性统计揭示了教师参与教科研的总体状况,但没有对教科研参与情况与学生成绩之间的关系作进一步分析。

除了以上三项研究之外,还有部分研究基于国际大型教育质量监测项目,例如国际学生评价项目(PISA)、国际数学与科学趋势比较研究(TIMSS)和教师教学国际调查(TALIS)对教师专业发展活动的有效性进行国际比较分析。例如谢敏等人(2008)采用TIMSS 数据比较了日本、瑞典、美国、中国香港地区的教师资格和职业发展对学生成绩的影响;陈纯槿(2017)基于TALIS 数据分析了教师参与专业发展的影响因素,发现影响教师专业发展有效性最主要的因素是教师的合作文化;李勉等人(2018)基于PISA、TIMSS和PIRLS 数据,分析教师特征和专业发展与学生成绩的关系。但由于数据的限制,以上国际比较分析并没有涉及中国大陆地区。

综上,在目前国内有关教师专业发展活动有效性的研究中,尤其是检验教师专业发展活动对学生成绩的增值影响的研究中,对教师专业发展活动的各方面因素都有所涉及,但尚未有研究将区域教研作为一个整体,将包括区级和校本在内的各类教师专业发展活动与学生的学业成绩相互联系起来,探讨区域教研活动对学生学业成绩影响的实证研究。

(三)基本分析框架

本文尝试在Desimone(2009)研究总结的理论框架的基础上(图1),结合国际教师调查对教师专业发展活动的概念框架和指标,构建针对区域教研对教师和学生成绩影响的分析框架。目前全球通用的有关教师专业发展、教师效能、教师教学实践及课堂行为等相关数据的调查问卷主要包括:TIMSS、PIRLS、TEDS-M 和TALIS 等⑦。其中TALIS 是经济合作与发展组织(OECD)研发的对教师专业发展、教学理念及实践和教师工作环境进行调研的国际项目。该项目力图通过问卷方式了解各国和地区教师的专业准备、入职培训、专业发展、教学信念与实践、教师评价、校长领导力、学校氛围与支持等方面的情况。上海是中国内地首个参加2013 和2016 年TALIS 调查的地区。根据研究目的,本文主要采用了TALIS 作为教师专业发展问卷的基本框架(表1)。

表1 TALIS 调查问卷基本框架

根据教师专业发展有效性研究的概念框架和TALIS 调查问卷基本框架,图2 构建了本文“投入—过程—产出”的概念框架。其中投入主要包括教师专业特征和教师专业发展两大主题。教师专业特征主要包括教师受教育背景、工作满意度和动机、自我效能。教师专业发展主要包括区级教研活动和校本教研活动。过程包括教师知识技能、教学实践以及相应的课堂环境和学校环境。在产出部分,本文主要关注的是学生学业成绩。区级和校本教研活动对学生学业成绩的影响路径如下:(1)在投入端,教师参与不同类型的区级和校本教研活动;(2)在过程端,教研活动提升了教师的知识技能,而知识技能的提升影响了教师课堂教学实践,提升了教师的自我效能,这一过程在相应的课堂和学校环境中发生;(3)在产出端,过程端的教师知识技能、教学实践的提升促进了教师自我效能与工作满意度的提升,也促进了学生学习和学业成绩的提升。

此外,各主题之间存在大量潜在的关系,这些关系可能是单向的,例如我们可以预期受教育背景会影响教师的教学实践,但教师入职之后的教学实践不大可能反向影响受教育背景。而另一些因素之间的关系则可能是双向的,例如教师参与教研活动会影响教师的实践,但这些实践也会影响对教研活动的需求、设计和实施。教师的课堂教学实践在课堂和学校环境中发生,同时也影响了课堂环境和学校氛围,学校环境既塑造教师专业实践,也由教师专业实践塑造。

表2 为教师问卷的基本框架。问卷包括6 个部分:(1)教师背景信息包括教师的年龄、性别等个人背景和学历、专业训练等教育背景;(2)工作情况包括职位、工作经历、教学及非教学时间安排;(3)教学情况包括课堂教学实践、与同事交流合作和与教学实践相关的自我效能;(4)教师专业发展包括教师参加的区级常规教研活动、区级专题教研活动和校本教研活动;(5)评价与反馈包括教师自身、同事、学校管理者和区教研员的评价,以及评价对教学实践和学生成绩的影响自评;(6)学校氛围和支持包括学校对教师发展的支持、对教研活动的支持,教师的职业认同感、学校归属感、工作压力和倦怠感。

图2 本文概念框架图

表2 本文调查问卷基本框架

三、数据和分析方法

(一)数据来源

本文使用的数据主要分为三个部分:一部分是2016—2019 年参加高考的42127 名高中学生成绩和选课数据。表3 为样本学生的分布情况,每一届在10000 人以上,其中文科为2500—2700 人左右,理科为7700—8100 人左右⑧。除了学生成绩和选课数据之外,本文使用的第二个数据为教师问卷数据。2019 年2—3 月课题组向参与教研活动的数学、语文、化学三科教师发放区域教研参与情况调查问卷。此次调查共有1974 名教师提交了问卷,其中语文教师占47%,数学37%,化学16%。第三,本文基于学生选课信息将教师数据与学生数据进行匹配,建立了包含学生基线成绩、出口成绩和相应学科任课教师信息的数据。

表3 样本学生的分布情况

(二)分析方法

基于学生成绩和教师问卷数据,本文主要关注三个方面的问题:首先,对数学、语文和化学三科教师参与教研活动,包括区级和校本教研活动的情况进行描述统计和回归分析,在此基础上采用结构方程模型对教师参与教研的作用进行分析;第二,采用增值评估的方法分析2016—2019 届高三学生的成绩,估计学校和教师对学生成绩的增值作用;第三,基于学生成绩和教师问卷匹配数据,采用增值评估的方法,分析教师专业发展活动参与情况对学生成绩的影响。

增值估计是基于教育生产函数模型衍生出来的增值评价方法,其理念是建立在一个前提假设的基础上,即学校和教师在能够在原有的基础之上增加学生的学业成绩,超出原本期望的部分即学校和教师的增值效应。目前在对学校和教师进行评价的时候,主要使用中考和高考升学率、上线率等指标。虽然中高考等高利害测验在筛选学生方面具有专业性,但仅使用中高考成绩评价学校质量和教师水平存在一些弊端。主要原因之一在于,中高考成绩是学生在初中和高中阶段学习的累积,如果不考虑学生入学时的学业水平,那么结果性评价就不能准确反映学校和教师的作用。增值估计则通过学生基线学业成绩,将学生开始成绩中学校无法作用的因素,如学生的遗传、性别、家庭背景等个人因素进行一定的控制,从而估计学校和教师对学生作出的“增值”影响。此外,增值评价可以在一定程度上分离学校、教师和学生自身因素对学业发展的影响,因此也有助于对学校和教师的影响进行更客观的评价。

具体来说,传统的教育生产函数为分析学生学业成绩产出提供了一个包含学生个人能力、家庭背景、学校和教师投入、同伴效应等各类因素在内的完整分析框架。在研究学校和教师的增值性效应时,我们在教育生产函数中加入了上一学期学生的学业成绩:

其中,An是第n 学期时的学业成绩。C、F、S、T、P 分别代表社区、家庭、学校、教师和同伴的影响, α代表学生个人能力。上标n 的引入意味着第n 学期学业成绩是从初始到当下全部教育投入要素共同作用的结果。A0是初始学业成绩,它的引入在很大程度上缓解了缺乏家庭背景信息、过去教育经历造成的遗漏解释变量问题。

目前,教师增值估计模型被广泛用于中小学阶段教师对学生成绩的增值评估(Jacob & Lefgren,2008;Kane et al.,2008;Hanushek & Rivkin,2010)和教师培训项目和教师专业发展项目的有效性评估(Boyd,et al.,2009;Harris & Sass,2011;Goldhaber et al.,2013)。根据Meghir & Rivkin(2011)对教师增值研究的梳理,增值模型主要分为获得分数(gain-sacore)和滞后分数(lagged-score)两类。本文采用的是滞后分数,也就是将学生的出口成绩作为结果变量,学生的入口成绩则作为控制变量之一。本文的增值分析分为三个部分:第一部分基于学生成绩数据分析不同学校对学生成绩的增值影响,即学校的“打包”增值影响(模型一);第二部分基于学生和教师匹配数据分析教师的“打包”增值影响(模型二);第三部分基于学生成绩数据和教师数据,分析教师参与专业发展活动与学生成绩增值的关系(模型三)。本文的计量模型如下:

1. 学校增值估计

3. 教师专业发展的增值估计

基于学生学业成绩的教师增值模型估计的是教师“打包”增值效果,提供的是教师相对水平信息,因此主要用于探索是否一些教师比另外一些教师有相对更多的进步,但无法进一步识别教师的哪些特征对增值的贡献更大。为了进一步分析教师参与专业发展活动对学生学业成绩的影响,本文采用考虑了学生滞后分数(lagged-score)以及学校固定效应的增值估计模型,此外还包括教师个人和专业背景特征,具体模型如下:

在实际分析中,由于数据的限制,增值估计往往携带有大量的干扰因素,理想的情况应该是分别控制学生的个体特征和学校的资源环境特征。学生的个体特征包括性别、年龄等个人特征,也包括父母受教育程度、职业、收入等反映家庭经济背景的因素,通常根据学生问卷获得相关数据。学校的特征包括学校规模、基础设施等投入和办学条件数据,也包括环境、氛围和管理等数据,通常根据校长问卷获得相关数据。在缺乏相应的数据时,研究常用的处理方法是采用学校固定效应,以控制学校层面不随时间变动的影响因素(Aaronson et al.,2007;Boyd et al.,2009)。在有多科成绩数据时一些研究还采用学生固定效应,以控制学生层面(例如成绩、家庭背景等)的影响因素(Clotfelter et al.,2010;Goldhaber et al.,2013)。在下面估计教师对学生成绩的增值影响时,我们先尝试采用学校随机模型,然后再采用学校固定模型。

(三)教师专业发展活动的衡量

基于本文所关注的区域教研体系下的教师专业发展活动与学生学业成绩的关系假设,我们重点采集区级教研活动和校本教研活动的相关数据。其中,区级教研活动又可分为区级常规教研活动、蕴含有效教师专业发展特征的教研活动和专题教研活动三类。

首先,根据活动的组织形式,区级常规教研活动包含8 个子问题:教材教法、研究课、专家讲座、课题项目研讨、中心组活动、跨学科教研、学术会议、优秀经验和成果分享。根据活动的内容,区级常规教研活动包含9 个子问题:学科课程的整合与开发、学科核心知识与思想方法的理解、学科教学关键问题的确定和解决、单元整体教学、深度学习活动的设计与实施、促进学习的持续性评价、中高考命题方向和命题思路、分析和使用学生评价数据、跨学科能力的教学(如STEAM、批判思维、问题解决等)。我们对每位教师参与区级教研活动的频率做平均值处理,得到每位教师区级常规教研活动的平均参与程度。其次,本文根据Darling-Hammond et al.(2017)总结的有效教师专业发展活动特征,将区级常规教研活动进行了归类,分为聚焦课程内容、融入主动学习、示范和模范、专家指导和支持四项蕴含有效专业发展特征的教研活动⑨。

表4 为教龄5 年以上的教师和教龄5 年以下的教师在各区级常规教研活动组织形式上的参与情况。总体来看,教师参与率较高的包括教材教法分析、研究课、专家讲座、课题项目研讨及分享。教师参与率较低的包括中心组成员活动、跨学科教研、各级学术会议以及优秀经验分享。从教龄5 年以上和教龄5 年以下的教师对比来看,老教师在大部分教研活动形式的参与率上要高于新教师,其中在参加各级学术会议和优秀经验分享上的差距更加明显。这可能是因为老教师从教经验长,经验更加丰富,同时也有更好的资源参与学术会议。

表4 区级常规教研活动参与情况(形式)

表5 为教龄5 年以上的教师和教龄5 年以下的教师在各区级常规教研活动内容上的参与情况。总体来看,教师参与频率较高的教研活动内容为单元整体教学、学科教学关键问题的确定和解决、学科核心知识与思想方法的理解。教师参与频率较低的教研活动内容为跨学科能力的教学、学科课程的整合与开发。对比来看,教龄5 年以上的教师在大部分教研活动的参与率上要高于教龄5 年以下的教师,其中在分析和使用学生评价数据、中高考命题这两项与评价相关的培训内容上差距尤为明显。

表5 区级常规教研活动参与情况(内容)

区级专题教研活动包括“基于学科能力表现的教学改进”“考试评价研讨”和“深度学习”三项专题教研项目。表6 为区级专题教研活动参与情况。“基于学科能力表现的教学改进”项目是地区教师进修学校与师范大学合作开展的项目。该项目基于学科能力构成模型,开发出指向核心内容主题的学科能力发展水平诊断工具,对学生的学科能力发展水平现状进行诊断,聚焦问题、反思教学、开展教学改进实践研究。在参与调查的教师中共1118 名教师参加过“基于学科能力表现的教学改进”项目,总体参与率为57%,教龄在5 年以上的教师有62.4%参加过该项目,教龄在5 年以下的教师仅34.6%参加过该项目。“考试评价研讨”专题教研活动基于评价数据的分析和反馈,帮助教师改进课堂教学,帮助学校改进教学管理,同时促进教研内容和方式的改进。在参与调查的教师中共866 名教师参加过“考试评价研讨”项目,总体参与率为44.2%,老教师参与率显著高于新教师。“深度学习”则是教育部基础教育课程教材发展中心的教学改进项目。在参与调查的教师中共1105 名教师参加过“深度学习”项目,总体参与率为56.4%。同样,老教师的参与率显著高于新教师。

校本教研包含7 个子问题:校内听评课、集体备课、参与校本课程及其他教学辅助材料的开发、就教学中遇到的问题与同事进行研讨、与同事讨论某类学生的学业发展问题、与同事分享教学经验与资源、接受专家指导(包括教研员、大学教学专家等)。首先,本文对每位教师参与校本教研的频率做平均值处理,得到每位教师参与校本教研活动的平均参与程度。其次,根据以往的文献,以上校本教研活动又可分为正式和非正式校本教研两类。本文进一步将校内听评课、集体备课、参与校本课程及其他教学辅助材料的开发以及接受专家指导归为正式的校本教研,将就教学中遇到的问题与同事进行研讨、与同事讨论某类学生的学业发展问题、与同事分享教学经验与资源归为非正式的校本教研。

表6 区级专题教研活动参与情况

表7 为教师校本教研活动的频率。总体来看,教师参与频率最高的正式教研活动为集体备课,有76.5%的教师经常参加(平均值未在表中显示),教龄5 年以上的教师参与频率高于新教师。其次是校内听评课,有51%的教师经常参加,新老教师没有太大差异。相对来说,教师在学校接受专家指导的机会较少,19.8%的教师从不或较少接受专家指导,新教师接受专家指导的机会更少。此外,29%左右的教师从未或较少参与校本课程及其他教学教辅材料的开发,新教师的参与频率低于老教师。从教师与同事的非正式交流来看,频率最高的是与同事讨论教学中遇到的问题,77.7%的教师经常与同事讨论,其次是与同事分享经验和资源以及讨论某类学生的学业发展问题。

四、区域教研活动与教师的教学实践和自我效能

本节主要是从区域教研活动,包括区级常规教研、区级专题教研和校本教研对教师的课堂教学实践、教学评价策略的使用以及与教学相关的自我效能的影响来检验专业发展有效性,此外还探讨了区级教研与校本教研之间的关系。

(一)区级教研与教学实践的关系

基于上述完成调查问卷的教师,我们通过OLS 回归,分析教师的区级教研活动参与情况和课堂教学实践之间的关系。具体模型如下:

TEj为教师j 相关教学实践活动的频率,包括教师课堂教学组织行为、评价策略使用以及与教学相关的自我效能三个部分。问卷中描述教师课堂教学组织行为频率的问题包含13 个子问题,分别是:“总结近期学过的内容”“明确学习目标”“建立新的知识点和以往知识点的联系”“结合日常生活问题或工作来说明新知识的用处”“提出没有明确答案的问题”“要求学生自己决定解决复杂问题的步骤”“归纳、小结课堂学习内容”“组织学生深度参与的体验性、探究性学习活动”“布置学生做需要批判性思维的作业”“布置需要至少一周时间才能完成的大作业”“让学生使用信息技术完成作业”“让学生以小组合作的方式解决问题或完成作业”“让学生不断练习直到掌握学科内容”。选项为几乎不会、偶尔、经常、总是,内部一致性系数(alpha 系数)为0.82。我们将每位教师对13 个子问题的选项求平均值,用以衡量课堂行为的频率,值越大表明频率越高。

表7 校本教研活动参与情况

评价行为包含4 个子问题,分别是:“自行设计单元和学期测试并使用”“除了分数,我还给学生评语反馈”“让学生反思和评估自己的进步”“现场观察学生在特定任务上的表现并提供及时反馈”,内部一致性系数为0.72。

教学相关的自我效能包含11 个子问题,分别是:“让学生相信他们能够学好”“让学生意识到学习的价值”“提出挑战性的问题”“注意培养学生的批判性思维”“激励学习积极性低的学生”“让学生遵守课堂纪律”“明确表达对学生行为的期望”“给学生思考、讨论和表达的机会”“使用多种教学策略”“使用多种评价策略”“使用信息技术辅助学生学习”,内部一致性系数为0.89。我们也对每位教师的评价行为使用频率和自我效能求平均值,值越高表明评价行为使用频率越高、越多样化,与教学相关的自我效能也相应越高。此外,我们也对各个具体的子项目分别进行回归分析。

模型中的 PDj为教师j 参加教研活动的频率,包括区级常规教研、蕴含有效教师专业发展活动特征的区级常规教研以及区级专题教研。 Tj为一系列教师个人和专业特征,包括性别、学历、与学校的劳动关系、职称、教龄、学校职务、奖励和荣誉等。附表A1-A3 为参与问卷调查的教师区级教研活动参与程度和课堂教学组织行为、评价策略的使用以及教师自我效能之间的关系分析结果(参见http://ciefr.pku.edu.cn/upload/Appendix_A1-A4.pdf)⑩。

1. 区级教研活动参与程度和教师的课堂教学组织行为的关系

首先,教师区级教研活动的参与程度与整体课堂教学组织行为水平以及各项课堂教学组织行为之间存在较为显著的正向关系。整体来看,教研活动参与度高的教师,其开展各项课堂教学组织活动的频率也相对较高,尤其是在教学过程中更频繁地“组织需要学生深度参与的体验性、探究性的学习活动”和“布置学生做需要批判性思维的作业”等更加需要学生进行探究性、批判性思考和学习的活动。

其次,就蕴含有效专业发展特征的常规教研活动来看,四类教研活动与大部分教学组织行为都有显著的正向关系,尤其是对“组织学生深度参与的体验性、探究性学习活动”的教学实践的促进。具体而言,参与具备“聚焦课程内容”要素教研活动较多的教师在教学过程中更加频繁地“归纳、小结课堂学习内容”以及“明确学习目标”;参与“融入主动学习”较多的教师更倾向于“布置学生做需要批判性思维的作业”,更多地“结合日常生活问题或工作来说明新知识的用处”;参与“有效示范及模范”和“专家指导和支持”较多的教师在教学中则更多地对课堂学习内容进行归纳小结,并“结合日常生活工作来说明新知识的用处”;而参与“专家指导和支持”较多的教师对“归纳、小结课堂学习内容”和“结合日常生活问题或工作来说明新知识的用处”的影响较大。此外,教研员的个性化指导与接受教研员指导的教师课堂教学实践水平也存在正向关系,尤其是提升了受指导教师“组织学生参与体验性、探究性学习活动”的教学实践。

最后,三类专题教研活动与各项教学组织行为之间存在较为显著的正向关系。参与专题教研的教师更加倾向于组织学生进行探究性的学习活动以及布置学生做需要批判性思维的作业。

2. 区级教研活动参与程度和教师的评价策略使用的关系

分析结果显示,参与程度高的教师更加倾向于选择“让学生反思评估自己”和“现场评估并给予反馈”的评价方法。从区级常规教研活动的参与来看,参与程度较高的教师不仅更加倾向于给予现场反馈、让学生进行自我反思,同时也能够更好地通过传统的评价策略,如设计单元学期测验来对学生的学习效果进行评价。从蕴含有效教师专业发展特征的区级常规教研活动的参与来看,参与此类活动的教师也更加倾向于给予及时反馈,促进学生自我的反思和评估。

3. 区级教研活动参与程度和教师自我效能的关系

首先,就区级域教研的整体参与程度来看,参与程度较高的教师更倾向于认为自己在教学过程中能够向学生提出挑战性的问题、使用多种评价策略以及培养学生的批判性思维。而接受更多教研员个性化指导的教师则更倾向于认为自己能够使用多种教学策略。

其次,就蕴含有效专业发展特征的常规教研活动来看,四类教研活动参与水平与教师整体的自我效能之间存在较为显著的正向关系。参与水平较高的教师在使用多种评价和教学策略、提出挑战性问题、培养学生批判性思维方面具有较高的自我效能。

再次,针对三类专题教研活动分析结果显示,参与“学科能力”项目较多的教师更加倾向于在教学过程中使用多种教学策略以及使用信息技术辅助学生学习;参与“考试评价研讨”项目较多的教师认为自己能够更多地使用多种评价策略和教学策略;参与“深度学习”项目较多的教师则认为自己能够更多地提出挑战性问题,并且让学生意识到学习的价值,给学生更多思考、讨论和表达的机会。

4. 区级教研活动的影响路径分析

我们通过结构方程模型来构建教师参与区级教研活动的程度对教学组织行为、评价策略和自我效能的影响路径。图3 构建的模型控制了教师年龄、性别、学历、职称、教龄等的影响,拟合良好(RMSEA=0.056,CFI=0.930,TLI=0.910)。模型对教学组织行为、评价策略、自我效能的解释率分别为27.6%、10.6%和22.1%。根据结构方程的分析结果,区级常规教研对教师教学实践有积极影响。基于活动组织形式衡量的区级常规教研活动对教学组织行为和自我效能的影响系数分别为0.333 和0.324;而基于活动内容衡量的区级常规教研活动对教学组织行为和评价策略的影响系数分别为0.205 和0.246。此外,也可以看出教师的教学组织行为、评价策略和自我效能之间存在着较强的相关性。

图4 构建了蕴含有效专业发展特征的区级教研活动对教学实践影响的结构方程。在控制了上述教师背景特征后,模型拟合良好(RMSEA=0.047,CFI=0.962,TLI=0.949)。模型对教学组织行为、评价策略、自我效能的解释率为19.5%、9.6%和14.9%。结果显示,蕴含有效专业发展特征的区级常规教研活动对教学组织行为、评价策略和教师自我效能三个方面有显著的正向作用,分别为0.383、0.286 和0.343。

图3 区级常规教研活动对教学组织行为、评价策略和自我效能的影响路径

图4 蕴含有效专业发展特征的区级教研活动对教学组织行为、评价策略和自我效能的影响路径

图5 为区级专题教研活动对教学实践影响的结构方程。控制了上述教师背景特征后,模型拟合良好(RMSEA=0.025,CFI=0.987,TLI=0.980)。模型对教学组织行为、评价策略、自我效能的解释率为16.5%、6.7%和8.4%。结果显示,“考试评价研讨”对教师的教学组织行为、评价策略、自我效能有显著影响,其标准化后的影响效应分别达到了0.293、0.191、0.184。可见,“考试评价研讨”相对其他两项活动,更能够积极影响教师进行各类教学组织行为、评价行为的频率,有助于提高教师的自我效能。

(二)不同类型教师参与区级教研活动的差异

根据调查问卷对教师专业发展活动参与情况的描述统计,不同类型的教师专业发展活动,例如区级常规教研、专题教研由于活动开展的目的和目标群体不同,参与的教师存在差异。本节基于教师问卷数据,分析教师的个人、学术和专业背景与区级教研活动参与情况之间的关系,建立模型如下:

模型中的 PDj与上文分类相同,包括区级常规教研、蕴含有效教师专业发展特征的常规教研活动和专题教研活动。 Tj为一系列教师个人和专业特征,包括性别、学历、与学校的劳动关系、职称、教龄、学校职务、奖励和荣誉。本节采用OLS 回归分析。

1. 区级常规教研(形式)

总体来看,学科带头人和获得市/国家教学设计、教学展示奖励的教师的参与度显著高于其他群体,而高级职称教师的参与度则显著低于其他群体。就不同年级的教师来看,参与度总体上不存在显著差异。就学科来看,语文和化学学科教师的平均参与度都高于数学教师。

图5 区级专题教研活动对教学组织行为、评价策略和自我效能的影响路径

具体而言,教师个人专业特征与各项教研活动参与频率之间的关系如下:(1)拥有硕士或博士学位的教师更多参与中心组活动、跨学科教研、学术会议和分享自己的教学经验和成果;(2)师范院校毕业的教师相对于非师范院校毕业的教师,非事业编制的教师相对于事业编制的教师,在其他个人和专业背景相似的情况下,在区域常规教研活动的参与上没有显著的差异;(3)与其他教师群体相比,资深教师更多参与教材教法研讨,而更少参与课题项目研讨和跨学科教研;(4)高级职称教师相对于其他群体教师较少参加区域教研,主要在研究课、课题项目讨论和跨学科教研等几个方面与其他教师群体相比显著偏少;(5)学科带头教师以及获得教学设计、教学展示奖励的教师则更多地参与到课题项目研讨、中心组活动、跨学科教研、学术会议及成果分享等区域教研活动中。

2. 区级常规教研(内容)

在参与的区级教研活动的主要内容方面,资深教师和获得市/国家教学设计、教学展示奖励的教师的参与度显著高于其他群体,而高级职称教师的参与度则略低于其他群体。各年级教师的参与度总体上不存在显著差异。就学科来看,语文教师的平均参与度高于数学教师,而化学教师则没有显著差异。

具体而言,教师个人专业特征与各项教研活动参与频率之间的关系如下:(1)在其他个人和专业背景相似的情况下,本科生或研究生、非师范生或师范生、非事业编或事业编教师在各类教研活动的参与程度没有显著的差异;(2)高级职称教师相对于其他群体教师较少参加教研活动,在单元整体教学、深度学习活动的设计实施、促进学习的持续性评价几类活动的参与度上显著低于其他教师;(3)与高级职称教师不同的是,在理解学科核心知识思想方法、确定与解决学科关键问题、单元整体教学以及中高考命题等几类活动的参与上,教龄长的教师参与度相应更高;(4)获得教学设计、教学展示奖励的教师在几乎所有类型的教研活动的参与度上都显著高于其他教师。

此外,在教师个人专业特征与蕴含有效专业发展特征的教研活动参与频率之间的关系上,与专题教研活动类似,最相关的教师个人专业特征是教龄和教师获奖情况。

3. 区级专题教研

除了常规性的区级教研活动,本文还针对“基于学科能力表现的教学改进”“考试评价研讨”和“深度学习”三项专题教研项目的参与情况进行分析。总体来看,与专题教研活动参与程度最相关的教师个人和专业特征是教龄和教师获奖情况。在其他个人和专业背景相似的前提下,教龄和专题教研活动的参与度之间呈现倒U 型分布,教龄越大的教师参与度越高,但随着教龄逐渐增加,参与度重新回落。而获得市或国家研究课、教学设计、教学展示等奖励的教师在三项专题活动的参与频率上都显著高于其他教师群体。从教师的职务来看,除了学科带头教师更多地参与到考试评价的项目中外,骨干教师和学科带头人参与专题教研活动的程度与其他教师不存在显著的差异。而没有任何学校职务的教师较少参与到各类专题学科教研活动中,其中深度学习和学科能力两个专题项目的参与程度更是显著低于其他有学校职务的教师。此外,就学科来看,相对于数学教师而言,语文和化学教师参与三类专题教研活动的程度明显更高,而化学教师除了考试评价项目的参与度要低于语文教师外,在学科能力和深度学习方面的参与度都要显著更高。

除了常规性、专题性教研活动,我们还询问了教师接受教研员对课堂教学的个性化指导的频率。结果显示,教龄较长的教师、骨干教师和学科带头人接受个性化指导的频率显著更高,而没有担任学校职务的教师、非事业编教师获得区教研员个性化指导的机会和频率都显著少于其他教师群体。

根据本节的分析,在区级常规教研活动中参与度较高、较为活跃的几个群体包括拥有研究生学历的教师、资深教师、学科带头人以及教学设计、展示等获得市及以上奖励的教师,而骨干教师、高级职称教师相对于其余教师而言不存在太大的差异。在教师群体中,就研究生学历的教师而言,在常规教研活动中,具有研究生学历的教师更多地参与到需要参与、融入和研究性质的教研活动中。就教龄而言,在常规教研活动中,教龄相对较长的教师更多参与教材教法研讨,而更少参与课题项目研讨和跨学科教研;在专题教研活动中,教龄越大的教师参与度越高。就学科带头教师而言,在常规教研活动中,他们更多地参与到需要主动参与和研究性质相关的教研活动中。而获得教学设计、展示奖励的教师在几乎所有类型的教研活动的参与度都显著高于其他教师。

(三)区级专题教研效果的主观评价

根据参加过专题教研活动的教师对效果的评价,我们对“基于学科能力表现的教学改进”“考试评价研讨”“深度学习”对教师知识技能提升的效果进行了描述统计(见图6)。其中,参与了“基于学科能力表现的教学改进”项目的教师对该项目提升知识技能的效果评价较积极,超过80%的教师认为项目效果较好或非常好。但需要注意的是,有17.2%的教师认为项目对把握学生能力发展的进阶情况(年级、水平)的效果一般。

图6 “基于学科能力表现的教学改进”项目知识技能提升效果评价

图7 表明,参与了“考试评价研讨”项目的教师对该项目的知识技能提升效果的评价较积极,超过80%的教师认为项目效果较好或非常好。在这些评价标准中,项目对帮助教师命制较高质量的阶段测试试题的效果相对其他方面的评价更低一些,16.3%的教师认为效果一般。

图8 显示,参与过“深度学习”项目的教师对项目提升知识技能效果的评价较积极。相对来说,“深度学习”项目对持续开展促进学生学习的评价和持续开展与学习活动融合的评价这两方面的效果较一般,分别有20.3%和20.5%的教师认为效果一般。

图7 “考试评价研讨”项目知识技能提升效果评价

图8 “深度学习”项目知识技能提升效果评价

(四)区级教研与校本教研的关系

首先,本节基于教师问卷数据,分析教师的个人、学术和专业背景与校本教研活动参与情况之间的关系。其次,本节进一步分析了区级教研与校本教研活动参与情况之间的关系。最后,本节通过结构方程模型来构建校本教研在区级教研和教学实践、自我效能之间起的中介作用模型。

其中, S ch_PDj为校本教研,包括校内听评课、集体备课、参与校本课程及其他教学辅助材料的开发、就教学中遇到的问题与同事进行研讨、与同事讨论某类学生的学业发展问题、与同事分享教学经验与资源、接受专家指导(包括教研员、大学教学专家等)。 Dis_PDjφ 为区级教研活动。 Tj为一系列教师个人和专业特征,包括性别、学历、与学校的劳动关系、职称、教龄、学校职务、奖励和荣誉。本节采用OLS 回归分析。

1. 校本教研参与情况

首先,我们将教师校本教研活动参与频率作为结果变量,分析教师的个人和专业背景特征与校本教研活动参与频率的关系。总体来看,非事业编教师相对于事业编教师、没有学校职务的教师相对于有一定职务的教师,其校本教研的平均参与程度显著更低。另一方面,学科带头人、获奖教师以及研究生学历的教师相对于其他教师群体,其平均参与程度显著更高。

具体到教师个人专业特征与各项校本教研活动参与频率之间的关系上,师范院校毕业的教师和学科带头人更多地参与到听评课活动中,而研究生学历教师、骨干教师和获奖教师更多地参与校本课程、教辅材料的开发。就与同事研讨教学问题、学生发展问题、分享经验和资源等非正式的专业交流活动来看,男教师和非事业编教师的参与度要低于女教师和事业编教师,教学经验更丰富的教师会更多与同事分享经验和资源,而学历、学校类型、职称、是否骨干教师或学科带头人等都没有显著差异。不过没有担任任何学校层面的职务(例如班主任、年级组长、备课组长、教研组长、主任、校长等)的教师在校本课程材料开发以及与同事交流方面都要低于担任职务的教师,这从侧面说明了校本教研活动不仅受到个人性别、受教育程度等影响,也受到学校组织安排的因素影响。

2. 区级教研与校本教研的关系

附表A4 为区级教研活动和校本教研活动参与情况之间的关系(参见http://ciefr.pku.edu.cn/upload/Appendix_A1-A4.pdf)。结果显示,在区级教研活动与校本教研活动的参与程度之间存在着十分显著且稳定的正相关关系。这种关系不仅体现在校本教研的平均参与程度上,体现在听评课、集体备课、接受专家指导等各项正式的校本教研活动的参与程度方面,也体现在与同事研讨教学问题、学生问题、分享教学经验等各项非正式的交流活动中。尤其是在接受专家指导和参与校本课程、教辅材料开发这两项活动方面,与区级教研活动的关系尤为紧密。

3. 校本教研的中介作用

我们构建了校本教研在区级教研活动中对教师教学实践影响的中介模型。我们将区级教研活动分为区级常规教研、蕴含有效专业发展特征的教研和专题教研三类,将校本教研分为正式的校本教研和非正式的校本教研,根据分类对各子项进行平均值处理。图9 构建了校本教研活动在区级常规教研和教学实践间的中介模型,模型拟合可以接受(模型拟合结果为RMSEA=0.060,CFI=0.912,TLI=0.888),模型对校本教研、教学组织行为、评价策略、自我效能的解释率为18.4%、52.3%、28.9%和49.3%。采用偏差校正的非参数百分位Bootstrap 法抽样1000 次计算校本教研在区级常规教研(形式)和教学实践间的中介效应,表8 显示其95%的置信区间分别为[0.035, 0.313]、[0.032, 0.446]、[0.045,0.435],表明校本教研在区级常规教研(形式)和教学实践间起中介作用,不同组织形式的区级常规教研活动参与率会首先影响校本教研,进而间接影响教师的教学组织行为、评价策略和自我效能。

图10 为校本教研活动在蕴含有效专业发展特征的区级教研和教学实践间的中介作用(模型拟合结果为RMSEA=0.056,CFI=0.939,TLI=0.919),模型对校本教研、教学组织行为、评价策略、自我效能的解释率为9.0%、50.0%、29.0%和48.0%。采用偏差校正的Bootstrap 法直接对校本教研在区级常规教研与教学实践间的中介效应进行检验,表9 显示其95% 的置信区间分别为[0.046, 0.111]、[0.039,0.103]、[0.062, 0.140],校本教研在其中起着部分中介作用,即区级常规教研通过影响教师校本教研的参与程度,间接影响教师教学实践。其次,区级常规教研对教师教学实践和教师自我效能存在直接的正向的作用,区级常规教研对教学组织行为、评价策略、自我效能标准化后的直接影响效应达到了0.195、0.136 和0.146。

图11 为校本教研活动在区级专题教研和教学实践间的中介作用(模型拟合结果为RMSEA=0.048,CFI=0.949,TLI=0.922),模型对校本教研、教学组织行为、评价策略、自我效能的解释率为11.1%、49.8%、27.7%和45.9%。可以发现,校本教研在其中起着中介作用,“基于学科能力表现的教学改进”“考试评价研讨”“深度学习”三项区级专题教研活动,首先影响教师参与校本教研活动的频率,进而再影响教师的教学组织行为、评价行为以及教师的自我效能。采用偏差校正的Bootstrap 法抽样1000次,以此来对校本教研在区级专题教研和教学实践间的中介效应进行直接检验,检验结果见表10。

图9 校本教研对区级常规教研活动影响的中介作用

表8 校本教研对区级常规教研活动影响的中介作用Bootstrap 检验

图10 校本教研对蕴含有效专业发展特征的区级教研活动影响的中介作用

表9 校本教研对蕴含有效专业发展特征的区级教研活动影响的中介作用Bootstrap 检验

图11 校本教研对区级专题教研活动影响的中介作用

表10 校本教研对区级专题教研活动影响的中介作用Bootstrap 检验

五、区域教研活动与学生成绩

对学校和教师增值效能的分析分为三个部分:第一部分基于学生成绩数据分析不同学校对于学生成绩的增值影响(模型一);第二部分基于学生和教师匹配数据分析教师“打包”的增值影响(模型二);第三部分基于学生成绩数据和教师问卷数据分析教师专业发展活动与学生成绩增值之间的关系(模型三)。

(一)学校的增值评估

1. 学校增值的估计

在评估学校对学生增值成绩带来的影响时,我们使用的是模型一,选取2016—2019 届高三学生数学、语文和化学三门课的模考成绩作为结果变量,并将各科模考成绩与相对应的2013—2016 年的中考各科成绩进行链接,建立包含学生中考和模考成绩的数据库。其中,所有考试得分均经过标准化处理(平均分为0,标准差为1)。

首先,我们根据学生嵌套于学校的数据结构,建立学校和学生的两层零模型,将学生模考成绩的变异分离为学校之内的变异和学校之间的变异;其次,加入学生的中考成绩,看控制了学生的入口成绩之后,学校之间的变异情况。此时学校间的变异就是学校对于学生成绩的增值,这个增值可能为正,也可能为负。根据零模型,样本学生在语文、数学和化学的一模成绩差异有48%、57%和62%为校际间的差异,在考虑了学生的入口成绩之后,可以由学校之间的差异解释的部分降低17%—18%。语文、数学和化学的二模成绩差异有43%、55%和59%为校际间的差异,在考虑了学生的入口成绩之后可以由学校之间的差异解释的部分降低19%—21%。

图12—14 按照各学校数学、语文、化学三科标准化后的学校平均分从低到高依次排列,以及根据模型一估计的学校增值的比较。不难发现,采用增值估计的方法与采用模考平均成绩的方法得出的结果存在一定的差异,尽管斯皮尔曼系数(Spearman correlation)显示两者之间存在高度而显著的相关。首先,各学校之间增值分数的差异要小于模考标准分的差异。增值估计的最大和最小值之间相差2.5 个左右标准差,而模考标准分则相差3.2 个左右标准差。即根据学校对学生增值成绩的影响来看,各学校之间的差异要小于根据一次性考试结果得出的评价。尤其是在高中阶段,在评估学校效能的时候,必须要考虑不同学校的生源差异和原本的教育积累。其次,一部分模考成绩在平均水平之下的学校,其对学生成绩增值带来的影响在平均水平之上。例如,根据数学学科的分析,一部分学校标准化后的平均成绩低于0,而相应的学校增值估计则要高于0。这一类学校为学生带来了比单纯的出口成绩排名更高的增值影响。

图12 模考分数与增值评价的比较(数学)

一般而言,学校的增值分和平均成绩之间存在显著的相关性,但不一定是十分一致的强正向相关。本文根据区域内学校的模考成绩得出了增值分数与最终成绩之间存在着十分强的正相关关系,模考平均分较高的学校给学生的增值成绩带来的正向影响也相对较高,这在一定程度上说明了相对优质的学校最终成绩较高不仅仅是因为这些学校能够筛选出入口(中考)成绩较高的学生,还因为在初始成绩的基础之上给学生带来了相对更大的增值影响。

图13 模考分数与增值评价的比较(语文)

图14 模考分数与增值评价的比较(化学)

表11 和表12 是四类学校的学校增值估计和标准化之后的平均成绩,第1—4 列为增值估计,第5—8 列为模考的标准分。一组学校历年数学、语文和化学一模总体成绩分别为0.76、0.67 和0.67,总体的增值估计分别为0.88、0.82 和0.99。二组学校历年一模总体成绩分别为0.21、0.20 和0.21,总体的增值估计分别为0.48、0.46 和0.62。三组学校历年一模总体成绩分别为−0.34、−0.32 和−0.53,总体的增值估计分别为0.08、0.06 和0.01。四组学校历年一模总体成绩分别为−1.30、−1.17 和−1.52,总体的增值分别为−0.65、−0.61 和−0.71。根据二模成绩计算的四类学校的学校增值估计和标准化的平均成绩的情况与一模类似。

图15 和图16 的趋势显示得更加清晰,可以看出三组学校尽管模考成绩低于平均水平,但学校对学生成绩的增值大于零。

2. 不同增值学校的教师参与教研的情况

根据2016—2019 年学校对学生的平均增值情况,我们将学校分为两类:在相应学科上增值大于0 的学校、在相应学科上增值小于0 的学校。表13 反映了来自增值大于0 和增值小于0 的学校的不同学科教师的区级教研(形式)参与情况。结果表明,对于语文老师来说,高增值学校的语文教师参与“分享自己的优秀经验及成果”的活动频率要显著高于低增值学校语文教师。对于化学和数学教师而言,他们在“中心组成员活动”上的参与率差异达到显著,高增值学校教师的参与率更高。

表11 2016—2019 四类学校的增值估计和标准分(一模)

表12 2016—2019 四类学校的增值估计和标准分(二模)

图15 增值估计与一模标准分

图16 增值估计与二模标准分

表13 学科与各增值学校教师参与率的交叉分析(区级教研—形式)

根据2016—2019 年学校对学生的平均增值情况,我们将学校分为两类:在相应学科上增值大于0 的学校、在相应学科上增值小于0 的学校。表14 反映了来自增值大于0 和增值小于0 的学校的不同学科教师的区级教研(内容)参与情况。可以发现,高增值学校和低增值学校的教师在各项活动的参与率上无显著差异。我们分析了不同组教师参与三类区级专题教研活动的差异,结果显示学校增值大于0 和小于0 的教师,在各项上的参与率和参与程度都没有显著差异(结果没有在正文中呈现)。

表14 学科与各增值学校教师参与率的交叉分析(区级教研—内容)

我们将校本教研分为两个部分,一部分为较为组织化、结构化的校本教研活动,包括校内听评课、集体备课、参与校本课程及其他教学辅助材料的开发以及接受专家指导(包括教研员、大学教学专家等);另一部分是非正式的教师个人交流,包括就教学中遇到的问题与同事进行研讨、与同事讨论某类学生的学业发展问题、与同事分享教学经验与资源。表15 呈现的是来自增值大于0 和增值小于0 的学校的不同学科教师参与校本教研活动的情况。结果显示,若单独看校内听评课、集体备课等校本教研活动的参与情况,两类学校的教师没有显著差异。从正式和非正式两类校本教研活动的平均参与水平来看,增值大于0 的学校的教师参与水平显著高于增值小于0 的学校的教师。

(二)教师的增值评估

1. 教师增值的估计

在评估教师对学生增值成绩带来的影响时,我们使用的是模型二。首先,我们根据学生嵌套于班级和学校的数据结构,建立学校、教师和学生的三层零模型。其次,加入学生的前测成绩、学生毕业年份、文理科等来看变化情况。表16 为调整前零模型和调整后增值模型的ICC 变化情况。根据零模型,样本学生数学和语文模考成绩差异有54.9%和47.2%可由校际间的差异来解释,有65.7%和55.2%可由包括学校差异在内的教师间的差异来解释,有10.9%和8.1%可由学校内部教师间的差异来解释。在加入了学生前测成绩等控制变量之后,可以由学校之间的差异解释的部分降低13.4%和15.5%,可以由包括学校差异在内的教师间差异解释的部分降低14.5%和15.1%,可以由学校内部教师间差异解释的部分降低20.3%和12.7%。

表15 学科与各增值学校教师参与率的交叉分析(校本教研)

表16 调整前零模型和调整后增值模型的ICC 变化情况

表17 是四类学校的教师增值评价结果和标准化之后的平均成绩。第1、2 列和4、5 列为四组学校平均的教师增值分,第3、6 列为模考的标准分。根据有效分析样本,一组学校2016—2019 年平均数学一模成绩为0.771,根据学校随机效应模型估计的教师增值分为0.010,根据学校固定效应模型估计的教师增值分为0.056。二组学校历年数学一模总体成绩为0.206,学校随机和固定效应模型的教师增值分估计分别为0.006 和−0.001。三组学校包括历年数学一模总体成绩为−0.274,学校随机和固定效应模型的教师增值分估计分别为0.002 和−0.004。四组学校历年数学一模总体成绩为−1.225,学校随机和固定效应模型的教师增值分估计分别为−0.022 和−0.011。

表17 2016—2019 四类学校的平均成绩和教师增值估计

学校随机和固定效应模型估计存在一定的差异,其原因在于学校固定效应模型是基于学校内部同一门学科的教师所教学生增值成绩的差异来估计教师增值分。从图17 和图18 来看,两种模型估计的教师增值分趋势更加明显。根据学校随机效应模型分析的结果,三门学科趋势较为相似:前三组学校的平均教师增值为正,第四组为负。根据学校固定效应模型分析的结果,三门学科存在一定差异。就数学来看,第一组学校的平均教师增值为正,其他几组学校都小于零,且第一组学校校内的数学教师增值分差异较大,超过根据学校随机效应模型分析的同一组各学校平均的教师增值分。语文、化学学科存在着类似的情况:第一组学校和第三组学校内部语文教师增值分的差异要超过同一组各学校平均的教师增值分,而化学学科则出现在第三组。在第四组学校,根据学校随机效应模型估计的教师平均增值分与根据学校固定效应模型估计的教师平均增值分在−0.01 到0.02 上下,趋势较为接近,校内教师之间的差异要小于同一组的学校之间的差异。由于学校固定效应模型可以排除学校层面以及学生群体层面(例如平均成绩)的干扰因素,因此,在估计教师专业发展对学生成绩的增值作用时,我们最终选择了带学生前测成绩的学校固定效应模型。

2. 教师增值估计与专业特征之间的关系

首先,基于调查问卷中的教师个人和专业背景特征,我们分析了教师增值分数和教师个人、专业特征之间的关系。表18 根据上文不同类型教师参与区级教研活动的差异分析结果,选择与教学实践和教研参与程度较为相关的一组教师个人和专业特征,分析这些教师个人和专业特征与教师增值估计之间的关系。结果显示,骨干教师、学科带头人,市/国家研究课、教学设计、教学展示获奖教师与教师增值分显著正相关,也即这几类教师给学生带来的增值影响高于其他教师群体。

图17 教师增值评价(一模)

图18 教师增值评价(二模)

表18 教师个人和专业特征与教师增值估计的关系

3. 不同增值教师参与教研的情况

根据教师增值分数的高低,我们将教师分为增值分大于0 和增值分小于0 的两组,然后再根据不同学科和考试类型将教师增值分作五等分,进一步将教师分为最低20% 组、中等60% 组和最高20%组,分析不同组教师教研活动的参与程度。表19 为不同增值组的教师参与区级常规教研活动的情况。

表19 教师增值与区级常规教研活动参与情况

整体来看,按照增值分大于0 和小于0 分成的两组,两类教师群体参与度不存在统计上显著的差异。就两个群体教师区级常规教研活动的参与率来看,增值分高于0 的教师在几乎所有活动类型上的参与率都要高于增值分低于0 的教师。根据增值最低20%,中间60%和最高20%分为三组,三类教师在研究课、课题项目研讨、中心组成员活动、学术会议和分享经验及成果几类区级常规教研活动的参与率上具有显著的差异,高增值的教师组参与率高于中、低增值的教师组。在其余各类活动的参与率上,三组教师不存在显著差异。从参与率的数值来看,高增值的教师组在各类区级教研活动的参与率基本都高于中、低增值的教师组。

表20 为不同增值组的教师参与专题教研活动的情况。结果显示,增值分高于0 的教师在基于学科能力表现的教学改进和深度学习两类项目的参与率上显著高于增值分低于0 的教师。尽管不显著,但增值高分于0 的教师参与考试评价的程度也相对较高。在将教师分为三组后,结果显示中、低增值组教师的参与率较为相近,在考试评价和深度学习上中间组略低,而高增值组教师在三项活动中的参与率都高于中、低组教师。

表20 教师增值与区级专题教研活动参与情况

表21 呈现的是增值大于0 和增值小于0 的两类教师的参与校本教研活动的情况。由结果可知,不同增值的教师在各校本教研具体项目上的参与率没有显著差异。但从数值上看,在个别项目上大于0 的教师要比小于0 的教师略高,高增值的教师参与率也更高。

表21 教师增值与校本教研活动参与情况

表22 将校本教研分为正式和非正式的校本教研两类,结果显示,增值分大于0 的教师在两项上的参与程度都要大于增值分小于0 的教师,而高增值教师在参与度上略高于中、低增值教师,但不存在显著的差异。

表22 教师增值与校本教研活动参与情况(正式和非正式)

(三)教研参与情况对学生成绩的影响

本节我们通过学生的选课信息将教师问卷数据与该教师所教授的学生的成绩数据进行匹配,建立了包含学生中考、模考成绩和任课教师信息的数据。根据这个数据,我们可以在考虑了教师个人和专业特征信息的情况下,探索教师专业发展活动参与情况与学生的成绩增值之间的关系。在“模型三”的基础之上,我们建立模型四如下:

其中, Yijst是s 学校中j 教师所教的t 届毕业学生i 的出口成绩(模考成绩), Yijst−1是学生i 的滞后分数(中考成绩)。 PDjst为学校s 的教师j 参加教研活动的频率,其系数 β2也是本节关注的核心估计值。在回归分析中,本文对每位教师参与区级教研活动的频率做平均值处理,得到每位教师参与教研活动的平均参与程度。教研活动仍旧分为区级教研活动和校本教研活动两类。区级教研包括区级常规教研活动、区级专题教研活动以及有效的教师专业发展活动,其中常规教研活动组织形式和内容包括平均参与程度以及每一项活动的参与程度;校本教研包括校本教研平均参与程度、正式和非正式校本教研的参与程度。

表23 中每一个系数都是回归分析结果中我们所关注的自变量(区级教研活动参与频率)与结果变量(学生成绩增值)的关系,括号中为标准差。每一个回归都控制了教师个人和专业特征,包括性别、学历、与学校的劳动关系、职称、教龄、学校职务、奖励和荣誉等。结果显示,区级常规教研、蕴含有效专业发展特征的区级常规教研、专题教研以及获得教研员个性化指导的频率与学生的成绩增值有显著的正向关系。其中,专题教研活动中的“基于学科能力表现的教学改进”和“考试评价研讨”项目与学生成绩的正向关系尤其显著。而蕴含有效专业发展活动的要素都不同程度地起到了积极的作用,尤以“聚焦课程内容”和“专家指导支持”最为稳定。表24 是基于二模成绩为出口成绩的回归结果,其整体趋势与表23 基于一模成绩为出口成绩的回归结果接近。

表23 区级教研参与程度对学生成绩增值的影响(一模考试)

表25 同样也显示了每一个回归分析结果中我们关注的区级常规教研活动参与程度和学生成绩增值之间的关系。分析采用的是学校固定效应模型,将一模考试、二模考试成绩作为结果变量,中考成绩作为前测成绩,控制变量不变,主要关注区级常规教研活动每一项活动与学生成绩增值之间的关系。总的来看,“学科课程整合开发”“学科核心知识和思想方法的理解”“学科关键问题的确定与解决”以及“单元整体教学”几项聚焦于学科内容的教研活动对学生成绩的增值作用尤其显著。

表26 为校本教研参与程度与学生成绩之间关系的分析结果,同样只显示了每一个回归结果中专业发展活动参与频率的系数。第1、2 列为OLS 分析结果,第3、4 列为学校固定效应模型分析结果。结果显示,校本教研活动的平均参与程度、教师之间正式和非正式的交流与学生的成绩增值有显著的正向关系。根据问卷中7 项校本教研活动的结果来看,参与校本课程教辅材料开发和接受专家指导对学生成绩增值有积极作用。同时,非正式的交流也不容忽视。教师与同事研讨教学问题、学生发展问题、分享教学经验和资源等都对学生成绩的增值有显著且较为稳定的积极影响。

表24 区级教研参与程度对学生成绩增值的影响(二模考试)

表25 区级常规教研参与程度对学生考试成绩增值的影响(分项目)

表26 校本教研参与程度对学生考试成绩增值的影响

六、总结和讨论

本研究聚焦具有中国特色的区县基础教育教学研究体系,基于北京市海淀区2016—2019 年高中阶段学生及其任课教师、所在学校相匹配的数据,通过建构教师专业发展对学生成绩影响的概念框架,采用增值模型、多层线性模型和结构方程模型,将区域教研活动分为组织、内容、有效性等多个维度,从教师个人特征、教学实践、自我效能、学生成绩等角度分析区域教研对教师和学生学业成绩的影响。研究结果显示,教研活动参与和教师的教学实践、自我效能、学生的成绩等存在多维度和多层面的关系,同时我们也可以发现,目前的教研活动对教师和学生的影响朝着探究性和以学生为中心的学习方式变革的方向转变。

(一)区级教研活动对教师的作用

首先,本文从教师专业发展活动对教师影响的角度出发,分析了教研活动的参与程度与课堂教学实践、学生评价策略的使用和教师自我效能评价的关系。总体上,区级教研活动参与度较高的教师,在其课堂教学过程中组织学生深度参与体验性、探究性学习活动的水平更高,更倾向于在教学过程中向学生提出具有挑战性的问题、培养学生的批判性思维以及给学生更多思考、讨论和表达的机会,在评价学生的时候更多地使用让学生反思评估自己和现场评估并给予反馈的评价策略。

其次,考虑到不同类型的教师专业发展活动所开展的目标群体有差异,因此参与不同类型教研活动的教师也存在差异,因此本文进一步分析了教师的个人、学术和专业背景与区级教研活动参与情况之间的关系。结果显示,整体上拥有研究生学历的教师、资深教师、学科带头人以及获得教学设计、展示等奖励的教师参与区级常规教研、专题教研和校本教研活动的程度较高。其中,获得教学设计、展示奖励的教师在几乎所有类型的教研活动的参与度上都显著高于其他教师。对教师特征与教师教学实践、自我效能和评价策略使用的分析结果显示,学科带头人和获得教学设计、展示奖励的教师在多种教学实践和学生评价策略的使用上显著高于其他教师群体。

再次,作为我国三级教研中的重要一级,校本教研是基层学校应用最为广泛的教师专业发展制度之一,因此区级教研与校本教研活动之间的关系也值得关注。本文的分析结果显示,区级教研活动与校本教研活动的参与程度之间存在着十分显著且稳定的正相关关系,尤其是在接受专家指导和参与校本课程、教辅材料开发这两项活动上。在与同事研讨教学问题、学生发展问题、分享教学经验与资源等非正式交流活动方面,则区级教研活动的参与程度相关性较低。

此外,对校本教研中介作用的分析显示,校本教研本身对教学实践有显著的正向作用,而且能够起到中介作用,即区级教研通过影响教师校本教研的参与程度,间接影响教师教学实践。值得注意的是,一些区级教研活动与教学实践之间的直接路径并不显著,但能够通过校本教研表现出中介效应(如学科能力、深度学习等)。对此,以往研究认为的可能解释:一是可能存在遮掩效应(suppressing effects),即间接效应的方向和直接效应的方向相反,使得总效应被遮掩;二是可能存在另外的中介路径,其间接效应大小与校本教研的间接效应接近但方向不同,从而造成总效应不显著(MacKinnon,Krull,& Lockwood,2000;Zhao et al.,2010)。由于数据限制,我们无法对更多可能的中介变量进行考察,进一步的原因有待今后研究进一步厘清。

(二)区域教研对学生成绩增值的作用

根据学生成绩与学校、教师的匹配数据,我们分别估计了学校和教师对学生成绩的增值作用,在此基础上根据学校和教师增值估计结果进行分组,分析不同组别教师教研活动的参与程度。首先,基于学校增值估计结果分为在相应学科上增值大于0 的学校、在相应学科上增值小于0 的学校,分析不同组别教师的教研活动参与程度差异。结果显示,高、低增值组学校的教师在大部分区级常规教研、专题教研和校本教研活动的参与程度上均较高。其中,高增值学校教师在中心组成员活动、各类学术会议等研究性活动以及分享经验成果方面的参与度较高,同时高增值学校教师参与正式和非正式两类校本教研活动的程度较高。

其次,基于教师增值估计结果分为增值最低的20%、中间的60%和最高的20%三组教师,分析不同组别教师的教研活动参与程度的差异。结果显示,高增值组的教师在以下活动的参与程度上高于中、低增值组教师:研究课、课题项目研讨、中心组成员活动、学术会议和分享经验及成果等区级常规教研活动;学科能力和深度学习两类区级专题教研活动;正式和非正式校本教研活动。

再次,从学生成绩增值估计的结果来看,聚焦于学科内容的教研活动对学生成绩的增值作用尤其显著。就常规教研活动来看,学科课程整合开发、学科核心知识和思想方法的理解、学科关键问题的确定与解决以及单元整体教学等聚焦于学科内容的教研活动对学生成绩的增值作用尤其显著。就蕴含有效专业发展特征的活动来看,四类教研活动都不同程度地起到了积极的作用,尤以聚焦课程内容、专家指导支持这两项最为稳定。就区级专题教研活动来看,学科能力和考试评价项目与学生成绩的正向关系尤其显著。就校本教研活动来看,校本教研活动的平均参与程度,尤其是参与校本课程及教辅材料开发和接受专家指导对学生成绩增值有积极作用。同时,教师之间非正式的交流也不容忽视,教师与同事研讨教学问题、学生发展问题、分享教学经验和资源都对学生成绩的增值有显著且较为稳定的积极影响。

(三)教师问卷分析的启示

调查问卷中关于教师问卷的分析结果给予我们如下的启示:一是教师所参与的教研活动主要集中在传统的教学及学科领域,相对而言教师对信息技术和跨学科能力等方面内容的职前准备和职后培训需求较弱,这可能与学校目前的需求和考评方式相关。在教研方面预先规划相关内容有助于推动信息技术背景下分层、跨学科、多元和个性化教育教学的推进。二是随着越来越多高学历非师范专业的人才进入教师行业,如何充分利用高学历人才优势,在夯实教学技能基础的同时发展研究型教学力量,这是教研当前面临的现实挑战。三是教师问卷数据显示,学校层面在资金补偿、根据教研活动适当减少工作量这些方面支持不足。此外,多数教师认为学校的考核、评价、晋升、职业规划等方面未能很好地衔接教师专业发展。OECD 国家教师专业发展的相关分析显示,大部分OECD 国家的教师专业发展均与教师职称晋升、薪酬等激励挂钩或相关,许多欧洲国家打通了教育相关部门、社会福利部门及服务机构、慈善机构及协会、地方政府及学校等渠道,全流程为教师专业发展提供特定的如人际关系、心理健康等方面的支持。这为我国教研系统的发展提供了参考。

(四)反思和讨论

1. 研究方法的反思

由于本文的核心数据是学生成绩、选课等行政管理数据和教师问卷数据,因此只能够采用事后回溯的方式,对教师专业发展活动进行影响评价,最终形成的分析数据除了以学生中考成绩为前测数据外,其余衡量教师知识技能、价值态度、教学实践策略的变量皆为横截面数据,即同一个时间点采集的数据。因此,本文虽然能够估计学校和教师对学生的增值影响,但只能够基于横截面数据分析教研活动参与度、课堂教学行为、教师自我效能与学生成绩之间的相关关系,而不是因果机制。如果条件允许,最佳的方式是从项目开始时就进行跟踪评价,采集项目开始前的基线数据、项目开始之后的过程数据以及项目的结果数据。为了能够准确评估教师专业发展活动对学生学习和学业成绩的影响并揭示其机制和影响路径,未来的研究可考虑以教师专业发展活动的实验研究为设计框架,由学科教师、教研员、学科教学专家以及项目评估专家共同参与,对项目进行基线、过程以及结果全程跟踪,尝试收集多维度的教师数据(例如教研活动的日志、课堂录像、课例分析记录等),结合学生和教师基线和结果测评数据,更好地探索教师专业发展活动是如何影响学生学习和学业成绩的问题。

如果按照Borko(2004)的三阶段分类,本文还处于第一阶段,并尝试向第二阶段过渡。第一阶段的研究聚焦于项目本身和作为学习者的教师之间的关系,主要目的是确认项目专业发展活动是否有效。从第二阶段开始,研究主要目的是确认同样的专业发展活动在不同的情景下由不同的培训者实施的时候是否能够保持有效性。这一阶段可以加入随机实验设计的元素:(1)为了能够更加客观地评价某一类教师专业发展活动给学生带来的影响,最佳的方式是采用实验组和对照组的方式,也就是控制实验的方式,将参与此类专业发展活动的教师与不参与的教师自身的情况及其授课学生的情况进行比较,以得出专业发展活动的真正效果;(2)为了能够评估不同的组织方式的有效性,可以保持专业发展活动的一部分要素不变(例如项目内容),在不同的学校和教师群体采用不同的培训方式(例如线上和线下),以测试不同的学习组织方式的有效性。

2. 分析框架的反思

Desimone(2009)在回顾以往研究的基础上梳理总结的“教师专业发展通过影响和改变教师知识、技能、观念和态度,最终影响学生学习”的分析框架能够帮助研究者更加清晰地定义有效专业发展活动的要素,并基于该定义进行数据收集,以便进一步分析和比较不同专业发展活动的有效性。该分析框架被广泛接受的原因之一是,20 世纪90 年代末到21 世纪初开始的学校问责制度改革以及对符合科学标准的研究(scientifically based research)的重视,使得20 世纪八九十年代更加强调情境、背景和体系的教师专业发展研究转向了更加强调影响和因果分析的实证研究。然而,教师的角色是多样的,教师的工作是多方面的,并且受到相互冲突的理想和观念的驱动,因此某一项专业发展活动往往只能解决其中一个方面的问题,并没有一个单一或统一的教师教学和学习理论能够全方位解释专业发展活动的影响机制。

有许多研究者认为,依据“过程—产出”的逻辑建立起来的框架过于线性,无法充分反应专业发展活动如何促进和实现教师学习和变化的复杂性。Opfer et al. (2011)认为,基于该框架的专业发展有效性研究仅简单地将可见、可测的专业发展活动要素(例如活动的组织形式、结构、内容、强度等)直接与可测量的教师和学生的变化联系在一起,并没有真正解释其因果。作者认为专业发展活动研究应该围绕“教师专业学习”(teacher professional learning)来展开。教师学习是一个同时发生在教师个人层面、教师群体层面和年级、学校机构层面的复杂的、系统的过程,而不是一次性的事件。因此,研究不仅需要关注什么样的专业发展活动是有效的,也需要关注教师个人的知识、信念、实践和经历对专业发展活动有效性的影响,以及从教师参与专业发展活动到其信念、知识、实践的转变这一过程并非线性发生的,而是相互作用和影响的。

Kennedy (2016)则认为,“行动理论”(theory of action)能够更好地分析和解释专业发展活动的影响机制。作者回顾了从1975 年至2015 年的教师专业发展有效性研究,发现一些被广泛认可的专业发展活动特征并不一定始终有效,有时候过度强调某一个方面反而会产生消极的影响。专业发展活动是否有效还取决于其他维度。基于行动理论,作者将专业发展活动按照要解决的教学实践问题和通过什么策略促使教师去改变这两个方面进行了重新归类,并将行动目的和策略这两个维度与项目特征相结合,发现能够更好地解释专业发展活动如何影响教师的学习,进而改变其教学实践。尽管基于不同的理论,但是强调专业发展需要围绕“教师专业学习”和围绕“行动理论”的两派研究者都强调教师的动机和对专业发展抱持的态度,对最终的效果有关键的影响。就目前的教师专业发展有效性的实证研究框架来看,大部分研究着重于专业发展活动本身的设计和实施对教师教学和学生学习的影响,而并未考虑教师个人的动机和意愿、专业共同体的观念和行为对专业发展有效性的影响。

无论是基于“过程—产出”的有效性分析,还是围绕“教师专业学习”或“行动理论”解释其作用机制,目前教师专业发展的实证研究更加关注学生和作为学习者的教师是如何学习的,以及如何支持和实现学习,但却很少关注教师培训者。国内关于教师培训者包括教研员和教研体系在内的研究已有一定积累,能够为其他国家在这一方面的研究提供经验和借鉴。而另一方面,有学者在回顾我国教研制度的相关研究之后指出,我国教研制度所发挥的实际功能与对它的理论解释比照悬殊,关于教研组织的“本体论”研究稀缺(丛立新,2011)。也有学者指出,尽管建国以来我国基础教育发展的研究文献积累丰富,但缺乏对教研制度的关注。为数不多的教研专题研究更加偏向于对教研工作中存在的问题和如何发挥作用进行阐述,缺乏对教研制度发展和特点的全面系统的研究(梁威等,2011)。随着我国基础教育改革和中小学课改的不断发展,教研体系越来越成为推进课程教学改革、提高教学质量和教师专业发展的核心力量,对教研制度的专业化、规范化和科学化的需求在不断加强,而这也将促进对教研支持教师专业发展的实证研究,推进与国际教师专业发展研究的接轨。

(本文的研究团队成员包括:海淀区教师进修学校罗滨、林秀艳、姚守梅、王梦、张荣慧、王帅鸣、王思南、杨智君;北京大学中国教育财政科学研究所黄晓婷、魏易、黄珍;温州市教育评估院刘舒畅。在此感谢所有团队成员所作的努力和贡献。)

猜你喜欢

区级校本教研
研学农谷 产教研学
如何更好地走好区级媒体融合发展之路
高中地理校本课程的开发与实施——以闽江环境保护校本开发为例
带你全面了解,勃艮第/Bourgogne带补充地理标识的大区级法定产区
建构基于校本的听评课新文化
赋能:教研转型中教研员的应然追求
《红楼梦》(新校本)
《红楼梦》(新校本)
区级农产品质量安全检验检测体系建设中存在的问题及对策
关注教研活动提升教研能力