指向科学决策的农村教育实证研究 *
2020-09-17刘善槐朱秀红
刘善槐 张 雪 朱秀红 霍 明
(东北师范大学中国农村教育发展研究院,长春 130024)
政策实践的迫切需求、数据科学的迅速发展和数据质量的不断提升推动了农村教育研究范式的转型升级。实证研究的重要性愈加凸显,适应范围不断拓展,认可程度日益提高。实证研究强化了农村教育研究者的方法论意识,使相似的研究能够更好地进行学术对话;拓宽了农村教育研究的问题域,使原来许多未能研究的问题有了新的突破路径;推动了农村教育的理论建构,使农村教育研究的知识结构得以延展和深化。在农村教育研究领域,实证研究是问题驱动下的研究,其最重要的作用是以合乎事实、规律和理性的方式回应了重大农村教育决策问题。实证研究为农村教育决策提供了数据参考、决策模型、判定标准和改进依据,全面提升了农村教育的科学决策水平。
一、农村教育实证研究文献的计量分析
为了准确判断实证研究在农村教育领域的研究现状和发展趋势,应全面收集相关文献,并对文献的数量、来源和主题进行计量分析。本研究旨在揭示实证研究对我国农村教育公共决策的作用和价值,因此,所选的基础文献以国内量化文献为主。为保证文献的准确性和权威性,研究以“中文社会科学引文索引”(CSSCI)收录期刊为文献来源。检索按照“内容+方法”的顺序分两步进行。首先,检索农村教育主题下的相关文献。选取“农村教育”“乡村教育”“农村教师”“乡村教师”“农村学生”“乡村学生”“农村学校”“乡村学校”“农村家长”“农村家庭”“留守儿童”“随迁子女”“农村寄宿制”和“小规模学校”等14 个主题词(主题词之间的关系词设置为“或者”),进入中国知网的期刊库进行检索,将时间跨度设置为2015—2019 年。其次,在结果中以“实证”“量化”“调查”“数据”“计量”“相关”“影响”“干预”“模型”“结构方程”“构建”“预测”“大数据”和“中介”等词进行篇关摘检索(篇关摘检索指在文献的篇名、关键词与摘要范围内检索,篇关摘之间的关系词设置为“或者”),从而完成初步的智能检索。检索完成后,剔除相关性较低的文献,最终筛选出农村教育主题相关文献1830 篇,其中农村教育实证研究相关文献681 篇。运用Citespace 软件,对已有文献进行计量分析发现,近五年农村教育实证研究呈现四个方面的典型特征。
(一)实证研究类文献数量呈上升趋势
2015—2019 年,农村教育研究发文量整体趋于稳定。其中,实证类研究数量占比自2016 年起连年递增,2019 年,农村教育实证研究占农村教育研究文献的比例高达42.35%。从数量上来看,农村教育实证类研究的文章一直平稳增长,但未呈现井喷式增长的态势,这与农村教育实证类研究的特性和学者群体的特性有密切关系。在农村教育领域,若想开展一项严谨的实证研究,首先需要获取高质量的数据。而为了获取高质量的数据,需要进行科学抽样、工具设计、实地调查和数据清洗等系列工作,完成这一过程需要经历较长一段时间,这最终决定了实证研究的研究周期较长,因此,不太可能在短期内产生大量的实证研究成果。此外,在教育领域,专门从事农村教育研究的学者并不多,从事农村教育实证研究的学者就更少,这也成为实证研究成果不可能大幅增加的原因。
(二)实证研究类型逐步走向规范化
农村教育实证研究在经历转型之后,科学性、规范性和创新性不断增强(刘善槐,2017)。近五年,农村教育实证研究范式逐步走向多元化,形成了大规模调查研究、关系性研究、干预实验研究、预测研究和构建性研究等基本范式。从发文总量来看,超过90%的论文为调查研究和关系性研究,其中调查研究的文献数量相对稳定;关系性研究的文献有增加的趋势;干预实验研究、预测研究和构建性研究的文献在逐渐积累。
(三)作者群体主要集中于师范院校的研究机构
实证研究的基础是数据和证据,而数据和证据的采集、清洗和分析过程往往需要大量人力和财力。分析发现,农村教育实证研究成果主要集中于专业的研究团队。近五年,农村教育实证研究的作者主要集中于东北师范大学、陕西师范大学、北京大学、华东师范大学、北京师范大学、南京农业大学、华中师范大学等高校的研究机构。其中,东北师范大学中国农村教育发展研究院、陕西师范大学教育实验经济研究所等机构关于农村教育实证研究的发文量最多。
(四)研究主题多与公共决策相关
农村教育实证研究中,内容包含对策建议、政策建议、破解思路等与公共决策主题相关的文章占比最高,五年累计达77.97%(详见表1)。这说明农村教育实证研究的基本取向是服务于公共决策。通过关键词分析发现,我国农村教育实证研究关注的对象主要为流动儿童(含留守儿童和随迁子女)、农村教师(含乡村教师)和农村学校等。
表1 2015—2019 年农村教育实证研究文献数量情况
二、农村教育实证研究关注的问题
农村教育实证研究的问题多源于重大现实问题。这决定了农村教育实证研究具有时代性的特征。当前,新型城镇化的深入推进、“全面二孩”生育政策的实施和农村家庭教育观念的改变使农村学龄人口剧烈变动。在这一背景下,“如何保证农村学生享有更加优质公平的义务教育”是农村教育的时代命题。这一命题衍生出了一系列重大的农村教育决策问题。
人口的变动使农村教育资源配置面临严峻挑战:规模波动使教育资源配置面临当下紧缺与未来过剩的矛盾,密疏分化使资源配置难以保障不同地区的学生享有均等的教育服务,跨区迁移使属地化教育资源管理体制困境凸显(刘善槐、王爽,2019)。如何配置教育资源使其能够满足农村学龄人口的教育需求是重大公共决策问题,需要预测学龄人口的分布状况和变化趋势,并在此基础上对农村教育资源的配置标准、学校布局调整等问题开展实证研究。
师资是保证农村学生享有高质量教育的关键。在国家政策的引导下,“如何建设一支数量充足、结构合理的高素质专业化农村教师队伍”是农村教育学界的研究重点。这一问题衍生出来的研究议题包括编制配置、结构优化、教师补充、教师交流、待遇提升和教师减负等。
农村教育发展的根本目标是促进农村儿童充分发展。农村儿童数量庞大,其中还包含一些特殊群体。学龄人口的稀疏不均改变了农村学校的规模和农村学生的上学距离,使农村地区出现了大量的寄宿制学校;劳动人口的迁移使农村的家庭结构发生了改变,在城市出现了随迁子女而在农村出现了留守儿童。这些儿童的早期教养、认知能力、身心发展状况等是农村教育实证研究关注的重要议题。
三、农村教育实证研究的基本范式
农村教育决策问题具有复杂性和多样性的特征。为了以科学化的方式回应这些问题,农村教育实证研究逐渐走向规范化,形成了大规模调查研究、关系性研究、干预实验研究、预测研究和构建性研究等基本范式。
(一)大规模调查研究
教育决策应建立在数据和事实之上(袁振国,2015)。大规模调查研究是掌握事实的直接途径。通过大规模调查获取的“事实”可满足以下几个特性:一是客观性,即农村教育的事实是客观存在的,不受调查者、调查时间、调查地点、调查工具及调查过程的影响;二是稳定性,即农村教育的事实至少在某一特定阶段内稳定不变;三是可获得性,即农村教育的事实可通过合理的调查工具直接或间接地获取并得到描述(刘善槐,2017)。
教育研究的科学性依赖于对“事实”的判断,“事实”可通过多种方式获取,如文献研究法、宏观统计资料分析等。那么,为什么仍需进行大规模的调查研究?这是由研究问题的数据需求决定的。以大规模教育评估项目为例,美国基础教育质量评估项目“国家教育进步评估”(National Assessment of Educational Progress,简称NAEP)需要获得能体现基础教育现状及其发展趋势以及能够证明教育改进效果的相关数据;经济合作与发展组织开展的“国际学生评估项目”(Programme for International Student Assessment,简称PISA)需要获得能为政策对话以及教育目标的界定与实施提供一个新的基础的相关数据(Ray & Margaret,2003);国际教育成绩评价协会开展的“国际数学和科学趋势研究”(Trends in International Mathematics and Science Study,简称TIMSS)和“国际阅读素养进展研究”(Progress in International Reading Literacy Study,简称PIRLS)需要获得能够为各国政策制定者提供科学权威的资料和数据,以为各国的教育发展情况提供国际标准。2007 年,中国教育部基础教育质量监测中心成立,该中心希望通过对基础教育阶段学生的学习质量和身心健康状况以及影响学生发展的相关因素进行全面、系统、深入地监测,以准确地向国家报告基础教育质量的现状,进而为教育管理和决策提供信息、依据和建议。①
如何摸清事实是农村教育研究者需要解决的首要问题。与国际上的许多项目类似,农村教育研究应在保障数据真实可靠的基础上,获取最小分解单元数据和关联性属性数据,这一过程需经调查研究实现(刘善槐,2017)。如研究农村教师编制测算模型,首先应收集学生数、课时数和所教科目及年级等关联性的数据以测算教师的教学常规工作量(刘善槐、邬志辉、史宁中,2014),并在此基础上测算每个农村学校各学科所需教师编制,然后才能生成各乡(镇)、县、市、省和全国农村所需的教师编制总量,而这些数据是宏观统计资料或相关文献无法提供的。另一方面,研究者作为独立方开展的实地调查研究能够从多个主体收集数据进行相互验证,并做到利益回避,以确保数据的真实性。
农村教育涉及的研究对象群体广、差异大、层次多、结构复杂。因此,在农村教育领域开展大规模调查研究需要庞大的资源支持。近五年,在CSSCI 来源期刊上发表的关于农村教育的调查研究成果共240 篇,调查主题包括教育发展基本状况、教师配置基本状况和学生发展基本状况等。其中,大规模调查研究的作用越来越凸显,基于大规模调查数据的文献数量越来越多(详见表2)。调查研究是一项系统性的工作,涉及调查样本抽取、调查工具设计、调查方式确定和调查质量控制等多个环节。
表2 2015—2019 年文献涉及的部分农村教育大规模调查项目
1. 调查样本的抽取
目前我国尚未开展关于农村教育的全国性普查,现有研究主要采用抽样调查的方式获取数据。抽样方法可分为概率抽样方法和非概率抽样方法,前者包括简单随机抽样、系统抽样(又称等距抽样)、分层抽样、整群抽样和多阶段抽样(又称多级抽样)等,后者包括目的抽样(又称判断抽样)、方便抽样(又称偶遇抽样)、定额抽样(又称配额抽样)、滚雪球抽样和自主抽样等。但是,许多关于农村教育的调查研究并不能简单地套用这些抽样方法。尤其是关于农村教育的决策问题,需充分考虑不同因素对决策的影响,这要求调研必须确保样本的丰富性。为此,应根据影响因素对总体进行分类,并在每一类别中抽取具有代表性的样本。若影响因素为连续变量,可使用聚类分析进行分类;若影响因素为(或可转化为)离散变量,分类则取决于影响因素的数量及各因素的类别(刘善槐,2017)。
2. 调查工具的设计
调查工具的设计取决于调查想要获取的信息,而调查信息源于研究问题。针对研究问题,可通过构建调查理论的框架,并以理论分析为基础采取演绎法,或根据实践经验采用归纳法,形成一套调查指标体系,作为工具设计的主要框架。如闫德明(2015)针对城乡义务教育经费投入一体化问题根据经费投入各项指标之间的关系构建了指标体系。调查工具是获取“事实”的主要手段,“好”的调查工具应基于“事实”进行科学设计。显性的“事实”可通过调查工具直接收集信息,并对其进行标尺化、次序化和类别化度量;隐性的“事实”则需间接地收集相应的表象特征信息,并对其加以分析和测量。以农村留守儿童焦虑情绪的研究为例,父母外出情况等基本信息属于显性的“事实”,可通过问卷直接获取;儿童焦虑情绪属于隐性的“事实”,需通过量表测量并加以分析(胡义秋、方晓义、刘双金、黎志华、朱翠英、孙焕良、范兴华,2018)。农村教育研究的调查工具包括问卷、量表、调查表和访谈提纲等,根据研究主题和研究目的选择适切的调查工具有利于提高调查信息的真实性、可靠性以及可获得性。
3. 调查方式的确定
农村教育调查研究可分为专题调研和跟踪性调研。如付卫东和范先佐(2018)专门对《乡村教师支持计划(2015—2020 年)》的实施状况设计了专题调查;姚松和高莉亚(2018)为了解河南省农村初中生辍学的深层次原因,在初步调查之后,对初次调查学生的基本情况和学习情况进行了多次追踪回访。跟踪性调查研究可为研究者提供持续性数据,有助于对结果变量的变化趋势、影响因素及其显著性等进行深入分析。跟踪性调研的工具设计应充分考虑不同时期信息的可比性及显著性,并在后续的调查中进行适当修正。不管是专题调研还是跟踪性调研,均可采取实地调查、网络/电话调查、邮寄调查和委托调查等具体实践方式。不同的调查方式对调查的效率和质量具有重要影响。目前,实地调查是农村教育调查中较为普遍的方式,这种方式通过实现调查者和被调查者间的信息交换和互动,在一定程度上确保了数据的真实性,且能有效地控制样本质量。在一些特殊情况下,受人员、安全、距离、成本、时间和语言等因素影响,研究者无法深入实地开展调查,此时网络/电话调查、邮寄调查和委托调查是获取所需信息的主要途径,调查质量取决于调查者与被调查者间建构的关系。
4. 调查研究的质量控制
调查研究的质量受调查目的、调查工具、调查样本、调查方式和分析方法等多方面因素的影响。在调查研究中,若按照相同的抽样方法选取样本,则样本量越大,抽样精度越高,样本代表性越强。在理想状态下,样本量的确定需在控制抽样精度的同时寻求最小样本容量。但在现实状态下,各信息的抽样精度很难全部合理估算,且在调查过程中,调研投入(如调研人员、调研经费、调研时间等)通常是有限的。因此,样本量的确定不能只考虑理论的抽样精度,还需考虑调研投入。
调查信息的回收率和有效比(即应答率和准确率)是保证调研质量的关键因素。因此在对工具进行设计时,应从调查对象角度出发,遵循从简至难、相似问题就近编排、合理设置问题筛选器等原则,并注意回避敏感信息、控制题量,以降低拒答率。为保障调查信息的有效比,还需确保被调查者具备清晰表述相关信息的能力。但是,农村教育的调查对象有时并不具备正确理解问题并回忆、描述相关信息的能力,这无疑增加了调查工具的设计难度,并有可能降低调研质量。如在调查农民收入时,由于许多经济作物生长周期可能跨越几年,易出现农民无法准确估计家庭年收入的情形。除此之外,为保证调查工具的科学性,应在正式调查之前进行预调查,以检验调查工具的信效度和调查方案的设计是否存在问题,并基于预调查结果进行调整。正式调查过程中,在科学地描述“事实”前仍需对采集到的数据进行信效度分析,以确保被调查者提供信息的可靠性及调查结果的一致性和稳定性。调查“事实”的分析方法主要有描述性统计(如频次/频率、均值、方差/标准差、相关系数、变异系数)和显著性检验(如t 检验、卡方检验、方差分析)等。根据研究目的和研究问题选择合适的分析方法能够提高研究结果的准确性和有效性。当前的大规模调查研究主要存在抽样方式不明确、样本量不足、未进行预调研、缺少信效度分析、分析方法使用不当等问题。
5. 大规模调查对农村教育决策问题的回应
摸清事实是科学决策的前提,而大规模调查是摸清事实有效而直接的途径。大规模调查研究在诸多重大农村教育决策议题上发挥了重要作用,如学校布局调整、师资配备、学生发展等(范先佐、郭清扬,2009;刘善槐,2011;刘善槐、史宁中、张源源,2011;李森、王建华和李振兴,2016)。基于调查研究提出的政策建议更具针对性,农村教育研究调查的对象包括学校、教师、家长、学生等。在关于学校的调查研究中,姚松和高莉亚(2018)根据对农村寄宿学生大规模调研数据的分析提出寄宿制学校建设及政策循证追踪的建议。在关于教师的调查研究中,孙德芳和林正范(2014)根据对农村教师发展现状调研数据的分析提出促进农村教师良性发展的政策建议;马红梅和孙丹(2019)通过对农村教师“本地人”效应进行调查研究,为乡村教师队伍“本地化”建设提供了依据;唐一鹏和王恒(2019)根据对特岗教师调研数据的分析提出稳定乡村教师队伍的政策建议。在关于农村家庭的调查中,韩嘉玲等人(2016)根据农村留守儿童家庭监护能力的调查研究,提出强化留守儿童关爱保护工作的建议。在关于农村学生的调查研究中,薛海平等人(2014)根据对义务教育学生课后活动调研数据的分析提出提高留守儿童成绩、缩小留守儿童与非留守儿童学业成绩差距的政策建议;杨宝琰和柳玉姣(2019)基于学生学业坚持的调查研究,提出激发学生学业坚持应重视家教家风建设的建议。有时,调查研究涉及多个对象。如凡勇昆和邬志辉(2014)根据城乡义务教育资源均衡的调查研究,从教师、财力、物力三方面提出促进城乡义务教育资源均衡配置的建议。
(二)关系性研究
关系性研究指的是利用统计模型从数据中提取理论关系来解释教育现象的研究(刘善槐,2017)。关系性研究探究的是变量与变量之间的关系,变量之间存在统计相关并不意味着它们有因果关系。近五年来,CSSCI 来源期刊上发表的关于农村教育的关系性研究论文共366 篇,占比为53.74%,主要研究农村教师队伍建设、农村儿童发展等议题,其中农村儿童发展是学者们关注最多的研究议题。
1. 关系性研究的基本过程
从研究过程来看,关系性研究本质上是现实数据对理论模型的拟合或现实数据对变量关系的重构。如果是自主设计的关系性研究,那么研究过程包括模型选择与变量界定、数据采集、参数估计和关系解释。模型选择与变量界定对关系性研究最为关键,其中模型决定了变量之间的结构关系,而选择什么样的模型取决于对问题的理论分析;变量界定对研究的可操作性具有重要影响,也决定着由数据拟合的关系模型能否回归到农村教育场景进行解释。如果是基于二手数据的关系性研究,那么研究过程包括变量选择、变量的数据表达、变量的模型拟合和变量的关系解释,其中,变量选择最为重要,它决定了后续将生成什么样的关系以及如何解释这种关系。
2. 关系性研究涉及的主要统计分析方法
关系性研究的主要统计分析方法包括回归分析、结构方程模型等。其中,回归分析方法包括线性回归、二次回归和Logistics 回归等,其优势是可以控制关系的替代解释(Theobald & Freeman,2014)。如王欢等人(2019)为了判断学校规模对学生学业成绩的影响,控制学生性别、学生年龄、学生是否寄宿、父母受教育程度等前人已证明能够对学业表现造成影响的变量,使用线性回归模型和二次回归模型分析学校规模对学业成绩的真实影响;朱秀红和刘善槐(2019)使用Logistics 回归模型,从个人-环境匹配的视角分析乡村青年教师流动的影响因素;尚伟伟、赵宁宁等使用分层回归模型分析学生个体、家庭、学校、环境等不同层面因素对流动儿童(随迁子女)学业成就的影响(尚伟伟,2015;赵宁宁、王露、刘琴琴、侍鲜、朱珅跃、王秀娜,2016)。
近年来,结构方程模型在农村教育领域的运用越来越广泛。结构方程模型主要用于研究潜变量和显变量之间的关系,路径分析、验证性因子分析和探索性因子分析是结构方程模型的特殊形式(Hox,1991)。例如,唐文雯、苏君阳、吴娱和孙芳(2015)以职业承诺为中介变量,研究了社会支持与离职意向的关系;贺文洁、李琼和穆洪华(2018)以教师能动性为中介变量,探究了学校文化气氛对乡村教师工作满意度的影响。
3. 关系性研究的质量控制
关系性研究的质量受理论框架分析、变量选择与界定、数据结构、模型选择等影响。理论分析不深入可能导致模型选择和变量选择不恰当,从而影响模型解释的饱和度。采集具有变量敏感度的样本数据是开展关系性研究的重要步骤。数据的测量尺度取决于研究的精度要求,相同的变量可有不同的测量尺度,如教师月收入可使用有序变量定义(肖庆业,2018),也可使用连续变量进行定义。模型结构将影响变量之间关系的精度及显著性。关系性研究中结论的描述应回归到教育场景中,以避免出现“伪相关”。当前的关系性研究主要存在模型误定、中介变量选取依据不明、脱离教育场景阐述研究结论等问题。
4. 关系性研究对农村教育决策问题的回应
目前,农村教育关系性研究的关注对象包括农村学校、教师、家庭和学生等。以农村学校为对象的研究中,陆伟、宋映泉和梁净(2017)研究发现农村寄宿制学校的校园霸凌问题较为严重,并运用多层probit 模型证实寄宿对学生成为霸凌受害者的显著影响,提议校园霸凌问题治理应重点关注农村寄宿制学校,改善其医疗住宿条件,增配生活管理人员,并建立校园安全问责制度;李玲、闫德明和黄宸(2014)使用规模报酬不变模型和规模报酬可变模型分析全国农村义务教育经费配置效率,提出加大义务教育经费投入并加强管理、加强教师队伍建设和大力支持民办教育的建议。以农村教师为对象的研究中,张峰和耿晓伟(2018)以组织公平和组织认同为中介变量分析组织政治知觉对农村教师离职意向的影响,给出减少学校中组织政治行为、提高农村教师的分配公平等建议。以农村家庭为对象的研究中,张永丽和梁顺强(2018)运用明瑟收入方程测算了农村家庭的教育收益率,并建立回归模型分析教育年限对教育收益率的影响,根据研究结果就农村家庭脱贫问题提出了完善贫困地区职业教育体系、深化教育制度改革等政策建议;李宾和马九杰(2014)探究了教育年限和工作经验对偏远山区农村外出劳动力工资水平的影响,提出了加强偏远山区中等职业技术教育的建议。
以农村学生为对象的关系性研究主要关注了学生的学业成绩、身体健康和心理健康等。如何提高农村学生学业成绩一直是农村教育研究的热点话题,学者主要探讨了外出务工模式、转学、社会情感能力、课外补习、寄宿、学校规模、教师支持等因素对学生学业成绩的影响,并提出户籍制度改革和公共资源分配方式改革、允许留守儿童一同迁移和加强女性教育、促进教师提升学生社会情感能力、对成绩较差学生进行精准补习、提高寄宿学校教学质量等建议,以促进农村学生学业成绩的提高(陈瑛华、毛亚庆,2016;庞晓鹏、严如贺、聂景春、罗斯高、张林秀、史耀疆、庞小冬,2017;滕秀芹、刘桂荣、宋广文,2017;黎煦、朱志胜、陶政宇、左红,2019;雷万鹏、马丽,2019;孟瑞华、杨向东,2019;王欢、常芳、刘涵、史耀疆,2019)。也有学者探讨了同伴效应、父母外出就业、隔辈溺爱对农村儿童身体健康的影响,并提出在医疗体制改革过程中对留守儿童给予特别关爱,加大学生营养干预力度,提高学校等教育机构供应餐食的质量等针对性建议(李强,2014;崔嵩、周振、孔祥智,2015;徐志刚、钟龙汉、周宁、陆五一,2017;刘贝贝、青平、肖述莹、廖芬,2019)。还有一些学者关注了农村留守儿童的心理状况及其关爱问题,探讨了家庭处境不利、留守时间、父母外出务工等因素对留守儿童的心理适应、焦虑抑郁情绪、亲子依恋、学校焦虑、孤独倾向等多个心理指标的影响,并提出母亲的陪伴、父母较近务工、子女随父母在务工地就学等措施是改善留守儿童心理健康的重要途径(范兴华、方晓义、张尚晏、陈锋菊、黄月胜,2014;赵文力、谭新春,2016;王玉龙、姚治红、姜金伟,2016;刘红艳、常芳、岳爱、王欢,2017)。
(三)干预实验研究
干预实验研究是农村教育正在兴起的研究方向。作为一种可以直接判断因果关系的方法,干预实验研究能够为农村教育公共决策提供直接的证据。农村教育干预实验的主要形式是随机对照实验(RCT),即通过对指定研究对象(通常称为实验组)施以某种特定的干预措施,以控制干扰变量对实验结果的可能影响,并在一段时间后,通过测量指定研究对象的变化,确定干预因素与结果变量间的因果关系。在正式执行干预前,研究者需要开展基线调查来采集指定研究对象和控制组的相关信息。
干预实验最早被用于医学、药学等领域,以判断某种治疗方案或者药物的效果(Auvert et al.,2006),后被逐渐引入社会科学领域。近十年来,教育干预实验研究显著增加。Connolly 等人(2018)通过对英文发表的文章和报告进行系统性回顾研究发现,1980—2016 年,共有1017 份随机对照实验(RCT)成果发表,其中近十年的产出占比四分之三以上。在国际上有许多著名的干预实验研究,这些研究在促进儿童发展、提高儿童认知水平等方面进行了有效尝试。如美国实施的“儿童健康保险计划”(the State Children's Health Insurance Program,简称 SCHIP)(Brach,Lewit & VanLandeghem,2003)和“儿童营养计划”(Child Nutrition Program,简称 CNP)②,旨在通过医疗补助为符合条件的儿童提供健康保险,协助学区和其他机构提供优质营养餐;联合国儿童基金会进行的“儿童早期发展干预项目”(UNICEF,2017)旨在从神经科学领域为促进儿童发展提供决策建议;哥伦比亚开展的“社会儿童早期发展活动”旨在通过早期干预促进儿童的语言和认知发展(Attanasio et al.,2020);欧洲经济论坛资助的FS 语音阅读项目(Fresh Start Phonics Reading Programme)③是一项针对可能在初中阶段落后于同龄人的学生的补习识字干预项目。
随着干预实验方法的逐渐成熟,有学者开始在中国尝试相关研究。但由于干预实验具有的不可逆性、长周期性以及高成本性,这类尝试面临诸多困难。干预实验研究在我国农村教育研究领域尚在起步阶段,干预实验项目并不多(详见表3)。从农村教育干预实验的干预对象、干预过程、干预的质量控制及其对农村教育公共决策问题的回应,可以研判这一方法在农村教育领域的发展动态。
表3 2015—2019 年文献涉及的部分农村教育干预实验项目
1. 干预实验的对象选择
样本规模与分组对实验结果具有重要影响。开展实验前,研究者需明确样本规模及干预对象。在不违背统计估计对样本数量一般要求的情况下,确定样本规模时通常需要考虑干预成本。样本的抽取分为概率抽样和非概率抽样两类。确定总的样本框之后,如何选择干预样本是干预实验研究的重要一步。为了减小组间差异和其他因素对实验结果的影响,需完全随机化地将样本分为两组(对照组和实验组),以保证其他所有可能的影响因素在两组中均匀分布,从而达到对与研究无关的因素进行控制的效果。分组后,参与者需确认知情并同意参与实验(Zelen,1979)。
2. 干预实验的基本过程
干预实验研究通常包括四个步骤。第一步,基于前期的理论基础对相关因素与实验结果进行预判,明确干预内容,设计实验并确定干预周期。在设计实验前需明确因果关系链。如李孟洁等人(2016)基于依恋理论和认知社会学习理论,设计了考察社区家庭工作坊对农村学龄前留守儿童心理行为影响的干预实验。第二步,基于研究问题和研究目的选择研究样本,对样本分组并进行基线调查。第三步,基于干预设计实施干预,并在执行过程中进行指导和监督。第四步,使用与前期测量可比较的测量工具对研究对象进行二次测量,对比分析干预因素对实验结果带来的影响。由于理论分析充分且实验数据完整,使用描述性统计分析、t 检验、回归分析等统计方法即可获得干预实验结论。
3. 干预实验研究的质量控制
干预实验研究的质量受理论预判的合理性、样本质量、分组的随机性、干预周期、干预执行度、前后测量的可比性等诸多因素的影响。理想化的随机分组应满足最大化统计功效、最小化选择偏差和分配偏差的要求。对照组和实验组的样本质量影响干预实验的可靠性,两组样本数量相当能够有效保障统计功效最大化。干预周期的确定应基于前期的理论研究并秉持周期内显效的原则。如张莉等人(2019)将学前流动儿童的阅读干预实验周期确定为“在16 周内每周进行两次”。干预的执行度是保障干预质量的关键因素。因而在设计干预、选择测量工具和实施干预时,应从干预对象和干预执行者的角度出发,对干预执行者进行适当的培训并建立监督提醒机制,以确保获取的测量信息准确。
4. 干预实验结论对农村教育决策问题的回应
随机对照实验可为教育政策的评估提供无偏估计(Styles & Torgerson,2018),通过对照和干预行为从微观角度探究某些因素对干预目标的影响,并以此甄别核心要素,进而为公共决策提供科学依据。现有的农村教育干预实验主要以教师和学生为研究对象。如常芳等人(2018)通过对教师实施绩效激励探究了农村教师的教学行为对学生学业表现的影响及作用机制,并提出通过改变教师绩效评价方式可促进学生获得更加公平的对待;Mo 和Li 等人通过对中学生开展现金补偿的干预实验验证了有条件现金转移支付(Conditional Cash Transfers,简称CCT)对初中生辍学率和高中入学率的影响,结果表明CCT 可有效降低辍学率、提高高估上学成本的弱势学生的高中入学率(Mo et al.,2013;Li et al.,2017);王雁等人(2015)通过在打工子弟校开展生活技能教育的干预实验分析生活技能对打工子弟学校小学三、四年级学生学校适应的影响,并提出在打工子弟学校开展生活技能教育的倡议;聂景春等人(2019)通过实施干预实验发现初中学生的配镜和戴镜行为均存在同伴效应,且这种同伴效应可能存在低水平均衡陷阱,因而提出相关部门应对学生眼镜使用行为进行外部干预的建议;张莉等人(2019)通过对学前流动儿童进行阅读干预实验,为提升我国弱势群体儿童的心理弹性提出了建议。
(四)预测研究
预测研究指的是基于历史数据所呈现的规律,对未来趋势做出预判的研究。预测研究的准确性主要取决于两个方面:一是预测模型,即研究者是否能找到事物过去的发展规律;二是核心影响因素,即研究者是否能获得影响事情未来发展形势所需的资料和数据(陈德棉、潘皖印、毛家杰,1997)。此外,预测的时间跨度越长,影响因素的波动性越强,模型稳定性受到干扰的可能性越大,预测结果的不确定性越高。
人口预测在教育领域发挥了重要作用。发达国家在进行教育规划时非常重视人口的变动趋势。如美国为给教育规划提供决策依据,对生育率变化、人口迁移、老龄化等人口变化因素如何影响教育需求开展了全方位研究(石人炳,2003)。为了提高教育发展规划的准确性和科学性,我国学者也开展了诸多关于教育发展趋势和资源需求的预测研究。1999 年,上海教科院智力所率先通过建立人口仿真模型对1995—2010 年的基础教育学龄人口进行预测,并分析了学龄人口波动给基础教育发展带来的可能影响。此后,陆续有学者关注这方面的研究,但研究问题的趋同性较高,发文量并不多。近五年,农村教育领域的预测研究主要关注“二孩”生育政策调整及城镇化对学龄人口变动、教师需求变化的影响等。
1. 预测方法的选择
学龄人口的总量和分布决定了教育资源的需求状况。因此,开展教育需求预测的前提是准确预测学龄人口的趋势。关于学龄人口的预测,常见的方法有CPPS 人口预测和队列要素法等。CPPS 是由中国人口与发展研究中心开发的人口预测软件,该软件可以根据研究需求设定不同的参数,对城乡不同年龄结构的人口变化进行模拟预测。如黄健毅、梁文艳、杨顺光、裘指挥等在预测教育资源需求之前均运用CPPS 软件进行了学龄人口的预测(黄健毅、廖伯琴,2015;梁文艳、杜育红、刘金娟,2015;杨顺光、李玲、张兵娟、殷新,2016;裘指挥、王攀、张丽,2018)。队列要素法通过构建可反映人口、种群生死更替的Leslie 矩阵模型,在预测过程中显示出较强的稳健性和适应性(任强、侯大道,2011)。因此,诸多教育学者在进行学龄人口的预测时常选择使用该方法。如薛耀锋、杜屏、李玲、谢倩等借助MATLAB 建立Leslie 模型预测学龄人口结构的变化(薛耀锋、杨棋雯、顾小清,2016;李玲、黄宸、李汉东,2018;杜屏、谢瑶、张世娇、张雅楠,2018;谢倩、李阳、胡扬名,2018)。
2. 预测研究的质量控制
在选定预测方法的基础上,预测的参数选取与设定、预测的时间跨度、影响因素的非预期波动性和基础数据质量均会影响预测结果。为了提高预测结果的准确性,借鉴较为成熟的研究成果设定预测参数是学者控制预测质量的常用手段。以总和生育率的设定为例,梁文艳等人(2015)在设定2014 年以后的分城乡总和生育率时参考了田雪原的研究结果;李玲等人(2018)以李汉东和李流的总和生育率估计结果为基础,对中国2010 年以后的生育水平进行了测算,并设计出高中低三种方案。考虑到时间跨度对预测结果的影响,研究者通常把预测年份限定在20 年以内。在使用基础数据时,大部分学者采用了人口普查数据和官方统计数据,部分学者对数据进行了校正。
3. 预测研究对农村教育公共决策问题的回应
通过预测研究,能够明确学龄人口和教育资源需求的变化状况,为教育发展规划提供方向指引。如黄健毅、廖伯琴(2015)预测了未来五年小学科学、初中生物、初中化学、初中物理等学科教师的盈缺状况,对未来中小学科学师资的配置提出了建议,包括分区分段推进小学科学课程开设、引导教师盈缺流动等。梁文艳等人(2015)预测了未来教师需求和教育经费需求的变化规律,并就“单独二孩”政策效应前的“机会窗口期”和政策效应后的“需求压力扩张期”提出了不同的应对策略。杨顺光、赵佳音、杜屏等通过对学前教育或义务教育阶段学龄人口变动和教育经费等资源需求的预测,为“十三五”期间教育发展规划提供依据(杨顺光、李玲、张兵娟、殷新,2016;赵佳音,2016;杜屏、谢瑶、张世娇、张雅楠,2018)。
(五)构建性研究
农村教育领域的构建性研究指的是以价值前置、价值嵌入或价值后置的方式构建科学的指标体系、度量标准或决策模型的研究。构建性研究不是从其他学科进行方法迁移而形成的研究范式,其目标也不是描述或解释过去和当下的教育现象,而是指导未来的教育决策。教育规划对未来教育发展格局具有决定作用,而构建性研究能够为教育规划提供科学依据。近年来,基于农村教育问题的构建性研究并不多,但这些研究为推动农村教育科学决策发挥了重要作用。
1. 构建性研究的模型选择
模型选择是一个复杂的过程,没有固定的模式和程序。问题属性和前期理论能够为模型选择提供指引。经典理论能够为不同类型的问题确定模型类别,为后续的数据收集和指标的操作化定义提供思路;基于现实与模型之间的解释偏差,可以准确判断既定模型的缺陷,找准原有模型的修正方向。如李玲、袁磊等借鉴补偿性工资理论、农村教育补偿效用函数和教师胜任力模型,确定了研究的基本假设和研究设计(李玲、卢锦珍、李婷,2015;袁磊、王冠楠、闫耀丽,2015);刘善槐等人通过分析教师供需矛盾和小规模学校公用经费使用问题发现教师编制标准和公用经费核拨标准的技术缺陷,确定了编制标准体系完善的价值取向,并根据公用经费的相关政策确定了测算标准的三个基本模块(刘善槐、邬志辉、史宁中,2014;刘善槐、韦晓婷、朱秀红,2017);李瑾和李文霞(2019)借鉴相关理论、客观实际和国家要求,提出城乡教育一体化指标体系构建的基本原则和总体结构。2. 构建性研究的变量选择
构建性研究通常按照演绎的逻辑遴选变量,再按照可测量性和敏感性确定最终的变量。如在农村教师编制测算模型的研究中,刘善槐等人(2014)基于学生获得公平的理念,设计了教师总工作量均等化和日均工作量合理化的编制测算平衡准则,并提取了能够衡量教师工作量的时间常模,根据调查数据最终确定了教师编制测算的核心因素。在农村学校布局调整标准问题的研究中,邬志辉(2010)针对学术界已有研究结论的局限性进行探讨,结合农村实际,建立了农村学校布局调整标准的12 个约束条件,并基于约束条件设计了具体标准。
3. 构建性研究的质量控制
好的构建性研究能够协调价值理性和工具理性的关系,它必须同时具备三个特点:模型适切性、变量完整性和价值嵌入合理性(刘善槐,2017)。其中,模型适切性体现在模型能否恰当表达现实问题,变量完整性体现在模型的变量是否全面且具代表性,价值嵌入合理性体现在模型能否协调价值冲突。
4. 构建性研究对农村教育决策问题的回应
构建性研究为农村学校布局调整、教育资源配置和教育发展评估等农村教育决策问题提供了依据。在关于农村学校布局调整的研究中,邬志辉(2010)建立了农村学校撤并的“底线标准”和“弹性指标”以及农村学校新建扩建标准体系,为农村学校布局调整提供了全面的决策依据;刘善槐(2012)基于“效用最优”、“满意度最大”和“底线公平”的基本理念提出了农村学校布局调整的科学化、民主化和道义化三重价值观照,建立了农村学校布局调整影响因素的分析框架,希望为政府进行学校布局调整决策提供科学的理论方案。在关于教育资源配置的构建性研究中,刘善槐、邬志辉和史宁中(2014)基于“基本编+机动编”的配置理念,构建了以课程设置、学生数量的年级和班级分布为基本参数的教师基本编制测算模型,并依据轮训周期和轮训时间确定了机动编的设置比例,为农村学校尤其是小规模学校的教师编制核定提供了更为科学合理的标准参考;李玲、卢锦珍和李婷(2015)通过构建农村教师的补充模型,验证了补偿性工资对农村教师补偿实践的作用,为完善教师补充补偿政策提供指导;刘善槐、韦晓婷和朱秀红(2017)基于学校公用经费的支出结构,构建了包含“基本+拓展+机动”三大模块的公用经费测算标准体系,为研制农村学校尤其是小规模学校的经费核拨标准提供了参考依据。在关于教育发展评估的研究中,李瑾和李文霞(2019)遵循科学、合理、实用原则构建了涵盖城乡教育资源配置及经费投入、城乡师资队伍及基本教学条件、城乡教育质量和教育成就三个目标层次的城乡教育一体化评价指标体系,为评估城乡教育一体化的发展状况提供方法依据。
四、农村教育实证研究的发展趋势
近五年,在农村教育问题的驱动下,农村教育实证研究逐渐规范化,在推动农村教育公共决策的科学化方面发挥了重要作用。但是,“教育问题+统计方法”的研究模式面临诸多限制,难以全面回应农村教育决策的复杂问题。农村教育的未来发展给实证研究提出了更高的要求,在问题转变、方法拓展、大数据运用和理论发展等多维度的驱动下,农村教育的实证研究范式将进行全面的转型升级。
(一)问题驱动—弱势补偿的关注
在实证研究的推动下,农村教育的资源配置体系将更加完善。城乡学校的硬件设施、经费和师资的配置差距将会缩小甚至消除。农村学校教育在教育质量提升上的敏感度将会下降,农村家庭的作用将会放大。农村教育的研究议题将从获得公平转向弱势补偿。农村教育研究的关注点将从农村学生的教育起点、教育过程转向教育结果,研究的跨度将从基础教育阶段向早期教养和教育后的出路延伸。未来,农村教育实证研究将重点关注以下几个方面的研究:一是农村学生发展状况的监测研究。这是判断农村教育发展状况的依据。关于农村学生的身心发展、智力发展和社会性发展的测量研究将得到重视。二是农村弱势学生群体的发展干预研究。发展干预是消除不利处境对学生发展的影响的有效途径。关于农村学生发展的干预实验研究将继续得到加强。三是农村学生发展轨迹的追踪研究。为了评估教育对提升农村学生社会地位的作用,必然要对农村学生开展追踪研究。针对追踪研究,纵向数据分析方法将显得尤为重要。
(二)方法驱动—“因果推断”的兴起
目前,农村教育实证研究方法主要从统计学、数学、心理学和经济学等学科迁移而来,这就意味着这些学科方法的发展将对农村教育实证研究范式的升级发挥助推作用。近年来,经济学的研究范式正在经历一场由“统计推断”向“因果推断”的转变(Panhans & Singleton,2015)。这意味着,研究者开始真正重视研究的“事实现象”,而不再过度依赖数据所呈现的“统计现象”。事实上,当理论模型清晰时,研究者可根据统计相关来判断因果关系;但若理论模型或内在逻辑不够清晰,研究者则很难基于统计相关推断因果关系。这种情况下,随机化干预实验给研究者进行因果推断提供了很大的帮助。近年来,基于随机化干预实验的实证研究已在农村教育领域不断出现,为促进农村教育决策科学化提供了很多直观的证据。但是,随机化干预实验的不可逆性、高成本性和长周期性给这类研究的发展带来了诸多限制和风险,对于某些问题,研究者很难开展真正的干预实验。对此,准实验研究为研究者提供了“备选方案”。准实验研究的基本原理是研究者借助自然条件(即研究对象自然地完成了实验过程)“故意”挑选符合条件的两组数据(对照组和实验组)进行比较分析以完成因果推断。常见的基于准实验数据的因果推断方法包括工具变量法(IV)、断点回归法(RD)、双重差分法(DID)、三重差分法(DDD)、倾向得分匹配法(PSM)等,其中倾向得分匹配法在农村教育领域运用较为广泛。倾向得分匹配法通过调整倾向性得分处理观察数据中混杂变量的影响,消除数据偏差(Rosenbaum & Rubin,1983)。目前,学者运用这一方法开展研究的议题包括农村学生学业成绩、农村儿童认知能力等。如庞晓鹏等人(2017)使用倾向得分匹配法对课外补习对学习成绩的影响进行了分析,发现课外补习对农村小学生的数学成绩没有显著的提高作用;黎煦等人(2019)运用倾向得分匹配法探究回流经历(包括随迁和返乡)对农村儿童认知能力的影响,发现回流儿童的认知能力并未得到有效改善。未来,这种基于随机化干预实验数据或准实验数据的“因果推断”将是农村教育实验研究的重要方向。
(三)数据驱动—教育大数据的运用
作为一种具有巨大潜在价值的数据集,大数据具有规模性(volume)、多样性(variety)、高速性(velocity)、真实性(veracity)、价值性(value)、易变性(variability)等多种特征(Laney,2001;Barwick,2011;IBM,2012;Hopkins et al.,2011)。大数据的发展促进了人们思维方式的转变,也引起学术界对数据价值、数据技术、数据安全、数据应用等多方面的深刻思考,推动了数据科学研究范式的转型。近年来,各大学科领域的大数据研究文献量急速增长。相比传统研究,大数据研究在研究目标、研究假设、数据来源、数据特性等方面都呈现较大的差别(Berman,2013;Ellaway et al.,2014)(详见表4)。
表4 传统研究与大数据研究的比较
2013 年左右,大数据研究开始在我国教育领域出现。目前教育领域的大数据研究主要为理论探讨,对于教育大数据的界定、来源、挖掘技术等相关研究尚在起步阶段,实证研究甚少,更遑论关于农村教育的大数据实证研究了。根据信息技术的发展趋势可以断定,大数据在教育领域的应用将会更加深入和广泛。并且,随着互联网的全面覆盖和信息化的快速推进,教育大数据也将作为关键要素和重要手段助推我国农村教育决策科学化。这意味着,基于大数据的农村教育实证研究将成为一种趋势。
什么是农村教育大数据?农村教育大数据是大数据的子集,即在大数据的基本定义内限制数据的范围和对象。根据其基本特征,可将大数据界定为突破传统数据库存储、处理能力的非结构化、高价值的自然产生的数据集。若数据集产生于农村教育或可运用于农村教育,则可称为农村教育大数据。
农村教育大数据来自哪里?按照对象划分,农村教育大数据可分为四类。一是关于农村学校的大数据。这类数据包括农村学校管理、经费、课程、办公、设备使用、校园生活等各方面的数据。这些数据散落在各个区域,如教育部门、财务部门、学校建立的教育数据平台甚至各个采购网站等。二是关于农村教师的大数据。这类数据包括教师上传的课程资源、教学平台的师生互动、教师的教学行为记录等。这些数据可能分布在在线教育平台、教师管理平台、微信等自媒体平台等。三是关于农村学生的大数据。这类数据包括学生在学习平台和其他平台的学习轨迹、学习时长、学习兴趣等个体行为记录等。四是关于农村家长的大数据。这类数据主要指向学生家长在各大网站关于子女教育的浏览记录,包括对学校网站、教育机构网站、相关课程网站的点击率、停留时间等。
大数据在农村教育领域将有更广阔的运用前景。大数据研究在农村教育资源空间布局优化、农村教师教育教学精准化和促进农村学生个性发展多样化等研究领域将发挥巨大的潜能。
(四)理论驱动—模型构建研究的加强
当前,农村教育理论体系尚未完全建立,这不利于农村教育的学科发展。那么,如何才能建立农村教育的理论体系?显然,单纯按照“教育问题+统计方法”的模式开展研究对农村教育理论体系的构建作用有限;过度陷入为现实问题寻求解决方案的研究惯性对农村教育理论体系的构建也无太多益处。理论构建的逻辑通常是,在现实问题中抽象出理论问题,在理论层面研究各种现象和关系,并构建新理论模型以回应现实问题;而理论发展的逻辑往往是,原有的理论模型未能很好的解释现象或回应问题,因而需要拓展、修正甚至推翻原有的理论模型,并建立新的理论模型。按照这种逻辑,农村教育理论体系的确立也应是不断构建的过程,农村教育的理论发展应按照构建的范式进行。因此,为了发展农村教育的理论体系,构建性研究将会进一步得到加强。