体育锻炼能够促进青少年的认知能力发展吗? *
——基于中国教育追踪调查数据的实证研究
2021-03-29方超黄斌
方 超 黄 斌
(南京财经大学 公共管理学院,南京 210023)
一、引言
进入21 世纪以来,《关于加强青少年体育增强青少年体质的意见》(2007)、《全民健身计划(2011—2015)》(2011)、《体育发展“十三五”规划》(2016)以及《全民健身计划(2016—2020)》(2019)等政策文件陆续推行,这些文件都大力倡导青少年通过参与体育锻炼提高身体素质。但是,受到传统文化中“重文轻武”观念的影响,父母担心子女经常参加体育锻炼会侵占学习时间并对在学表现产生消极影响,而相关学术研究对于参与体育锻炼是否具有正向溢出效应尚存争议,即青少年能否通过参与体育锻炼在强身健体的同时促进认知能力或学业表现的发展有待进一步检验(陈爱国等,2013;方黎明,2020)。因此,相关政策文件的出台并未起到预期中的理想效果,青少年参与体育锻炼的热情不高、意愿较低是不争的事实(宋逸等,2012;章建成等,2012;杨守建,2020)。
然而,与国内既有研究和传统文化观念不同的是,国外学者的相关研究却发现,经常参与体育锻炼的青少年不仅身强体健,更是在大脑发育、认知能力发展、学业表现等方面优于不参加体育锻炼的同龄人(Hillman et al.,2008,2009;Tomporowski et al.,2008,2011)。参加体育锻炼究竟能否提高青少年的认知能力是本文关心的核心问题。鉴于此,本文将利用中国人民大学调查与数据中心提供的中国教育追踪调查数据,综合利用普通最小二乘法、异质性的分位数回归以及准实验的倾向得分匹配法,实证检验经常参加体育锻炼对青少年认知能力发展的现实影响,旨在为推进青少年参与体育运动提供信息支撑与决策参考。本文剩余结构安排如下:第二部分对国内外相关研究做简要回顾,并通过研究述评提炼本文的边际贡献值;第三部分阐述包括模型、方法以及数据在内的研究设计;第四部分汇报实证分析结果;最后为全文结论与研究展望。
二、文献回顾
(一)核心概念界定
根据《全民健身计划》在主要指标说明部分的阐述可知,经常参与体育锻炼的标准是指每周参与体育锻炼活动3 次以上,每次30 分钟以上,锻炼强度中等以上。根据上述标准,结合本文所用数据在某些统计量上的可获得性,我们将每周参与体育锻炼在3 天以上(含3 天)的青少年定义为经常参与体育锻炼的群体,而体育锻炼天数在3 天以下的则为不经常参与体育锻炼的青少年。
(二)文献综述
国外学者对参加体育锻炼能否提高青少年认知能力发展的研究虽然始于上世纪50 年代,但相关学术研究直到进入21 世纪后才呈现出爆炸式增长的态势(Howie et al.,2012),温煦(2015)的综述曾对该选题的研究现状与未来发展方向做过全面系统的梳理,本文仅根据研究需要简要回顾相关研究的学术发展脉络。
有关体育锻炼与青少年认知能力关系的早期研究往往基于环境心理学的唤醒理论(Arousal Theory)。唤醒理论认为个体执行某项任务时的表现与其唤醒水平呈现倒U 型的关系:在达到最佳唤醒水平之前,唤醒程度越高越好,但在达到唤醒峰值之后,唤醒程度与个体执行任务的表现则呈负相关。利用唤醒理论的相关研究旨在通过实验的方式验证体育课的课程设置抑制了学生的学习成绩(Gabbard &Barton,1979),但实证研究结论却与理论预期相去甚远。譬如,Mcnaughten 和 Gabbard(1993)的研究发现,六年级学生经过30 分钟和40 分钟步行后,在数学测验的表现上要优于仅有20 分钟步行的学生。同时,另一些研究也发现经常参与体育锻炼对提高青少年的创造力、缩短反应时间可能有着积极影响,但对运动知觉(Perceptual Motor)等因素的影响却并不显著(Hinkle et al.,1993;Zervas et al.,1991;Tuckman et al.,1986)。
在早期研究的基础上,21 世纪以来的研究逐步纳入了对家庭经济文化背景(ESCS)、身体质量指数(BMI)、青少年体质水平、父母参与等因素的考察,同时增强了对于认知能力的关注(Castelli et al.,2014)。譬如,Field(2001)等学者发现积极参加体育锻炼的高中生有着更高的绩点,Dywer(2001)等学者的研究揭示了澳大利亚7—15 岁青少年参加体育运动的频次与学业表现间的正相关性。Chang 等(2011)学者以42 名青少年为样本,将处理组定义为进行30 分钟中高强度的自行车骑行,控制组则是进行30 分钟阅读训练,研究显示短时间有氧训练有助于提高青少年的执行力。Chaddock-Heyman 等(2013)学者针对23 名8—9 岁长期参加体育锻炼的青少年的研究发现,每周5 次,每次至少1 小时,连续运动9 个月的青少年在注意力与抗干扰能力上的表现有所增强。
与国外研究的丰富性相比,国内学者有关体育锻炼对青少年认知能力影响的研究相对较少,尤其缺少采用大规模抽样调查数据进行的实证研究。譬如,陈爱国等(2011)以9 名10 岁儿童为研究样本,采取最大心率的60%—69%参加中等强度的自行车骑行为干预方案,发现短期中等强度的体育锻炼有利于提高儿童的执行力。殷恒婵2014 以326 名三年级和五年级的小学生为研究样本,在课外体育活动时间进行为期20 周的干预,采取“花样跑步”和“武术+跳绳+八字跑”两种干预方案,发现两种方案均能有效提升小学生的执行力,并且干预效果与干预时长存在一定的正相关。
(三)研究述评
基于对国内外相关文献的总结,我们发现学界围绕体育锻炼与认知能力发展的关系业已形成了大量有益的研究经验,并且在推动青少年积极参与体育运动上起到了一定的积极效果,但就本文关注的研究议题而言,国内相关研究仍然存在以下可拓展的研究空间:首先,从研究主题上看,受到数据可获得性的掣肘,国内仅有少数研究采用大规模抽样调查数据,就体育锻炼与青少年学业表现或认知能力发展的关系进行因果性分析(方黎明,2020);其次,从研究方法上看,既有研究较少采用因果推断研究方法对体育锻炼的净效应进行估计,同时较少采用认知能力测试的标准化成绩作为因变量,这不利于学界厘清体育锻炼对青少年发展的积极或消极影响,从而无法为家庭鼓励子女进行体育锻炼提供信息支撑;最后,从研究对象上看,既有研究缺乏对初中生青年群体的聚焦,不利于为教育决策或相关行政部门推动体育项目进校园提供决策基础。
三、研究设计
(一)数据与变量
1. 研究数据
本文所用数据源自中国人民大学调查与数据中心(NSRC)提供的中国教育追踪调查数据(China Education Panel Survey,CEPS),我们将基线调研数据(2013—2014 年)与追访数据(2014—2015 年)进行合并与匹配,同时将青少年在身高、体重等方面的异常值剔除后,得到有效样本7495 个。
2. 变量处理
青少年的认知能力是本文的被解释变量。CEPS 为八年级学生设计了一套认知能力测试题,这套题目的内容不涉及学校课程所教授的具体识记性知识,而是为了测量青少年的逻辑思维和问题解决能力,具有国际可比性、全国标准化的特点。根据前述对经常参与体育锻炼这一核心概念的界定,我们将每周参与体育锻炼天数在3 天以上的青少年定义为经常参加体育锻炼的处理组,而将参与天数在3 天以下的青少年定义为不经常参加体育锻炼的控制组。从表1 给出的基本统计信息中可以看出,处理组认知能力测试的标准化得分为0.469,高于控制组的0.210,并且双T 检验在1%水平上显著。同时,为了控制前期能力引致的内生性偏估,我们将青少年在2013—2014 学年的认知能力纳入方程后,利用增加能力变量的方法纠正内生能力偏估。
青少年参加体育锻炼的时间是本文在基准回归与异质性分析中最重要的解释变量。在变量处理方面,我们借鉴胡鹏辉和余富强(2019)提供的方法,采用“平均每天锻炼时间=周锻炼天数*日锻炼时间/7”的办法求得,并将其取对数做平滑处理后代入方程。从统计描述上看,处理组青少年日均体育锻炼的对数值为3.141,显著高于控制组的2.168。
在青少年投入体育锻炼以及影响认知能力发展的相关因素方面,我们选择了周一到周五完成作业的时间、上网或看电视的娱乐时间、对自身整体健康状况的感知、对身材胖瘦的感知、对学业压力的感知以及小学阶段是否上过健康教育课六个方面。理论上讲,青少年用于完成学校作业与沉溺网络游戏的行为均会在一定程度上侵占其课余时间(方超等,2019a),从而不利于投入更多的精力参与体育运动锻炼,但统计描述却显示,处理组中的青少年将更多时间用于完成作业和看电视(网络游戏)的占比均高于控制组。处理组中的青少年对于目前身体状况较差的感知,在全样本中的占比为32.8%,低于控制组的37.9%,但对学业压力感到无压力的占比为72.3%,高于控制组的66.7%。
CEPS 在调查青少年是否上过健康教育课时提供了两个问题,分别是小学阶段和初中阶段是否接受过健康教育课。鉴于健康教育课程对于青少年参与体育锻炼及其认知能力发展的影响可能存在着滞后性,我们选择了小学阶段是否接受过健康教育课作为代理变量。从统计描述中可以发现,处理组中有69.4%的青少年在小学阶段接受过健康教育课,比控制组中的60%高出了9.4 个百分点。此外,处理组与控制组中的青少年对于身材是否偏瘦的感知基本一致,在全体样本中的占比均为62.3%。
在家庭特征方面,我们分别控制了家庭经济资本、人力资本、文化资本以及教育期望。家庭经济资本以青少年自评经济条件表示,处理组对家庭经济条件较差的感知在全样本中的占比为12.3%,低于控制组的18.6%,表明经常参与体育锻炼的青少年在家庭经济资本上优于不常参与体育锻炼的青少年。人力资本与文化资本分别选取了父母受教育程度与家庭藏书量作为代理指标,家庭教育期望则反映了父母对子女学业表现的重视程度,三者在理论上均与青少年的认知能力发展呈正相关(郑磊等,2018;方超等,2019b)。
表1 所涉变量的统计描述
最后,本文还控制了青少年在性别、年龄、民族、户籍、独生子女、BMI 等方面的个体特征。其中,身体质量指数(BMI)的计算方式为“BMI=体重/身高2”。
(二)模型与方法
1. 模型
为估计参加体育锻炼对青少年认知能力的影响,本文设定如下线性模型:
2. 研究方法
(1)有条件分位数回归
本文首先采用普通最小二乘法估计体育锻炼对认知能力的影响,并将估计结果作为基准估计校对。但是,基准回归仅能为我们提供体育锻炼参与回归后的均值效应,无法捕体育锻炼的异质性特征。异质性是指青少年参与体育锻炼对认知能力的干预并非线性、均质的,随着认知能力分位点的上升,体育锻炼促进认知能力发展的影响效应可能存在差异。从某种程度上讲,体育锻炼的异质性特征可能成为倡导家庭体育观念、推动体育进校园的政策落脚点。具体而言,如果体育锻炼的异质性特征表现为对低认知分位点上的干预作用高于高认知分位点,那么通过鼓励、引导低认知分位点的青少年积极参与体育锻炼,就能有效推动青少年认知能力的均衡发展。鉴于此,本文将进一步采用Koenker和 Bassett(1978)提供的条件分位数回归,分析参与体育锻炼对于青少年认知能力的异质性影响:
(2)无条件分位数回归
条件分位数回归虽然能够捕捉体育锻炼的异质性特征,但其适用范围却有一定的局限性,它只能揭示体育锻炼对于具有相似可观测特征青少年的异质性影响,因而回归结果只能提供自变量对于因变量变化的有条件影响。但对学术研究和决策者而言,更值得关心的是无论青少年的可观测特征是否相似,参与体育锻炼对于认知能力变化的无条件影响(朱平芳、邸俊鹏,2017)。鉴于此,本文将进一步采用无条件分位数回归(Unconditional Quantile Regression,UQR),检验体育锻炼对于认知能力变化的无条件影响:
在式(3)中, β1表示体育锻炼 Exerciseit的边际变化对青少年在 Qτ分位点上认知能力的边际影响,利用式(3)就能求得体育锻炼对于认知能力变化的无条件影响。
(3)倾向得分匹配
受到事后观测数据的限制,青少年进行体育锻炼的个体决策并不具有随机性,而是受到诸如年龄、性别、BMI 等方面个体特征,以及家庭经济、文化资本、父母受教育程度等可观测特征的影响。因此,利用OLS 估计式(1)时将会产生选择性偏差(Selection Bias),主要体现在以下两个方面:第一,前述个体因素、家庭因素等可观测特征导致的青少年参与体育锻炼的自选择问题(Self Selection);第二,当OLS 将未参与体育锻炼青少年的认知能力作为参与体育锻炼青少年的反事实认知能力时,处理组(Treated)和控制组(Control)在原始条件上的组间差异将会导致反事实问题(Counterfactual)。
鉴于此,为了尽可能实现青少年参与体育锻炼与其认知能力发展之间的因果关系推断,本文将采用Rosenbaum 和 Rubin(1985)提供的倾向得分匹配法(Propensity Score Matching,PSM),以纠正由可观测异质性引致的估计偏误(黄斌、方超、汪栋,2017)。倾向得分匹配法的基本原理是:为经常参与体育锻炼的青少年i 找到一个在可观测特征上近似但却并不经常参与体育锻炼的青少年,将该个体作为青年i 的反事实,同时基于结果均值的比较实现平均处理效应的估计。
基于倾向得分匹配法估计体育锻炼的平均处理效应时,需要同时满足条件独立假设与共同支撑假设。条件独立假设是指可观测特征变量X 既能影响i 是否经常参与体育锻炼,又对i 的认知能力产生影响,但却不会受到个体认知能力的反向干预,对可观测变量进行充分控制后,经常参与体育锻炼就可被视为随机分配的过程。共同支撑假设要求经常和不经常参与体育锻炼的青少年在倾向得分上有重叠的区域。当同时满足条件独立假设和共同支撑假设时,倾向得分则落入公共支撑区间内:
在式(4)中,下标1 和0 分别表示经常参与和不经常参与体育锻炼的青少年,相应的CognitibeAbility1i与Cognitive Ability0i则表示经常参与和不经常参与体育锻炼青少年的认知能力水平, Di则是用虚拟变量表示的示性函数(Indicator Function),若i 经常参与体育锻炼则有 Di=1, 反之则有 Di=0 。 p(X)表示青少年参与体育锻炼的概率值。在具体匹配策略方面,我们将利用K 最近邻与近邻匹配、半径(卡尺)匹配、核匹配法以及马氏匹配估计体育锻炼影响认知能力的平均处理效应。
四、实证研究结果
(一)基准回归
在式(1)的基础上,我们首先利用普通最小二乘法估计参加体育锻炼影响青少年认知能力发展的均值效应,并将估计结果作为异质性分析与倾向得分估计的基准回归校准,表2 汇报了普通最小二乘法的估计结果。其中,方程(1)提供的是以是否经常参加体育锻炼作为核心解释变量的估计结果,方程(2)提供的是以平均每日参加体育锻炼的时间作为核心解释变量的估计结果,方程(3)则在方程(2)的基础上进一步纳入基期能力,R2由方程(2)中的0.2096 上升到了方程(3)中的0.3566,表明纳入能力变量后显著提升了方程在整体上对于认知能力变化的解释力度。
表2 基准回归估计结果
在方程(1)中,经常参与体育锻炼的参数估计值 β1为0.149(p<0.01),说明每周参加体育锻炼3 天以上的青少年在认知能力测试的标准化得分上,相对于参加体育锻炼在3 天以下的青少年要高出0.149,这一估计结果揭示了体育锻炼与青少年认知能力发展间具有正相关性,即长时间参与体育锻炼有助于促进青少年的认知能力发育。
在方程(2)中,以体育锻炼的时间为核心解释变量, β1的参数估计值为0.073(p<0.01),其含义是青少年参加体育锻炼的时间每上升一个单位值,可以推动自身认知能力提高0.073 个标准分。然而,当我们纳入能力变量增强对青少年前期能力的控制后, β1的参数估计值在方程(3)中下降到了0.049,也就是说运动时长促进认知能力发展的影响效应下降了0.024 个标准分。
最后,根据方程(3)的估计结果,对参与回归的控制变量的估计结果做简要汇报:完成作业时间在2 小时以下的青少年,在认知能力测试上相对于用时在2 小时以上的青少年要低0.098 个标准分;将上网和看电视时间控制在1 小时以下的青少年,相对于沉溺网络游戏和电视的青少年,认知能力测试要高出0.161 个标准分;对学业压力及家庭经济状况的感知与认知能力的发展呈负相关,家庭文化资本、人力资本以及教育期望则正向促进青少年的认知能力发展。
(二)异质性分析
1. 条件分位数回归
普通最小二乘法仅能在式(1)的基础上为我们提供体育锻炼影响认知能力的均值效应,但无法回答体育锻炼是否具有异质性特征的问题。因此,本小节在式(2)的基础上,首先采用条件分位数回归揭示体育锻炼的异质性特征。在条件分位数回归中,我们分别选取了0.1、0.25、0.5、0.75 以及0.95 认知能力分位点,依次表示青少年在低、中低、中位数、中高以及高认知能力测试上的水平,采用自举法反复抽样100 次进行回归,表3 报告了条件分位数回归的异质性分析结果。
表3 异质性分析结果(条件分位数回归)
从表3 提供的估计结果可以看出, β1在0.1、0.25、0.5、0.75 以及0.95 分位点上的参数估计值分别为0.027、0.039、0.057、0.039 以及0.027,并且各分位点上的参数估计值均具有统计学上的显著意义,其含义可以理解为青少年参加体育锻炼的时间每提高一个单位值,能将低、中低、中位数、中高以及高认知分位点上的认知能力依次提高0.027、0.039、0.057、0.039 以及0.027 个标准分,经常参与体育锻炼对于提高中位数上( τ=0.5)青少年的认知能力发展具有最强的促进作用。
根据不同认知分位点上的估计结果,对于具有相同可观测特征的青少年群体,体育锻炼的异质性特征可以总结为一条“倒V”型曲线(图1 第3 幅图):随着认知分位点的上升,体育锻炼的影响效应先上升再下降,“倒V”型曲线的拐点出现在中位数上。同时,体育锻炼对于低-高分位点上认知能力的干预效应均为0.027,表明分布在认知能力上尾端和下尾端的青少年投入更多时间进行体育锻炼不会拉开在认知能力上的组内差距。
图1 各变量在认知分位点上的变化趋势
2. 无条件分位数回归
如前所述,条件分位数回归只能基于相同可观测特征的研究假设揭示青少年参与体育锻炼的异质性特征,但该研究假设使得我们的研究结论存在一定的局限性。鉴于此,本小节将采用无条件分位数回归捕捉参与体育锻炼对于青少年群体认知能力的无条件影响。从表4 报告的回归结果上看, β1的参数估计值在0.1、0.25、0.5、0.75 以及0.95 分位点上分别为0.098、0.094、0.040、0.018 以及0.0003,并且绝大多数认知分位点上的参数估计值具有统计显著性。从估计结果中我们能够得到如下三点结论:(1)体育锻炼对于青少年认知能力具有正向的促进作用,且不同认知分位点上的干预效应存在差异,显示出体育锻炼确实具有异质性的特征;(2)体育锻炼的异质性特征与条件分位数回归提供的估计结果存在一定差异,随着认知分位点的上升,体育锻炼对于青少年认知能力的干预效应呈单调下降的趋势,而非条件分位数回归所刻画的“倒V”型曲线;(3)体育锻炼对低分位点的干预效应为0.098(p<0.01),高于高分位点上的0.0003,表明推进低认知分位点上青少年参与体育锻炼的频次能够有效缩小低-高认知分位点之间的组内认知能力差异。
对比有条件与无条件分位数回归的估计结果不难发现,采用多种研究方法揭示体育锻炼的异质性特征具有一定的现实意义。如果我们仅采用条件分位数回归,则只能揭示体育锻炼的异质性特征表现为对于低-高认知分位点的影响效应相同,并且该异质性要求青少年具有相似的可观测特征。然而,当我们进一步采用无条件分位数回归后,却能发现体育锻炼的异质性特征随分位点的上升表现为单调下降的趋势,体育锻炼对于低分位点的促进作用高于高分位点,这就为推动体育项目进校园、推动家庭体育运动与全面健身热潮提供了依据,即体育锻炼不仅能够强身健体,还具有促进青少年尤其是低认知分位点青少年认知能力发展的正向溢出效应。不过,假如采用单一研究方法则无法得到这一研究结论。
表4 异质性分析结果(无条件分位数回归)
(三)倾向得分匹配估计
1. 参与体育锻炼的影响因素分析
利用倾向得分匹配法估计体育锻炼影响认知能力的平均处理效应之前,在技术处理上需首先厘清青少年参与体育锻炼的影响因素:
在式(5)中, Di为青少年体育锻炼的参与情况,X 为影响体育锻炼的相关因素。X 在理论上应该同时满足两个条件:第一,决定青少年是否经常参与体育锻炼,并且对其认知能力发展产生影响;第二,不会受到认知能力的反向干预,即成为参加体育锻炼的前定变量(方超等,2019c)。根据这一原则,我们将前述影响变量代入方程,利用Probit 二值选择模型估计了各因素对青少年体育锻炼参与率的影响,表4汇报了二值选择模型的估计结果。由于Probit 模型的被解释变量为是否经常参与体育锻炼的二元变量,估计结果仅能告诉研究者各因素对青少年是否参与体育锻炼的影响方向,而无法给出确切的概率信息,也就是平均边际效应。因此,为了得到各因素的概率值,我们进一步计算了各变量的平均边际效应,即 dy/dx(表5 第4 列)。
从表5 提供的估计结果来看,Probit 模型的估计系数与平均边际效应在参数方向与显著性上基本一致,表明方程所涉变量为青少年是否经常参与体育锻炼提供了相对稳健的解释。具体看来,完成作业时长与青少年的体育锻炼参与率呈负相关,用时在2 小时以下的青少年比超过2 小时的青少年在体育锻炼参与率上低了1.6 个百分点,这一方面说明作业时长并不是青少年经常参与体育锻炼的决定因素,另一方面也反映出作业时长并不是课业负担较好的代理指标,而用于看电视时间以及对学业压力感知的估计结果则验证了这一论断。
学校作业是青少年在学期间必须完成的任务,但课余时间的娱乐活动安排却在一定程度上具有自主选择性,并且表现为各种娱乐活动之间的相互挤出关系。譬如,当青少年选择延长看电视或玩网络游戏的时间时就意味着他们投入体育锻炼的时间相应减少,也就是说看电视构成了对体育锻炼的有效挤出。从估计结果上看,每天用于看电视或玩网络游戏时间在1 小时以下的青少年参加体育锻炼的概率值更高,表明经常参与体育锻炼的青少年在某种程度上压缩了看电视和玩游戏的时间,因而娱乐活动的可选择性与时间可支配性成为决定青少年是否参加体育锻炼的关键因素。此外,对学业压力感知更小的青少年在参与体育运动的意愿上比压力更大的青少年高出了2 个百分点。
家庭特征方面,自我感知家庭经济条件较差的青少年在体育运动参与率上比较好的青少年低3.4 个百分点,而文化资本、人力资本、教育期望与体育运动参与率则呈现出正相关性,即身处文化氛围浓厚、父母亲受教育程度较高以及对子女未来受教育程度抱有更高期望的家庭,青少年的体育运动参与意愿越强。个体特征方面,男生比女生的体育运动参与率低了9 个百分点,而身体质量指数(BMI)与青少年体育运动参与率呈正相关,BMI 每上升1 个单位值,将推动体育运动参与率上升0.3 个百分点。
表5 体育锻炼参与率的Probit 估计结果
2. 协变量的平衡性检验
基于对青少年体育运动参与率的Probit 估计,我们还需要检验协变量的平衡性。协变量的平衡性检验关注的是具有相同倾向得分的青少年在参与体育运动锻炼上是否呈现出随机分配的过程,即经常参与和不经常参与体育锻炼的青少年应该具有相似的个体特征,从而保证平均处理效应估计的准确性。从图2 刻画的核密度函数图中,我们发现在实现数据匹配后,处理组与控制组变得相对拟合与聚拢,重叠区域也稍微变得宽泛,这就使我们相信通过数据匹配能够消除青少年在可观测特征上的组间差异,从而为估计体育锻炼的净效应提供了便利。
对于数据匹配后的平衡性检验,我们首先采用Rubin(2001)提供的办法,通过伪R2(Pseudo-R2)、均值偏差(Mean Bias)、B 值以及R 值等诊断性指标,从整体上检验匹配样本的平衡性。从表6 提供的检验结果上看,数据匹配后的伪R2、偏差均值、B 值和R 值表现出下降的趋势,五种匹配策略下的B 值小于25%,R 值则落入了[0.93,1.32]的取值区间内,表明数据匹配后满足整体平衡性的要求。
图2 核密度函数图
表6 样本整体平衡性
在样本整体平衡性检验的基础上,我们进一步通过偏差削减的百分比来检验协变量的平衡性。在具体操作方面,我们剔除了青少年在小学阶段是否上过健康教育课、对身材的感知、体育锻炼时间等与认知能力发展关联相对较弱的因素,利用K 近邻匹配估计策略对协变量的平衡性进行检验,表7 汇报了协变量的检验结果。其中,表7 第3、4 列分别为处理组和控制组在匹配前后的样本均值,第5 列报告了以百分比衡量和偏误削减程度,即经常和不经常参与体育锻炼青少年的认知能力均值差与方差均值的平方根比,第6、7 列则汇报了偏差削减百分比的绝对值以及t 值。
从表7 提供的平衡性检验中可知,所有协变量的偏误在数据平衡后均实现了不同程度的削减。其中,青少年对学业压力的感知实现了最大幅度的偏误削减,降幅达到了98.2%,而青少年用于完成作业时间的偏误削减幅度最小,降幅为80.3%。总的来看,经过数据匹配后,协变量的t 值下降而p 值增大,并且不具有统计显著性,说明数据匹配消除了经常和不经常参与体育锻炼的青少年在可观测特征上的显著差异,体育锻炼的个体差异便能够被视为随机分配的过程,从而满足条件独立假设。
3. 平均处理效应估计
基于协变量的平衡性检验,我们利用研究设计所提及的五种匹配策略估计经常参加体育锻炼影响青少年认知能力的净效应,即平均处理效应(ATT),五种匹配策略分别为K 最近邻匹配、K 近邻匹配、半径匹配(卡尺匹配)、非参数的核匹配以及异方差稳健标准误的马氏匹配(Abadie et al.,2006)。技术处理方面,K 最近邻与K 近邻匹配分别采取了一对一(K=1)和一对四(K=4)的匹配策略,半径匹配(卡尺匹配)则选择了距半径“不太远”的范围(Radius=0.01),非参数的核匹配则默认了0.06 的核函数带宽,多种匹配策略一方面能够实现稳健估计,另一方面则能得到参数估计的取值区间,表8 报告了上述五种匹配策略对平均处理效应的估计结果。
表7 协变量的平衡性检验
表8 体育锻炼影响认知能力的平均处理效应估计
从表8 提供的估计结果中可以看出,体育锻炼的平均处理效应在五种匹配策略下分别为0.084、0.104、0.112、0.117 以及0.095,并且估计结果均在0.01 水平上显著,其含义可以理解为相对于不经常参与体育锻炼的青少年,一周参与体育锻炼在3 天以上的青少年能将认知能力测试的标准化得分提高0.084、0.104、0.112、0.117 以及0.095。将上述估计结果进行横向整理后,得到体育锻炼影响认知能力的平均处理效应落入了[0.095,0.117]的取值区间内,将这一取值区间与方程(1)在基准回归中提供的参数估计值(0.149)进行对比后,我们发现选择性偏差导致了传统研究方法高估了青少年积极参与体育锻炼对认知能力的促进作用。
4. 敏感性分析
最后,为了检验本文对倾向得分匹配法的运用是否纠正了选择性偏差,以及是否依然存在被隐藏偏差扰动的风险,从而导致回归方程中由误差项所反映的未观测到的异质性(Unobserved Heterogeneity)具有非随机性,我们采用罗森鲍姆提供的Wilconxon 符号秩序检验进行敏感性分析。从表9 报告的检验结果上看,在0.05 统计水平上,当Γ>1.4 时才会对隐藏偏差变得敏感;在0.1 统计水平上,当Γ>1.6 时才会对隐藏偏差变得敏感,因而可以认为处理变量青少年是否经常参与体育锻炼与遗漏变量不相关。
表9 敏感性检验
五、结论与讨论
(一)研究结论
本文利用中国人民大学调查与数据中心提供的中国教育追踪调查数据(2014—2015),采用普通最小二乘法、分位数回归以及准实验的倾向得分匹配法,实证检验了体育锻炼对青少年认知能力的影响,结果如下:
第一,利用普通最小二乘法发现,每周参加体育锻炼3 天以上的青少年在认知能力测试的标准化得分上比每周锻炼天数在3 天以下的青少年要高出0.149,而在控制基期能力后,青少年参加体育锻炼的时间每上升1 个单位值,能将认知能力测试成绩提升0.049 个标准分。
第二,利用条件分位数回归发现,参加体育运动对认知能力处于中位数上的青少年具有最强的促进作用,并且投入更多时间进行体育锻炼不会拉开青少年在低-高认知能力上的组内差距,而体育锻炼的异质性特征突出表现为“倒V”型曲线;利用无条件分位数回归放松对青少年在可观测特征上相似性的假定后,发现体育锻炼的异质性特征随分位点的上升表现出单调下降的趋势,体育锻炼对于低分位点的影响效应高于高认知分位点,因而鼓励低认知能力的青少年积极参加体育运动有利于缩小认知能力的组内差异。
第三,利用Probit 模型对青少年体育运动参与意愿的分析发现,学校作业并非青少年参与体育锻炼的决定因素,看电视、玩网络游戏等则对青少年参与体育锻炼构成了挤出关系,家庭特征中的文化资本、人力资本以及教育期望与青少年的体育运动参与率呈正相关,女生比男生的体育运动参与率高出9 个百分点,而青少年的BMI 每上升1 个单位值,将会提高0.3 个百分点的体育运动参与率。
最后,在协变量平衡性检验的基础上,利用倾向得分匹配法估计出经常参与体育锻炼对青少年认知能力的促进作用落入[0.095,0.117]的取值区间内,经常参与体育锻炼能将青少年在认知能力测试上的表现提高0.095—0.117 之间,估计结果低于基准回归中的0.149,表明忽视选择性偏差将会高估体育锻炼的净效应。
(二)进一步讨论
本文的研究结论具有一定的政策意涵。首先,本文依次通过基准回归、异质性的分位数回归以及准实验的倾向得分匹配法,揭示并确定经常参与体育锻炼对青少年的认知能力发展具有正向促进作用。这就为决策部门推行体育进校园、大力倡导青少年进行体育锻炼找到了理论依据:体育锻炼不仅能够为青少年提供强健的体魄,在某种程度上还具有一定的正向溢出效应,即有利于提高青少年的认知能力。其次,父母对子女的教育期望与青少年是否参与体育运动并不矛盾。父母的受教育程度、教育期望与青少年的体育运动参与率呈现出正相关,表明高知父母乐于子女参与体育运动锻炼,而体育锻炼又能促进青少年的认知能力发展,这就为千万家庭广泛鼓励子女参与体育运动找到了现实依据。父母在家庭教育中应摒弃“重武轻文”的传统观念,对青少年参与体育运动形成“鼓励-支持-引导-反馈”的有益闭环。最后,从影响因素上看,各项课余时间的娱乐活动与青少年参与体育运动之间存在一定的挤出关系,看电视与网络游戏的时间会挤占青少年参与体育运动的时间,这就要求父母对青少年的课余时间做出科学的规划与指导,合理安排时间并对各项娱乐活动进行平衡。