APP下载

基于多层线性模型的青少年认知能力作用机制研究

2021-09-25

关键词:变量系数青少年

赵 赞

(湖南工程学院 计算科学与电子学院,湘潭411104)

0 引言

不同的家庭、不同的社会背景究竟对学生能力发展的影响如何,成为学者们研究的热点问题.影响青少年认知能力的因素来自不同层次,如学生个体层次(第一层)的自我教育期望、父母教育程度和家庭经济条件等,以及班级组织层次(第二层)的女生比例、群体父母教育程度和群体经济条件等.现有的相关研究大多采用最小二乘(OLS)回归或结构方程(SEM)的传统线性模型[1-3],仅支持对涉及一层数据的问题进行分析,从而忽略了群体因素(学校或班级层面的因素)对于青少年认知能力发展的直接和间接影响.为了解决这一问题,本文将通过多层线性模型进行深入分析.HLM模型针对的是多层嵌套关系数据的研究,如学生嵌套于班级,班级镶嵌于学校.该模型不仅能够研究各层变量的直接影响,而且能够同时研究学生层次变量与班级层次变量之间的交互作用,从而分别揭示在个体和群体层面影响青少年认知能力的重要和中介因素,全面构建青少年能力发展的作用机制模型,并据此提出具有建设性的相关建议.

1 数据来源

本文所采用的CEPS数据来源于中国人民大学中国调查与数据中心,它所针对的调查对象为初中生群体,并对他们进行长期的追踪调查,因此该大型社会调查项目具有全国性和连续性.它采用的调查方法为多阶段的概率与规模成比例(PPS)抽样方法,基线调查于2013-2014学年进行,对七年级和九年级进行同步调查,随机抽取了112所学校、438个班级进行调查,被调查学生人数共19487名,根据对研究变量的选取,在剔除缺失值和无效数据后,最终来自112所学校共15869名学生的样本进入了本次研究.

本文的被解释变量为青少年的认知能力,通过CEPS数据中的cog3pl变量来测量.此项测验题目的内容与学校科目中所教授的具体识记性知识并无太大关联,而是考察各年级中学生的逻辑推理与解决问题的能力,在国际上具有可比性.该指标为连续性变量,分数越高,表示青少年的认知能力越强.本文的解释变量则是由CEPS学生问卷中相应的问题进行测量,通过对这些问题的选项进行编码得到其问卷调查结果的均值和标准差等统计数据.最终的研究变量赋值与描述性统计如表1所示.

表1 变量赋值与描述性统计表

2 多层线性模型

影响个体行为的因素来自两个方面,一是自身特征对个体的影响,二是个体所处环境对其造成的影响,其中环境指群体或者层次.传统的线性回归模型具有一定的自身局限性,使得它在对不同层次的数据进行变异分解时难以将群组效应进行分离,导致模型的误差项数值增大.此外,由于实际研究的数据往往比较复杂且存在不同的分布方式,因此会破坏传统回归模型建立之前应当满足的方差齐性假设.综合上述传统回归模型与研究数据的特性,传统模型在本次研究中适用性较差,因此本研究通过引入多水平分析的方法来解决上述问题.

普通最小二乘(OLS)回归方程如下:

其中β0表示截距,β1表示线性回归系数,残差项γi的假设为:1)γi服从正态分布;2)γi是相互独立的;3)γi的方差恒定;4)γi与因变量不相关.对于自然存在的嵌套数据,其残差很难满足上述假设,因此考虑使用多层线性模型解决这一问题:

对第一层:

对第二层:

合并后的模型为:

其中Y ij表示第j个班级第i个学生的因变量值(如:学生的学业成绩),X ij表示第j个班级第i个学生的自变量值(如:学生的学习动机强度),W j表示第j个班级的特征变量(如:班主任的工作年限);β0j和β1j分别表示第j个班级学生的学习动机强度对学业成绩回归直线的截距和斜率,γij表示第j个班级第i个学生的测量误差;对于第二层变量,γ00和γ10分别为β0j和β1j的平均值,为固定成分;μ0j和μ1j分别为β0j和β1j的随机成分,代表第二层不同组织之间的变异.

多层线性模型能够将残差项进行分解,使得残差满足OLS回归的理论假设,对于多层嵌套数据的研究更为合理.

3 分析架构

本文的因变量为青少年的认知能力,属个体层次.第一层的解释变量主要用于反映个体因素、家庭因素和社会因素的影响.个体因素主要考虑青少年的自我教育期望;家庭因素包括家庭经济资本、家庭社会资本和家庭文化资本;社会因素包括师生关系和同学关系.第二层的解释变量主要包含女生比例、群体经济水平、群体父母教育程度和父母职业多样性四个解释变量.女生比例表示班级中女生所占的百分比,主要体现群体性别因素的影响;群体经济水平和群体教育程度均是通过第一层相应的解释变量,以班级为单位分类整合而来.父母职业多样性的计算方法参考Fu和Cities(2007)[4]的计算方法,具体如下:

其中OD j表示第j个班级的父母职业多样性,取值介于0和1之间,数值越大,表示该班级内的父母职业多样化程度越高.PN j表示第j个班级的父母人数,PN ij表示第j个班级内从事第i类职业的父母人数,n j表示第j个班级内父母所从事的全部职业类型数.

根据上述所选变量,变量间的假设关系如图1所示,其中实线箭头(H1~H12)表示各层变量对认知能力直接正向影响的假设,虚线箭头(H13~H15)表示第二层变量对第一层变量与认知能力关系的间接正向调节作用的假设.

图1 认知能力研究架构图

4 实证分析

本文使用HLM模型来验证图1架构中的相关假设,估计结果如表2所示.

表2 青少年认知能力驱动因素的多水平分析结果

续表2

其中模型1~模型4分别表示零模型、随机系数回归模型、截距模型和完整模型.根据表2可知,四种模型中完整模型的偏离值(deviance)最小,说明它与实际情况最为契合,适配度最佳.

4.1 零模型(模型1)

零模型中只有被解释变量和群组变量,不含任何解释变量,用于检验青少年的认知能力是否会因为班级的不同而有所差异.具体模型如下:

式中,cog ij表示第j个班级中编号为i的青少年的认知能力测试分数,εij表示个体层次误差项,u0j表示班级层次误差项,γ00表示青少年认知能力在不同班级的平均值.通过零模型结果可计算组内相关系数ICC值,该值用于检验个体数据是否可以正当地聚合为更高阶的数据,在更高阶进行分析.ICC(1)表示组间方差对总方差的解释占比,ICC(2)表示组均值代表组员的可信程度.据表2零模型的检验结果显示,组间方差和组内方差分别为0.233和0.510,经(9)式计算得到其ICC(1)和ICC(2)分别为0.295和0.938,分别大于0.05和0.5的经验值,表明不同班级间的认知能力存在明显差异,满足多水平分析的要求.

ICC值具体计算方式如下:

4.2 随机系数回归模型(模型2)

随机系数回归模型只将第一层变量代入方程,而第二层方程中不代入变量.这一模型旨在检验第一层变量的影响是否显著存在,具体设定如下:

估计结果如表2(模型2)所示.零模型的组内方差是0.510,而随机系数回归模型降低到了0.470,改善了7.842%.这表明第一层变量能够有效解释青少年认知能力的组内差异,随机系数回归模型的适配性得到了验证.

(1)控制变量

控制变量中,性别系数γ10=-0.034(t=-3.251,p=0.002),在1%水平显著,说明男生认知能力的整体水平高于女生;年级系数γ20=-0.032(t=-0.709,p=0.478),说明年级对青少年的认知能力无显著影响.

(2)个人因素的影响

自我教育期望的系数γ30=0.032(t=17.956,p=0.000),说明青少年的自我教育期望越高,认知能力越强,研究假设H1得到验证,表明对自己未来的教育发展有强烈愿望的青少年,其认知能力能得到更好的发展.

(3)家庭因素的影响

家庭经济资本系数γ40=0.022(t=2.199,p=0.028),青少年所处家庭的经济条件越好,更可能为孩子提供优越的学习和认知能力发展环境,研究假设H2得到验证.家庭社会资本中的亲子沟通频率系数γ50=0.003(t=0.240,p=0.811),说明家长与孩子之间的普通亲子沟通对青少年认知能力的影响并不显著,研究假设H3不成立.父母教育期望系数γ60=0.019(t=10.623,p=0.000),学生家长对孩子的教育期望越高,青少年的认知能力越强,研究假设H4得到验证.家庭文化资本中的父母教育程度系数γ70=0.010(t=3.633,p=0.001),父母的教育程度越高,其孩子的认知能力越强,研究假设H5得到验证.家庭藏书量的系数γ80=0.036(t=6.055,p=0.000),家庭的藏书越多,越能激发青少年对知识的兴趣,其认知能力越强,研究假设H6得到验证.

(4)班级社会因素的影响

在班级社会因素的影响中,师生关系系数γ90=0.025(t=2.289,p=0.023),与老师的关系越亲近,青少年的认知能力水平越高;同学关系系数γ100=0.007(t=0.650,p=0.516),表明与同学关系越好的中学生,其认知能力越强.研究假设H7和H8均被证实,说明在班级中维系良好的人际关系可为青少年提供良好的认知能力发展环境.

4.3 截距模型(模型3)

第二层变量对青少年认知能力的影响通过截距模型来测量.截距模型在第一层方程中只加入控制变量,再以第一层的截距项β0j作为因变量,加入第二层的解释变量.模型设定如下:

估计结果见表2(模型3).零模型的组间方差是0.483,而截距模型降低到了0.135,改善率高达72.052%,这表明第二层变量能够有效解释青少年认知能力的组间差异,截距模型与零模型相比有所改进.

女生比例的系数γ01=0.850(t=4.274,p=0.000),说明班级中的女生比例对青少年的认知能力水平有显著的正向影响,即女生比例越高(在一定范围内),班级中学生的平均认知能力水平就越高,研究假设H9得到证实.群体经济水平系数γ02=0.349(t=3.510,p=0.001),说明群体经济水平对青少年认知能力的影响显著为正,若某班级的群体平均经济条件越好,则该班级中学生的认知能力水平越高,研究假设H10得到证实.群体教育程度系数γ03=0.116(t=8.256,p=0.000),说明群体教育程度对青少年认知能力具有显著的正向影响,若班级中学生父母的平均教育程度越高,青少年个体的认知能力水平越高,研究假设H11得到证实.父母职业多样性系数γ04=0.460(t=3.075,p=0.003),说明班级中的父母职业越多样化,青少年个体的认知能力水平越高,研究假设H12得到证实.

4.4 完整模型(模型4)

班级中各群体因素对影响青少年认知能力因素的调节作用通过完整模型来进行分析,即将第一层方程的截距项和斜率项作为因变量,并加入第二层的解释变量,具体设定如下:

估计结果见表2(模型4),零模型的组内方差和组间方差分别是0.510和0.483,而完整模型的两项指标分别降到了0.471和0.136,改善了7.653%和71.842%,则完整模型能够有效解释青少年认知能力的各项差异,表明该模型的适配性较好.

在家庭平均经济水平对自我教育期望的调节作用上,其系数γ31=0.016(t=2.347,p=0.019),说明随着班级中家庭平均经济水平的提高,自我教育期望对青少年认知能力的正向影响会进一步增强,研究假设H13得到证实.在父母平均教育程度对父母教育期望的调节作用上,其系数γ61=0.003(t=2.838,p=0.005),说明随着班级中父母平均教育程度的提高,父母教育期望对青少年认知能力的正向影响会进一步增强,研究假设H14得到证实.而父母平均教育程度对家庭藏书量的调节作用系数为γ81=0.006(t=1.618,p=0.106),说明此调节作用不显著,研究假设H15不成立.

5 结论

本文利用CEPS全国数据,结合HLM多水平模型探讨了青少年认知能力的作用机制,得到以下结论:在个体因素方面,自我教育期望对青少年认知能力具有显著影响;在家庭因素方面,包括家庭经济资本、家庭社会资本和家庭文化资本,普遍对青少年的认知能力具有正向影响;在社会因素方面,师生关系对青少年的认知能力有正向影响.因此建议每个青少年应对自己的未来做长期规划,充满自信;每个家庭需尽量为孩子提供良好的教育环境,增大在文化资本方面的投入,尽可能地提高青少年发展能力的机会;教师在教学中不但要传授知识,还要注意增强与学生的互动,让学生体会到老师对自己的关心和关注.

考虑到本文数据为两层嵌套关系,因此使用多水平线性模型进行了分析,从理论和实证结果均可表明HLM模型非常适合于此类嵌套数据的研究.针对不同类型的多层数据,可通过建立两层、三层甚至四层线性模型,得到更加精准的研究结果,进而延伸应用到其他领域.

猜你喜欢

变量系数青少年
基于符号相干系数自适应加权的全聚焦成像
青少年发明家
寻求不变量解决折叠问题
抓住不变量解题
苹果屋
嬉水
分离变量法:常见的通性通法
激励青少年放飞心中梦
让雷锋精神点亮青少年的成长之路
他为青少年开展普法教育