我国城市社区居民体育锻炼行为研究
2011-11-09李骁天周风祥
李骁天,宁 科,周风祥
(1.首都体育学院产业与体闲教研室,北京 100088;2.陕西教育学院体育部,陕西西安 710061; 3.伊犁师范学院体育学院,新疆伊宁 835000)
我国城市社区居民体育锻炼行为研究
李骁天1,宁 科2,周风祥3
(1.首都体育学院产业与体闲教研室,北京 100088;2.陕西教育学院体育部,陕西西安 710061; 3.伊犁师范学院体育学院,新疆伊宁 835000)
采用分层线性模型对我国城市社区居民的个体体育锻炼行为进行研究。研究认为,社区居民的体育锻炼行为的发生不仅受到个体每周工作时间影响之外,受到受教育年限的影响,更重要的是社区居民体育锻炼行为受到高层次变量——家庭月支出的影响。
城市社区;体育锻炼行为;分层线形模型
人们的体育锻炼行为的发生受到多种因素影响。纵观当前体育锻炼行为的文献多在个体层次的变量基础上,进行人群分组后的群组之间体育锻炼行为的对比,得出组与组之间健康满意度有无差异;其次将体育锻炼行为研究作为因变量,选择人口学变量:生活行为及患病情况等作为自变量建立统计模型分析。该类研究主要针对影响体育锻炼行为的因素进行统计分析,将不同类型的影响因素纳入同一模型进行回归分析就可能产生分析结果异常,原因在于影响人们体育锻炼行为的各种因素之间可能存在分层结构现象,其导致的案例同质性可能会使传统的回归方法不能有效分析各种因素的具体影响。因为不同人群总是嵌套在不同的群体组织中,如学生嵌套在学校之中,个人嵌套在家庭组织中。个体数据在单位上具有嵌套的关系,在同一单位内的观测,具有更大的相似性。影响人们体育锻炼行为的分层结构决定了人们的实际生活状态,单个人的体育锻炼行为必然会受其个体的社会经济教育因素等因素的影响,同时单个人又生活在更高层级的家庭组织和社区环境中,家庭经济状况、生活区域环境质量等也可能会对其体育锻炼行为产生影响。
为避免案例同质性的负面影响,采用分层模型方法,来研究个体的体育锻炼行为是否受到家庭层次因素的影响。分层线性模型是一种专门用于分析分层结构数据的分析方法,它能够在分析过程中有效地做到宏观与微观相结合,避免了传统回归方法对分层数据分析的一些弊端。分析分层差异是否会对人们的体育锻炼行为产生显著影响,以及在考虑分层结构效应的前提下,各层所含具体影响因素对是否会对人们的体育锻炼行为产生显著影响,具体影响力有多大,以期为提高我国城市社区居民体育锻炼行为研究提供理论上的帮助。
1 研究对象与方法
1.1 研究对象
论文数据来源于CGSS2006项目。该项目对全国125个县(区)、500个街道(乡、镇)、1 000个居(村)委会、10 000户家庭中的个人进行调查,有效问卷11 250份。本研究选自城市社区问卷数据部分,根据研究设计要求对数据进行删失处理,保留2 647个样本,其中女性样本1 270个(48.2%),男性样本1 376个(51.8%)。
1.2 研究方法
1.2.1 数理统计法 分层线性模型是一种具有普适性的新统计模型,正好适用于上述这种分层结构数据的分析。分层模型可以在一个模型中通过嵌套子模型来对不同层次的变量进行分析。比如个人隶属于家庭,家庭又隶属于社区,而同一社区、同一家庭的学生由于面对同一环境,因而有很强的共同性。这就是分层数据结构。该方法比常规回归方法更有优势,分层线性模型可以在一个模型之中同时处理微观层次的个人变量和宏观层次的处理变量。分层线性模型在三个方面优于常规统计方法,一是能够对个体单位取得较好的效应估计,二是可以对各层次之间的效应建立模型并进行假设检验;三是可以分解各个层次间的方差和协方差成分。这种模型不仅在技术上是强大的,而且比传统单一层次的统计技术具有更大的包容性(或称为一般性),改进了对个体效应的估计。
本研究主要采用HLM 6.06软件建立分层模型分析。它可以分析目前数据结构是否具有层次效应,可以允许个人层次采用logistic回归(或其他非线性回归),而家庭层次自变量对个人层次自变量系数的影响则采用线性回归。采用非线性分层模型对影响人们体育锻炼行为的自变量比进行研究,即可以在家庭层次使用家庭年收入、家庭月医疗支出等自变量进行研究。分层模型可以将家庭层次的家庭收入等变量和个人层次的其他变量结合在一起,来解释体育锻炼行为的发生。
1.2.2 专家访谈法 对从事群众体育的专家以及社会统计学的学者进行面访、电话访谈、电子邮件咨询等方式,多方面、多渠道广泛咨询和征求研究对象范畴的意见和看法,并进行记录整理。此外还访谈一些普通居民对本研究提供扎实、丰富的实证依据。
2 研究设计
首先是分析家庭层面自变量对个体层面因变量体育锻炼行为的影响。对于此首先采用HLM分析研究个体层次与家庭层次的关系。探索个体层次的体育锻炼行为是受家庭层次的自变量影响。进而在HLM软件进行模型分析时对逐渐纳入连续性变量模型进行拟合分析。
3 研究假设
体育锻炼行为的发生不仅受年龄、个人收入、个人所受到的健康教育等因素的影响,还受到了体育态度、心理因素、行为环境、社会环境等潜在变量的影响。有学者认为城市各阶层居民体育锻炼参与程度存在显著性差异,并有随着阶层上升而上升的趋势;各阶层居民体育锻炼行为影响因素存在着结构性差异,并随着阶层上升影响因素越趋向多元化。此外,有研究者从家庭微观角度探索家庭环境视角发现父母受教育程度与大学生余暇体育锻炼行为的关系呈现低度负相关;父母参加锻炼状况与大学生余暇体育锻炼行为的关系呈正相关;父母对子女参加体育锻炼的态度对大学生参加余暇体育锻炼相关不密切;有学者借助操作条件反射学说和组织行为学中的强化理论分析了体育习惯和运动技能之间的关系。综观上述研究发现,这些研究始终没有涉及研究环境及学校层次的变量、家庭层次的变量与社区层次的变量对个体体育锻炼行为的影响;在个体水平上究竟个人收入、每周工作时间、受教育年限、性别究竟会对产生体育锻炼行为有什么样的影响。对于此本文设立如下假设。
H1.个体水平
H1-1.个人体育锻炼行为受性别影响。
H1-2.个体体育锻炼行为受个人的受教育年限影响。
H1-3.个体体育锻炼行为受个人的每周工作时间影响。
H1-4.个体体育锻炼行为受个人的年收入影响。
H2.家庭水平
H2-1.个人体育锻炼行为受家庭年全家总收入影响。
H2-2.个体体育锻炼行为受家庭年教育费用影响。
H2-3.个体体育锻炼行为受家庭月基本生活费影响。
H2-4.个体体育锻炼行为受家庭年医疗费影响。
4 研究模型设计
本研究中只选择建立随机效应的贝努里两层模型,不涉及随机系数模型与以截距和斜率作为结果的模型。
4.1 研究变量选择
本研究在个人层次上的自变量为个人年收入、个人每周工作时间、性别、个人受教育年限,因变量为体育锻炼行为(该变量为虚拟变量:0为不锻炼,1为锻炼)。家庭层次变量为家庭年收入、家庭月基本生活费、家庭年医疗费、家庭年教育费用(表1、表2为各层自变量的描述统计结果)。
表1 LEVEL-1个体层次变量描述性统计
表2 LEVEL-2家庭层次变量描述性统计
4.2 零模型
由于层一体育锻炼行为因变量是二分变量,故采用专门分析二分变量的贝努里模型。进行分析首先设立零模型(null model),它又称为随机效应的单因素方差分析(Oneway ANOVA with random effect),也就是说设立零贝努里模型。零模型分析是应用分层模型分析的第一个步骤,是指在模型各层中不加入任何解释变量,对分层数据进行无条件方差分解分析,通过零模型的分析,可以将个体体育锻炼行为的总方差分解到不同层次,观察两层随机方差各占总方差的比例分布,便可以确定进行分层分析是否必要。采用HLM软件来进行人们体育锻炼的分层分析。以本研究为例,层一为个人,层二次为家庭,层次一的模型与传统的回归模型类似,与一般回归方程有区别的是,回归方程的截距和斜率不再假设为一个常数,不同的是个人回归方程的截距和斜率都不同,是一个随机变量。个人的回归方程的截距和斜率都直线依赖于第二层次变量(家庭收入、支出等),这样就构成了个人—家庭二层模型,模型可表示如下。
层一模型(个人层次):
层一模型中由于因变量B0取值1时代表参加锻炼,所以模型中的P就是参加体育锻炼的概率。而这时的发生比P/(1-P)的意义其实就是参加体育锻炼行为的比率。一般检验数据存在层级效应有三类方法,首先看零模型的Random Effect的卡方检验P值是否显著,其次组内相关系数(ICC1>.12)的存在可以说明存在层级效应,需要两层模型来运算。这反映出人们体育锻炼行为的总方差中层-2家庭方差所占比例越大,因此用家庭级变量来加以解释的可能性就越大。如果这一方差比例极小,便表明家庭之间差异极小,那么意味着家庭级模型没有什么可以解释的余地,即这一层次的设立没有必要,便否定了家庭特殊影响的存在,因而也就没必要采用分层模型,可以用常规回归模型直接分析个体案例数据。再次,ICC2与ICC1不同的是受到层二样本量影响,ICC2>.70即说明模型存在层级效应。一般这三个指标放在一起来检验模型是否存在层级效应。零模型运行Final estimation of variance components:Random Effect的卡方检验P值显著,证明数据存在层级效应。
其次,组内相关数ICC1=.21>.05,说明有21%的变异来自家庭(即组间变异),79%的变异来自个体变量。经计算ICC2=.98>.70,说明数据存在层级效应。根据研究需要在模型中的两层纳入自变量后的全模型进行运算。
4.3 全模型
全模型,在层一与层二纳入了研究所涉及的自变量。该模型的具体研究假设是:认为人们的体育锻炼行为的发生是由于分属于不同经济收入水平的家庭类型,其体育锻炼行为的产生存在差异。同时个体的生活的具体区域环境差异也会导致个体体育锻炼行为状况存在显著不同。全模型如下:
层一模型(个人层次)
其中G00是层-1模型的截距,由于各连续变量都按家庭的平均值对中,因此截距在这里代表着各家庭的个人体育锻炼行为。而其他各B系数分别代表个人特征变量的效应,它们体现着由于个人特征而导致每个体育锻炼行为对家庭的系统性偏离,与一般回归系数的解释方式相同。
在加入层二的变量后,引入家庭层次的家庭年收入、家庭月基本生活费、家庭年医疗费、家庭年教育费用的自变量之后,这里家庭层次仅有家庭月基本生活费显著,其他不显著(详细讨论下个小节)方差成分由第一层模型的0.13053减少到0.02130。从纳入家庭层次的自变量与个体层次的自变量来说,模型的方差降低,说明模型分层效应明显。
5 讨论
从本研究的假设认为,城市社区中体育锻炼行为是由个人特征和所处背景共同作用的结果,经济、社会和文化等方面都会对体育锻炼行为产生一定的影响。家庭的背景变量包括该家庭的年收入、月支出、家庭年教育支出等,这可以作为个体所在家庭的经济和社会状况指标。家庭收入(SD= 26500.43)的差别其实都是比较大的,反映出我国在城市社区中的家庭经济、社会发展水平的不同。随机效应的两层贝努里模型只做个体体育行为锻炼是否受到来自家庭层面的自变量的影响及个体水平自变量的影响。
表3 对城市社区家庭个人体育锻炼行为的HLM完全模型分析的回归系数表
从表2发现层二中的家庭收入(famincome)、家庭医疗费用(famhos)、家庭年教育支出(famedu)这三个自变量对于模型不显著,仅有家庭月支出(fammof)显著。层一中的性别(gender)与个人年收入(indincome)不显著对个体体育锻炼行为没有影响,这一点与何丽娟研究结果一致,受教育年限(eduyear)与每周工作时间(weekhours)显著。下面对分析结果做解释。最终模型的截距B0是体育锻炼行为发生比,即在控制了家庭影响条件下、个人层次模型的体育锻炼行为发生比。本模型的总参照类(所有个人自变量全都取0值)就是:锻炼。由于现在个人层次回归方程的截距值还取决于家庭月支出(即B0=G02×家庭月支出),已经不再是一个常数。说明家庭支出越大其体育锻炼行为的发生比越高。G02对应的优势比(OR)为1.030,它的实际意义是,表明在控制其他变量或其他方面不变当家庭月支出提高1元钱(即从0变为100%时),它导致个体体育锻炼行为变化1.030倍,这是家庭月支出对体育锻炼行为直接影响的一种统计归纳。这里并不是说家庭月支出越多就是人们参加体育锻炼的原因,而是说在存在体育锻炼行为偏好为既成事实的条件下,家庭月支出提高,个人就容易参加体育锻炼。其次,从回归系数(Coefficient=0.0101)为正值即增高家庭月支出可以促进个体体育锻炼行为的可能性会提高来看,对于个体层次的自变量来说,受教育年限与每周工作时间显著,受教育年限的回归系数为正值,即为提高受教育年限会促进个体参加体育锻炼,它的实际意义是,表明在控制其他变量或其他方面不变个人体受教育年限每提高一年(即从0变为100%时),它导致个体体育锻炼行为变化1.145倍,需要注意的是受教育年限越多会导致个体参加体育锻炼,而是说在存在体育锻炼行为偏好为既成事实的条件下,受教育年限提高会导致个人参加体育锻炼的发生率。每周工作时间显著,值得注意的是每周工作时间的回归系数为负值,即为减少每周工作时间会促进个体参加体育锻炼,它的实际意义是,个体每周工作时间每减少一小时,它导致个体体育锻炼行为变化0.987倍,这是个体每周工作时间对体育锻炼行为直接影响的一种统计归纳,并不是说减少每周工作时间越多会导致提高个体参加体育锻炼,而是说在存在体育锻炼行为偏好为既成事实的条件下,个体每周工作时间减少,个人就容易参加体育锻炼,这和实际情况一致,困扰我国城市居民参加体育锻炼的因素当中就有没有时间参加体育锻炼。总体说来,从数据的模型拟合情况来看家庭层面的自变量对个体水平的体育锻炼行为的发生确实有影响,到底影响有多大,这可以作为本研究今后的一个研究方向。这对今后制定城市社区体育发展政策来说,促进家庭层面的消费会对个体体育锻炼行为的发生有一定作用。但是家庭收入在本研究未体现出对个体育行为的发生有影响,值得关注。因为家庭支出与家庭收入呈显著的相关关系——收入决定支出(支出每提高一元体育锻炼行为发生比会提高1.030陪),支出显著而收入不显著的悖论,需要今后更进一步的定性研究,此外对于这个问题需要借助更多角度的研究,因为相关性高的变量会在方程中出现共线性的问题,造成模型不拟合。个体水平的自变量来看个体的受教育年限对体育锻炼行为的影响要大于每周工作时间影响(比数比OR),看来提高学历水平对体育锻炼行为有一定的影响。对于之前文献研究过程中发现性别对于体育锻炼行为发生有影响这在本研究未得到证实,最后,个体收入对个体体育锻炼行为没有影响这一点与人们常识不一样,对于造成其的原因需要进一步的定性研究。
6 结论
本研究所设立的假设来看个体水平的H1-1没有通过验证,即性别对参加体育锻炼行为没有影响;H1-4没有通过验证,即个人年收入对个体参加体育锻炼行为没有影响。家庭层次H2-1没有通过验证,即家庭年收入对参加体育锻炼行为没有影响;H2-2没有通过验证,即家庭年教育投入对个体参加体育锻炼行为没有影响;H2-2没有通过验证,即家庭年教育投入对个体参加体育锻炼行为没有影响;H2-4没有通过验证,即家庭年医疗支出对个体参加体育锻炼行为没有影响。在通过模型验证的自变量中家庭层次中家庭月支出对个体体育锻炼行为的影响比较大,回归系数达到了0.0101,比数比为1.030。在个体层面的变量中受教育年限与每周工作年限对体育锻炼行为的发生具有显著性。尤其是受教育年限,看来今后在提高群众体育锻炼的参与率应重点提高人们的受教育年限上。此外,每周工作时间对体育锻炼行为的影响比较显著,这与人们的常识接近即工作时间会制约人们体育锻炼行为的发生。最后,在多水平模型分析中,一些自变量不显著,并不一定表明它们真的没有实际作用,可能存在其他原因,不要轻易放弃。对于在多水平模型中回归系数统计性不显著的一个原因是前面已经提到的自变量之间的多元共线性问题,它不仅发生于定距自变量之间,也同样发生于标识编码自变量之间。
7 研究的不足及展望
本研究只设计了简单的随机效应模型来探索家庭层面自变量与个体层面自变量对个体体育锻炼行为的影响,未涉及本研究的基础模型的扩展——随机系数模型与以截距和斜率为结果的模型。这就会造成无法回答回归方程在家庭之间的变化程度有多大,具体的说无法区分究竟是家庭月支出对个体体育锻炼行为的影响大,还是个体层次的每周工作时间与受教育年限对体育锻炼行为的影响大。其次,无法分析两层中的自变量与体育锻炼行为这个因变量的相关性。因此今后研究应设计随机系数模型来探讨上述问题。再次,截距和斜率为结果的模型将会解决为什么有些家庭的均值高于其他家庭,为什么有些家庭月支出与个体体育锻炼行为的相关程度要高于其他学校。这些都是今后要深入讨论的问题。此外,本研究只对城市社区中居民的体育锻炼行为进行了研究,未对农村的样本进行研究,下一步对农村进行研究也是今后的研究方向。
[1]StephenW,Raudenbush,Anthony,et al.HierarchicalLinearModels: Applicationand Data Analysis Methods(Second Edition)[M].Sage Publication,USA,2002.
[2]Tom A.B.Snijders,Roel J.Bosker.Multilevel Analysis:An Introduction to Basic and Advanced Multilevel Modeling[M].SAGEPublications,1999.
[3]张 雷,雷 雳,郭伯良.多层线性模型应用[M].北京:教育科学出版社,2003.
[4]陈晓萍,徐淑英,樊景立.组织与管理研究的实证方法[M].北京:北京大学出版社,2008.
[5]郭志刚.2000年人口普查按生育政策类型的人口分析.2000年人口普查国家级重点课题研究报告[R].北京:中国统计出版社,2005.
[6]郭志刚,李剑钊.农村二孩生育间隔的分层模型研究[J].人口研究,2006(4):1.
[7]成 君,赵 冬,曾哲淳,等.北京市居民体育锻炼现状及其影响因素分析[J].中国公共卫生,2007,23(5):2.
[8]周林清,李相如,孙艳英,等.北京市城市社区体育的现状及发展趋势[J].体育科学,2003,23(5):62-66.
[9]郭新艳,徐玖平.城镇居民体育锻炼行为变化阶段量表的编制与检验——基于四川省部分城市居民社区的调查[J].成都体育学院学报,2010,36(5):20.
[10]汤国杰,丛湖平.社会分层视野下城市居民体育锻炼行为及影响因素的研究[J].中国体育科技,2009,45(1):31.
Residents’Sports Exercise Behavior in Urban Communities
LI Xiaotian1,NING Ke2,ZHOU Fengxiang3
(1.Department of Sports Industry and Leisure Sports,Capital Institute of Physical Education,Beijing 100088,China;
2.Dept.of PE,Shaanxi Institute of Education,Xi’an 710061,Shaanxi,China;
3.Institute of PE,Yili Normal College,Yining 835000,Xinjiang,China)
This study examines unban community individual sports exercise in our country by Hierarchical Linear Models.The research shows that the behavior of community crowd is affected by three variables as follows:1)influenced by the working hours of individual each week;2)limited by the level of education background;3)affected by monthly available salary which is the most magnificent one in the behavior of urban community individual sports exercise research.
unban community;the behavior of sports exercise;hierarchical linear models
G80-05
A
1004-0560(2011)05-0012-04
2011-01-12;
2011-02-26
李骁天(1979-),男,博士,主要研究方向为休闲体育。
责任编辑:乔艳春
◂体育人文社会学