基于分层线性回归模型的上海市外来务工人员心理健康状况及影响因素分析
2014-02-08宋徽江汪天英
宋徽江,汪天英,刘 瑶
上海每年约有400万外来务工人员,提高他们的综合保障水平不仅关系到外来务工人员自身的发展和幸福,还影响到整个社会的和谐与稳定。有研究提示,外来务工人员中心理压力巨大的情况较为突出[1]。当前针对外来务工人员的心理状况分析往往将其心理情况与年龄、性别、居住情况、不良生活习惯、工作环境等诸多因素参杂在一起进行多元Logistic回归分析,往往得到不一致的相关性结论,这些研究的统一特征是:将环境层面的变量和个人层面的变量统一分析,而未加以分层,这样的结论往往缺乏可靠性,也不能说明环境层面的变化对个人实际生活状况的影响,本研究通过横断面研究获得农民工的心理健康状况、生活习惯资料,结合其生活环境,利用国际上较为先进的分层线性模型(HLM)展开分析,了解上海市外来务工人员的心理健康状况及影响因素,并验证这一方法在此项研究领域中的有效性。
1 资料与方法
1.1 资料来源 于2012年7—10月,选择普陀区长征、长宁区新泾、浦东新区三林、徐汇区漕河泾、杨浦区殷行、嘉定区黄渡、青浦区华新7个社区(皆为本市外来务工人员较为集中的区域)作为现况调查区域。按照本市外来务工人员的性别、年龄分布等人口学特征,采用分层整群随机抽样的方法进行抽样。数据资料包含了体检者姓名、性别、年龄、居住地等基本信息。最终有效问卷调查人数841人。
1.2 研究方法
1.2.1 环境变量的控制与赋值 环境选择居住区域、行业以及单位规模3个变量,覆盖了农民工的工作和生活环境,具有较强的代表性。农民工居住区域按照城乡差异进行分类赋值建模;工作环境根据农民工较为集中的建造业、餐饮住宿业、家政服务业、批发零售业、娱乐性场所类进行赋值建模;单位规模是根据单位人数情况进行赋值建模。
1.2.2 研究工具 心理状况调查采用国际标准症状自评量表(SCL-90),将量表按照躯体化、强迫症状、人际关系敏感、抑郁、焦虑、敌对、恐怖、偏执、精神病性等维度分为9类。个人不良生活习惯采用Fagerstrom尼古丁依赖性测试量表[2]、饮酒问卷(ADS)[3]及匹兹堡睡眠质量指数量表(PSQI)[4]对生活习惯进行更为全面的了解,均按照各量表的评分原则进行评分。
1.2.3 建模方式 从问卷中挑选出与个人心理健康状况相关因素进行分析,重点分析个体层面的因素和外在环境的因素作为调节变量是怎样影响心理健康状况的。将环境因素与个体层面会影响心理健康的因素分开,使用HLM了解个体和环境层面是如何影响个人心理健康的,并探究个体因素和环境因素的关系。本研究对841名农民工的心理健康水平进行检测,农民工有其自身的“个人效应”,同时农民工又从属于自己的生活环境,就是“背景效应”。在进行个体研究时必须考虑到被研究对象所处的背景或他所从属的上层分析单位。运用HLM能够使分析的结果更加贴近事实[5]。
本研究建立的HLM为二层模型[6],假设第一层次为农民工个体,第二层次为环境,层次一的模型与传统的回归模型类似,所不同的是,回归方程的截距和斜率不再假设为一个常数[7],而是不同的农民工的回归方程的截距和斜率都不同,是一个随机变量。每个农民工回归方程的截距和斜率都直线依赖于第二层次变量[8](如所属行业、单位规模大小),这样就构成了农民工-环境二层模型。可表示如下:
层-1(农民工)Yij=β0j+β1jXij+eij
层-2(环境)β0j=□00+□01Wj+u0j
β1j=□10+□11Wj+u1j
合并的模型表示为:
Yij=□00+□10Xij+□01Wj+□11XijWj+ u0j+u1jXij+eij[9]
其中:Yij表示第j个环境的第i个农民工的相应变量观测值(如农民工的心理分数),Xij表示第j个环境的第i个农民工的解释变量观测值(如农民工的吸烟状况),Wj表示第j个环境的环境特征变量(如单位规模大小)。对于层-1模型,β0j、β1j分别表示第j个农民工吸烟(饮酒/睡眠)回归直线的截距和斜率,eij表示第j个环境第i个农民工的测量误差。对于层-2模型,□00、□01分别表示β0j截距对于环境变量Wj的回归直线的截距和斜率,u0j表示由第j个环境的环境变量带来的截距上的误差。□10、□11分别表示截距β1j对于环境变量Wj的回归直线的截距和斜率,u1j表示由第j环境的环境变量带来的斜率上的误差[9]。
1.3 统计学方法 将经过质控审核的统计资料采用Epidata 3.01软件录入,对数据进行核实,采用SPSS 19.0 统计软件进行单因素Logistic回归分析和组间t检验或方差分析。统计学检验水平α设置为0.05。HLM建模使用HLM 6.04软件。
2 结果
2.1 人口学特征 76.1%的农民工居住在郊区;76.6%集中在建筑业和制造业(建造业),37.0%子女不在身边;居住情况为与家人同租房或单位宿舍的分别占30.0%、35.5%(见表1)。
2.2 SCL-90评分情况及与常模的比较 将841个样本数据与全国成人常模[10](n=1 388)相比,在9个因子中,除了躯体化和精神病性与成人常模相比差异无统计学意义(P>0.05)外,其他7个因子比较差异均有统计学意义(P<0.05),农民工心理健康水平得分较全国成人常模得分低(见表2)。
2.3 不同人口学特征农民工SCL-90得分比较 针对此次调查人群的人口学特征,包括居住区域、所属行业、单位规模、子女是否在身边及目前居住情况,分别进行单因素检验分析发现,这些因素在单独情况下对农民工SCL-90总分的影响均无统计学意义(P>0.05,见表1)。
2.4 不同生活习惯农民工SCL-90得分比较 对农民工的生活习惯进行调查,主要从吸烟、饮酒以及睡眠三方面进行了解,包括对该类生活习惯的态度以及危害的认知度等方面。结果显示,是否酒精依赖、睡眠好与不好的农民工SCL-90得分间差异有统计学意义(P<0.05,见表3)。
注:*为t值;SCL-90=症状自评量表
2.5 运用HLM对农民工不良心理状况的建模结果 采用HLM 6.04软件进行处理,环境因素下农民工心理健康水平二层完全模型[11]为:
层-1
Y=B0+B1×(吸烟总分)+B2×(睡眠总分)+B3×(饮酒总分)+R
层-2
B0=G00+G01×(居住区)+G02×(行业)+G03×(单位规模)
B1=G10+G11×(居住区)+G12×(行业)+G13×(单位规模)
表3 不同生活习惯农民工SCL-90得分比较
Table3 Comparison of the SCL-90 score of different living habits peasant workers
人数〔n(%)〕SCL-90得分(x±s,分)t值P值吸烟情况10550331 是375(446)12010±3858 否466(554)12238±3919酒精依赖情况33070000 是365(434)12285±4006 否476(566)12002±3795睡眠情况14180003 好277(329)13743±4279 不好564(671)11347±3423
B2=G20+G21×(居住区)+G22×(行业)+G23×(单位规模)
B3=G30+G31×(居住区)+G32×(行业)+G33×(单位规模)
运行后在环境因素下农民工心理健康水平完全模型结果见表4。此外,调查发现农民工所从事的行业对吸烟有影响(P=0.008),居住区及单位规模大小对饮酒行为有影响(P值分别为0.041、0.023)。
表4 生活环境下农民工心理健康水平HLM完全模型结果
Table4 The HLM completely model results of mental health level on the peasant workers in the living environment
固定效应系数P值标准差G00899900001707G014680047236G022890352311G03-12530068688G100260887182G205810001171G30-0160858090
3 讨论
本研究通过使用SCL-90量表对农民工心理健康状况进行测试后结果显示,农民工心理健康水平得分低于全国成人常模得分,这与国内廖传景[12]的研究结果一致,但是与林秋红等[13]的研究结果存在差异,提示应对农民工心理健康水平进行持续观察,以期正确把握农民工的心理健康。
本研究的结论可以从两方面来看,在个体水平上,农民工的不良生活习惯(包括吸烟、饮酒、不规律或低质量的睡眠)对其心理健康的影响是非常重要的。其中,睡眠情况直接影响到农民工的心理健康水平(G20,P=0.001),这可能与本研究中的农民工从事行业有关,其中建造业和娱乐业的人员近90%,多为较强的体力劳动工作,因体能需靠良好的睡眠进行恢复有关,故睡眠在影响其身体和心理健康中起到一定作用。
在环境水平上,环境的差异对农民工心理健康水平有影响(G00,P=0.000),验证了我们所假想的环境“背景效应”[14]对农民工的心理健康水平会产生影响。本研究所选的三个环境层次的变量中居住区会对农民工的心理健康水平产生影响(G01,P=0.047),表明农民工的心理问题受所居住区域的影响,但是不受自身行业(G02,P=0.352)及所在单位规模大小(G03,P=0.068)的影响。
通过HLM的建立,我们可以看到在环境层面上,农民工所处的环境会直接影响到他们的一些个人行为而影响其心理情况,居住在市区以及所在单位规模大的农民工更倾向于养成饮酒的习惯,不同行业的属性也会直接导致他们的吸烟行为,这与人群的聚集行为有关,也显示出农民工容易受到外界环境的影响,导致抽烟及饮酒的行为发生,由于饮酒与吸烟、不良睡眠对SCL-90得分有影响,因此提示我们改善农民工的心理状况应从改善其所处环境情况入手,缓解其由于行业差别、城乡差别、单位规模引起的不良生活习惯的传播。
多数人认为抽烟、饮酒等行为可以缓解压力,本调查则显示个人层面上只有不良睡眠习惯与心理状况呈相关性(G20,P=0.001),同时提示不佳的居住和工作场所带来的背景效应引导农民工沾染不良生活习惯,从而影响其心理健康。随着新生代农民工的逐渐进入,农民工群体的受教育程度有了提高,对健康知识的知晓率也逐渐增大,少饮酒、不吸烟或已戒烟等健康行为形成率有一定提升[10]。建议社区应对农民工进行群体式健康教育及干预,同时所在单位应积极开展一些有益农民工身心健康的活动,对该群体进行正确引导,使得他们的心理压力能有合适且健康的宣泄方式。
1 李祚山,王思阳,卢淋淋,等.农民工应对方式与心理健康的特点及其关系[J/OL].现代预防医学,CNKI:51-1365/R.20120919.1126.024.
2 张向阳,曹连元,陈大春,等.中国男性精神分裂症患者吸烟、精神病理学、认知功能和治疗相关不良反应的病例对照研究[J].中国药物依赖性杂志,2009,18(4):283-293.
3 韦耀阳.大学生孤独感与饮酒行为的关系研究[J].精神医学杂志,2012,25(4):289-290.
4 安翠霞,许顺江,宋美,等.轻度认知功能损害患者睡眠质量分析[J].中华精神科杂志,2012,45(5):295-298.
5 艾伟强,葛建军.运用分层线性模型对高校教师科研水平的研究[J].统计与决策,2008,24(7):95-99
6 郭志刚,李剑钊.农村二孩生育间隔的分层模型研究[J].人口研究,2006,30(4):2-11.
7 蔡经汉.高职学生评教影响因素的分层线性分析[J].重庆理工大学学报:社会科学版,2013,27(3):125-130.
8 徐一丁,杜子芳.公司治理结构对经营绩效的影响研究——基于分层线性模型的实证分析[J].现代管理科学,2012,31(12):7-9,17.
9 Scheel I,Ferkingstad E,Frigessi A,et al.A Bayesian hierarchical model with spatial variable selection:the effect of weather on insurance claims[J].J R Stat Soc Ser C Appl Stat,2013,62(1):85-100.
10 黄艳苹,李玲.用症状自评量表(SCL-90)评估中国大学生心理健康状况的Meta分析[J].中国心理卫生杂志,2009,23(5):366-371.
11 Lee W,Lim J,Lee Y,et al.The hierarchical-likelihood approach to autoregressive stochastic volatility models[J].Computational Statistics & Data Analysis - CS&DA,2011,55(1):248-260.
12 廖传景.青年农民工心理健康及社会性影响与保护因素[J].中国青年研究,2010,22(1):109-113.
13 林秋红,刘移民,周静东,等.2010年广州市农民工人格特征与心理健康关系研究[J].预防医学论坛,2011,17(10):889-892.
14 Shoults-Wilson WA,Peterson JT,Unrine JM,et al.The Asian clam Corbicula fluminea as a biomonitor of trace element contamination:accounting for different sources of variation using an hierarchical linear model[J].Environmental Toxicology and Chemistry,2009,28(10):2224-2232.
分层线性回归模型(HLM)简介:
分层线性回归模型是由不同层次的自变量解释同一变量的一体化模型。当数据存在于不同层级时,先以第一层级的变量建立回归方程,然后把该方程中的截距和斜率作为因变量,使用第二层数据中的变量作为自变量,再建立两个新的方程。通过这种处理,可以探索不同层面变量对因变量的影响。它包含了不同层次的测量变量;在高层次模型中,第一层次的回归系数可被第二层次的解释变量所解释。
多层线性模型主要用来处理具有层次结构特点的数据。它能够考虑不同层次的随机误差和变量信息,提供正确的标准误差估计;得到更有效的区间估计与更精确的假设检验,以及回归方程中截距和斜率之间的相关关系;可以分析重复测量的数据,探讨以往关于同一问题的不同研究结论是否具有一致性。
很多研究都涉及分层数据结构。例如:经济学家探求在多个国家中经济政策是如何影响居民的消费行为的,研究采集的观测数据不仅包括以国家为层次的经济指标,还包括以家庭为单位的信息,因此整个观测的数据结构是分层的。此时,同属一个层次的个体之间的相关性会大于来自不同层次的个体之间的相关性,整个观测样本就不再具有独立分布性质,如果继续使用经典的线性回归模型,就会得到有偏倚的参数估计和错误的统计推断结果。