PHQ-9与GDS-15应用于上海市某社区中老年人抑郁评估的信效度比较
2014-08-07超钱雯刘春涛盛新春傅华戴俊明
王 超钱 雯刘春涛盛新春傅 华戴俊明△
(1复旦大学公共卫生学院预防医学教研室-公共卫生安全教育部重点实验室 上海 200032;2上海市浦东新区张江镇健康卫生办公室 上海 201203;3上海市浦东新区爱国卫生运动办公室 上海 200136)
PHQ-9与GDS-15应用于上海市某社区中老年人抑郁评估的信效度比较
王 超1钱 雯1刘春涛2盛新春3傅 华1戴俊明1△
(1复旦大学公共卫生学院预防医学教研室-公共卫生安全教育部重点实验室 上海 200032;2上海市浦东新区张江镇健康卫生办公室 上海 201203;3上海市浦东新区爱国卫生运动办公室 上海 200136)
目的比较PHQ-9和GDS-15两量表应用于上海市某社区中老年人群抑郁调查的信度和效度。方法采用知情同意、整群抽样、自主填写问卷的方法,对1 400名社区老年人同时用PHQ-9和GDS-15两个量表进行问卷调查。分别分析两种量表的内部一致性信度,抑郁结果判定的一致性及相关性,同时对两个量表进行非条件Logistic回归分析。结果收回有效问卷1 390份。PHQ-9量表的Cronbach'α为0.879,各条目间的相关系数为0.126~0.612,均有统计学意义(P<0.01);GDS-15量表的Cronbach'α系数为0.527,各条目间相关系数为0.003~0.419,其中16对相关系数无统计学意义(P>0.05)。两量表总分相关系数为0.498(P<0.001)。两量表对调查人群抑郁判断的一致率为81.4%,相关系数0.463(P<0.001)。Kappa值结果为0.454。Logistic回归显示各因素对两量表的影响相似,但PHQ-9对文化程度和失眠较敏感,GDS-15对前职业类型更敏感。结论两种量表均是中老年人抑郁评估的有效工具。PHQ-9与GDS-15相比更简短,内部一致性更好,更适宜作为筛选工具在社区使用。
中老年人; 抑郁; PHQ-9; GDS-15; 信效度
2010年第6次全国人口普查结果表明,我国60岁以上老年人口已到达1.78亿,占总人口的13.3%[1]。随着老龄化程度加深,老年人抑郁障碍作为普遍的公共卫生问题日益受到关注[1-2]。同时,老年人抑郁的症状可能作为日常生活中的恶劣事件以及疾病的自然结果而被忽视,导致老年人抑郁障碍很难被识别,特别是高龄老人[3]。因此需要使用具有较高信效度的抑郁测评量表来进行老年人抑郁筛查。
目前有多种抑郁测评量表包括贝克抑郁量表(Beck Depression Inventory-Ⅱ,BDI-Ⅱ),流行病学研究中心抑郁量表(Centre for Epidemiology Studies Depression Scale,CES-D),老年抑郁量表(Geriatric Depression Scale-15,GDS-15),医院焦虑与抑郁量表(Hospital Anxiety and Depression Scale,HADS),一 般 健 康 问 卷 (General Health Questionnaire,GHQ-12)和患者健康问卷抑郁分表(Patient Health Questionnaire-9,PHQ-9)等[4-6]。国外研究显示,筛查老年人心理健康状况GDS-15比GHQ-12更灵敏,PHQ-9与CES-D相比其优势在于更简短,并且得分计算容易控制[6,7]。国内研究认为,PHQ-9条目简洁、操作方便,在社区老年人群中应用具有良好的信效度[8-10]。
鉴于老年人抑郁问题的普遍性和隐匿性,急待一种较好的筛查工具用于评估。PHQ-9和GDS-15量表分别应用于老年人的研究众多,但将其同时应用并对其进行信效度比较尚未见报道。本研究将PHQ-9和GDS-15同时应用于社区抑郁障碍筛查,比较其信效度,以确定更适合老年人抑郁筛查的量表。
资料和方法
研究对象本研究选取上海某社区为调查现场,采用整群抽样,对符合入选标准的人群进行问卷调查。研究对象的入选标准:研究现场所在村(居委)的常住居民(在当地居住6个月以上),年龄为50~80岁,小学及以上文化程度,能看书读报;在知情同意的基础上,愿意参与本项目的社区中老年人。剔除标准:年龄不在此范围内的人群,文盲,有严重疾病无法自主活动者,经过动员仍拒绝参与者。调查共发放问卷1400份,回收有效问卷1390份,有效回收率为99.3%。
研究工具
GDS-15[4]对15个问题的回答均由“是/否”组成,得分为0~15分,该量表主要用于评估过去一周内受调查者的抑郁状况。本研究以总得分>5分为抑郁阳性。
PHQ-9[4]共分2个部分,第一部分有9个条目即9个抑郁症状组成,第二部分有1个条目,调查其社会功能受损情况。本研究中以总得分≥15分为抑郁阳性标准。
生活满意度量表 由5个条目组成,条目按Likert 6级设定选项,计分0分到5分,总分25分,得分<13分者为生活满意度较低,总得分≥13分者为生活满意度较高。
自我管理睡眠问卷 包含3个条目的症状描述:(1)入睡时间过长;(2)不能保持睡眠状态;(3)晨醒过早。只要满足一项即判定为失眠。
社会支持问卷 共10个条目,按Likert 4级设定选项,总分即10个条目得分之和;2、6、7评分之和为客观支持得分;1、3、4、5评分之和为主观支持得分;8、9、10评分之和为支持利用度得分。以中位数作为截断值分为高与低两组。
调查方法将人口学特征条目和上述研究工具合编成问卷,于2012年9月至10月对入选调查对象进行横断面调查。调查对象在知情同意基础上自主完成问卷。每个社区将研究对象分批集中到其所在社区的居委会完成调查,每批30人左右,每个居委由2名经过培训的调查员在现场指导,并现场收取问卷,同时对完成条目逐一核对,以检查遗漏。如有遗漏当场补齐,以保证调查问卷质量。
统计学方法采用EpiData 3.0软件建立数据库并进行录入;采用PASW(SPSS 18.0)统计软件包进行描述性分析、内部一致性检验、相关与Logistic回归分析;以P<0.05为差异有统计学意义。
结 果
一般资料1 390例调查对象中,男性472例(34.0%),女性918例(66.0%);年龄50~80岁,平均年龄(63.25±6.78)岁,男性平均年龄(66.23±6.87)岁,女性平均年龄(61.72±6.21)岁;在婚1 262例(92.7%)、非在婚(离异、丧偶)100例(7.3%);文化程度:小学及以下414例(30.0%)、初中/高中844例(61.1%)、大专及以上123例(8.9%)。
内部一致性信度分析Cronbach'α系数反映量表的同质性信度,系数的大小直接反映量表内部一致性的程度。PHQ-9量表的Cronbach'α系数为0.879,GDS-15量表的Cronbach'α系数为0.527。PHQ-9各条目与量表总分的Spearman相关系数为0.335~0.773,各条目间的Spearman相关系数为0.131~0.609,均有统计学意义(P<0.01,表1)。GDS-15各条目与量表总分的Spearman相关系数绝对值为0.260~0.536,各条目间的Spearman相关系数绝对值为0.003~0.419,其中16对相关系数无统计学意义(P>0.05,表2)。
抑郁结果判断的一致性及其相关性分析应用PHQ-9量表进行抑郁筛查有253例结果显示抑郁阳性(18.2%);应用GDS-15量表有345例结果显示抑郁阳性(24.8%)。其中,两个量表均显示有抑郁的例数为170例(12.2%),均显示无抑郁的例数为962例(69.2%),两量表对调查人群抑郁判断的一致率为81.4% (表3)。对两个量表判断结果进行Spearman相关分析,相关系数为0.463,差异有统计学意义(P<0.001)。Kappa值为0.454(P<0.001)。PHQ-9总分为(8.69±6.45)分,GDS-15总分为(3.87±2.73)分,Pearson相关分析显示两量表总分相关系数为0.498,且有显著相关关系(P<0.001)。
表1 PHQ-9各条目间及各条目与总分的相关性Tah 1 The correlation hetween each item and that hetween total score of PHQ-9
表2 GDS-15各条目间及各条目与总分的相关性Tah 2 The correlation hetween each item and that hetween total score of GDS-15
表3 PHQ-9与GDS-15的交叉分析表Tah 3 Cross tahulate of PHQ-9 and GDS-15
GDS-15及PHQ-9与相关因素的二元Logistic回归分析分别以GDS-15和PHQ-9判断二分类结果作为应变量,以性别、婚姻、年龄、前职业类型、文化程度、失眠状况、社会支持和生活满意度作为自变量,进行非条件二元多因素Logistic回归分析。采用逐步后退法,P<0.05为入选标准,P>0.1为剔除标准。结果显示,进入PHQ-9回归方程的变量为年龄、文化程度、失眠状况、生活满意度和社会支持中的客观支持;进入GDS-15回归方程的变量为年龄、前职业类型、失眠状况、生活满意度和社会支持中的客观支持(表4)。
表4 PHQ-9与GDS-15与相关因素的非条件二元Logistic回归Tah 4 Non-conditional hinary Logistic regression analysis on relevant factors of PHQ-9 and GDS-15
(续表4)
讨 论
PHQ-9量表由美国哥伦比亚大学于20世纪90年代中期开发,专门针对初级卫生保健机构的精神障碍筛查与诊断,仅9个条目,比其他量表简短,被基层医疗机构广泛用于有关精神障碍的筛查[8]。PHQ-9在抑郁筛查和诊断方面都有良好的灵敏度和特异度[9]。Chen等[10]研究显示PHQ-9量表适合应用于中国老年人群抑郁筛查。GDS-15量表是针对老年人群开发的抑郁自填问卷,最初版本有30个条目,得分在0~30分之间。鉴于老年人的特点,有学者开发出了仅包含15个条目的简表(GDS-15),被调查者只需回答是或否,应用起来更为简便[4]。Craen等[11]研究显示GDS-15量表在老年人群中应用具有较好的信度和效度。本研究将两种量表同时应用于社区中老年人,通过信效度比较,以确定何者为更适合社区中老年人抑郁的筛查工具。
本研究采用Cronbach'α系数与各条目间及各条目与总分间的相关系数来判断量表的内部一致性。一般认为Cronbach'α值≥0.7为内部一致性信度较好[12]。本研究发现:PHQ-9量表的Cronbach'α值为0.876,各条目间相关系数的差异均有统计学意义(P<0.01),表明PHQ-9量表具有较好的内部一致性;此外,PHQ-9与睡眠障碍相关性最强,这与 Macgregor等[13]的研究结果一致。GDS-15量表的Cronbach'α系数仅为0.502,其中16对相关系数的差异无统计学意义(P>0.05),提示条目10与其他条目间的关联性较低,GDS-15量表与活动兴趣缺失项目的相关性最强。同时我们比较了两量表对抑郁结果判断的一致性并作相关性分析,结果显示其对调查人群抑郁判断的一致率为81.4%,并呈现正相关,其Kappa值大于0.4;相关性分析显示两量表呈现显著的正相关,说明PHQ-9和GDS-15量表对中老年人群抑郁判断的一致性较高。
本研究分别将两种量表判断结果作为应变量,与影响因素作非条件Logistic回归分析。这一方面可验证个体特征和社会心理因素对抑郁影响的差异,如年龄、生活满意度和社会支持等[14-16];另一方面可通过进入模型的影响因素及OR值来判读两量表的区别,从而为两量表的建构效度提供依据和实证数据基础。对比PHQ-9和GDS-15量表的非条件Logistic回归分析结果发现,年龄、失眠状况、生活满意度和社会支持中的客观支持均进入了两个量表的回归方程,PHQ-9量表对文化程度较敏感,而GDS-15量表对前职业类型较敏感。在PHQ-9回归方程中失眠的P值小于0.05,而在GDS-15回归方程中该值小于0.1,说明GDS-15量表对睡眠状况的效度可能不及PHQ-9量表。老年人抑郁与睡眠障碍关系非常密切,研究显示抑郁症与失眠时整个非快速动眼期的觉醒状态密切相关[17],说明PHQ-9量表可能更适合中老年人抑郁筛查。
本研究不足之处主要在于未用标准抑郁诊断方法对筛查对象进行进一步的抑郁诊断,只是自评问卷评估的筛检,并非临床抑郁诊断,有待今后进一步验证问卷筛查与临床诊断间的一致性;同时两种量表未作多个时点的重复测量。徐勇等[7]和金涛等[8]的研究均显示PHQ-9量表的重复测量稳定性较好。本研究显示,经PHQ-9量表筛查的老年人进行临床评定,其灵敏度为88%,特异度为99%,具有较好的效度[7]。有文献报道GDS-15量表的灵敏度为74%~100%,特异度为53%~98%[18]。PHQ-9量表在临床疾病患者中的应用较为广泛[9],GDS-15量表更适用于有认知损伤的老年人[11]。
综上所述,两量表的抑郁判断一致性较好。PHQ-9量表的内部一致性较GDS-15量表更好,且PHQ-9对失眠较敏感,其得分与睡眠障碍的相关性较强。因此,PHQ-9量表在筛查社区中老年人群抑郁障碍方面具有较明显的优势。
[1] Riedel-Heller SG,Weyerer S,Konig HH,et al.Depression in old age:Challenge for aging societies[J].Nervenarzt,2012,83(11):1373-1378.
[2] 吴海苏.社区老年期抑郁症相关问题的初步研究[D].复旦大学,2007,12-14.
[3] Zhao KX,Huang CQ,Xiao Q,et al.Age and risk for depression among the elderly:a meta-analysis of the published literature[J].CNS Spectr,2012,17(3):142-154.
[4] Smarr KL,Keefer AL.Measures of depression and depressive symptoms:Beck Depression Inventory-Ⅱ(BDI-Ⅱ),Center for Epidemiologic Studies Depression Scale (CES-D),Geriatric Depression Scale (GDS),Hospital Anxiety and Depression Scale (HADS),and Patient Health Questionnaire-9 (PHQ-9)[J].Arthritis Care Res (Hoboken),2011,63(11):S454-S466.
[5] Vittengl JR,Clark LA,Kraft D,et al.Multiple measures,methods,and moments:a factor-analytic investigation of change in depressive symptoms during acute-phase cognitive therapy for depression[J].Psychol Med,2005,35(5):693-704.
[6] Boey KW.Assessing psychological weil-being of the oldold:A comparative study of GDS-15 and GHQ-12[J].Clinical Gerontologist,1998,19(1):65-73.
[7] 徐勇,吴海苏,徐一峰.病人健康问卷抑郁量表(PHQ-9)在社区老年人群中的应用¯¯¯信度与效度分析[J].上海精神医学,2007(5):257-279.
[8] 金涛,陈树林,沈毅,等.病人健康问卷抑郁量表在社区老年人中应用的信度与效度研究[J].浙江预防医学,2011,23(6):27-29,33.
[9] Milette K,Hudson M,Baron M,et al.Comparison of the PHQ-9 and CES-D depression scales in systemic sclerosis:internal consistency reliability,convergent validity and clinical correlates[J].Rheumatology (Oxford),2010,49(4):789-796.
[10] Chen SN,Chiu H,Xu B,et al.Reliability and validity of the PHQ-9 for screening late-life depression in Chinese primary care[J].Int J Geriatr Psychiatry,2010,25(11):1127-1133.
[11] Craen AJ,Heeren TJ,Gussekloo J,et al.Accuracy of the 15-item geriatric depression scale (GDS-15)in a community sample of the oldest old[J].Int J Geriatr Psychiatry,2003,18(1):63-66.
[12] Green SB.Commentary on coefficient alpha:a cautionary tale[J].Psychometrika,2009,74(1):121-135.
[13] Macgregor KL,Funderburk JS,Pigeon W,et al.Evaluation of the PHQ-9 Item 3 as a screen for sleep disturbance in primary care[J].J Gen Intern Med,2012,27(3):339-344.
[14] Tiwari SC,Pandey NM,Singh I.Mental health problems among inhabitants of old age homes:A preliminary study[J].I ndian J Psychiatry,2012,54(2):144-148.
[15] Nes RB,Czajkowski NO,Roysamb E,et al.Major depression and life satisfaction:a population-based twin study[J].J Affect Disord,2013,144(1-2):51-58.
[16] Mendelson T,Leis JA,Perry DF,et al.Impact of a preventive intervention for perinatal depression on mood regulation,social support,and coping[J].Arch Womens Ment Health,2013,16(3):211-218.
[17] Ko FY,Yang AC,Tsai SJ,et al.Physiologic and laboratory correlates of depression,anxiety,and poor sleep in liver cirrhosis[J].BMC Gastroenterol,2013,13(1):18.
[18] 李献云,费立鹏,张艳萍,等.抑郁症诊断筛查量表的编制及其效度检验[J].中国神经精神疾病杂志,2007,33(5):257-263.
Comparison of the reliahility and validity hetween PHQ-9 and GDS-15 in screening depression for middle aged and elderly in some community of Shanghai
WANG Chao1,QIAN Wen1,LIU Chun-tao2,SHENG Xin-chun3,FU Hua1,DAI Jun-ming1△
(1Key Laboratory of Public Health Safety,Ministry of Education-Department of Preventive Medicine,School of Public Health,Fudan University,Shanghai200032,China;2Health Office,Zhangjiang Town,Pudong District,Shanghai201203,China;3Patriotic Sanitation Office,Pudong District,Shanghai200136,China)
middle aged and elderly; depression; PHQ-9; GDS-15; reliability and validity
R 395.1
A
10.3969/j.issn.1672-8467.2014.02.005
2013-06-20;编辑:张秀峰)
上海市公共卫生重点学科建设项目(08GW2X1001)
△Corresponding author E-mail:jmdai@fudan.edu.cn
【Ahstract】 OhJectiveTo assess the reliability and validity of PHQ-9 and GDS-15 which were used among middle aged and elderly of the community.MethodsA total of 1400 community middle aged and elderly participants of the survey were selected by cluster sampling,and all questionnaires of PHQ-9 and GDS-15 were completed by self-administered.All of them were investigated based on the informed consent.We analyzed the following aspects respectively:internal consistency,consistency and relevance in detecting depression,and non-conditional binary multivariate Logistic analysis.ResultsAmong the 1 400 samples,1 390 valid questionnaires were collected.The Cronbach'αof PHQ-9 among this survey reached 0.879,and correlation coefficients between every item of PHQ-9 were ranged from 0.126 to 0.612,all of which weresignificant(P<0.01).The Cronbach'αof GDS-15 was only 0.527,and correlation coefficients between every item were ranged from 0.003 to 0.419,while 16 of them were not significant(P>0.05).The two scales had a correlation coefficient as 0.498(P<0.001)between their total score;and 81.4%of the survey sample had consistent result when detected by the two scales respectively and the correlation coefficient was 0.463(P<0.001).Kappa value was 0.454.The results of multivariate Logistic analysis indicated that PHQ-9 was more sensitive to educational background and insomnia while GDS-15 was more sensitive to working history.ConclusionsBoth of the two scales are effective tools for depression evaluating in the middle aged and elderly of community.But PHQ-9 seems to be a better tool with more advantages for its brief framework and better internal consistency and sensitivity.
*This work was supported hy the Fund Program of Shanghai Key Discipline Construction of Puhlic Health(08GW2X1001).