患者健康问卷抑郁量表9在痤疮患者中的信度和效度检验
2019-08-25冯霞叶欣舒慧玲余蓓黎昌强
冯霞 叶欣 舒慧玲 余蓓 黎昌强
西南医科大学附属医院皮肤科,四川泸州 646000
研究显示痤疮是一种与心理因素密切相关的疾病,且抑郁程度与痤疮病情严重程度有一定相关性[1-2],其影响患者的工作及生活,甚至会使患者产生轻生念头或自杀行为[3]。因此,临床医护人员应及早对痤疮患者进行筛查,以便在新型医疗模式下进行痤疮伴抑郁患者的心身治疗。患者健康问卷抑郁量表 9(patient health questionnaire-9,PHQ-9)简短,易于操作和评分,具有良好的信度和效度[4]。在国外,PHQ-9已广泛作为基层医疗中抑郁障碍的筛查工具之一[5]。国内已有PHQ-9 应用于青少年[6]、综合性医院普通门诊[7]及颈椎病抑郁患者[8]等的报道,显示了良好的信度及效度。我们通过心理自评和他评量表对258 例痤疮患者进行问卷调查,包括PHQ-9 自评量表、汉密尔顿抑郁他评量表(hamilton depression scale,HAMD)及美国《精神障碍诊断与统计手册(第4 版)》临床定式访谈(structured clinical interview for DSM-Ⅳ,SCID),旨在检验PHQ-9 在综合医院皮肤科门诊痤疮伴抑郁患者中的信度和效度,了解其在痤疮患者中的筛查应用价值。
对象与方法
一、研究对象
2017年1月至2018年6月在西南医科大学附属医院门诊收集痤疮患者。入组标准:符合《中国临床皮肤病学》痤疮诊断标准[9];年龄18 ~ 24岁,性别不限;小学及以上文化程度。排除标准:患有其他皮肤病;焦虑症筛查量表(general anxiety disorder-7)评分>4 分者;有精神疾病史;有使用精神类药物史及其他抗精神病治疗史;目前或既往患有严重的系统性疾病、传染病;近3个月发生过急性压力事件,或明确经历持续性慢性压力。本研究已经过西南医科大学附属医院伦理委员会批准(伦理批号:K2018011-R),所有受试对象均签署知情同意书。
二、评定量表
1.一般情况调查表(自制):内容主要包括患者姓名、性别、年龄、学历、痤疮初发年龄、病程、家庭经济状况、职业、既往病史等。
2.痤疮综合分级评分系统(global acne grading system)[10]:将痤疮好发部位分为前额(2)、右颊(2)、左颊(2)、鼻部(1)、下颏区(1)、胸及上背部(3),共6 个区(括号内为不同分区的因素分值)。每个区域皮损分值原则上决定于炎症反应最严重的皮损:无皮损为0分,≥1个粉刺为1分,≥1个丘疹为2分,≥1个脓疱为3分,≥1个结节为4分;该区总分值= 因素分值× 皮损分值,各不同分区总分之和为综合分值。根据综合分值大小将痤疮分级为:轻度1 ~ 18 分,中度19 ~ 30 分,重度31 ~ 38 分,特重度≥39分。
3.PHQ-9[11]:PHQ-9是由Spitzer等[11]根据DSM-Ⅳ诊断标准编制的患者健康自评问卷,由9个条目组成,用来了解在过去2 周内,患者受到包括情绪低落、兴趣减退、失眠等9 个问题困扰的时间。0=完全不会;1=几天;2=一半以上的日子;3=几乎每天。量表总分为27分,0 ~ 4、5 ~ 9、10 ~ 14、15 ~27分分别代表无、轻度、中度、重度抑郁,将中度和重度统一为重度。
4.HAMD[12]:为临床上评定抑郁状态时应用最广泛的量表之一。本研究所用HAMD 为17 项版,17 个条目分为3 级或5 级评定(0~2 或4 分),根据最近1周的感受进行评定。总分0 ~7分为无抑郁,8 ~17分为轻度抑郁,18 ~24分为中度抑郁,>24分为重度抑郁。
5.SCID[13]:为美国最新的抑郁症诊断标准,与中国精神障碍分类与诊断标准诊断抑郁一致性较高[14]。本研究采用SCID作为抑郁“金标准”进行评定,其通过结构式访谈来获取患者过去2周内的自我生活感知及其他功能改变以诊断患者是否存在抑郁障碍。
三、评定方法
由经过规范化培训的皮肤科医生,使用规定的指导语,指导患者完成问卷及评定。PHQ-9由患者认真阅读问卷后,独立、真实地填写,HAMD、SCID由两名主治医师以上精神科医师完成评估,并记录完成各问卷花费的时间。使用Excel 软件中RANDBETWEEN 函数生成 1 ~ 258 之间 50 个随机数字,即从中随机抽取50例患者在初次测评1周后再次进行PHQ-9评定。
四、统计分析
使用SPSS18.0 统计软件对数据进行处理、分析,定量资料中符合正态分布的采用描述,且两组间比较采用两独立样本t检验;不符合正态分布的资料采用中位数和四分位数即M(P25,P75)描述。采用Cronbach′s α 系数评估量表内部一致性信度;评分不符合正态分布时,采用Spearman 相关分析评估条目间及条目与总评分间的相关性、两次评分间的相关性(重测信度)及测试量表与校标量表间的相关性(校标效度);应用Kaiser-Meyer-Olkin(KMO)检验及Bartlett球形检验测定因子分析的可行性,探索性因子分析用于评估结构效度;采用受试者工作特征曲线(receiver operating characteristic curve,ROC 曲线)检验 PHQ-9 诊断效能,并分析PHQ-9在不同分组人群中的筛查效度。以P<0.05为差异有统计学意义。
结 果
一、一般情况
共访问300例患者,其中17例拒绝,25 例中途退出未完成,258 例完成全部有效问卷,回收率86%。258 例痤疮患者中男102 例(39.5%),女156 例(60.5%),年龄(20.7 ± 1.5)岁(范围18 ~ 24 岁);痤疮病程 1 ~ 12 年,M(P25,P75)为4(3,6)年。痤疮严重程度:轻度96 例(37.2%),中度 132 例(51.2%),重度29 例(11.2%),特重度1例(0.4%)。
二、抑郁检出情况
本研究检出符合SCID 有关抑郁障碍诊断标准者47 例(18.2%),无抑郁患者211 例(81.8%)。PHQ-9与HAMD检出抑郁情况见表1。
三、信度分析
1.内部一致性信度:PHQ-9 内部一致性信度Cronbach′s α 系数为0.851。各条目与量表总分的Spearman 相关系数为 0.550 ~ 0.709,各条目间的Spearman 相关系数为0.224 ~ 0.654,均具有相关性(P< 0.001),见表2。
2.重测信度:对PHQ-9初测与1周后重测进行分析,Spearman相关系数为0.824(P< 0.001)。
四、效度分析
1.效标效度:Spearman相关分析显示PHQ-9与HAMD总分呈正相关(r=0.766,P< 0.001),说明两表有较好的同时效度。
2.结构效度:Bartlett 球形检验(χ2= 782.709,P< 0.001)和KMO 检验(值为0.859)表明条目间有共同因子存在,可进行因子分析。应用主成分分析法,经方差最大旋转后共获得2 个公因子,累计方差贡献率为65.52%。公因子1含心情低落、自我否定、集中注意力困难、烦躁不安和消极观念共5 个条目,可解释为认知-情感因子;公因子2含兴趣下降、睡眠障碍、饮食障碍和精力缺乏4个条目,可解释为躯体化因子。
3.作为筛查工具的效度:以PHQ-9总分为分析变量,以SCID 为效标,进行ROC 曲线分析,PHQ-9评分的最佳截断点为9分,此时灵敏度为95.7%,特异度88.6%,阳性预测值65.2%,阴性预测值98.9%。ROC 曲线下面积为0.973(95%CI:0.956 ~0.990),表明PHQ-9 对抑郁障碍的识别能力较好,ROC曲线理想。见图1。
表1 患者健康问卷抑郁量表9(PHQ-9)与汉密尔顿抑郁量表(HAMD)检测258例痤疮患者抑郁情况(例,%)
表2 患者健康问卷抑郁量表9(PHQ9)各条目间及各条目与总分的相关系数
4.不同分组下PHQ-9 筛查效度:以9 分作为PHQ-9 诊断抑郁障碍的评分截断点分析其在不同人群中的筛查效度,其ROC曲线下面积最低0.886,最高0.955;灵敏度最低89.5%,最高97.0%,特异度最低82.4%,最高94.7%。男女间特异度相当,但女性灵敏度高于男性;20 岁及以上患者灵敏度略低于<20岁者,但特异度高于<20岁者;中重度痤疮患者灵敏度和特异度略低于轻度患者。见表3。
五、量表对比
1.自评工具和医生评定的一致性分析:将PHQ-9的中重度和重度统一为严重,以5、10、15分分别为轻度、中度和严重抑郁症的划界值,将PHQ-9和HAMD 得出的抑郁程度等级作一致性评价,Kappa值为0.530(P< 0.001),说明两表一致性可。
图1 患者健康问卷抑郁量表9(PHQ-9)的受试者工作特征曲线(ROC 曲线) PHQ-9 评分的最佳截断点为9 分,此时灵敏度为95.7%,特异度为88.6%,ROC曲线下面积为0.973
表3 不同分组下患者健康问卷抑郁量表9(PHQ-9)诊断抑郁准确性(评分截断点为9分)
2.两种量表完成时间比较:本研究中258例患者完成 PHQ-9 总耗时约 1 257 min,完成 HAMD 约11 413 min,完成每份PHQ-9的时间(4.9±1.2)min低于完成HAMD的时间(44.2±5.9)min,差异有统计学意义(t=108.787,P< 0.001)。
讨 论
SCID是根据DSM诊断系统设计的结构式访谈工具。是多种精神疾病诊断的“金标准”[15],已在综合医院、社区人群、青少年等中作为抑郁评价的“金标准”使用[6,16-17]。HAMD 是目前应用较为广泛的评价抑郁严重程度的他评量表,其条目是抑郁患者最常见的临床表现,也是患者抑郁的主要症状,已被作为常用的筛查评估方法[1,18]。信度主要评价量表稳定性和一致性。本研究选用内部一致性信度(Cronbach′s α 系数)来检验PHQ-9 的稳定性和可靠性。研究显示Cronbach′s α 系数最小可接受值为 0.65 ~ 0.70,0.70 ~ 0.80 之间为相当好,0.80 ~0.90 之间为非常好,重测信度一般要求达到0.7 以上[19]。本研究中,Cronbach′s α 系数为0.851,各条目与量表总分间及各条目间均具有相关关系,提示PHQ-9 具有良好的内部一致性及稳定性。重测信度系数为0.824,提示PHQ-9 具有较好的跨时间稳定性,研究结果与其他研究接近[6-8]。
效度主要评价量表的准确度、有效性和正确性。因子分析是检验量表结构效度的常用方法。当公因子与调查表设计结构的组成领域相符,且公因子的累积方差贡献率至少在40%以上,每个条目都在其中一个公因子上有较高的负荷(≥0.4),而对其他公因子负荷值较低时[20],认为效度较好。本研究KMO和Bartlett球形检验显示,KMO统计量为0.859,球形检验P<0.001,表明适宜进行因子分析。从9个条目中提取出2个因子,其中条目2、6、7、8、9属于认知-情感维度,条目1、3、4、5属于躯体症状维度,与既往研究结果一致[8,16]。析出的 2 个公因子可共同解释量表65.52%的变异量,且高于其他研究[16]。也有研究显示PHQ-9 为一因子结构[6,21],但尚需在其他人群中进一步验证。
ROC 曲线通过综合分析能够对筛查工具进行更全面的评估。ROC 曲线下面积可以用来评价诊断试验的效果,小于0.7 表示诊断准确度较低,0.7 ~0.9为中等,0.9以上表示诊断准确度较高。本研究采用ROC曲线评估PHQ-9的预测价值和预测分界值,得出曲线下面积为0.973,显示PHQ-9对抑郁障碍的诊断价值较高,结果与其他研究接近[6-7]。本研究得出PHQ-9 诊断抑郁障碍的最佳诊断划界分为9 分,此时的灵敏度为95.7%,特异度为88.6%,Youden指数最大。一项关于PHQ-9多语种版本的研究[22]显示,划界分在8 ~11分之间均具有较好的筛查和诊断特性;近期一项在国外青少年中进行的研究[23]显示最佳划界分为11 分,这提示不同种族来源以及不同地域和人群文化差异可能会导致不同的诊断划界分。在不同分组人群中,以9分为PHQ-9诊断划界值,ROC曲线下面积最低0.886,最高0.955。以9 分为PHQ-9 诊断划界值,在本研究不同分组人群中灵敏度最低89.5%,最高97.0%,特异度最低82.4%,最高94.7%,灵敏度和特异度均较高,说明该量表在不同年龄、不同性别及不同痤疮严重程度人群中均具有较高的筛查诊断价值。
本研究中,PHQ-9和HAMD相关系数为0.766,提示PHQ-9 和HAMD 有较好的同时效度。Kappa值是评价一致性程度的重要指标,Kappa 值≥0.75表示两者一致性极好,0.75 >Kappa 值≥0.4 为中、高度一致;Kappa 值<0.4 表示一致性较差。本文PHQ-9 和 HAMD 量表 Kappa 值为 0.530,表示两表评定抑郁程度等级一致性可。HAMD 是目前广泛应用于评价抑郁严重程度的他评量表,但其操作耗时较长且耗费人力。本研究中258 例患者完成HAMD所需时间明显多于PHQ-9,完成每份PHQ-9的时间显著低于完成HAMD 的时间。相对于HAMD 他评量表,PHQ-9 自评量表条目少、操作方便,更便于临床实施。因此,PHQ-9 更具有时间及人力优势。
综上所述,痤疮患者有发生抑郁的风险,而PHQ-9具有条目少、操作方便、筛查效率高等优点,且量表中9 条目均为DSM-Ⅳ中抑郁症诊断标准,不仅具有筛查价值,还可以对抑郁严重程度作出评估。该量表对痤疮伴抑郁患者进行筛查的效果较为确切,对于临床医护人员来说,采用PHQ-9 便于及早判断痤疮病情,为患者制定综合身心治疗方案,对治疗痤疮伴抑郁患者有较高的临床价值,且该量表较HAMD具有明显时间及人力优势,更利于在临床中实施推广。庄文锦等[24]研究显示使用PHQ-9 的观察组失眠患者治疗效果和满意率较未使用PHQ-9 的对照组有明显提高。本研究缺少此方面的数据,我们拟在未来完善PHQ-9对痤疮疗效评估的实验设计。
利益冲突所有作者均声明不存在利益冲突
志谢西南医科大学附属医院精神科刘可智教授及张雪丽医师