功能大体评定对 12项一般健康问卷假阳性和假阴性的影响分析*
2010-06-15章健民石其昌付永利王淑敏周夏江胡伟萍
章健民 石其昌 付永利 王淑敏 顾 卫 周夏江 胡伟萍
12项一般健康问卷(12item-General Health Questionnaire,GHQ-12)广泛用于筛选精神障碍[1],但所筛选的精神障碍相对长而复杂但更具效度[2]的“金标准”精神障碍测量工具如《DSM-Ⅳ轴Ⅰ障碍用临床定式检查》(Structured Clinical Interview for DSM-IV Axis I Disorders,SCID)[3-4],将产生“诊断”分类上随机性的或系统性[1]的错误 ,产生假阳性或假阴性。本文探讨功能大体评定量表(Global Assessment of Functioning Scale,GAF)对 GHQ-12假阳性和假阴性的影响,为今后以 GHQ-12为工具的研究提供参考。
1 对象与方法
1.1 调查和抽样方法 全省性精神疾病流行病学调查的总体设计、随机抽样过程及主要结果已报告[5-6]。调查通过 3个阶段(市 /县、街道 /乡镇、居委会 /村)分层整群随机抽样,最后以个体为随机抽取单位。全省抽取≥15岁共 15000人 (农村10000人,城市 5000人)。 调查在 2001年 9~ 12月间完成。
1.2 对象 本文分析对象为 15000名被测中 10%的质控样本[5]。质控样本中的所有被测均进行 GHQ-12评定和 SCID检查 (包括轴 I和 V)。
1.3 测量指标
1.3.1 GHQ-12 GHQ-12共 12题 ,每题有 4个选项 ,采用 2分法记分[7],即选择回答前两项者不计分,回答后两项者计 1分,每题分值 0~ 1分,12题总分在 0~ 12分之间。 GHQ-12由精神科护士评定,调查时间约为 15~ 20分钟 (含附加题目)。本文以 GHQ-12总分 3分作为切分值[2,7],即≥ 3分为 GHQ-12病例。
1.3.2 SCID轴 I SCID[3-4]涵盖了 DSM-IV(Diagnosticand Statistical Manual of Mental Disorders,Fourth edition)[8]中所有轴 I的主要诊断,共 45类。本文中 SCID病例是指具有任何 SCID轴 I诊断的被测。正确分类包括真阴性和真阳性,真阴性指非 GHQ-12病例同时为非 SCID病例;真阳性指GHQ-12病例同时为 SCID病例;错误分类包括假阳性和假阴性,假阳性指 GHQ-12病例但非 SCID病例;假阴性指非GHQ-12病例但为 SCID病例。假阳性记分为 1,非假阳性记分为 0;假阴性记分为 1,非假阴性记分为 0。SCID由经过培训的精神科医生评定,无精神障碍者的调查时间约 40~45分钟,有精神障碍者约 80~ 120分钟。SCID与 GHQ-12测定在同一天完成。
1.3.3 GAF(SCID轴 V) GAF量表是 SCID的轴 V诊断[4-5,8],与 SCID轴 I同时评定。GAF量表评定过去 1个月中功能最差 1周心理、社会及职业的最低功能水平。分值在 1~100之间,分数越低,病情愈重,80分以下提示功能失调,60分以下提示精神病理性[9]。本文以 GAF总分 80分[9]为切分值 ,≤80分记分为 1,> 80为 0。
1.3.4 人口学指标 人口学指标作为协变量,包括性别、年龄 (≤ 34岁 ,35~49岁 ,≥ 50岁 ),受教育年限 (≤ 5年 ,6~ 9年 ,≥ 10年),人均年收入 (< 2500元 ,2500~4999元,> 5000元 ),婚姻状态 (未婚且未同居,结婚或同居,结婚或曾结婚目前未同居)和居住地(城市和农村),共 6项。
1.3.5 自评健康和求助状况 自评近期健康状况和精神或心理问题求助史作为协变量。
自评健康状况询问被测在调查之前几个星期自评的躯体和心理健康水平 ,分为“差”与“不差”,后者包括优秀,良好,好,一般。共 2题。
自评求助状况询问被测在调查之前的任何时候是否因精神问题寻求过帮助,分为“从未求助过”和“曾经求助过”,后者包括亲属,朋友同事 ,中医,普通西医 ,精神科医生以及其他人员的帮助)或住过院 (分类为“是”或“否”)。共 2题。
自评健康和求助状况题目由北京回龙观医院费立鹏教授提供。
1.4 统计分析 统计分析在 SPSS15.0上完成,显著水平设定在 α<0.05。 GHQ-12正确分类(真阴性、真阳性)和错误分类(假阴性、假阳性)的 GAF分值比较采用方差分析 ,两两比较采用 Bonferroni法。多因素分析中以 GHQ-12假阳性或假阴性为结果因素,GAF≤80为暴露因素,人口学指标、自评健康和求助状况为协变量,进行常规 Logistic回归分析。考虑到抽样设计因素可能影响样本对浙江省总人口的代表性,为使结果更好地外推至浙江省总人口,我们对完成调查样本进行了数次加权,抽样设计因素是经过数次加权后产生的新变量,分析方法采用复杂抽样 Logistic回归分析 (Complex Samples Logistic Regression Analysis)。
2 结 果
2.1 一般结果 在 15000名被随机抽取的全省样本中,共有质控样本 1510人,其中 1482人 (98.1%)完成 GHQ-12调查,28人拒做。在完成 GHQ-12的 1482人中,33人未完成SCID。1449(96.0%)人完成两项调查。在 1482完成 GHQ-12的被测中,女性占 52.1%,平均年龄为 43.2± 17.2岁 (极差 19~ 91岁 )。 15000名被测中 ,14634(97.6%)完成 GHQ-12测定,女性占 51.0%,平均年龄为 43.2± 17.2岁(极差 15~ 98岁)。以上结果表明质控样本和全省样本之间在 GHQ-12完成率、性别和年龄上无明显差异。
表 1 大体功能评定总分在 GHQ-12筛选中的比较(±s)
表 1 大体功能评定总分在 GHQ-12筛选中的比较(±s)
注:*两两比较(Bonferroni)P<0.001
n % GAF分值 与真阴性 GAF分值差及 95%区间 与真阳性 GAF分值差及 95%区间正确分类 真阴性 948 65.4 90.8±6.121.7(19.9~23.5)*真阳性 157 10.8 69.1± 12.8 -21.7(-23.5~-19.9)*错误分类 假阴性 114 7.9 75.8±12.0 -14.9(-17.0~-12.9)* 6.8(4.2~9.3)*假阳性 230 15.9 88.1± 7.2 -2.6(-4.1~ -1.1)* 19.1(16.9~21.2)*F 422.1 df 3,1445 P<0.001总样本 144 86.8±10.8
表 2 GHQ-12假阳性和假阴性和功能大体评定 (GAF)的多因素关系
GHQ-12病例和 SCID病例的粗时点患病率分别为 26. 7%(387/1499)和 18.7%(271/1449);GHQ-12的正确分类率为 76.3%(1105/1449),其中真阴性率 65.4%(948/1449),真阳性率 10.8%(157/1449);错误分类率为 23.7%,其中假阳性率 15.9%(230/1449),假阴性率 7.9%(114/1449)。GAF分值的均数为 86.8±10.8分,中位数(median)为 90.0分,众数(mode)为 90.0分,下 4分位数的分值为 84.0分,> 80分1172人 (80.9%),≤ 80分 277人 (19.1%)。在 1172名 GAF>80分的被测中,假阳性为 17.1%(200/1172),假阴性为 4.1%(48/1172);在 277名 GAF≤80分的被测中,假阳性为10.8%(30/277),假阴性为 23.8%(66/277)。
2.2 GAF总分与 GHQ-12筛选结果比较 见表 1。GAF总分在 GHQ-12正确分类(真阴性、真阳性 )和错误分类(假阴性、假阳性)间的差异和两两比较均有统计学意义(P<0.001)。
2.3 GAF和 GHQ-12假阳性和假阴性的多因素结果 见表 2。从比数比 (Odds Ratio,OR)看,GAF分值≤ 80和 GHQ-12假阴性和假阳性的关系在进过系列控制(人口学因素、自评健康、求助状况和抽样设计因素)后依然存在(P<0.001)。
3 讨 论
从一般结果看,GHQ-12假阳性在 GAF>80者中多见,假阴性在 GAF≤80者中多见。从表 1看,GAF总分真阴性最高,然后依次为假阳性和假阴性,真阳性最低,差异有统计学意义(P<0.001)。在正确分类,真阳性比真阴性平均低 21.7分(95% CI:23.5~ -19.9),可见我们选择 GAF分值 80分为切分值[9]来定义“功能失调”,具有一定的合理性。在错误分类,假阳性的 GAF总分较高,接近于真阴性,分值差仅-2.6分(95% CI:-4.1~ -1.1),假阴性的 GAF总分较低,接近于真阳性,分值差仅 6.8分(95% CI:4.2~9.3)。这些结果说明,在既定的 GHQ-12切分值下,GAF分值影响 GHQ-12相对于 SCID的准确性。
从表 3看,在进行系列控制(人口学因素、自评健康、求助状况和抽样设计因素)后,GAF≤80分与 GHQ-12假阳性和假阴性的关系依然具有统计学意义,说明是 GHQ-12假阳性和假阴性的一个持续而相对独立的影响因素。从OR值看,GAF≤80分与 GHQ-12假阳性的 OR值始终小于 1,是GHQ-12假阳性的保护因素;GAF≤80分与 GHQ-12假阴性的 OR值始终大于 1,是 GHQ-12假阳性的危险因素,比较 GAF与 GHQ-12假阳性和假阴性在全省总人口中的联系强度,GAF≤80分与 GHQ-12假阳性的 OR值为 0.35(95%CI:0.19~0.64,P<0.001)(假阳性模型 12),也就是说,GAF>80即为 GHQ-12假阳性的危险因素(OR=2.85,95%CI:1.56~ 5.26);GAF≤ 80分和 GHQ-12假阴性 OR值为 10.81(95%CI:6.45~ 18.11,P<0.001)(假阴性模型12),由此可见,在切分值为 80时 ,GAF对 GHQ-12假阴性的影响远大于 GHQ-12假阳性。从系列控制过程中 GAF≤80分与 GHQ-12假阳性和假阴性 OR值的变化看,控制自评躯体健康(假阳性模型 7和 8)使 GAF≤80分与 GHQ-12假阳性的关系得到加强,控制抽样设计因素(假阴性模型 11和 12)使 GAF≤80分与 GHQ-12假阴性的关系得到明显加强,提示不考虑自评躯体健康和抽样设计因素将低估 GAF≤80与 GHQ-12假阳性和假阴性关系的真实强度。其他协变量对 GAF≤80分与 GHQ-12假阳性或假阴性的 OR值影响不大。
GHQ-12作为精神障碍筛选工具得到广泛应用[1],但其中位数为 78.3%(60~ 96.7%)和 82.7%(59.9~ 93%)灵敏度和特异度[7]似乎还有待改善。另一方面 ,GAF成本低,操作便利[11]、信度较好[10-11],甚至用于评估治疗效果[11-12],但其作为潜在筛选工具的研究却不多见。本文结果显示 GAF影响GHQ-12的假阳性和假阴性,可以作为 GHQ-12筛选的一个重要参考指标,对大于 GHQ-12切分值但 GAF分值较高的被测,假阳性可能大,反之,对小于 GHQ-12切分值但GAF分值较低的被测,假阴性可能大。 GAF似乎对减少GHQ-12假阴性更有效。本结果可能为今后以 GHQ-12为筛选工具的研究提供一定的参考。
致谢:本项目得到北京回龙观医院费立鹏教授的技术指导。
[1]Martin C R,Jomeen J.Is the 12-item General Health Questionnaire(GHQ-12)confounded by scoring method during pregnancy and following birth[J].Reproductive and Infant Psychology,2003,21(4):267-278
[2]Bell T,Watson M,Sharp D,et al.Factors associated with being a false positiv e on the General Health Questionnaire[J].Soc Psychiatry Psychiatr Epidemiol,2005,40(5):402-407
[3]First M B,Spitzer R L,Gibbon M,et al.Structured Clinical Interview for DSM-IV Axis I Disorders-Patient Edition(SCID-I/P)(Version 2.0)[M].New York:Biometrics Research Department,New York State Psychiatric Institute,1998
[4]周茹英,胡峻梅.DSM-IV轴 I障碍用临床定式检查执行手册(研究版)[M].成都:四川大学华西医学中心附属第一医院心理卫生研究所,2001
[5]石其昌,章健民,徐方中,等.浙江省 15岁以上人群精神疾病流行病学调查 [J].中华预防医学杂志,2005,39(4):229-236
[6]Phillips M R,Zhang J,Shi Q,et al.Prevalence,treatment,and associated disability of mental disorders in four provinces in China during 2001-05:an epidemiological surv ey[J].Lancet,2009,373(9680):2041-53
[7]Goldberg D P,Gater R,Sartorius N,et al.The validity of two versions of the GHQ in the W HO study of mental illness in general health care[J].Psychol Med,1997,27:191-197
[8]American Psychiatric Association.Diagnostic and Statistical Manual of Mental Disorders(Fourth edition).Washington,DC:American Psychiatric Association,1994
[9]Segu í J,Ramos-Casals M,García-Carrasco M,et al.Psychiatric and psychosocial disorders in patients with systemic lupus erythematosus:a longitudinal study of active and inactive stages of the disease[J].Lupus,2000,9(8):584-8
[10]Hilsenroth M J,Ackerman S J,Blagys M D,et al.Reliability and validity of DSM-IV axis V[J].Am J Psychiatry,2000,157(11):1858-63
[11]Tungstrom S,Soderberg P,Armelius BA.Relationship between the Global Assessment of Functioning and other DSM axes in routine clinical work[J].Psychiatr Serv,2005,56(4):439-443
[12]Greenberg G A,Rosenheck R A.Using the GAF as a national mental health outcome measure in the Department of Veterans Affairs[J].Psychiatr Serv,2005,56(4):420-426