社区抑郁状态电话筛查问卷的编制及其信度和结构效度检验(上)☆
2011-04-19田德财张新卿姜凤英周景升方向华闵宝权
田德财张新卿姜凤英周景升方向华闵宝权
·论 著·
社区抑郁状态电话筛查问卷的编制及其信度和结构效度检验(上)☆
田德财*张新卿*姜凤英*周景升※方向华△闵宝权*
目的 为了提高社区中抑郁症的识别率,初步编制一个适合社区使用的用于电话筛查的抑郁状态问卷。方法 根据理论构想编制问卷的备选条目池,由98名专家和45例抑郁症患者分别对问卷条目进行评价后形成复选条目池,以所得条目评定200例门诊抑郁症患者,采用区分度分析法、极端值的临界比、相关系数法、因子分析法、克朗巴赫系数法5种统计学方法对条目再次筛选,最后编制出问卷并测试153例抑郁症门诊患者,并且在一周后选择其中的30人进行重测。结果 105个备选条目中初步筛选出条目42条,形成包含16个条目的社区抑郁状态电话筛查问卷。问卷的克朗巴赫系数为0.906,重测总分相关系数是0.723,分半信度系数为0.886,因子分析提取出三个因子(抑郁心境、睡眠障碍及食欲变化),分析显示问卷结构效度较好。结论 本研究编制的社区抑郁状态电话筛查问卷效度具有较好的信度、效度。
抑郁症 电话筛查问卷 编制 信度
抑郁症是全球范围内最大的疾病负担之一,死亡率高达12%[1]。然而患者因抑郁问题至医院就诊的比例较低,而且大多首先就诊于综合医院的内、外、中医科等[2]。除了社会上对抑郁症存在偏见之外,缺乏简便有效的应用于社区的抑郁筛查工具是一个重要原因。在抑郁症的筛查与诊断中,神经心理量表检查有重要的临床意义。国内使用的绝大多数抑郁量表来自西方,由于文化及人口特征不同,以西方文化为背景编制的抑郁量表,并不完全适合国人[3]。此外,面对医务人员时,有些患者刻意掩饰自己的抑郁情绪。电话问卷有利于保护患者的隐私,便于广泛应用。目前将抑郁电话筛查量表与交互式语音应答 (interactive voice response,IVR)系统相结合是将计算机应用于医学领域的一个重要方法[4]。但目前我国还没有应用于交互式语音应答系统的抑郁量表,故本研究目的是初步编制应用于交互式语音应答系统的社区抑郁状态筛查问卷。
1 对象及方法
1.1 研究对象 问卷编制过程分3个部分,研究对象分别如下:
对象1:用于问卷编制中初选条目池的条目选择。为宣武医院、安定医院、北医六院及北方地区部分三甲医院的精神科及神经科专家98名,其中精神科专家32名,神经科专家66名。2010年4~5月首都医科大学宣武医院抑郁专家门诊就诊的抑郁症患者45例,其中男12例(26.70%),女33例(55.50%)。年龄17~72岁,平均(45.91±12.95)岁。文化程度分别为小学(4.40%)、初中(37.80%)、高中(28.90%)、大学(28.90%)。
对象2:用于问卷编制中复选条目池的条目选择。为来自2010年5~9月至我院抑郁专家门诊就诊的200例抑郁症患者。200例患者中男89例(44.50%),女111例(55.50%)。平均年龄(41.53± 13.47)岁。文化程度分别为小学(1.00%)、初中(25.50%)、高中(25.00%)、大学(42.00%)、研究生(6.50%)。
对象3:用于问卷的信效度检验。为来自2010年9~11月到我院抑郁专家门诊就诊的153例抑郁症患者为对象,男49例 (32%),女104例(68%)。年龄16~79岁,平均46.43岁。文化程度分别为小学 (1.30%)、初中 (34.00%)、高中(37.30%)、大学(26.10%)、研究生(1.30%)。
1.2 问卷编制过程及方法 问卷的编制过程:首先提出理论构想,并逐步形成备选条目池、初选条目池及复选条目池,再从中筛选出最终的问卷条目,然后对初步编制的问卷进行信效度检验。
1.2.1 理论构想的提出 根据相关研究[5],结合美国精神障碍诊断与统计手册第四版(DSM-Ⅳ)及国际疾病分类第10版(ICD-10)的诊断标准,参考五因子模式的抑郁型人格障碍理论[6],提出该问卷的理论构想包括抑郁情绪、躯体化症状、思维运动迟滞、睡眠障碍四个方面。
1.2.2 备选条池的建立 咨询神经科及精神科的专家,参考目前的常用抑郁量表(包括HAMD抑郁量表、MADS抑郁量表、BDI抑郁自评量表、Zung抑郁自评量表、HAMA焦虑量表、Zung焦虑自评量表等),获得105个条目进入备选条目池。
1.2.3 初选条目池的建立 由3名高级职称医师组成核心小组,根据IVR系统采用电话和计算机交互的特点,参考计算机程序的运算流程,删除或者合并重复条目,并对多含义的条目进行拆分,使所有条目适合“一问一答式”筛查和单向流程。然后将所有条目进行归类,分为抑郁情绪、精神运动迟滞、睡眠(入睡困难、早醒和睡眠过多)、食欲增加或降低、体重增加或减轻、兴趣减低、疲劳感增加、躯体化症状、自责或自罪、焦虑情绪等21个方面,每个方面有5~6个条目组成。
1.2.4 复选条目池的建立 一方面根据专家的评价选出最重要的一个条目,一方面请抑郁患者选出最能反映他们症状的通俗易懂的条目。根据专家及患者的选择,将条目按评价的高低排序,综合评价每个条目的重要性。从那些反映同一方面问题的不同条目中选择最重要的两个条目,组合成42条目的筛选问卷。
1.2.5 问卷条目的筛选方法 由我院神经心理室专业人员使用条目筛选问卷,遵循重要性大、敏感性高、独立性强、代表性好、确定性好的原则筛选条目。使用以下5种方法分析每一个条目,凡有两种及以上方法不符合要求的条目,则予以删除。①区分度分析法:将调查对象按问卷得分高低排序,得分最高的27%个体组成高分组,得分最低的27%个体组成低分组。以t检验比较两组各条目得分是否有差异,两组得分差异无统计学意义的条目可以删除;②极端值的临界比:将t统计量的标准值设为3.00,若条目高低分组差异的t统计量小于3.00,则表示条目的鉴别度较差,可以删除;③相关系数法:计算各个条目与问卷得分的相关系数。条目得分与总分的相关系数的绝对值较大(>0.4),表明条目有代表性,予以保留;④因子分析法:用主成分法进行因子分析,并进行最大正交旋转。若是条目在共同因素的因素负荷量小于0.45,表示共同因素能解释个别条目的变异小于0.20,则该条目可以删除;⑤克朗巴赫系数法:计算克朗巴赫系数(Cronbachα),比较去除某一条目后对系数影响。如果去掉某条目后α系数有较大上升,则说明该条目有降低问卷内部一致性的作用,应该去掉,反之则保留。上述统计方法的运算均利用SPSS 16.0完成。
1.2.6 问卷的信效度检验 由我院神经心理室两名专业人员随机使用编制的16条目问卷采用书面问卷的形式测试153例患者(研究对象3),并且在1周后选择其中的30例进行重测。
2 结果
2.1 复选条目池的建立 用Q1-21分别表示21个方面的问题,每方面的5~6个条目以阿拉伯数字的后缀表示,如Q1.1代表第一方面问题的第一个条目。按照医生和患者对条目的评价,分别统计频数,按照条目率的高低选择评价最高的两个条目。结果见表1。其中条目的同质性检验包括共同性(≥0.2)、题项删除后的α值(小于等于量表的内部一致性系数)及因素负荷量(≥0.45);条目的独立性为t检验的决断值(≥3);条目的相关性为题项与总分相关(≥0.4)。
2.2 条目筛选及问卷的形成 对进入复选条目池的条目,重新以Q1.1及Q1.2等编号。采取前述的5种统计方法进行分析。见表2。
结果:条目2.1、2.2、6.1、6.2、7.2、16.2、21.2有两方面及以上不符合统计学要求可以直接删除。由于条目8.1、8.2、10.1、10.2、19.1、19.2的应答率较低,结果无统计学意义,予以删除。对于符合统计学要求的条目,根据进入复选条目池的条目频数,对那些反映同一方面问题的两个条目中选择最有代表性的一个,删除1.2、3.2、4.2、5.2、9.2、11.1、12.2、13.2、14.2、15.2、17.2、18.2、20.1。最后形成16条目的问卷。
2.3 信度检验 对153名患者的结果分析,问卷的克朗巴赫系数为 0.906,Guttman折半系数为0.886。30名患者1周后的重测总分相关系数为0.723,三个因子(抑郁心境、睡眠障碍及食欲变化)的重测信度分别为0.759、0.640、0.621。
2.4 结构效度检验 对所测量的数据进行探索性因素分析,采用主成分法提取因子及最大变异法进行正交转轴,获得三个共同因素,即抑郁心境、睡眠障碍及食欲变化。根据转轴后的成分矩阵,题项在三个因素的负荷如图1所示。三个因素转轴前的特征值分别为6.503、1.154、1.051,转轴后的特征值分别为4.526、2.385、1.798,三个因素构念解释个别的变异量分别为 32.326%、17.037%、12.842%,联合解释的变异量为62.204%。
表1 医生及患者对问卷条目的评价
表2 问卷条目的最终筛选结果
图1 转轴后因素空间内的因素图
3 讨论
抑郁症是重大的公共卫生问题[7],然而由于对精神障碍相关知识缺乏、以及病耻感的原因,患者羞于承认抑郁症状[8]。因此需要能在家庭中使用的隐私性好的筛查工具。电话是比较普及的通讯工具,如果通过在家拨打电话就能完成抑郁筛查,不仅隐私性好而且简便易行。电话和交互式应答系统结合起来效率更高,适合社区筛查。我们与清华大学合作开发了IVR系统,该系统能够代替人工24小时提供服务,具有评估方式标准化及程度评定方便的优势[9-10]。本研究旨在编制适合该系统的抑郁电话筛查量表。
目前使用的抑郁量表绝大多数来自国外,其中他评量表需要患者到医院就诊,大规模筛查有困难。自评量表如Zung自评抑郁量表,由于某些条目如“我做事情象平时一样不感到困难”翻译后与汉语习惯差别较大,许多患者难以理解。因此,需要编制适合中国国情的简便的电话筛查量表。我们根据IVR的电话和计算机交互特点编制问卷,条目设置简洁易答,能够配合计算机程序流畅运行。
条目筛选是量表编制中的关键问题。筛选条目有多种方法,每种方法或指标考察点不同,保留或删除的条目也不同[11]。本研究对条目采取5种方法联合筛选,从独立性、代表性、相关性等多种方法考察条目。从筛选结果看,Q2.1及Q2.2为症状早晚变化的条目,该条目与总分的相关性较低。Q6.1、Q6.2、Q7.2、Q16.2及Q21.3在共同因素的因素负荷量小于0.45,共同因素能解释个别条目的变异小于0.20,予以删除。Q8.1及Q8.2为食欲增加和饮食过量,Q10.1及Q10.2为体重增加,在快速抑郁症状量表 (the quick inventory of depressive symptomatology,QIDS)中曾经被提及[12],本研究也将其列入条目池,由于抑郁症患者这方面的症状相对较少,条目的应答率较低,仅有35人(17.5%)有相关症状,结果无统计学意义。问卷中Q19.1及Q19.2是关于性生活方面的条目,在条目初选过程中,发现部分患者不主动回答此方面的问题。此现象的原因可能为:①受中国传统文化的影响,性方面一直都是一个比较敏感的问题。当涉及此问题时,许多人采取回避的方式来处理;②在调查过程中,对部分青少年、高龄老年人及丧偶者不适用。最后该条目被删除了。
从信度、效度分析来看,该问卷的信度和效度均达到了测量学的要求。在信度方面,该问卷的克朗巴赫系数大于0.90,非常理想,可以直接用于个体鉴别,具有实际应用的价值。虽然睡眠障碍与食欲变化因子的重测信度稍低,但重测总分的信度系数值大于0.7,表明问卷的再测信度较好、稳定性良好。在效度方面:①内容效度:主要是指条目或内容的代表性和适切性。由于抑郁是一种自身体验,是根据临床医生主观评价,还是根据患者的自我叙述进行评定还没有定论[13]。本研究不但从医生角度进行评价,也从患者的角度选择条目。让患者评价该条目对其症状的反映程度及他们的接受程度,从而使条目更能反映患者的症状,使本问卷具有较高的内容效度;②结构效度:本研究因素分析时,共提取出三个因子,即抑郁心境、睡眠障碍及体重变化,与最初的理论构想在因子数目上有所不同,原因在于国人在睡眠和饮食方面的主诉较多,两方面成为独立的因子。而理论构想中的思维运动迟滞和抑郁情绪合并为抑郁心境。由于以少数的因素构念来解释所有观察变量的总变异量,并且行为及社会科学领域的测量不如自然科学领域精确,因而本研究萃取后保留的因素联合解释变异量达到60%以上,仍表示萃取后保留的因素相当理想,显示问卷结构效度较好;③效标效度将在下一期中发表。并且,绘出ROC曲线,得出界值,利用kappa一致性检验分析问卷的分数与诊断的一致性,将是我们下一步研究的内容。
16条目的社区抑郁状态电话筛查问卷条目通俗易懂,有汉语口语特征,适合电话筛查。按程序化的方式筛选条目,适合计算机程序和交互式应答系统。问答简洁,适合社区筛查。下一步我们将该问卷和交互式语音应答系统相结合,代替人工进行自动语音处理,通过电话按钮输入信息进行抑郁评价。不但为患者提供了便利,也使研究者和临床医生能够及时获取相关信息。
[1]Baas KD,Wittkampf KA,van Weert HC,et al.Screening for depression in high-risk groups:prospective cohort study in general practice[J].Br J Psychiatry,2009,194(5):399-403.
[2] 李献云,张艳萍,王志青,等.北京地区综合医院患者抑郁障碍的患病率[J].中国神经精神疾病杂志,2010,36(2):65-69.
[3]Parker G,Chan B,Tully L,et al.Depression in the Chinese:the impact of acculturation[J].Psychol Med,2005,35(10):1475-1483.
[4] 田德财,张新卿.交互式语音应答系统在抑郁障碍筛查中的应用[J].中国神经精神疾病杂志,2010,36(11):695-697.
[5]Ohmae S.The modern concept of atypical depression:four definitions[J].Seishin Shinkeigaku Zasshi,2010,112(1):3-22.
[6]Samuel DB,Widiger TW.Comparing personality disorder models:cross-method assessment of the FFM and DSM-IV-TR[J].J Pers Disord,2010,24(6):721-745.
[7] 马辛,李淑然,向应强,等.北京市抑郁症的患病率调查[J].中华精神科杂志,2007,40(2):100-103
[8] 蒋锋,汤宜朗,侯也之.精神疾病病耻感形成的相关因素及对策[J].中国心理卫生杂志,2002,16(10):721-722.
[9]Mundt JC, Geralts DS, Moore HK.Dial “T” for testing:Technological flexibility in neuropsychological assessment[J].Telemed J E Health,2006,12(3):317-323.
[10]Rush A J,Bernstein IH,Trivedi MH,et al.An evaluation of the quick inventory of depressive symptomatology and the hamilton rating scale for depression: a sequenced treatment alternatives to relieve depression trial report[J].Biol Psychiatry,2006,59(6):493-501.
[11]郝元涛,孙希凤,方积乾,等.量表条目筛选的统计学方法研究[J].中国卫生统计学,2004,21(4):209-211.
[12]Trivedi MH,Rush AJ,Ibrahim HM,et al.The Inventory of Depressive Symptomatology,Clinician Rating(IDS-C)and Self-Report(IDS-SR),and the Quick Inventory of Depressive Symptomatology,Clinician Rating(QIDS-C)and Self-Report(QIDSSR)in public sector patients with mood disorders:a psychometric evaluation[J].Psychol Med,2004,34(1):73-82.
[13]Mundt JC,Katzelnick DJ,Kennedy SH,et al.Validation of an IVRS version of the MADRS[J].J Psychiatr Res,2006,40(3):243-246.
The development of phone screening questionnaire and the test on its reliability and construct validity.
TIANDecai,ZHANG Xinqing,JIANG Fengying,ZHOU Jingsheng,MIN Baoquan.XuanWu Hospital,Capital Medical University,45#Changchunjie Road,Beijing 100053.China.Tel:010-83198673.
Objective To develop a phone screening instrument to improve the identification of individuals with depression in the community.Methods The initial entry pool questionnaire was developed according to the theoretical concept.The initial questionnaire was evaluated to form the second entry pool by 98 experts and 45 depressed patients.The second entry pool was further evaluated in 200 outpatients with depression, and differentiation analysis, extreme values of the critical ratio, correlation coefficient, factor analysis and Cronbach's coefficient five kinds of statistical methods were used for re-entry screening to form the final pool.The final preparation of the questionnaire was used to test 153 outpatients with depression,30 of whom were selected for re-test one week later.Results Forty two items including 16 community entries were selected form initial 105 entries of the initial screening to form a community depression phone screening questionnaire.The Cronbach's coefficient test-retest score,correlation coefficient and split-half reliability coefficient were 0.906, 0.723 and 0.886, respectively.The factor analysis of three factors (depressive mood,sleep disturbance and appetite changes) suggested the good construct validity of the questionnaire. Conclusion The CDSQ-T(Community Depression Status Screening Questionnaire via Telephone)developed by stepwise selection method possesses a good reliability and validity.
Depression Phone screening questionnaire Development Relaibility Validity
R749
A
2011-01-28)
(责任编辑:曹莉萍)
☆ 国家高技术研究发展计划(863计划)(编号:2008AA02Z414)
* 首都医科大学宣武医院神经内科(北京100053)
(E-mail:xinqingzhang@263.net)
△ 首都医科大学宣武医院康复科
※ 首都医科大学宣武医院社会医学部