中文版PROMIS焦虑和抑郁简表在乳腺癌患者中的测量学检验
2022-02-17黄青梅吴傅蕾蔡婷婷朱瑞张雯杨瑒袁长蓉
黄青梅 吴傅蕾 蔡婷婷 朱瑞 张雯 杨瑒 袁长蓉
(1.复旦大学护理学院,上海 200032;2.复旦大学附属肿瘤医院,上海 200032)
乳腺癌的诊断和治疗往往给患者带来一系列的身心痛苦症状,其中焦虑和抑郁是乳腺癌患者最常经历的心理痛苦症状[1]。而对于患者的主观症状体验,应由患者自己陈述,以患者的自我报告为金标准[2],有效的患者报告工具则是实现患者主观症状准确报告的关键。目前的研究中,对于乳腺癌患者焦虑、抑郁症状的评估工具众多,如焦虑(抑郁)自评量表,医院焦虑抑郁量表等[3-4]。但这些传统的评估工具由于条目数不同、条目内容存在较大差异及计分方式不同等原因,使得不同研究得出的结果差异较大。如Maass等[5]针对乳腺癌治疗后焦虑抑郁发生率的系统综述中,纳入的17篇文献报道的乳腺癌患者焦虑发生率从17.9%到33.3%不等,而抑郁的发生率最低仅9.4%,最高达到66.1%。如此大的差异使得不同研究间的结果无法直接比较,究其原因则与不同研究使用的评估量表不同有关。
为解决传统患者报告结局评估工具各居一方,结果无法直接比较及测验效能的有效性及可靠性不足等问题,美国国立卫生研究院于2004年牵头研制了患者报告结局测量信息系统(patient-reported outcomes measurement information system,PROMIS)[6]。PROMIS的研制整合了测量学、健康信息技术、质性研究等多领域最新最科学的研究方法,经过15年的项目发展,目前PROMIS已发展成为国际公认的收集患者自我报告健康结局精确可信的测量工具系统。PROMIS的其中一大优势即是各个工具的测评得分均可进行标准化,这使得来自不同疾病、不同人群、不同地域间的研究结果具有可比性[7]。而PROMIS焦虑和抑郁量表是PROMIS心理健康测量领域最常用的评估工具,其简表形式是从条目池中经统计检验筛选出的敏感条目。其中8条目的PROMIS焦虑和抑郁简表已由本研究团队完成中文翻译并通过PHO质量审核,但尚未在乳腺癌患者群体中进行测量学检验。本研究旨在通过多中心大样本的调查,在乳腺癌患者群体中评价中文版成人PROMIS焦虑和抑郁8a简表的测量学指标,为今后评估患者焦虑抑郁症状提供高质量测评工具。
1 对象与方法
1.1研究对象 本研究基于横断面研究设计收集资料,采用方便抽样法于2018年11月-2020年5月选取在上海、江苏、山东、浙江、贵州等地三甲医院乳腺外科及肿瘤外科就诊的患者。纳入标准为:经病理学诊断确诊为乳腺癌的患者;处于术后阶段或化疗周期内;年龄≥18岁;患者知晓病情;无认知功能障碍;能独立阅读写作且自愿参加本研究。同时排除合并其他肿瘤或严重疾病者。所有研究对象签署知情同意书。样本量根据经验法则,即为条目数的5~10倍,则至少应收集研究对象160例。
1.2研究工具
1.2.1患者人口学及疾病相关资料 采用自制的人口学及疾病资料采集表收集患者的年龄、宗教信仰、婚姻状态、文化程度、生活方式、月经状态、家庭人均月收入等人口学资料;以及疾病分期、治疗阶段等疾病相关资料。
1.2.2PROMIS焦虑和抑郁8a简表 PROMIS焦虑和抑郁8a简表是PROMIS心理健康模块下最常用的用于评估患者负性情绪的量表,焦虑全条目库包含29个条目,抑郁则包含28个条目[8]。简表是PROMIS测评形式之一,由从条目库中经过多重检验后筛选出的最敏感条目组成,目的是在保证测量信息有效性和可靠性的前提下尽可能地降低患者的测量负荷。PROMIS焦虑和抑郁8a简表中文版由吴傅蕾等[9]研究者完成,翻译过程遵循的是PROMIS数据管理中心要求的国际标准的慢性病治疗功能评价(functional assessment of chronic illness therapy,FACIT)翻译方法,主要过程包括前译、调和、回译、专家审核校对、提交PROMIS数据管理中心质量评价及认知性访谈等[10]。各包含8个条目,每个条目均采用Likert 5级评分(1=从来没有、2=几乎没有、3=有时、4=经常、5=总是),要求研究对象对过去7 d的焦虑、抑郁体验进行评估,总分为8~40分,分数越高,表示其焦虑、抑郁症状越严重。按照PROMIS量表的计分要求,原始得分经转换后采用标准T-分(均值为50,标准差为10)进行不同患者间焦虑、抑郁程度的比较。
1.2.3乳腺癌患者生活质量测定量表(functional assessment of cancer therapy-breast,FACT-B) FACT-B是近年来广泛应用于乳腺癌患者的生活质量评价量表,由癌症患者生活质量共性模型(FACT-G)和乳腺癌特异子量表组成,包含生理状况、社会/家庭状况、情感状况、功能状况和附加关注,共36个条目组成。所有条目均采用5级评分,得分越高,生活质量越好。中文版各维度Cronbach′s α系数为0.61~0.84[11]。该量表所属FACTI组织是PROMIS国际联盟核心成员之一,其研发的系列量表亦是PROMIS的核心条目池来源,因此本研究采用该量表作效标关联效度的检验。
1.3统计学方法 采用Mplus 7.4软件及SPSS 17.0软件对资料进行统计学处理。患者人口学及疾病相关资料采用频数、百分率描述。对量表的测量学评价方面,首先评价量表的地板效应和天花板效应,若评分为最低分(最高分)的病例数占总样本的百分比>15%,则提示存在明显的地板(天花板)效应。由于PROMIS量表均为单维度因子结构,采用验证性因子分析(confirmatory factor analysis,CFA)检验PROMIS焦虑和抑郁8a简表的单维度结构;采用Spearman相关分析法评价效标关联效度;采用两样本t检验对处于癌症早期与晚期患者的焦虑和抑郁得分进行已知组别效度检验。两量表的信度指标采用内部一致性信度(Cronbach′s α系数)和折半信度(Gutman系数)进行评价。另外,根据PROMIS量表翻译及测量学检验指导手册,本研究增加对两量表的测量等价性检验,通过多指标-多因模型(multiple-indicator multiple-cause,MIMIC)检验两量表在乳腺癌群体中跨年龄(≤40岁;>40岁;≥60岁)的条目功能差异(differential item functioning,DIF)来实现测量等价性检验。MIMIC模型可以看作是带有协变量的CFA模型,可以用来检测协变量的组间测量等价性。显著的P值提示条目存在功能差异,即该条目在不同组别人群(如不同年龄组)间存在不同的解读,采用Mplus 7.4软件进行模型估计,P<0.05为差异有统计学意义。
2 结果
2.1研究对象一般资料 共发放问卷1 100份,回收有效问卷975份,有效回收率88.6%。纳入研究对象的平均年龄为(49.06±10.32)岁,在40岁及以下的患者占19.4%,60岁及以上的占16.5%。20.6%的患者具有大专及以上文化程度,30.4%的患者来自城市地区,人均月收入在3 000元以下的患者占47.5%。另外,53.3%的乳腺癌患者处于绝经前期,65.9%的患者处于化疗期,34.1%的患者处于术后阶段。
2.2中文版PROMIS焦虑和抑郁8a简表的信度 中文版PROMIS焦虑和抑郁8a简表的Cronbach′s α系数分别为0.958和0.961,折半信度分别为0.927及0.948,表明两量表均具有良好的信度。见表1。
2.3中文版PROMIS焦虑和抑郁8a简表的地板效应和天花板效应 PROMIS焦虑和抑郁8a简表的原始总分范围为8~40分,评分为最低分即8分的患者分别占15.8%及21.6%,评分为最高分即40分的患者分别占0.5%及0.4%。结果提示,总简表几乎不存在地板效应和天花板效应,但条目评分最低“1”分的患者比例范围为24.2%~38.0%,最高“5”分的患者比例范围为0.8%~3.0%,说明条目存在较明显的地板效应,但均不存在天花板效应,表明2个量表的条目在测评轻微焦虑或抑郁症状方面表现欠佳,在获取严重焦虑或抑郁症状方面表现较好。见表1。
表1 中文版PROMIS焦虑和抑郁8a简表的条目分析 n(%)
续表1 中文版PROMIS焦虑和抑郁8a简表的条目分析 n(%)
2.4中文版PROMIS焦虑和抑郁8a简表的结构效度分析 采用稳健极大似然估计法进行CFA模型拟合,通过综合各个拟合指标进行模型评价,见表2。由表可知,在初始模型时,TLI及RMSEA指标未达到参考标准。因此对初始模型进行修正,根据修正指数提示,将PROMIS焦虑简表的条目3和条目4,及抑郁简表的条目7和条目8分别设为误差相关。修正后的模型各个指标均达到了参考标准,且由图1和图2可知,修正后8个条目的标准化因子载荷均>0.7,提示中文版成人PROMIS焦虑和抑郁8a简表结构效度良好。
图1 中文版PROMIS焦虑8a简表验证性因子分析条目载荷情况(修正后)
图2 中文版PROMIS抑郁8a简表验证性因子分析条目载荷情况(修正后)
表2 验证性因子分析模型拟合结果
2.5中文版PROMIS焦虑和抑郁8a简表的效标关联效度和已知组别效度 经正态性检验,PROMIS焦虑、抑郁及FACT-B量表得分均不符合正态分布,因此采用Spearman相关分析法进行两两相关分析。结果显示,PROMIS焦虑和抑郁简表与FACT-B总分呈显著负相关(P<0.001),相关系数分别为-0.354和-0.447,效标关联效度较好。另外,根据文献报道,晚期癌症患者往往比早期患者有更严重的焦虑和抑郁症状。因此,本研究拟通过比较癌症早期和晚期患者焦虑及抑郁症状得分的差异来检验量表的已知组别效度。结果显示,两组患者的评分差异具有统计学意义(P<0.05),表明中文版PROMIS焦虑和抑郁8a简表能够区分出不同组间人群已知的差异,具有良好的已知组别效度。见表3。
表3 已知组别效度分析结果
2.6中文版PROMIS焦虑和抑郁8a简表的测量等价性检验 中文版PROMIS焦虑和焦虑8a简表的条目功能差异检验结果,见表4。结果显示,抑郁简表的8个条目的跨年龄(≤40岁;41~59岁;≥60岁)条目功能差异分析均无统计学意义,表明中文版抑郁简表在乳腺癌患者群体中具有良好的测量等价性。然而焦虑简表的条目5、6、8存在跨年龄的条目功能差异(P<0.05),提示以上条目存在跨年龄的测量不等价。
表4 中文版PROMIS焦虑和焦虑8a简表的条目功能差异分析(n=975)
3 讨论
3.1中文版成人PROMIS焦虑和抑郁简表在乳腺癌患者中的测量学性能较好 患者症状自我报告工具是获取患者主观症状体验的最有效方法,但其测量性能的可信度和可靠性是前提。虽然目前针对患者焦虑、抑郁症状的评估量表众多,然而由于传统的量表的研发是非系统的,零散的,且多数是基于传统的测量理论进行研发,使得不同研究者在测量工具选择上各自为政,致使研究结果间可比性较差[12]。因此目前在健康测量领域,越来越重视患者报告结局评估工具的标准化。PROMIS测量系统是基于现代测量理论进行研发,目的是为患者主观症状的评估提供国际标准化的工具。本研究团队前期已完成成人PROMIS焦虑和抑郁简表的中文版研制并正在不同疾病群体中进行测量学检验,本研究旨在评价中文版成人PROMIS焦虑和抑郁8a简表在乳腺癌患者中的测量学性能。研究发现,中文版PROMIS焦虑和抑郁8a简表在乳腺癌患者中的信度指数均在0.9以上,大于0.7的标准,具有良好的信度。本研究采用验证性因子分析对PROMIS焦虑和抑郁8a简表的单维度因子结构进行了验证,虽然在初始模型时,部分拟合指标为达到参考标准,但经过模型修正后,所有拟合指标均达到了参考标准且因子载荷均大于0.7,表明中文版成人PROMIS焦虑和抑郁8a简表在乳腺癌患者群体中具有良好的结构效度。同时,以FACT-B量表作为校标,相关分析发现PROMIS焦虑和抑郁简得分与FACT-B总分呈显著负相关,表明具有较好的校标关联效度。而已知组别效度是指某一工具测评结果能否区分出不同组间已知的差异,往往采用t检验、方差分析等检验两组或多组间的测量结果是否具有统计学差异进行评价[13]。本研究通过比较早期乳腺癌患者组和晚期组间的焦虑、抑郁得分差异评价已知组别效度。结果显示,晚期患者组的焦虑、抑郁得分显著高于早期组,说明中文版PROMIS焦虑和抑郁8a简表能够区分出乳腺癌患者不同组别间的差异。
另外,本研究亦评价了中文版PROMIS焦虑和抑郁8a简表的测量等价性。测量等价性或者称为测量不变性,是指观测变量和潜在特质之间的关系在相比较的各个组之间等同,是量表的一种特征,传统的信效度分析不能取代[14]。满足测量等价性是量表结果进行组间差异比较的前提条件,也是跨文化引进的量表进行国际化应用和推广的重要方面[15]。本研究通过分析PROMIS焦虑、抑郁简表的8个条目在乳腺癌患者群体中的跨年龄的条目功能差异对其测量等价性进行初步评价,结果显示,抑郁简表具有良好的测量等价性结果,而焦虑简表的条目5、6、8存在跨年龄的测量不等价。原因可能由于中西方的文化差异使得以上条目的表述影响了患者对这些条目的理解和应答。尽管前期中文版的引进严格按照FACTI的翻译方法进行,但也可能存在部分条目用词不够准确的问题,提示今后可能还需要对以上条目开展认知性访谈再次进行中文用词上的修订和完善。
3.2中文版成人PROMIS焦虑和抑郁8a简表在乳腺癌患者中的部分测量学性能尚待进一步改善 虽然中文版成人PROMIS焦虑和抑郁简表在乳腺癌患者中的信度、效度等测量学性能较好,但在量表的条目分析时,本研究发现中文版成人PROMIS焦虑和抑郁8a简表的条目在乳腺癌患者群体中存在较明显的地板效应。量表的地板效应和天花板效应是指大部分分数集中在偏低和偏高的一段,该指标反映了量表分数分布的特征[15]。研究[16]认为,当最低或最高分数分布比例>15%被认为存在显著性的地板效应或天花板效应。虽然2个量表总分的地板效应不明显,但所有条目最低评分“1分”的比例均大于20%。说明PROMIS焦虑和抑郁8a简表在评估轻微焦虑抑郁症状方面性能欠佳。这可能与本研究样本中乳腺癌患者大部分处于治疗稳定期,焦虑抑郁症状体验较少有关。也有可能与PROMIS作为普适性健康评估量表的研发理念有关。为了使得不同疾病、不同人群间的研究结果具有可比性,PROMIS在研发之初,就定位为不限定病种,即可用于健康人群,也可用于疾病人群的健康状况自我评估工具[17]。从而使得PROMIS量表缺乏疾病特异性症状的评估条目,使得量表在获取患者与疾病特异性相关程度较高的症状体验时存在不足[9]。另外需要指出的是,PROMIS是基于现代测量理论中的项目反映理论(item response theory,IRT)进行研制的,IRT强调对量表从微观层面分析每个条目的性能,如条目难度、区分度、信息量等[18]。而本研究采用的条目分析方法依然是传统测量理论框架下的,因此建议今后再次引入IRT理论框架下的测量学检验方法评价中文版PROMIS焦虑和抑郁8a量表在乳腺癌患者群体中的条目性能。
3.3本研究局限性 本研究存在以下几点局限性,首先,本研究的横断面设计仅收集了乳腺癌患者单个时间点的测评数据,因此没法进行量表重测信度和反应度的评价,今后应增加患者不同时间点的症状评估数据收集以评价以上测量学性能。其次,本研究仅对中文版PROMIS焦虑和抑郁8a量表的测量等价性进行了初步检验,需要在今后的研究中进一步验证本研究结果;另外,跨文化等价性是PROMIS这一国际标准化的量表进行国际推广应用的重要前提,今后本研究团队需积极与其他国家的PROMIS研究中心开展合作,增加对中文版PROMIS焦虑和抑郁8a简表的跨文化测量等价性的检验。
综上所述,本研究通过多中心大样本的资料收集,在乳腺癌患者群体中评价了中文版成人PROMIS焦虑和抑郁8a简表的测量学性能。总体来说,中文版成人PROMIS焦虑和抑郁简表在乳腺癌患者中的测量学性能较好,适用于中国乳腺癌患者人群。但还需要今后引入项目反映理论框架下的量表检验方法更多的从微观层面分析条目的性能。总之,本研究为中国乳腺癌患者焦虑抑郁症状的自我评估提供了国际标准化的工具,建议今后可在中国人群中推广使用。