肺癌患者报告结局工具及应用研究进展
2021-12-06李华艳樊榕榕
李华艳 樊榕榕
(北京大学人民医院,北京 100044)
以往大部分关于肺癌的研究主要以围手术期并发症、长期生存率等[1-2]为研究观察指标,忽略了对患者来说非常重要的症状、心理、情感健康状况等指标。而随着近年来“以患者为中心”的照护理念不断深入,患者的切身感受渐渐被纳入到临床实践中来,将患者报告的结果放至结局评估很重要的位置。本文综述了患者报告结局(Patient reported outcome,PRO)在肺癌患者管理中的应用,并着重介绍了目前肺癌患者特异性的主要PRO的工具及应用现状,为完善肺癌患者的临床结局评估和照护方案提供参考。
1 PRO概述
PRO是指未经医务人员解释,直接来自患者(在某些情况下,可能是其照料者)的任何有关于患者健康状况的报告[3]。基于PRO产生的肿瘤患者的数据,对于评估肿瘤治疗风险及效果、进行恰当的肿瘤患者支持护理有着显著的作用。基于此,一些国际组织或机构如美国国立卫生研究院,美国国家癌症研究所,美国食品药品管理局,美国外科医生学院和欧洲医疗产品评估机构等等都在积极促进PRO的研究。
2 肺癌患者特异性PRO工具
2.1肺癌症状量表(Lung cancer symptom scale,LCSS) 由Hollen等[4]于1985年开发,旨在为临床试验提供测量肺癌患者与健康相关的生活质量的特异性工具。LCSS包括9个条目,其中6个条目为肺癌症状(食欲,疲劳,咳嗽,呼吸困难,咯血和疼痛),另3个条目评估患者症状总体严重程度、对生活的影响以及目前的总体生活质量。该量表采用视觉模拟评分法,由0到100 表示无到最严重/最坏的状态,总分是所有条目的总和,得分越高表示症状负担越重,生活质量越低。LCSS通过测量肺癌症状的严重程度及其对日常生活的影响,从身体和功能方面分析患者生活质量。
量表内部一致性克隆巴赫α系数为0.82,重测信度>0.75。同时,Hollen等[5]在后期的多中心研究中,引用美国胸科学会问卷(American thoracic society questionnaire,ATS)和麦吉尔疼痛问卷(McGill pain questionnaire,KPS),情绪状态评估(Profiles of mood states,POMS)和疾病影响概况(Sickness impact profile ,SIP)作为标准,验证量表的校标效度,结果显示有较好的相关性(相关系数r为0.40~0.67);又和简易症状评估清单(Brief symptom inventory,BSI)做聚合效度分析,相关系数r为0.77,表示聚合效度高。LCSS也是症状评估工具,相比其他工具,具有简洁的优势,但其内容不够全面,因此其是应用范围并不如MDASI-LC。
2.2欧洲癌症研究与治疗组织的生命质量核心量表和肺癌特异模块 欧洲癌症研究与治疗组织(The european organization for research and treatment of cancer,EORTC)于1986年开发了癌症患者的普适性健康相关生活质量评价量表,就是目前的生活质量核心量表QLQ-LC30[6]。后来又在此基础上增加了特异性的条目,形成不同疾病的特异性模块。QLQ-LC13是1994年增加的肺癌特异模块[7],它与核心量表联用可以全面评估肺癌患者的生活质量[8]。QLQ-C30(30个条目)和肺癌特异性模块QLQ-LC13(13个条目)共包含43个条目,通常又被叫做QLQ-LC43。QLQ-C30分为3个领域:功能领域(包括身体功能、角色功能、情感功能、社交功能和认知功能,共15个条目),症状领域(包括疲劳、疼痛、恶心/呕吐,失眠、气促、便秘、腹泻、食欲减退等,共13个条目)和总体健康状况(2个条目)。除总体健康状况领域的2个条目采用7级评分(从差到好记为1~7分)外,功能领域和症状领域的条目均采用4级评分:用1~4分依次代表从没有、有一点、较多、很多。各领域所含条目得分相加再除以条目数记为该领域得分粗分,然后采用极差化方法将粗分转化为0~100内取值的标准分即为该领域得分。功能领域和总体健康领域得分越高,表示患者功能或健康状况越好;症状领域得分越高表示患者生活质量越差。QLQ-LC13由13个条目组成,用这些条目来评估肺癌特有的症状:包括咳嗽、咯血、呼吸困难、治疗副作用(口痛,吞咽困难,脱发,周围神经病)、疼痛等等,也采用4级评分法计分方法同QLQ-C30,得分越高,表示表示患者生活质量越差。
目前,EORTC QLQ-LC43被认为是最方便、最精准的肺癌患者生活质量测量工具[7],也是最常用的工具,广泛地应用到肺癌患者生活质量研究[9]。我国最早由万重华等[10]对其进行了汉化并在181例肺癌患者中进行验证,发现大多数域的重测可靠性r高于0.60。除认知功能外,EORTC QLQ-LC43所有领域的克隆巴赫α系数均大于0.65,通过因子分析以及以FACT-L作为标准时的相关分析都表明EORTC QLQ-LC43有较好的有效性。此后,天津市癌症研究所[11]又结合SF-36问卷对317例肺癌患者进行进一步调查验证,也得出了类似的结论。近年来,EORTC组织又使用模块开发手册对QLQ-LC13进行了改进[12],形成了QLQ-LC29,保留了13个原始项目中的12个,并补充了17个主要评估关于新疗法的治疗副作用的项目,优化了肺癌患者的评估,但目前该工具目前还处于验证阶段。
2.3肺癌治疗功能评估量表(Functional assessment of cancer therapy-lung,FACT-L) 由慢性病治疗功能评估小组(Functional assessment of chronic illness therapy,FACIT) DavidCella等[13]学者在1995年开发。它主要评估肺癌患者的生活质量[14],包括一个癌症通用量表(Functional assessment of cancer therapy-generic,FACT-G)和一个肺癌分量表(Lung cancer subscale,LCS),一共包含5个维度,36个条目。其中通用量表FACT-G从4个维度评估患者的健康状态,共21个条目。分别是:生理状况(7个条目)、社会/家庭状况(7个条目)、情感状况(6个条目)和功能状况(7个条目)。而肺癌分量表LCS主要评估肺癌的症状,包含9个条目。该量表36个条目均采用Likert 5级评分法,从0到4分别表示“一点也不”“有一点”“有一些”“相当”“非常”。其中生理状况、情绪状况和LCS这3个维度的条目需要逆向评分,36个条目得分的总和为量表最终得分。最终得分越高,表示患者的生活质量越高。此外,该量表还有另一种计分方法,即试验结果指数(Trial Outcome Index ,TOI),计算生理状况、情绪状况和LCS这3个维度条目得分之和,得分越高,表示患者的生活质量越高。
FACT-L一共经历了4个版本的演变。上述FACT-L就是目前比较通用的4.0版本,它已被翻译成多个语言版本,广泛应用于各国肺癌患者生活质量的评价[15-19]。我国学者万重华等[20]分别在2000年和2007年先后汉化了FACT-L(3.0)和FACT-L(4.0)并进行了心理测量学特征分析。简体中文版FACT-L重测信度和Cronbach′s α系数均>0.75;此外,校标效度、结构效度和反应度也较好,具有良好的信效度。继EORTC QLQ-LC13之后,它成为评估肺癌患者生活质量的临床研究中最常用的工具。
2.4MD安德森症状清单-肺癌模块+修订版肺癌模块 MD安德森症状清单(MDASI)于2000年开发,是一种相对较短的自我管理调查表[21],用于测量癌症患者过去24 h内的症状强度以及这些症状对日常活动的干扰,更好地反映出患者的症状经历。它是核心模块,由 2 部分内容组成,共19 个条目。第 1 部分包括 13 个条目,用于评估癌症患者的常见症状;第 2 部分包括 6个条目,用于评估症状对患者生活造成的困扰。第1 部分计分方法采用 0~10 分计分法,“0”分表示该症状未发生,“10”分表示该症状已达到最严重状态。第 2 部分计分方法也采用 0~10 分计分法,“0”分表示症状不会对患者造成困扰,“10” 分表示症状对患者造成的干扰最大。目前,该量表已被翻译为多种语言,中文版安德森症状评估量表的内部一致性信度为 0.82~0.94。该量表使用方便、简洁,适合用于我国癌症患者[22]。
MD安德森症状清单肺癌模块(MDASI-LC)是由Mendoza 等[23]于2011年开发,是肺癌特定模块。它包括3个条目:咳嗽,便秘和喉咙痛,其计分原则与核心量表一致。与QLQ-LC13一样,它不能单独使用,必须与核心量表联用。我国学者臧瑜[24]的研究发现,此量表在评估肺癌患者的特异性症状时不够全面,在原量表基础上进行了修订,修订版量表有6 个条目,删除了原有的咽喉痛,增加了咳痰、咯血、胸闷、和体重下降4个条目,计分方法同安德森症状评估量表。修订版肺癌模块与核心量表结合测Cronbach′s α系数为0.925,内容效度为0.944。探索性因子分析后得到2个公因子,方差累积贡献率为63.933%,各条目的因子负荷均大于0.40,表示结构效度较好;此外,修订版肺癌模块与简易生活质量评价量表SF-12相关系数r为-0.439,表示有较好的校标效度。
与EORTC QLQ-LC13和FACT-L不同的是,前两者是基于健康相关生活质量的框架发展而来,尽管包含症状评估,但其本质是测量患者的生活质量,而MDASI-LC主要基于症状,是真正的症状评估工具。
2.5肺癌患者术后症状评估量表 该量表由我国华西医院车国卫[25]团队于2017年提出,该量表提出了肺癌特异性的8个症状,包括咳嗽、疼痛、气促、疲劳、虚汗、便秘、咽喉疼痛及失眠。量表分为2部分,第1部分是8个症状的影响因素,第2部分是8个症状的严重程度,用数字评分法0~10分表示,0分表示没有症状,10分表示疼痛程度十分强烈。与上述量表不同的是,该量表聚焦肺癌围术期患者,在此类患者基础上完成了开发和验证,更关注术后急性期症状。通过对8家医院383名肺癌患者的调查,展现了良好的信效度:Cronbach′s α系数是0.888,内容效度CVI为 0.900,结构效度评价中两个公因子的方差累积贡献率为47.70% 和 57.46%。但由于开发时间较短,该量表并未得到广泛地应用,目前未见更详尽的报道。不过随着早期肺癌手术的增多,对这类人群生活质量的关注也将越来越多,该量表对于评估这类人群的症状,预测生活质量有着重要意义。
2.6患者报告的结果测量信息系统 21世纪以来,研究者们逐渐意识到由于以往工具的多样性和差异性,不同研究的结果分析十分混乱,需要一套规范的标准的工具。基于此,美国国立卫生研究院在2004年开发了患者报告的结果测量信息系统(Patient-reported outcomes measurement information system,PROMIS)。用于评估与7种健康状况相关的症状和知觉:这7中健康状况包括身体机能,疼痛和影响,疲劳,睡眠障碍,情绪健康,包括抑郁,焦虑和参与社会角色的能力。它使用了定性和定量的混合方法,并使用了项目反应理论(Item response theory,IRT)校准的项目库,可用于评估不同慢性病患者(包括肿瘤患者)和普通人群的评估,使得不同疾病状态和人群间的数据具有可比性。此外,与传统统一的PRO工具相比,PROMIS使用了计算机自适应测试软件CAT,能对被测量者进行水平测试并依据其水平高低匹配相同能级的测试条目,这样不仅对被测试者更加友好方便,提升了其准确度和配合度,同时也节省了整体测试时间。
基于PROMIS的以上特点,目前医学技术政策中心已经将其推荐为癌症临床研究首选的PRO之一,在自我报告结局的相关研究中也得到了广泛应用,在肺癌研究领域也得到了传播。如Khullar等[26]在美国进行一项预实验研究,将肺癌术后患者自我报告结局嵌入胸外科医师学会数据库,探索其效果和可行性。他们采用平板电脑对数据进行收集,主要观察了108名患者术后6个月内自我报告结局指标的变化,结果表明肺癌术后患者在术后1个月时疼痛,疲劳和睡眠障碍显著增加,身体机能下降,到6个月时则基本恢复到基线水平。该研究也表明将PROMIS整合到电子健康系统是可行的,它可以较好地对患者的症状和功能进行动态监测。
值得一提的是,虽然前期已有大量研究证实了该工具在某一特定人群中的良好的信效度和可重复性,但目前暂未有研究验证该系统在肺癌患者人群中的信效度。此外正如上述描述,PROMIS适用于全人群的测量,这意味着PROMIS并非肺癌患者特异性症状的评估工具,对于希望关注到特异性症状的研究,还需要结合某一特异性工具。
3 PRO在肺癌患者管理中的应用
3.1PRO用于肺癌患者疾病进展的监测 PRO最常用于肺癌患者的症状监测中。Fagundes等[27]使用MD安德森症状清单调查了60 例I期或II期非小细胞肺癌患者从术前到术后3个月的多种症状,发现术后最严重的症状是疲劳,疼痛,呼吸急促,睡眠不安和嗜睡,但在术后第3个月末,以上症状均恢复至术前水平。Trine等[28]采用EORTC QLQ -C30和QLQ -LC13 对375名原发性肺癌患者调查结果指出,患者在术后5个月内一直持续且程度较重的症状是咳嗽和睡眠困难,而其他症状(疼痛、呼吸急促、焦虑)在术后1个月后会明显缓解。Lowery等[29]对术后1-6年的早期非小细胞肺癌(NSCLC)长期幸存者完成了5种特定症状(疼痛,疲劳,呼吸困难,抑郁和焦虑)的纵向调查,发现大多数幸存者(79.8%)有一定程度的症状负担,其中30.6%的人报告一种临床上明显的症状,27.9%的人报告两种症状,21.3%的人报告三种或更多症状。Shi Q等[30]将PRO与肺癌患者术后临床结局(并发症风险、住院时间)相结合,用MD安德森症状量表评估患者术后功能恢复情况。结果表明患者在术后第3天时的功能受损最严重,后期有慢慢恢复至基线水平,而重复测量MDASI有利于识别患者手术后的功能恢复情况。
此外,PRO也是患者治疗期间的健康相关生活质量和存活率的重要评估方法,用于预测患者生存。D.E. Ediebah[31]采用EORTC QLQ-C30和QLQ-LC13 对391名晚期非小细胞肺癌患者在基线以及每个化疗周期后的健康相关生活质量。结果表明患者基线时疼痛和吞咽困难每增加10分,患者死亡风险分别增加11%和12%;而当基线时的身体功能每提高10分,患者的死亡风险将降低7%。Fiteni等[32]的研究中用EORTC QLQ -C30调查了451例高龄(70-89岁)肺癌患者的健康相关生活质量与总体生存质量的关系。结果表明总体健康状况维度评分与良好的总体生存相关,在生活质量低、中、高危风险组,患者的总体生存时间中位数分别为14.5、8.2和5.3个月(P<0.000 1)。
3.2PRO用于评估临床治疗效果 肿瘤治疗效果的评估主要依赖总生存期和一些临床实验室、影像学等指标。但近年来,PRO逐步被应用。PRO评估的使用将使人们更好地了解各项治疗对患者预后的影响。Barlesi F[33]等研究者使用EORTC QLQ-C30和EORTC QLQ-LC13问卷调查接受免疫治疗的肺癌患者,以了解免疫治疗引起的常见症状或毒性反应。在该研究中,他指出基于PRO的疾病调查表发现了部分与治疗相关的症状。因此,有报告[34]指出在将来的癌症免疫治疗研究中,应将PRO评估视为免疫治疗效果的标准评估工具,同时开发更特异性的工具[35]。
3.3PRO用于指导改善患者的诊疗 通过个体化随访策略,及早发现症状复发并进行症状管理,可以改善生活质量和总体生存率。一项随机临床试验研究[36]常规收集PRO对肺癌患者的影响。与常规护理相比,PRO作为干预措施,在症状严重或恶化时使用想医师发送电子邮件预警。随之立即采取行动,如更换药物或转诊等。结果表明基于PRO的症状监测干预可以增强医师的意识,将其重点更多地转移到患者的需求上,从而更好地控制症状。此外,另一项关于肺癌晚期化疗患者的研究[37]也指出,系统应用PRO进行症状监测能提高患者的生存率,相比被动监测,PRO主动监测症状的患者生存时间延长了5.2月(P<0.05)。
4 小结与展望
随着“以患者为中心”理念的不断深入,基于PRO的测量研究持续增多,证实了PRO在患者医疗保健管理中发挥着重要作用。但值得注意的是,目前研究存在着质量参差不齐,结局报告不一致的问题。我国目前基于PRO的肺癌患者管理还处于探索层面,层次低,范围小,多数研究停留在调查患者的生活质量或症状层面,缺乏进一步的研究。如依据PRO指导干预、建立基于PRO的健康信息库等,且目前基于PRO的数据量小,尚未形成适宜规模以指导干预。要在常规临床环境中实现高质量的PRO数据收集和使用并不容易,需要很多其他的资源,例如教育培训,制定PRO的详细患者管理计划,同时评估成本,时间,所需人员,适用范围等。因此,在今后的研究中,既要重视PRO的必要性,同时应重点加强对PRO测量的相关培训,提升研究质量及深度。
此外,随着信息化的不断发展与进步,基于网络平台的PROMIS是以其高效性和简洁性获得了国外研究者们的重视和青睐。因为它简化了数据收集和管理流程,使大规模的数据收集成为可能,但我国目前却极少开展相似研究。因此,我国也可以借鉴国外研究经验与成果,形成中国肺癌患者的自我报告结局测量信息系统。