整形外科临床研究工具：患者报告结局测评量表及其应用

2022-11-27何乐人

协和医学杂志 2022年3期

何乐人

中国医学科学院整形外科医院七科，北京 100144

整形外科乃至全医疗行业，医学干预结果的传统判断多由医生主导，判断的依据是用现有技术手段对躯体可测量参数进行分析，诸如体液(包括血液、尿液等)生化检测、影像学资料提取、躯体机械运动能力测评等。然而，对于整形外科而言，用躯体的基础理化信息来判断治疗结局远远不够。患者求助整形医生是为了通过形体的美化获得心灵的愉悦甚至社交效能的提升[1]，因此患者的感受理应在整形外科医疗决策中占据更大权重。患者报告结局是指直接来自于患者对自身健康状况、功能状态以及治疗感受的报告，不包含其他任何人员的解释[2]，是对自身观点的客观反应，其量化工具即为患者报告结局测评量表(patient reported outcome measures, PROMs)。20世纪70年代，人们对生命质量的关注度逐渐增强，使用问卷收集患者意见的临床研究亦逐渐增多。2006年，美国食品药品监督管理局(Food and Drugs Administration，FDA)发布的《将PROMs用于医疗产品研发的指南草案》[2]是此类研究的里程碑事件。自此，关于PROMs的研究进入了标准化、系统化阶段[3- 4]。整形外科相关的PROMs从较早的BREAST-Q，到后来的FACE-Q，BODY-Q，也逐渐丰富而成熟。但国内本行业仅有利用国外PROMs的一些零星而初级的临床研究[5- 9]，关于整形外科特异性PROMs的研发或本土化工作几乎为零。本文简要介绍整形外科相关PROMs的发展及应用概况，并阐述有关我国整形外科PROMS相关研究的个人思考。

1 PROMs发展概述

PROMs的呈现形式为系列化问卷，调查结果直接从患者处获取。这一方法将来自于患者的主观感受量化，转化为客观指标。2006年美国FDA发布的相关指南草案是对PROMs作为临床研究依据的认可[2,10],并在很大程度上推动了PROMS的研发和推广。整形外科领域PROMs相关研究的发文量从侧面反映了这一趋势(图1)。

早期基于患者报告结局的临床研究多采用非标准化的临时问卷。Pusic等[11]对2010年之前发表的基于患者报告结局的临床研究进行了系统回顾，发现大多采用临时测评量表。这些量表虽然也能提供一些信息，但因问卷未经过充分的论证和修订，所得结果的稳定性和敏感性均较低，且即使对于相同的问题，在不同研究之间也不具备可比性。

目前国际上广泛采用的PROMs通用问卷为医疗结局36条目健康调查量表(Medical Outcome Study Short Form 36-Item Health Survey, MOSF- 36)[12]。通用问卷关注的是躯体、情感、社交等问题，可以跨疾病类型对研究结果进行比较，但不利于捕捉与特定疾病相关的特殊问题。比如进行乳房整形的患者除关注上述有关生活质量的公共问题外，还会关注乳房形态、性体验、哺乳功能等与乳房疾病或乳房整形相关的具体问题，而减重患者则更多关心术后运动与饮食相关的问题。与通用问卷对应的是专病特异性问卷，此类问卷调查与特定身体条件直接相关的临床问题。在针对特定人群进行调查时，专病特异性问卷比通用问卷敏感性高，缺点是不能用于不同人群的比较研究。多模态量表则可弥补上述两类量表的不足。比如BREAST-Q可针对特定单一手术如隆乳、乳房缩小、重建和不重建的乳房切除术进行患者报告结局的研究，其中的独立模块可用于检测特定手术人群，而公用条目则用于不同手术的组间比较。然而在整形外科，由于针对多种修复重建/医疗美容类型的PROMs尚未研发完成，临床应用仍然受到一定限制。

2 PROMs研发步骤及科学指标

了解PROMs的研发过程是恰当选择测评工具的关键。为确保PROMs的可靠性、有效性和良好的响应性，严格遵循研发步骤非常必要。1990—2000年前后，关于PROMs研发的国际论坛极其活跃，2002年欧洲医疗结局科学咨询委员会制定了PROMs评价规范[13],指出PROMs的开发应包含3个必要步骤：第一步，基于文献回顾、目标患者深度访谈和专家意见初步形成条目池，然后通过预试验遴选并确定问卷条目；第二步，将第一步形成的问卷用于较大样本检验，并将最能反映结果的问题保留为精简版PROMs，然后基于现代标准心理测量工具反复检验，从而选择最佳条目，进而形成测试版问卷；第三步，进行心理学评价研究，即将测试版问卷进行大规模、多中心检验，确定其可接受度、信度、效度和响应性。

PROMs的临床价值在于其是否能够回答医患所关心的所有重要临床问题，而PROMs的科学性指标包含信度、效度及响应性[14]。其中，信度是PROMs的重要属性，即在一段时间内的不同场合反复测定可获得相对恒定和可重复的结果；效度是指PROM在测评目标问题时的有效性；响应性指PROMs检测变化时的灵敏度。

3 如何使用PROMs数据开展临床研究工作

PROMs可用于多种类型临床研究。就研究方法而言，可以基于PROMs设计高证据级别的随机对照研究，也可以用来进行证据级别稍低的横断面研究[14- 15]。就研究内容而言，可用于比较不同手术方式与生存率的相关性研究，也可用于不同手术并发症危险性的比较研究[16]。而以患者满意为重要指标的整形外科手术或医疗美容干预则可通过PROMS获取有价值的研究参数[17]。另外，可借助PROMs收集特定人群关于某种整形医疗措施的偏爱数据，用于在临床工作中为患者提供相对准确的信息，有利于医生和患者进行安全的决策[18]。使用PROMS进行循证时要注意针对不同特定人群选择正确问卷体系，而对于所得数据临床意义的解读应基于对测评工具的充分理解和测评过程的严谨把控[19- 20]。

4 整形外科PROMs清单

整形外科急需严谨的PROMs,但研发工作显然需由包含心理学家、社会学家等在内的多方研究人员共同完成。目前从https://qportfolio.org/网页可以较为方便地获取与整形外科相关的PROMs清单,包括ACNE-Q、BODY-Q、BREAST-Q、LIMB-Q、CLEFT-Q、EAR-Q、FACE-Q、GENDER-Q、HAND-Q、LYMPH-Q、NAIL-Q、SCAR-Q、WOUND-Q，其中除GENDER-Q、LIMB-Q、NAIL-Q仍在开发中外，其他问卷均对非营利机构免费开放，其中大部分已被翻译成包括中文在内的多种语言。此类PROMs的制订过程严格遵循PROMs的3个步骤，并在全世界进行了多中心大样本检测，且明确交代了每个PROMs适用的研究类型。以使用较多的BREAST-Q为例，其包含了适用于隆乳手术、乳腺癌手术(乳房切除、保乳手术、乳房重建手术)与巨乳缩小术的独立问卷体系。每个问卷体系的概念性框架包含生活质量和患者感受两个方面。例如，针对隆乳手术的BREAST-Q,包含9个独立的评分表格，用于测评患者对于治疗结果和治疗过程的评价。关于心理健康，主要针对体像关注和社交自信设置问题；关于躯体健康，则针对疼痛、紧绷感、运动能力设置问题；关于性健康，主要针对性吸引、性自信与性体验设置问题；关于乳房外形设置的条目包括乳房大小、罩杯是否舒适以及触感等；另外还有关于医疗过程中照护体验的问题。当然这套测评工具也仅是一个致力于这项工作的团队提供的一种较为系统的评价工具，而非PROMs的金标准，随着行业的发展，PROMs也一定会被赋予新的内容。

5 小结与思考

整形外科新技术、新材料的快速涌现，带给患者关于自身体貌美化更多美好想象的同时，也必然增加选择与决策的难度。一些新的干预措施不仅对于患者是陌生的，医生也缺乏充分的直观经验，甚至无法获取充足且可靠的间接研究资料。冲动决定不仅可能会给患者带来灾难性的后果，也会给医生造成严峻的职业挫折。凡此种种，要求全行业高度重视基于循证医学的研究证据。患者的满意度和生存质量是整形外科最关键的结局指标之一，因此PROMs必然成为整形外科临床研究的重要工具。然而，迄今为止，我国整形外科领域尚未开展任何系统的PROMs研发工作，或对经过检验的其他语种的PROMs进行本土转化研究。而PROMs的三要素——信度、效度和响应性均与文化和语言高度关联，因此直接采用欧美已经开发完成的PROMs在我国进行临床研究与常态数据收集工作，显然是不妥当的。我国整形外科医生有必要牵头发起协同心理学家、经济学家、循证医学专家等相关专业人员共同参与的多元团队，开发适合我国文化环境、语言特征、经济状态的患者报告结局测评体系，以丰富临床研究的循证医学手段，获取有价值的临床决策依据，促进行业稳步发展，最终造福患者。

利益冲突：作者声明不存在利益冲突