应用RE-AIM矩阵评价糖尿病自我管理支持干预措施

2018-11-27RussellGlasgowPhDCandaceNelsonMALisaStryckerMADianeKingMSOTR

健康教育与健康促进 2018年5期

Russell E.Glasgow, PhD, Candace C. Nelson, MA, Lisa A. Strycker,MA, Diane K. King, MS, OTR

Russell E.Glasgow, PhD, Candace C. Nelson, MA, Lisa A. Strycker,MA, Diane K. King, MS, OTR

Kaiser Permanente Colorado, Clinical Research Unit （Glasgow, Nelson, King), Denver, Colorado; and Oregon Research Institute (Strycker), Eugene, Oregon

：目前的医疗保健证据依赖于相对较窄的疗效数据来决定项目的影响。本文阐述了来自更广视角以及决策者比较关注的如覆盖度、适合度、成本这些重要问题的RE-AIM（覆盖度，有效度，适合度，执行度和维持度）框架影响指数的应用。

：RE-AIM综合指数汇总了个体水平和场所水平的影响和成本效率，用来比较两种不同的糖尿病自我管理支持方法。其中一项是糖尿病优先级（DP）研究项目，886名糖尿病患者来自30个初级保健机构，由通常的临床工作人员开展实施。另一项研究为糖尿病健康联系（DHC）项目，335名糖尿病患者来自HMO和有偿服务机构，由健康教育人员开展实施。

：DP项目在场所水平影响指数上效果更好，但是两个项目在对个体水平影响方面结果类似。DP项目的覆盖度更广（50% vs 38%），在初始访视时更有效[中位数效应大小（ES）：0.23 vs0.17]，并且对不同人群的影响更为一致。DHC项目在一些其他指标上效果更好，包括医生办公室使用率（20% vs 6%）和员工使用率（79% vs 70%）均较高，并且干预人员在协议实施方面的可变性较小（ES：0.0 vs 0.50）。

：更多地运用侧重于公共卫生和外部有效性标准的指标，可以帮助确定最有可能对人群健康产生重大影响并适合当地环境和重点的项目。

引言

在未来几十年里，慢性病患病率预计将会上升[1-4]，而这些疾病推荐的照护与实际情况之间存在明显差距，这表明需要对疾病进行更有效的管理[4-5]。一些研究发现，自我管理支持和以患者为中心的照护是最不可能持续提供照护的领域[4,6-8]。两者都包括理解患者观点，设定协作目标，以及为患者量身定做干预措施。除了这些挑战之外，与中产阶级的白人相比，少数族群和服务供给不足的患者所接受的照护和健康结果都存在差异[9-12]。遗憾的是，大多数初级照护实施者并没有经过良好的培训，无法应对这些慢性病自我管理或行为咨询方面的挑战[12-16]，很少有足够的资源或时间[5,17]优先考虑这些问题。

由于卫生保健资源有限，社会必须对其合理分配以产生最大效益[1,18]。卫生保健资金要发挥最大价值，部分取决于成本效益和相关的经济指标[18-19]。如果存在可接受的疾病管理的公共卫生结果，而不是每种疾病的单独结果，那么将更能促进卫生保健价值最大化。简单地估计健康结局中的单位成本变化，甚至是生命质量调整年，比较局限，尤其是当结果并不是为了反映社会影响而设定的（www.ihi.org）。

许多临床医生和决策者发现，循证医学建议和指导方针与他们要做出决定的相关性是有限的[20-23]。Tunis等[23]呼吁开展和上报更实际的临床试验。这种方式意味着要在多个有代表性的环境中开展研究，包括不同的患者、比较替代性干预措施以及采取多种与临床医生、消费者群体和决策者相关的措施。当前，行为医学学会循证行为医学委员会成员鼓励类似“实用性行为试验”[24]，后者包含的结果更全面、相关性更高。

构建RE-AIM（覆盖度，有效度，适合度，执行度和维持度）框架的目的是将这些研究和应运而生的其他研究转化成实践问题[25-26]（www.re-aim.org）。该模型强调了下述不同维度的综合效果：覆盖度，有效度（包括对生活质量的影响和潜在的负面结果），适合度（如有代表性的场景和临床医生），不同工作人员的执行的一致性，以及在患者和场所水平上的可持续性。最近一篇论文提出了计算反映人群影响的RE-AIM综合指数[27]。这些综合指数结合了RE-AIM维度，还包括有关患者、环境、临床医师亚组和成本这些结果的稳健性或一致性信息。这些新的综合指数目的是提供标准的公共卫生影响指标，以指导决策者和服务机构“在公平的竞争环境中”评估可选择的方案[27]。

迄今为止，这些RE-AIM综合指数尚未被应用于实际的干预措施，主要是因为大多数已发表的研究未提供关于采用和覆盖范围等因素的必要数据。两种糖尿病自我管理支持方法的个体研究结果和以糖尿病为重点的结果已分别发表在单独的报告中[28-30]。本文的目的旨在运用各种RE-AIM综合指数对这些项目进行比较。

方法

项目和参与人员

由美国国立卫生研究院资助的糖尿病优先研究（DP）和糖尿病健康联系研究（DHC）均是随机对照试验，以测试计算机辅助健康行为改变项目的影响。与一般健康风险评估项目相比，这两项研究均包含了改善2型糖尿病自我管理的行动计划。两项研究使用了相同的比较条件，包括计算机辅助管理和对一般健康风险的反馈（例如，关于戒烟、癌症筛查的建议）。这两个项目在几个关键方法上存在差异，包括干预内容和计算机程序以及服务提供的场地和方式，但所收集的措施是类似的。两者均得到相关机构审查委员会的批准，并分别于2001—2003年（DP）和2003—2005年（DHC）收集数据。

DP关注的重点较为广泛，包括提高医生对国家质量保证委员会/美国糖尿病协会糖尿病照护绩效标准的依从性[31]，以及帮助患者制定计划与目标来改善饮食习惯、身体活动或吸烟行为。该研究在科罗拉多州初级保健服务组的30个混合付款患者中进行，他们随机接受DP项目或健康风险评估项目，并由常规诊所的工作人员开展实施[28]。52名医生和886名患者参与了为期12个月的活动。

该干预措施与常规糖尿病访视同步进行，需要使用20~30 min的交互式计算机程序，评估患者对推荐的糖尿病护理程序的接受情况，以及其饮食模式，身体活动和烟草使用情况。计算机程序帮助患者设定自我管理目标，选择活动方式，明确障碍和策略，制定行动计划，并且患者可以将该计划打印出来带回家中[28]。参与的医生需要在随访期间审查并认可患者的该行动计划。然后，一名诊所工作人员，通常是护士或医生助理，与患者简要地讨论行动计划，并安排两次访问之间的电话访谈，以及接下来6个月和12个月之后的访谈。

尽管DHC研究更集中，并且专注于改变生活方式，但还是使用了交互式CD-ROM技术来促进行为改变[29]。该研究共有335名2型糖尿病成年患者和42名初级保健医生参加，均来自混合付款类型的组织和HMO组织。在首次就诊前，患者被随机分配到两组，接受干预或健康风险评估项目。DHC干预仅侧重于改善饮食和身体活动行为，大约需要30~45min完成，提供了比交互式DP CD-ROM更深入的评估、反馈和行动计划，在更短的时间内涵盖了更广泛的糖尿病管理问题。

由于DHC研究访视与初级保健访视分开进行，并且由研究人员担任“健康管理员”提供帮助，因此并不注重提问的简洁性。访视时间2~3 h不等，内容包括详细的评估、CD-ROM的完成情况、行动计划的讨论和定制以及技能培养活动（例如，使用Thera-bands®估算食物份量和力量训练）。DHC的参与者被跟踪了18个月，第一次就诊时设定了饮食和运动目标，然后在2个月后的第二次预约会面时进行了修订。健康管理员提供电话访视和邮寄通讯。DHC参与者的医生提供了一份患者行动计划传真或者行动计划的医疗记录扫描件，对医生或临床工作人员的时间没有相关研究要求。

这两项研究都将所有参与活动的2型糖尿病患者视为其分母，不包括仅接受透析或辅助生活护理设施的患者。表1总结了两项研究中参与者和医生的人口统计学特征。尽管这些样本之间的差异具有统计学意义，但总体来讲，两者均代表了科罗拉多州成年糖尿病人群，且均通过行为风险因素监测调查（BRFSS）的评估[28-29]。

措施

使用先前验证的量表创建综合分数以反映脂肪摄入量、身体活动和生活质量结果。这两项研究均是采用通用的13 条目的Block Fat Screeners[32]来衡量脂肪摄入量（约g/d）。询问调查对象消耗每种高脂肪食物（例如，汉堡包，奶酪，甜甜圈）的频率，以1~5来代表从每月一次或更少到一周五次或更多次。对各个项目的回答进行求和，以估算总体膳食脂肪摄入量。研究使用BRFSS（www.cdc.gov/brfss）项目来测量自我报告中的中度和剧烈身体活动的强度。研究人员列举了“剧烈运动”和“中度运动”的例子，并询问参与者“在过去7天里，有多少天有20分钟及以上的剧烈运动”和“有多少天有30分钟及以上的中度运动”。将剧烈和中等身体活动的天数相加得出总的运动量。研究通过17项内容的糖尿病抑郁量表来对生活质量进行评估[33]。示例项目包括“我觉得糖尿病每天占据了我太多的脑力和体力”和“当我想到糖尿病时，我感到愤怒、恐惧或沮丧。”对分数求平均数后再乘以17，得出生活质量。

表1 病人、医生、临床特征：DP/DHC

RE-AIM指数

计算了四个基本的RE-AIM指数，以便将研究结果与以前发表文献的结果相一致[34-35]。这些指标（分析部分详细说明）包括以下内容：

覆盖度，定义为患者参与率和参与者的代表性）；

有效度，定义为干预治疗后的效应平均值，又称效应值（ES），即减去基线平均值，除以行为变化的共同标准偏差，以及两项研究中共同的生活质量指标；

适合度，同意参加的初级保健服务组织和临床医生的参与率和代表性；

执行度，各工作人员和干预部门实施干预措施的一致性）。

DHC研究尚未提供维持度的结果，因此无法包含此元素。

表2列出了本文中使用的RE-AIM综合指数29[29]的计算公式。个体层面的影响指数结合了覆盖度和有效度，每个指数都有多个指标，以产生患者层面的整体指数。覆盖度将参与率与参与者代表性的度量相结合（参与者与非参与者之间在人口统计学特征上对比的中位数ES）。见表1。有效度指数结合ES测量饮食脂肪摄入量，体力活动和生活质量的指标，然后通过减去患者亚组结果中“差异”的中位数ES来降低这种效应。见表2。

场所水平的复合指数结合了RE-AIM领域中的两个维度：适合度和执行度。通过分析参与与未参与场所之间差异的中位数ES来设定参与率，再计算适合度。见表1。在临床医生水平进行了一系列平行的适合度分析。通过从所有员工和干预元素的中位执行率中减去员工差异实施的中位数ES来计算执行度的情况。见表2。

上述两个复合指数本身并不完整。第三个指数包括成本和经济因素，以衡量这些结果获得的效率。第四个指标对4个RE-AIM维度进行评分，并将得到的分数转换为0到100来进行解释。

分析

统计分析包括统计描述和参数检验（如方差分析）或非参数检验（如卡方）对两项研究结果进行比较。为了简化计算，ES预计不包括医生内部存在患者的嵌套效应，但是行为改变测量的组内相关性接近于零且在两研究间相等。由于综合指数测量是在每个条件=1的研究水平上计算的，因此没有进行正式的统计检验。相反，与成本效益指标一样，这些指标被用来理解两个项目的相对优势和局限性。2005年使用SPSS 11.0（SPSS Inc.，Chicago, 2003）进行了统计分析。

结果

RE-AIM基本维度

图1总结了两个项目在RE-AIM的4个基本维度（覆盖度、有效度、适合度和执行度）上的结果。卡方分析结果显示，DP项目显著提高了患者的参与率（<0.01）和身体活动的有效性（<0.01），但膳食（=0.374）或生活质量（=0.216）没有改善。相比之下，DHC项目中医生的适合度显著提高（= 0.03），但对于这些环境中的工作人员则不然（= 0.62）。这两个项目的执行率都非常高，但DHC的完成咨询率（<0.001）和第一次电话访视（<0.01）的比率要高得多。见表2。

表2 RE-AIM综合指数和各部分得分

注:除了开始的“差异效应值”外，所有措施的分数越高越好。而开始的“差异效应值”这些指标，则分数越低越好。效益是指在关键的复合效应测量上产生一个完全标准偏差的增量成本

图1 DP与DHC对个体RE-AIM维度的影响

综合指数

如表2所示，这两个项目在个人层面的综合影响的得分几乎相同，但原因各不相同。DP项目在患者参与率和行为改变的中位数ES方面得分较高，对有效措施的差异影响较小。相反，DHC干预具有更高的生活质量改善ES，以抵消上述差异。

就吸引力方面而言，两个项目不同参与ES的影响都很低，这表明他们对不同亚组的成员有相似的吸引力。

场所水平的综合影响得分揭示了不同的结果模式，说明了公共卫生影响的复杂性。在这个指标上，DP项目明显优于DHC项目。检查得分的组成情况可发现，这主要是由于DHC项目在场所适合度方面与差异特征的变化较大。DHC项目中这项得分的影响，超过了和DP项目比较高的实施一致性和医生适合率的影响。

DHC项目的成本高于DP项目（每个参与者分别为547美元和222美元）。成本上的差异是由于较长的干预活动，需要一名健康教育工作者参加扩展的计算机辅助活动，并规划个人身体活动抵抗训练部分。这些成本估算包括招募患者和使用原始研究中的人员配置模式进行干预的费用。这两个项目都采用了2005年的工资标准，附加福利和管理费用都包含在36%中，提供了相对全面的治疗费用估算。项目边际成本从处理成本中减去控制条件的成本。由于这两个项目的个体水平影响几乎相同，因此DP计划的效率得分更高，因为其增加的成本较低。见表2。

最后，在平均指数上，DP和DHC项目相差不大。DP项目对患者的参与率和ES结果的优势被DHC项目中更高的医生采用率和实施分数所抵消。

讨论

新的RE-AIM综合指数的应用揭示了两个项目之间的几个不同之处，特别是关于结果的不同亚组结果，患者和医生的参与以及实施情况。这种类型的信息很少有报道，也很少被用于项目的比较[34]。最令人感兴趣的是两个项目在覆盖度和效应值上的主要结果与场所适合率和实施一致性的“逆转”。这说明了该领域的一个重要问题，以及关于疾病管理和健康促进项目决策的复杂性。从传统观点来看，专注于患者个体的DP方案似乎更有优势，因为更多的患者愿意参与与他们的初级保健访视相结合的项目，而不是单独进行冗长的健康教育访问。这一发现既直观又重要，也是支持初级保健机构干预的最常见原因之一[22-23]。更令人惊讶的是，对于收集的常见行为改变措施，DP项目中的患者改善情况程度不比密集的DHC中的患者小（表2）。这一发现与通常关于生活方式、肥胖、戒烟评估的结论不一致[35-38]，通常认为，更多的强化干预会产生更大的行为改变。

以RE-AIM变量评价场所水平的影响结果文献报道不多[34]，本次研究显示出不同且更复杂的情况，这对公共卫生决策者具有启示意义。可以理解的是，与DHC相比，很少有初级保健医生愿意在他们的诊所服务中加入糖尿病自我管理支持（DP）。许多大型组织正在转向集中行为改变咨询计划[39-40]和“外包”疾病管理服务的一个原因，就是这些服务不会去干扰初级保健诊所工作人员或强制他们去实施[38]。各项目场所水平因素的另一个难以预测的变量，即DHC项目中场所水平中的采用率有更大的变异性。这可能是因为DHC研究同时包括HMO和按服务付费的诊所，并且更大的HMO更有可能参与（可能是因为该研究得到了HMO领导层的支持）。相比之下，DHC雇用的集中式健康教育人员实施干预方案的可变性要小于DP项目中繁忙的初级保健人员，糖尿病自我管理项目只是后者工作的一小部分。

那么，究竟作出决策的最基本依据什么？遗憾的是，没有一个简单的答案。未来关于长期后续结果的信息可能会使一个项目的选择更加明确。在某种程度上，应根据一个组织最重视的结果来选择项目。覆盖最大比例的患者，机构可能会选择DP项目。相比之下，最关心项目质量和实施一致性的决策者可能会选择DHC项目。有明确与一个或多个RE-AIM要素相关的组织任务的哪场所可以给予哪些要素更大的权重（例如，广泛覆盖，亚组间最小差异）。目前的指数隐含地假设这些不同组成部分的权重相等，因为在整体公共卫生和基于人口的影响方面，所有这些都很重要。

这是第一篇将新的RE-AIM指标与实际数据相结合发表的文章，并且含有从指标本身获得的经验。首先，为了实现报告的透明化，将汇总指数与可视化表达结合（如图1所示）、与详细信息结合（如表2）、可以帮助实现报告透明化[41]。只提出综合措施而不提出组成部分分数可能会造成误导，并可能掩盖差异；在没有汇总措施的情况下提出一系列的组成措施可能会令人困惑。一些RE-AIM指标有可能小于零，并且在本研究的结果也确实如此，这加大了解释的难度。在形成组成指数时，产生了一些价值判断。例如，项目在不同患者亚组之间影响的稳定性与总体影响的大小同样重要，特别是考虑到健康差异的数据[10-12]。未来的研究可能会尝试使用不同的公式来组合个体和场所水平的信息，尽管在本次研究中发现，大多数用于组合数据的显见操作（例如，加法或乘法）也会产生负数。

本研究的局限性包括这两个项目都涉及糖尿病，并由相同的研究团队使用相似的患者来进行定义和共同控制条件。在不同的条件下，在运用更多不同方法的项目中，使用RE-AIM综合指数将对这些措施的有效性提出了更严格的测试。

总之，需要更多的研究报告给临床医生和决策者提供相关的信息[20,23]。使用综合测量指数（如这些RE-AIM指标）以及图表（如图1）等数据，是汇总此类复杂数据的一种方法。使用这些指数并不一定能使决策变得更容易，但确实使许多问题更加明确（如覆盖度，适合度和执行度，以及差异效应），包括在传统结果里通常被忽视或掩盖的健康公平性。

本文原文及参考文献请浏览：

https://www.ajpmonline.org/article/S0749-3797（05)00333-8/pdf

译自Am J Prev Med, 2006, 30(1):67-73

翻译：宋允雪（上海市普陀区疾病预防控制中心）

审校：傅华（复旦大学健康传播研究所）

10.16117/j.cnki.31-1974/r.201805008