混合方法系统评价对复杂问题循证决策的价值及实施方法

2023-12-10肖炳屹郑州大学第一附属医院

管理学家 2023年21期

肖炳屹郑州大学第一附属医院

对定性和定量证据的系统回顾可以丰富对复杂现象的理解。这种类型的审查越来越受欢迎，已经被用来探索知识，并解决通常无法仅仅依靠定量或定性证据的审查类型的问题。在复杂的社会问题领域，使用混合方法的系统评价的数量正在增加。这种方法在设计复杂性问题的询证决策方面体现出其全面而详细的特点，越来越多的专家学者希望通过混合方法的系统评价得到解决某个社会问题的相关知识。

一、社会干预中的复杂性

在评估许多干预措施，例如临床筛查、公共卫生、精神卫生、慢性疾病管理、卫生服务提供、服务组织、系统、社会护理和政策层面干预措施等的效果时，考虑复杂性在决策的各个阶段都是非常重要的。大多数社会政策问题，包括公共卫生、社会服务提供和社会护理，都不是简单直接的。因为它们涉及许多相互作用的利益相关者、更广泛的社会群体和复杂的社会背景。政策体系内部的微小变化可能引发一系列反应，甚至产生不利影响。

尽管总是用于总结复杂干预措施的特征，但“复杂性”并不只是一个描述符，而是值得考虑的实践中的各种影响。在评估复杂的社会干预措施时，复杂性问题可以分为几个维度，涉及从议程设置到干预实施的各个阶段。为了识别复杂干预，吉斯和他的同事们总结了所有复杂干预所共有的两个共同维度，即干预复杂性和途径复杂性[1]。干预复杂性，即一项干预涉及多个组成部分；而途径复杂性是指该项措施具有复杂的反馈回路、因果途径或中介。

除了这两个方面，复杂干预还可能具有其他三个特征[2]。一是群体复杂性，它是指在一次干预中需要考虑多个目标群体的情况，因为不同目标群体的特征可能会影响最终效果。二是情境复杂性，它强调动态和可变的环境因素及其与干预的相互作用。尽管干预措施的实施因地方系统而不同，但分析背景属性与某些政策结果之间的关系有助于决策者预估类似措施在具有相似关键因素的新环境中的潜在影响。三是实施复杂性。其特点是在实施过程中需要采取许多策略和行为。关于实施复杂性的讨论源于对干预措施的妨碍和促进因素的探索，以及对将干预投入和产出联系起来的因果机制的解释。

理解研究中的复杂性有助于审察使用者探索干预措施与结果之间的关系。复杂性的分类避免了将“复杂性”简略概念化为一个宽泛的粗略术语，然而，这些维度之间的边界可能是微妙的，因为它们可能在这些标准化类别之外相互作用。在众多文献中描述的背景因素也很重要，可以被视为实施的要素，例如组织管理和系统中几个部门之间的合作。复杂性决定了干预与其背景和结果之间的因果关系。为了将研究结果实际应用于政策，在评估干预措施时，要根据特定问题的需要来考虑复杂性的来源，以决定是只以维度为主还是包括这些维度之间的相互作用。

以肥胖问题为例，肥胖是一个常见且有影响力的公共卫生问题。截至2020 年，全球有三分之二的成年人超重，五分之一的儿童有肥胖困扰。在过去的几十年里，各国政府发布了数十项战略来解决肥胖问题，然而，肥胖率并没有成功降低。传统上，肥胖问题被描述为具有简单线性机制的个体问题，大多数肥胖干预措施始终旨在通过改善饮食和加强体育锻炼来改变个人行为。然而，认识到肥胖是一个复杂的政策问题是至关重要的，它与生物、文化、经济等多个因素相互作用，需要在多个层面上采取适当的解决方案。范登布鲁克、古森斯和克莱门斯揭示了所有与肥胖相关的相互作用因素，符合上述复杂问题的特征。

与肥胖相关的因素有许多种，从基因层面的“保存能量的倾向”到更广泛的社会层面的“消费的社会压力”，以及100 多个与体重增加或减少有关的非线性反馈回路，其中大多数因素可以影响多个因果关系。例如，某些街区可步行性的改变可能会影响非机动交通，导致个人身体活动的减少。这种变化也会影响居民的食物暴露，从而导致饮食习惯的改变，进而影响能量的积累。然而，认识到更广泛的背景复杂性至关重要。例如，改变步行环境的城市规划政策被排除在系统之外。此外，尽管没有区分个体层面的行为者，但肥胖问题存在人口复杂性，因为不同年龄的超重群体具有不同的因果途径和不同的风险因素。因此，政策制定者需要了解针对特定人群的干预措施，如儿童和孕妇等。

二、混合方法系统评价的价值

在评价层面，混合方法是一种整合并分析定性、定量和混合证据及方法的方法，同时它可以保证每个研究结果的完整性，以便在一个评价中实现对某一领域的全面理解。在初级研究中，许多广泛或复杂的问题可以用一种以上的方法来研究，所以很多人主张混合方法初级研究。同样，初级研究的逻辑也可以应用于系统评价。混合方法评价通常包含两个或更多的子评审，用于处理整个评审问题的不同方面。

对检索单一方法初级研究的评价（例如Meta 分析及元人类学等系统评价方法）的优缺点的认识，引起了评价学者对定性和定量研究相结合的兴趣。对于侧重于统计证据的评价，它们需要解决缺乏基于上下文的实际解释的局限性问题；而对于那些仅由文本观点组成的研究，评价者无法提供有效的量化估计。例如，英国托马斯博士关于儿童食用水果和蔬菜的研究中，由于定性研究不足以收集量化的可比收益和危害，学者们无法通过访谈或焦点小组得出一种干预措施比另一种更有效的结论。同时，在Meta 分析中，关注某种干预措施有效性的试验显示出巨大的异质性。然而，当分析来自儿童访谈和实证试验的干预措施时，可将从儿童感知中检索到的文本结果与定量研究的效应大小统计数据进行比较。因此，混合方法综合可以提供“双重检查”，能够帮助获得更可信的结果和统计异质性的详细解释。

除了结合定性和定量研究的优势外，混合方法还使研究人员能够回答复杂的问题。干预措施和结果之间的关系包含多种复杂性来源，不同的复杂性相应地需要适当的分析方法。传统的评价方法侧重于通过随机对照试验（RCT）的荟萃分析来解决有效性问题。尽管它体现了评估效应大小的“黄金法则”[3]，但在审查复杂干预措施时，它可能在整合不同类型的证据和产生高度实用的信息方面受到挑战。当对更复杂的干预进行审查时，假设检验不仅困难，甚至可能不可取。这是因为，单纯从“起作用”或“不起作用”的角度来评估复杂的社会干预可能过于简单和具有误导性。相反，在这些情况下的系统回顾可能不应该侧重于做出这样一个总括性的、笼统的陈述，暗示干预在所有情况下都有效，而应该侧重于收集一系列的例子，说明当干预在不同的情况下实施时发生了什么[4]。社会问题的复杂性决定了即使涉及了多个组成部分，单一的系统审查也有可能无法完整地提供人们所需的信息。除非之前有一段时间的概念性和实证性工作，使研究状态达到这样一种审查可能有所帮助的程度。因此，通过整合实践中实施的有效性和背景，混合方法审查可以提供更多与政策相关的信息。

此外，混合方法需要仔细地将研究类型与问题相匹配，并将综合方法与所包含的数据类型相匹配。因此，这种方法加强了我们的系统评价，并通过将干预有效性的证据与人们生活中的定性理解相结合，增加了政策相关性。审查层面的混合方法提供了一个独特的视角，使得研究人员可以通过它来检查社会科学初级研究中的方法问题。

然而，混合方法也遇到了一些挑战。由于混合方法评价涉及统计和概念的证据和方法，其全面性可以揭示出在缺乏资源的情况下，为了进行广泛的评价，对每种分析细节的深度进行权衡的关注。此外，在匹配潜在的经验干预和综合主题时，评价者自己的判断是至关重要的，这可能会引入选择偏差。这就表明，在应用混合方法时，需要更严格的审查设计和指导。

三、混合方法系统评价如何实施

一般来说，研究人员面临着“整合挑战”，即产生大于每个单独部分总和的整体的挑战。在混合方法的系统评价中，仅有定性和定量成分是不够的，它的价值在于将这两种成分混合在一起。通过整合定性和定量研究而不是简单地罗列它们，混合方法审查能比单一方法审查获得更多的政策性信息。费特斯库里和克雷斯韦尔总结出定性和定量研究结果的整合可以通过合成设计和报告结果阶段来实现。

（一）合成设计

混合方法系统评价的合成设计有两种方法，分别是顺序混合方法评价设计和收敛混合方法评价设计。顺序混合方法评价设计包含两个阶段，其中一种类型的证据的数据收集和分析发生在另一种类型的证据收集和分析之后，并由另一种类型的证据收集和分析告知，第二阶段以第一阶段综合的结果为依据。这种设计通常是将一个整体的问题与子问题结合起来，两者的综合是相互补充的。这种类型适用于全面理解某些问题，循序渐进的结构可以使审查清楚，以便审查进行和报告发现。然而，由于第二阶段的分析依赖于定性或定量综合的结果，它仍然有保持单一研究弱点的风险。

收敛混合方法评价设计可以定义为对定性和定量证据的合成和解释逐步、连续和不断细化的过程。研究人员正以非线性的方式工作，以认知表征为指导，以新的基于数据的合成或基于结果的合成或基于创建的结果来进行解释。根据普吕叶和洪的研究[5]，该类型的合成设计还有三个子类别。首先，基于数据的收敛设计被更频繁地使用，可能是因为它更容易执行，特别是用于描述目的。其他综合设计可能更复杂，但可以对特定主题的文献进行更深入和更广泛的分析。其次，基于结果的收敛设计分别合成定量和定性证据，然后在另一种综合中整合和比较结果。这种设计允许审稿人同时收集每种类型的数据，混合成一个连贯的整体，同时保持它们的完整性。然而，它也可能需要广泛的努力和适当的策略来解决定性和定量结果之间的分歧问题。最后，平行结果的收敛合成设计在研究过程的同一阶段，以平行的方式分别收集和分析定量和定性证据。

（二）报告结果

顺序混合方法评价设计在第二阶段的综合中就做到了定性和定量证据的结合。与此不同的是，收敛混合方法评价设计主要在结果部分进行整合。结果的报告可以采用矩阵策略来比较元分析和主题综合的结果[6]。矩阵内并置结果主要用于混合定性和定量研究，因为定性和定量研究结果之间的匹配和不匹配很容易确定。基于结果的认知表征来解释不匹配也可以表明感兴趣现象中的证据差距。

从技术上讲，使用矩阵可以帮助研究人员解释定量合成过程中发现的异质性，并检查感兴趣的干预措施的关键成分。通过使用矩阵来比较和对比一篇综述中不同综述的研究结果，可以将定性和过程评价证据的综合与定量研究的综述结合起来，以评估干预效果。矩阵可以是积分的乘积，也可以作为其他方法的辅助。坎迪和他的同事采用了这种方法，并证明了显著提高艾滋病病毒携带者坚持药物治疗的干预措施比没有发现统计学显著效果的干预措施包含更多被患者认为重要的成分。审查小组还可以使用一个矩阵来说明背景因素如何影响干预措施的实施。

另一个可以用于报告结果的方法是逻辑模型。逻辑模型可以通过“代表干预影响个人、社区和组织变化的潜在过程”来阐明规划理论。逻辑模型可以直观地表示，通常以图表的形式表示干预输入和输出之间的联系。在系统综述中，逻辑模型被推荐为捕捉干预复杂性的工具。使用逻辑模型可以提供一个公共框架来促进合成，在这个框架中，定量和定性的研究过程与评估证据的合成都可以发挥作用。

四、结语

文章分析了循证决策过程中存在的干预复杂性和途径复杂性。通过分析从干预措施投入到结果的不同复杂性来源，决策者可以探索消除由不同因果关系产生的障碍的适当方法。同时，对比现有的单一系统评价，混合方法的系统评价在研究复杂的干预措施或社会问题时能够提供更全面的分析以及针对更多问题的解答，使用此种方法的系统评价对于决策者，尤其是政策的制定者在处理此类问题时有很大的帮助。