APP下载

分析性临床医学研究:病例对照研究的设计要点

2023-12-11王瑞平肇晖李斌

上海医药 2023年21期
关键词:样本量队列关联

王瑞平 肇晖 李斌

(1. 上海市皮肤病医院临床研究与创新转化中心 上海 200443;2. 上海医药行业协会 上海 200003)

病例对照研究(case-control study)是分析性流行病学最基本、最重要的一种研究类型。病例对照研究本质上属于观察法,研究者不能根据自己的设想对研究进行处理或干预,通常以现有确诊患有某种疾病的患者作为病例,以未患有该种疾病但具有可比性的个体作为对照,通过询问、实验室检测、环境因素暴露测量等方式收集既往各种可能的危险因素暴露史,测量比较病例组和对照组中各因素的暴露比例差异,如经统计学检验差异有统计学意义,则可以认为暴露因素与疾病之间存在统计学关联。在评估各种偏倚对研究结果的影响后,借助病因推断技术,综合判定某个或某些暴露因素是否为危险因素,达到探索或检验疾病病因假设的目的(图1)。

1 病例对照研究衍生类型

巢式病例对照组研究(nested case control study):指在已建立的人群队列基础上,将随访期间确诊的病例作为病例组,同时在未患病的队列人群中随机抽取可比的人群作为对照组,通过比较病例组和对照组某个或某些危险因素的暴露情况,评估暴露与疾病之间的关联。巢式病例对照研究是将经典的病例对照研究和队列研究相结合而形成的一种研究方法,一般适用于有复杂实验室检测,生物标本前期已完成采集和保存,后期详细调查内容在研究期间保存不变的情况。

病例队列研究(case cohort study):又称为病例参比式研究,也是一种将病例对照研究和队列研究相结合的研究类型。其设计方法是在队列研究开始之前,在所有的队列人群中按照一定比例随机抽取一个有代表性的样本作为对照组,观察结束时将队列中出现的所研究疾病的全部病例作为病例组,进而比较病例组和对照组某个或某些危险因素的暴露情况,评估暴露与疾病之间的关联。相比于巢式病例对照组研究,病例队列研究在暴露和疾病关联评估方面更具优势,可以直接计算相对危险度(relative risk, RR)。

病例交叉研究(case crossover study):主要用于研究某些短暂暴露与随后发生的急性事件之间的可能关联。其设计的基本思路是,比较相同研究对象在急性事件发生前一段时间的暴露情况与未发生事件的某段时间内的暴露情况。如果暴露与急性事件有关,那么研究对照在2 个时间段内的暴露频率一定存在差异。病例交叉研究应用有2 个重要的条件:一是整个研究周期中暴露因素必须是变化的;二是暴露和效应之间的诱导时间和效应期都很短。例如,分析过强的体力活动与急性心肌梗死之间的关系研究,就可以采用病例交叉研究设计。

病例病例研究(case case study):又称为单纯病例研究或病例系列研究,常用于同一疾病不同亚型或同一疾病不同遗传表型与暴露因素之间的关联分析。在分子流行病学研究中,由于从健康人群中采集生物学标本可能受到伦理学方面的制约,而病例病例研究则可以免除这种制约,同时减少样本量,节约研究经费,因此逐渐得到了研究者们的认可和重视。

2 病例对照研究样本量计算

病例对照研究设计包括2 种类型:病例对照匹配和病例对照不匹配。病例对照匹配要求在选择对照时,要求对照组对象的某些特征或因素与病例保持一致,如将“性别”“年龄”进行匹配,目的是排除匹配因素对研究结果的干扰和影响,可采取个体匹配(individual matching)或频数匹配(frequency matching)方案。在匹配时要注意,匹配因素应该为已知的混杂因素,同时注意匹配过头(over matching)问题[1]。病例对照不匹配是指在选择病例和对照时,不添加任何限制和规定,分别抽取一定量的研究对象组成病例组和对照组的研究类型。

1 ∶1 匹配的病例对照研究中,样本量计算与暴露因素在对照组和病例组人群的暴露率有关,也与暴露和疾病的关联强度(odds ratio, OR)有关,其样本量计算公式为:

其中,M 是总对子数,α为Ⅰ类误差,β为Ⅱ类误差,OR 为关联强度(RR 可替代),p0和p1分别代表目标人群对照组和暴露组的估计暴露值,q1=(1-p1),q0=(1-p0),p1=p0OR/[1+p0(OR-1)]。

例如,一项关于女性使用月经棉和阴道癌关系的病例对照研究中,采用1∶1匹配设计,设α=0.05,β=0.10,对照组暴露比例p0=0.30,估计OR =2.0,则p1=0.46,代入上述公式计算得M =186,即分别需要纳入186 例病例样本和186 例对照样本。

非匹配病例组和对照组人数相等时,病例对照研究的样本量计算与暴露因素在对照组和病例组人群的暴露率有关,也与暴露和疾病的OR 有关,其样本量计算公式为:

上述样本量计算公式中,α为Ⅰ类误差,β为Ⅱ类误差,p0和p1分别代表目标人群对照组和暴露组的估计暴露值,p1=p0OR/[1+p0(OR-1)],OR 为关联强度,可用RR 替代。

又如,拟开展一项病例对照研究,探讨吸烟与肺癌的关系。既往研究显示,一般人群吸烟率p0=0.30,预期吸烟者的相对危险度RR =2.0,设α=0.05,β=0.10,根据p1=p0OR/[1+p0(OR-1)],计算p1=0.46,代入上述样本量计算公式计算后得n=193,即分别需要纳入193 例病例样本和193 例对照样本。

3 病例对照研究的设计与实施要点

1)病例对照研究设计原则 与常规的临床研究设计原则一样,病例对照研究设计也须遵从PICO 原则,即明确研究人群(population, P)、确定暴露因素(intervention,I)、指定对照组(control/comparison, C)和结局变量(outcome, O)。

2)提出假设和明确研究目的 根据疾病分布研究或现况调查结果,结合文献复习,提出病因假设。然后基于病因假设,选择合适的病例对照研究方法,明确研究目标。

3)制定研究计划 在确定研究目的后,需制定详细的研究计划。明确病例和对照的来源和选择方法,确定病例的诊断标准和方法;根据设定的参数和文献计算样本量;根据提出的病因假设和项目团队所具备的条件,确定暴露变量和调查因素;设计纸质调查问卷和数据采集电子数据库;制定研究计划时要全方位考虑整个研究过程中可能出现的偏倚,故应设计好控制偏倚的方案;考虑获取研究因素信息的方法及数据整理和分析方法;制定项目预算,做好人员分工和工作内容,并配套制定严格、可行、针对各个环节的质控措施[2]。

4)确定病例和对照来源 病例和对照的来源包括以医院现患病者、门诊病案等为基础的人群和以社区居民、社区监测资料或普查抽样调查为基础的人群。在选择病例时,应采用国际通用或国内统一的诊断标准;病例选择以社区病例为主考虑代表性,避免特殊暴露人群;同时优先选择新发病例。对照的选择应遵循原则是,对照应来源于产生病例的源人群,最好是全人群的一个无偏样本,或是产生病例的人群中全体非罹患该疾病群体的一个随机样本,可以是医院为基础的人群,也可以是邻居、同胞、配偶等。因此,对照的选择应当来自产生病例的人群,在选择对照组时除了应具有和病例一致的某些特征而与病例有可比性之外,同时还须注意对照组人群应不罹患与所研究疾病有共同已知病因的疾病[1]。例如,研究吸烟与肺癌关系时,不能选择慢性支气管炎病人为对照,因为吸烟同时是2 种疾病的可能病因。

5)估算研究的样本量 根据研究目的,参考既往研究中暴露因素与结局变量的关联强度(RR 或OR),暴露因素在患病人群和对照人群中的暴露率,Ⅰ类错误α和Ⅱ类错误β;同时结合研究的设计类型为匹配设计还是非匹配设计,以及病例组和对照组样本量的比例,选择适当的样本量计算公式开展病例对照研究样本量估算。

6)明确变量类型和资料采集方法 对研究中涉及的所有变量,要给出明确的定义,如吸烟、饮酒等以便调查员采集数据时统一标准,同时在信息采集时尽可能全面细致深入。资料采集的方法与现况研究一样,主要方式包括通过测量或检查的方法获取、问卷调查和信息系统摘录等3 种类型。须强调的是,无论采取什么方法采集数据,都要实行质量控制,降低研究中可能带来的选择性偏倚、信息偏倚和混杂偏倚。

7)制定统计分析计划并开展数据分析 根据病例对照研究类型和采集的变量,制定数据分析计划。首先对采集的研究数据进行核查、修正、补充等数据治理工作,然后开展统计描述和统计学推断。统计学描述对研究对象的一般人口学特征、主要暴露信息和协变量信息进行描述分析;统计学推断主要采用卡方检验(计算OR 值和95%置信区间等)、趋势卡方检验、logistic 回归分析等分析暴露因素的效应估计与因果关联分析。

8)常见偏倚类别和控制 病例对照研究属回顾性观察性研究,研究过程易出现各类偏倚,包括选择性偏倚、信息偏倚和混杂偏倚。选择性偏倚主要是因为入选的研究对象与未入选的研究对象在某些特征上存在差异而引起的系统误差,包括入院率偏倚(伯克森偏倚)、现患病例新发病例偏倚、检出征候偏倚、时间效应偏倚等。信息偏倚是在数据采集过程中产生的系统误差,包括回忆偏倚、报告偏倚、测量偏倚等。混杂偏倚是指由于混杂因素存在导致的暴露与结局变量关联偏离真实情况的一种系统误差。对于常见偏倚的控制,应重点做好以下几个方面:①严格落实研究方案,确保对照组选择的随机化原则完全实施;②做好宣传沟通工作,提高研究对象的依从性和应答率;③正确选择测量工具和检测方法,并进行统一校对;④做好组织工作,进行统一培训;⑤做好研究过程中资料的复查和复核,提高数据质量;⑥选择正确的统计分析方法,注意辨析混杂因素及其影响。

4 病例对照研究的应用

病例对照研究属于观察法,分析流行病学范畴,相比于现况研究,对暴露和疾病因果关系可以进行初步验证。病例对照研究的主要用途包括:①用于探索或验证病因和流行因素,通过病例对照研究设计,初步探讨疾病与某个/某些暴露之间的因果关系,同时也可以分析某些疾病的流行因素,如食物中毒突发事件的现场调查,常常会用到病例对照设计;②用于评估预防和治疗措施效果及其不良反应,对于既往实施的一些干预措施,可采用病例对照研究进行疗效评估,同时对某些疾病药物治疗后的不良反应也能够进行评估;③用于国内或国际项目开展效果的评价,对于开展的研究项目,通常可以采用病例对照设计对项目的实施效果进行评价。

猜你喜欢

样本量队列关联
医学研究中样本量的选择
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
队列里的小秘密
基于多队列切换的SDN拥塞控制*
“一带一路”递进,关联民生更紧
在队列里
航空装备测试性试验样本量确定方法
奇趣搭配
Sample Size Calculations for Comparing Groups with Binary Outcomes
丰田加速驶入自动驾驶队列