APP下载

试验设计中均衡原则的把握与常见错误的辨析

2011-08-15胡良平贾元杰鲍晓蕾军事医学科学院科技部生物医学统计学咨询中心北京100850

药学服务与研究 2011年1期
关键词:病程分组病情

胡良平,贾元杰,鲍晓蕾 (军事医学科学院科技部生物医学统计学咨询中心,北京100850)

在进行一项临床或生物医学科研课题的设计时,一般都会涉及两组或两组以上病人的药物或治疗措施的有效性与安全性的比较或评价问题。如果这些组中的病人在很多非试验因素方面几乎都一致,其区别仅仅在于试验因素的水平不同,如药物的种类不同,或同一种药物的剂量不同,或手术的方式不同,此时,研究结果就具有较高的可信度。在进行科研设计时,科研人员常用的做法是简单地采用完全随机化方法分配受试对象,试图使试验组和对照组中的受试者在一切非试验因素方面都达到均衡一致,但这样做总能如愿以偿吗?本文作者将就此问题开展一些讨论,并介绍有利于提高均衡性的策略与措施,最后列举在均衡性方面常犯的一些错误案例,并对差错进行辨析与释疑。

1 均衡原则的概念及其作用[1]

均衡原则要求同一个试验因素各水平组之间除了所考察的因素取不同水平外,在一切非处理因素方面达到均衡一致。其作用在于使试验因素不同水平组中的受试对象受到非试验因素的影响完全平衡,确保试验因素各水平组间不受其他试验因素或重要的非试验因素的不平衡的干扰和影响,以便使所考察的试验因素取不同水平条件下对观测结果的影响能真实地显露出来。值得注意的是,在小样本的试验研究中,完全随机化分组常常导致组间严重缺乏均衡性。例如,有某疾病病人24例(重症16例,轻症8例),若完全随机地将他们均分成两组,则很有可能某一组中12例病人全是重症病人。若将重症者、轻症者分别随机均分成两组,则每组中重症与轻症病人分别为8例和4例,这样就确保了两组病人在“病情轻重”这个重要非试验因素上是均衡的。

实际操作中,要注意以下两点:(1)科研设计时要考虑采用盲法降低人为因素和心理因素对观测结果的干扰和影响。(2)分组时应尽可能采用分层随机化法,使各组病人在诸多重要非试验因素方面应尽可能一致。比如,病情构成(轻、中、重的比例),病程构成(短、中、长的比例),性别构成,年龄分布,抽烟、饮酒的数量和过度劳累的程度等方面,在试验组与对照组之间应具有很好的可比性。这些可能影响疗效评价的各个方面,在统计学上常被称为重要的非试验因素。在试验分组时对此类因素应考虑周全,妥善处置。具体地说,可按重要非试验因素形成“复合型区组因素”,即对几个重要非试验因素的水平进行全面组合,形成多个小组,每个小组中的受试者在所考察的几个重要非试验因素方面是完全相同的,再将每个小组中的全部受试者完全随机均分入试验组与对照组中去,这种分组方法被称为“分层随机化”(stratified radomization)。下面通过一个实例生动地说明严格遵守均衡原则进行试验设计和具体实施的重要性。

例1 某研究者欲比较兰索拉唑与法莫替丁治疗反流性食管炎(reflux esophagitis,RE)的疗效,选取1999年1月-2000年12月经胃镜检查诊断为RE的病人共46例,男性37例,女性9例,男女之比为4.11∶1。年龄46~86岁,平均年龄67岁,其中60岁以上的老年人共31例,占67.4%。所有病人均排除胃溃疡的可能,治疗前肝、肾功能均正常。内镜检查诊断,其中Ⅰ型病人23例,Ⅱ型病人18例,Ⅲ型病人3例,Ⅳ型病人2例。将46例病人随机分为两组,一组用兰索拉唑,另一组用法莫替丁[2]。

对差错的辨析与释疑 本例中只有一个要考察的试验因素就是药物种类,有两个水平。原作者在进行分组时采用的是完全随机分组方式,这种方式看似符合随机原则,但真正能使两组病人在重要非试验因素方面达到均衡吗?通常,相同的治疗方案对不同病情的治疗效果是不一样的,病情程度轻的病人治疗效果要好于病情程度重的病人。文中写明46例病人中Ⅰ型病人23例,Ⅱ型病人18例,Ⅲ型病人3例,Ⅳ型病人2例。也就是说这46例病人的疾病分型甚至病情轻重程度是不一样的。原作者采用简单随机化分组的方法,很有可能使两组病人的病情轻重分布不一致,如果出现这种情况,试验得到的最终结论不能令人信服。再如年龄因素,它一般也是重要的非试验因素,年轻病人的疗效往往要好于老年病人。原作者并没有说明对年龄的处理,如果随机分组后两组的年龄分布不一致,同样也会导致试验结论不能令人信服。那么,应该怎样才能保证试验是有意义的,结论是可信的呢?首先应确保试验设计是正确的,确保试验设计正确的关键便是严格遵守试验设计的均衡原则。因为随机、对照、重复原则都是从属于均衡原则的。其次,是实施过程中的严格质量控制。因为实施过程中,可变的东西很多,包括环境条件、试验条件、研究者的技术水平和心理作用、受试者的依从性和心理状态等。如果质量控制没有做好,其组间的可比性也会大大下降。

2 提高均衡性的策略

2.1 从人的主观能动性角度考虑 (1)研究者应具有较好的专业知识、统计学知识和很强的责任感,对整个试验研究的各个方面有整体的把握,使其尽可能满足均衡性要求,能够制定出较为理想的试验设计方案;(2)试验设计方案制定出来以后,应该请从事本专业研究的有经验的专家帮助审阅和修改,使其至少在“基本常识和专业知识”方面尽可能趋于完善;(3)应当请对统计学有较深入研究的统计学工作者参与设计方案的制定,至少要请他们帮助审阅和修改设计方案[3]。

2.2 从研究的整个过程角度考虑 (1)制定合理的纳入和排除受试对象的标准;对参与的研究者进行严格的技术培训;(2)对试验条件进行标准化管理(如仪器、试剂的校准;制定出科学的诊断、测定和评价标准);(3)严格按随机(注意按重要非试验因素进行分层随机)、对照(强调设置合理的对照组)、重复(各试验条件下应有足够的样本量,最好用特定的公式估算出来)和均衡原则选取和分配受试对象;(4)对一切重要非试验因素应作合理安排和控制,特别是定量的非试验因素,从试验开始就必须记录其在每个个体身上的具体取值;(5)选取合适的设计类型,安排多个试验因素;(6)注意整个试验过程和数据管理过程中的质量控制;(7)在统计分析时,尽可能利用更多的信息,采取相应的统计方法消除混杂因素(如协方差分析等)对观测结果的影响[4]。

3 对违反均衡原则案例的辨析与释疑

3.1 违反均衡原则的案例 例2 某研究者欲研究参芪扶正注射液联合化疗治疗恶性肿瘤的疗效,选用2002年12月-2004年5月住院治疗的恶性肿瘤病人86例,其中男性46例,女性40例;年龄26~69岁,平均年龄53岁;其中肺癌26例,大肠癌22例,鼻咽癌16例,乳腺癌12例,卵巢癌6例,恶性淋巴瘤4例。将86例病人随机等分成A﹑B两组,分别接受单纯化疗和参芪扶正注射液联合化疗两种方法的治疗,观察相应指标的变化情况。

对差错的辨析与释疑 以这个例子来分析一下哪些地方不符合均衡原则。(1)病情程度 原作者将病人随机分成了两组,每组43例,没有说明是如何分组的,是否符合随机化分组原则,也没有告知每组中43例病人的病情轻重程度如何。原文中写明的肺癌、大肠癌、鼻咽癌、乳腺癌、卵巢癌和恶性淋巴瘤,这6种肿瘤的5年存活率是不一样的,也就是说这几种肿瘤恶化的轻重程度不一样。同一种治疗方式,病情轻的疗效肯定比病情重的疗效好。如果两组病人病情程度的构成不一样,假设一个组病情程度轻的病人所占比重大,另一个组病情程度重的病人所占比重大,即使最后得到两组差异有统计学意义和实际意义,这个结论也是不可信的。(2)病程 病程这个非试验因素对治疗效果一般是有影响的,通常病程越短,治疗效果越好。原作者没有说明病人的病程情况,也没有说明这两组病人的病程分布是否相同。如果分布不同,同样的治疗方式,最后的治疗效果也是不一样的。因此,即使统计学上得出差异有意义的结论,其结论也是不可信的。(3)年龄 原文中受试病人的年龄为26~69岁,年龄跨度大,通常年龄越小治疗效果越好。原作者未说明两组病人的年龄分布是否相同,如果分布不相同,其结论也是不可信的。正确的做法是采取必要的措施保证各组在重要的非试验因素方面(比如年龄、病程、病情等)达到均衡,以使各组之间具有可比性。

3.2 违反随机和均衡原则的案例 例3 某研究者欲研究在对症治疗的基础上加用小剂量干扰素及三氮唑核苷治疗流行性乙型脑炎的疗效,选择某院收治的该病病人172例,均给予对症治疗。在对症治疗的基础上,选择发病在5 d以内的病人(99例),加用小剂量干扰素及三氮唑核苷静滴,发病在5 d以上的病人(73例)仅给予对症治疗,疗程为5~7 d。比较两种方法的疗效差异。

对差错的辨析与释疑 本例中试验因素只有“治疗方法”一个,但从文中看还有一个影响试验最终结果的重要的非试验因素,就是“病程的长短”。即便在相同的治疗措施下,发病时间短的病人治疗效果也会好于发病时间长的病人。原作者在进行分组时,将99例发病在5 d以内的病人分为一组,将73例发病在5 d以上的病人分为一组,病程短的这组在对症治疗的基础上加用小剂量干扰素及三氮唑核苷作为治疗组,病程长的这组仅给予对症治疗作为对照组,这样分组得出的最终结论是不可信的。原作者在最初的试验设计阶段没有很好地遵循试验设计的四个基本原则,违反了其中的随机原则和均衡原则。

正确的做法应该是采用分层随机化的方法,使两组病人在重要的非试验因素方面达到均衡,这样才能使试验因素的效果真实地显露出来。

3.3 违反对照和均衡原则的案例 例4 某作者研究支气管哮喘小鼠肺液清除功能的变化及地塞米松的作用,选取雌性C57/BL6小鼠48只,6~8周龄,体重18~20 g,随机分为对照组、哮喘组和地塞米松干预组。统计分析采用 t检验比较组间差异[5]。

对差错的辨析与释疑 本研究涉及两个实验因素,一个因素是“是否建模”,另一个因素是“是否用药干预”。每个因素均有两个水平,两个因素各水平全面组合,一共应有4(2×2=4)种试验条件。研究者仅在3种实验条件下进行了实验,违反了对照原则,犯了对照不全的错误,也就使整个实验的组间均衡性受到了严重的破坏。正确的做法应在不建模的基础上补做一组用地塞米松干预的实验,这样形成两因素析因设计,可以通过两因素析因设计一元定量资料方差分析得到正确的分析结果和结论。

3.4 违反重复和均衡原则的案例 例5 某研究者研究丁酸氢化可的松软膏对不同种类的皮炎及湿疹的疗效,随机从门诊选择160例皮炎、湿疹病人,男性94例,女性66例;年龄最大72岁,最小1岁,平均年龄(28.53±3.67)岁;病程1~10年不等,平均(18.61±7.86)个月。其中急性湿疹15例、亚急性湿疹35例、慢性湿疹32例、神经性皮炎55例、接触性皮炎5例、虫咬皮炎18例[6]。

对差错的辨析与释疑 原文作者按不同种类的皮炎和湿疹分成6组,考察丁酸氢化可的松软膏对这6种皮炎和湿疹的治疗效果。从文中可以看出这6组的样本例数差异较大,病人最少的组只有5例,最多的组有55例,最多例数组样本量是最少例数组样本量的11倍。这6组间在病人例数方面违反了重复原则和均衡原则。急性湿疹组、接触性皮炎组、虫咬皮炎组病人例数分别只有15例、5例和18例,样本量太小,所产生的治疗效果的结论不是很可靠。正确的做法是增大各组的样本含量,并使各组的样本含量大体一致,这样得出的最终结论才令人信服。另外,病人的年龄、病程也都相差悬殊,很难保证它们在6组间均衡。这也是导致结论不可信的重要原因。

3.5 重要的非试验因素不均衡的案例 例6 某作者研究了生长抑素和后叶加压素对食管曲张静脉破裂出血(esophageal variceal bleading,EVB)的治疗效果,选择1991年以来住院的病人220例,其中生长抑素治疗组120例,男83例,女37例,年龄36~76岁,平均(49.5±6.3)岁,其中肝硬化合并EVB 94例,肝癌合并 EVB 26例;后叶加压素治疗组100例,男79例,女21例,年龄38~81岁,平均(46.5±9.4)岁,其中肝硬化合并 EVB 83例,肝癌合并EVB 17例[7]。

对差错的辨析与释疑 本例中两组病人的年龄跨度大,需要注意两组病人年龄分布是否相同。经分析,两组病人年龄差异有统计学意义(P= 0.005 3)。既然两组病人平均年龄不同,那么如果年龄这个非试验因素对试验结果有影响,如年轻病人治疗效果好,年长病人治疗效果差,这种情况下得到的最终结论是不可信的。

正确的做法是:(1)采取必要的措施保证两组在重要的非试验因素方面(比如年龄)达到均衡,以使两组之间具有可比性。(2)如果采取了必要的措施(如分层随机化)后,某些定量的重要非试验因素(如本例中年龄)仍然不能达到均衡,可以在统计分析时将其作为协变量,采用诸如协方差分析等方法,以扣除它们对观测结果的影响。

[1] 胡良平.科研课题的研究设计与统计分析(第二集)[M].北京:军事医学科学出版社,2010:23-24.

Hu LiangPing.Design and statistical analysis of scientific research topics(Second set)[M].Beijing:Military Medical Sciences Press,2010:23-24.Chinese.

[2] 袁晓琴,曹克升,秦为群.兰索拉唑与法莫替丁治疗反流性食管炎疗效的比较[J].药学服务与研究,2002,2(2):99-101.

Yuan XiaoQin,Cao KeSheng,Qin WeiQun.Comparison of efficacy of lansoprazole and famotidine in treatment of patients with reflux esophagitis[J].Pharm Care Res,2002,2(2): 99-101.Chinese with title in English.

[3] 胡良平.检验医学科研设计与统计分析[M].北京:人民军医出版社,2004:14-18.

Hu LiangPing.Scientific research design and statistical analysis in laboratory medicine[M].Beijing:People’s Military Surgeon Press,2004:14-18.Chinese.

[4] 胡良平,陶丽新,毛 玮,等.如何正确把握试验设计中的均衡原则[J].中国骨伤,2009,22(8):638-641.

Hu LiangPing,Tao LiXin,Mao Wei,et al.How to grasp the balance principle in experiment design[J].China J Orthop Traumatol,2009,22(8):638-641.Chinese.

[5] 董春玲,鲁继荣,王桂芳,等.地塞米松对哮喘小鼠肺液清除功能障碍的作用[J].药学服务与研究,2008,8(1):24-27.

Dong ChunLing,Lu JiRong,Wang GuiFang,et al.Effects of dexamethasone on alveolar fluid clearance in mouse asthma models[J].Pharm Care Res,2008,8(1):24-27.Chinese with title in English.

[6] 王宗明.丁酸氢化可的松软膏治疗皮炎湿疹的疗效观察[J].药学服务与研究,2003,3(3):193-194.

Wang ZongMing.Curative effect of hydrocortisone butyrate cream in treatment of chronic cezema[J].Pharm Care Res, 2003,3(3):193-194.Chinese with title in English.

[7] 姚定康,谢渭芬,张忠兵,等.生长抑素和后叶加压素治疗食管曲张静脉破裂出血的结果比较[J].药学服务与研究,2001,1 (1):37-39.

Yao DingKang,Xie WeiFen,Zhang ZhongBing,et al.Clinical parallel study of somatostatin and vasopressin in treatment of patients with esophageal variceal bleeding[J].Pharm Care Res,2001,1(1):37-39.Chinese with title in English.

猜你喜欢

病程分组病情
鼻负压置换治疗对呼吸道合胞病毒肺炎患儿病程及病情的影响
HBV-ACLF患者血清miR-122和HMGB1水平及其与病情、预后的关系
不戒烟糖友病情更难控制
低GI饮食模式或能显著改善糖尿病病情
重症肺炎肺泡灌洗液miR-127-5p、 miR-3686、 sTREM-1的表达及与病情、预后的关系
分组搭配
怎么分组
分组
枣庄地区小儿支原体肺炎实验室检验结果及流行特点的研究
针灸配合关节腔内注射治疗膝关节滑膜炎的临床疗效观察