在生理学研究中如何严格遵循试验设计四原则*
2017-01-13孙岩松胡良平
胡 完, 孙岩松, 胡良平△
(1. 军事医学科学院生物医学统计学咨询中心, 北京 100850; 2. 军事医学科学院疾病预防控制所, 北京 100850)
在生理学研究中如何严格遵循试验设计四原则*
胡 完1, 孙岩松2△, 胡良平1△
(1. 军事医学科学院生物医学统计学咨询中心, 北京 100850; 2. 军事医学科学院疾病预防控制所, 北京 100850)
目的:为从事生理学研究的科研工作者严格遵循试验设计四原则(以下简称四原则)提供一些有效的技术方法。方法:通过简单介绍“四原则的概念”、举例阐述“生理学研究中在落实四原则方面出现的常见错误和案例”和简单介绍“生理学研究中如何遵循四原则”来阐述遵循四原则的具体做法。结果:需要根据实际情况,选择合适的随机化方法,分层随机化是常用的好方法;应力求设置合理的对照组,才能真正体现出对照原则的价值;有根据地给出每个小组合适的样本含量,是试验结果具有重现性的基本保证;严格遵循随机、对照和重复原则,最终才能实现对比组之间达到极好的均衡效果,这说明均衡原则是一个把关的原则。结论:在生理学科研中,严格遵循四原则对保证生理学研究结果准确可靠至关重要。
生理学;试验设计;随机原则;对照原则;重复原则;均衡原则
【DOI】 10.12047/j.cjap.5408.2017.023
1 试验设计四原则概念
为了使试验能够较好地控制随机误差,避免系统误差,以较少的受试对象取得可靠的信息,达到科学完善经济高效的目的,试验设计时必须遵循随机、对照、重复和均衡四原则。
1.1 随机原则
随机的含义是指在抽样时总体中的每个试验对象均有同等机会或概率被抽取到;分配样本时样本中的每个个体都有相同的机会或概率被分配到试验组和对照组中的任何一组中去。而随机原则就是指无论是从总体中获得受试对象还是把样本中的受试对象分配到各组中去,都必须进行随机化,即没有人为因素的干扰或影响。只有通过随机抽样和分组才能避免各种主客观因素可能引起的偏性,减少系统误差。在实际工作中,随机化主要是通过随机数实现[1]。在试验设计中,最常用的两种随机化分组方法是完全随机化和分层随机化。
1.2 对照原则
为消除非试验因素对试验结果的影响,从而把试验因素的效应分离出来,就必须设立对照组。对照原则就是在一个完整的试验安排之中,任何一组都有与其具有极好对比性的另一个组。此时,研究者关心的那个组常被称为试验组,而与它最具有可比性的另一组常被称为对照组。有时,两组之间互为对照组。什么叫做“具有极好对比性”呢? 例如,设A组是“低氧组”,而B组是“低氧+特定剂量的药物D”,进入这两组的受试对象在其他一切方面(通常指病情轻重、患病时间长短、性别构成、平均年龄等)都几乎完全相同。
常见的对照形式包括空白对照、试验对照、标准对照、相互对照、安慰剂对照和自身对照。值得一提的是,往往在一个试验研究中,有多种对照形式并存。一般来说,涉及几个因素就会有几个对照组。
1.3 重复原则
重复原则是指重复试验原则,即试验研究中试验组和对照组应有一定数量的样本量。另外,重复还有两个相近的概念:一是重复取样;二是重复测量。重复原则的主要作用在于控制和估计试验中的随机误差。试验研究中遵循重复原则的一个具体体现就是有根据地合理估计样本量。
1.4 均衡原则
均衡是指试验组和对照组之间除试验因素取不同水平外,其他非试验因素在各组间几乎相同,组间具有极好的可比性。所谓均衡原则,就是强调在一个完整的试验安排中,所有各组之间必须达到均衡性。一般而言,只有在随机原则、对照原则和重复原则都遵循得很好的情况下,均衡原则才能符合要求。
在以上四个原则中,前三个原则都有具体的“动作”,而第四个原则仅仅起到一个“验收”或“把关”的作用;随机和重复两个原则的具体遵守可以靠统计软件来实现,即随机抽样与随机分组、估计样本含量(其本质就是重复原则)的计算机实现。
2 生理学研究中试验设计原则方面常见错误与案例
2.1 违反随机原则
在试验设计中随机原则遵循不严的场合[2]有以下几种:随机分组方法不明了;回顾性研究在选择受试对象时通常无法遵循随机原则;用完全随机取代分层随机;用随意分组取代随机分组以及没有遵循随机原则。在生理学研究中违反随机原则主要表现为前4种。
2.1.1 随机分组方法不明 例1 某试验研究组蛋白去乙酰化酶抑制剂对大鼠应激性心肌损伤的保护作用[3],在该研究中对动物分组的表述为“大鼠18只,随机分为3组(n=6):对照组、束缚应激组、束缚应激+TSA干预组”。
辨析与释疑:原作者没有详细说明随机分组采用的是完全随机分组、区组随机分组还是分层随机分组。由于在随机分组中需要考虑非试验因素在各组间的均衡性,在样本量不是很大的情况下,最好采用区组随机分组或分层随机分组。
2.1.2 回顾性研究无法遵循随机原则 例2 某论文[4]表述如下:自1996年11月至2000年3月,采用手术治疗合并重度肺动脉高压先心病患儿34例,男22例、女12例。根据患儿手术时间分为对照组(1998年8月前)和肺保护组(1998年8月~2000年3月)。
辨析与释疑:这是一个回顾性研究,研究者根据患者就诊时间的先后顺序分为两组,这严重违背了随机分组原则。回顾性研究在受试对象的选择和分组上无法满足随机的要求,故回顾性研究的结论可信度低,一般只能作为参考,所以在条件允许的情况下,最好采用前瞻性研究。
2.1.3 用完全随机取代分层随机 例3 某研究探讨传统体育对老年知识分子原发性高血压(EH)患者临床症状影响[5]。其分组方法为:将48例有临床症状EH(Ⅰ级29例,Ⅱ级19例)患者随机分为一个非运动组A组(对照组)、一个太极拳组B组和一个气功组C组。
辨析与释疑:原作者随机将患者分为3组,没有考虑EH 分级对结果影响。在样本量小同时存在的重要非试验因素可按程度明确区分开来时,比较科学的做法是采用分层随机化,即先将全部入选受试对象按重要非试验因素取不同水平分层,再将每层中的受试对象完全随机地均分入试验组与对照组中去。
2.1.4 用随意分组取代随机分组 例4 某临床研究通过将女性原发性高血压患者分为未绝经(50例)及绝经(50例)两组;再将两组按自愿分别分为单纯规范治疗组和维生素D添加组,运用ELISA法测定各组25例患者的羟维生素水平,同时发放调查问卷跟踪持续一年以了解患者生活习性及日照时间,并监测各组血压控制情况,以研究规范剂量的维生素D及适度日照时间对女性原发性高血压的血压控制影响[6]。
辨析与释疑:原文作者在分组时没有遵循随机原则,而是根据自愿原则进行分组。对高血压知识的了解和经济条件可能是受试者自愿选择接受何种治疗的影响因素,原作者人为造成了此因素在试验组与对照组间的不均衡,导致得出的结论说服力不强。
2.2 违反对照原则
在生理学研究中,执行对照原则时常见的错误有以下几种:对照不全;缺乏对照;重复设置对照;对照组与研究目的不符;对照过剩。
2.2.1 对照不全 (1) 2×2析因设计只设3组
例5 某试验研究褪黑素对过度训练大鼠胃肠动力及血浆中应激激素水平的影响[7],选取雄性SD大鼠30只,3月龄,体重180~220 g,动物室内温度20℃~29℃,相对湿度40%~55%,分笼饲养,自由饮水,饲啮齿类普通饲料。将大鼠适应性饲养5 d后随机分为3组(n=10):对照组、过度训练组、褪黑素干预组。对照组:不进行任何训练,每天补充同剂量生理盐水;过度训练组和褪黑素干预组大鼠进行每周5次,共6周的递增负荷的训练。过度训练组灌服生理盐水(15 ml/kg),褪黑素组灌服褪黑素(15 ml/kg),30 min后开始训练,每天1次,每周5次。
辨析与释疑:由该研究分组设置情况来看该研究中涉及到两个因素,第1个因素是“有无过度负荷训练”,共两个水平,分别是“有过度负荷训练”和“无过度负荷训练”;第2个因素是“有无用褪黑素灌服”,共两个水平,分别是“用褪黑素灌服”和“用生理盐水灌服”。故该试验合理设计类型应为2×2析因设计,应有4组,在该研究中缺少“没有过度负荷训练但有褪黑素灌服”的试验组。
(2)多因素析因设计组数不全
例6 某研究探讨西黄丸对雌激素受体不同状态乳腺癌的选择性作用[8],选取雌激素依赖性与非雌激素依赖性乳腺癌患者各30例,数字随机法分别分为治疗组与对照组各15例,分为试验组A、试验组B、对照组A、对照组B。其中试验组A为雌激素依赖性乳腺癌患者口服来曲唑同时加用西黄丸;试验组B为非雌激素依赖性乳腺癌患者服用西黄丸;对照组A为雌激素依赖性乳腺癌患者仅口服来曲唑;对照组B为非雌激素依赖性乳腺癌患者,不做处理。
辨析与释疑:该研究中涉及到三个因素,第1个因素是“乳腺癌的类型”,共两个水平,分别是“雌激素依赖性乳腺癌”和“非雌激素依赖性乳腺癌”;第2个因素是“是否用来曲唑”,共两个水平,分别是“用来曲唑与不用来曲唑”;第3个因素是“是否服用西黄丸”,该因素共有两个水平,分别是“服用西黄丸与不服用西黄丸”。2×2×2析因设计应有8个组,但该试验只设置了4个组,还缺少4组,缺少的第一组为雌激素依赖性乳腺癌患者口服西黄丸;第二组为雌激素依赖性乳腺癌患者,不做处理;第三组为非雌激素依赖性乳腺癌患者口服来曲唑同时加用西黄丸;第四组为非雌激素依赖性乳腺癌患者口服来曲唑。
2.2.2 缺乏对照 例7 对10例慢性原发性骨髓纤维化病例,采用中医药为主,伍用小剂量化疗药物治疗,完全缓解4例,好转3例,进步3例。结论是该用药方法获得显著疗效。
辨析与释疑:该研究所有研究对象均接受同一种处理,没有设置对照组,所得结论没有说服力。正确的做法是设立合理的对照,对照组可以是其他常规疗法或者标准疗法。
2.2.3 重复设置对照 例8 某研究应用iTRAQ结合质谱技术筛选冷应激大鼠血浆差异表达蛋白,选用12周龄,体重(340±20)g的健康SPF级雄性Wistar大鼠30只。试验前将大鼠精选单笼饲养,均按标准食量饲喂和自由饮水预饲1周。将大鼠随机分为2组,分别为冷应激组A和常温饲养组B。为了减少试验误差,增加技术重复,将A、B两组分别随机分为3组,即A1、A2、A3组和B1、B2、B3组,每组各5只大鼠,冷应激时将每组单笼饲养的5只大鼠放在同一室内同时刺激。冷应激温度为(4.0±0.1)℃,常温饲养温度为(24.0±0.1)℃,光照按12h标准昼夜交替,冷应激时间为12 h。冷应激试验均在人工智能气候室进行[9]。
辨析与释疑:该研究中受试对象一共分为6组A1、A2、A3组和B1、B2、B3组。但其中A1、A2、A3组处理完全相同,B1、B2、B3组处理也完全相同。原文作者犯了重复设置相同对照的错误。正确的做法是:设置冷应激组A和常温饲养组B两组,并按单因素两水平设计估计出所需要的合适样本含量,没有必要为了减少试验误差,增加所谓的技术重复而设置A1、A2、A3组和B1、B2、B3组。
2.2.4 对照组与研究目的不符 例9 某研究为证明肝炎灵联合丹参注射液治疗慢性乙型肝炎的疗效好于单用肝炎灵,选择慢性乙型肝炎病人随机分为两组,治疗组60例,接受肝炎灵联合丹参注射液治疗,对照组44例,接受肌苷、维生素C治疗,两组在性别、年龄、病程、病情等方面均无显著性差异。
辨析与释疑:原文作者的目的是想证明肝炎灵联合丹参注射液治疗慢性乙型肝炎的疗效好于单用肝炎灵,但对照组却选择了不相干的肌苷和维生素治疗,即使通过分析得到治疗组比对照组好,也只能说明肝炎灵联合丹参注射液治疗慢性乙型肝炎的疗效好于肌苷加维生素C。因此,对于该研究目的,对照组的合理设置应为接受肝炎灵加安慰剂治疗。
2.2.5 对照过剩 例10 某试验研究规范剂量的维生素D及适度日照时间对女性原发性高血压的血压控制效果[6],选取了100例到本院就诊的女性原发性高血压患者和50例到本院体检的健康体检者。并将其分组为未绝经原发性高血压组50例,平均年龄(43.5±5.9)岁;绝经原发性高血压组50例,平均年龄(63.6±6.1)岁;健康对照组50例,平均年龄(45.4±5.5)岁。
辨析与释疑:原文作者研究维生素D及适度日照时间对女性原发性高血压的血压控制效果,那么研究对象应为患有原发性高血压的女性患者不服用维生素D且未接受适度日照,设置健康对照组对研究目的和研究结果没有多大的实际意义和帮助,因此完全可以删除。
2.3 违反重复原则
在试验研究中,最常见的违反重复原则的方式是没有进行样本量的估计。
例11 某研究评价用心肺运动试验(CPET)指导制定个体化运动处方对慢性心力衰竭患者康复疗效[10]。选择10例CPET患者,随机分成两组,每组5人。对照组仅进行没有运动的心脏康复处方治疗,运动康复治疗组进行包含CPET运动指导个体化运动强度的心脏康复处方治疗。治疗结果运动康复治疗组6 min步行距离(470±110)显著超过对照组(401±92)(P<0.05)。
辨析与释疑:原文作者采用的是成组设计,每组样本5人,第一眼看去给人感觉就是样本量很小,但是看结果似乎两组差别很大。经计算该试验的检验效能,若为单侧检验,则β=0.71,检验效能(1-β)只有0.29;若为双侧检验,则β=0.81,检验效能(1-β)只有0.19。所以不管是单侧检验还是双侧检验,该试验的检验功效都很低,也就是说该试验得出的结论运动康复治疗组6 min步行距离显著超过对照组这一结论正确的概率很低。
2.4 违反均衡原则
一项人体试验研究一般会涉及两组或两组以上患者的药物疗效之间的差异性比较问题,若各组在所有重要非试验因素构成[如年龄构成、性别构成、病情构成(即轻、中、重的比例)或临床分期构成和病程长短分布等]上一致,那么该试验研究各组间是均衡可比的;而在动物试验中,一般应尽可能确保动物种属、性别、窝别、体重等在各组间均衡可比。
例12 一个违背均衡原则的经典案例:为了弄清经常吃含赖氨酸的面包是否对少年儿童生长发育有帮助,有人设计了如下的试验:对住校的某班级学生,随机分为A和B两组(年龄、性别构成相同),A组学生每天上午和下午课间各吃一个含赖氨酸的面包,B组学生课间不吃面包,一年后比较这两组学生的身体发育情况,从而得出赖氨酸有利于少年儿童生长发育的结论。
辨析与释疑:在该案例中,A、B两组学生年龄、性别构成相同,但是A组学生课间吃了含赖氨酸的面包,B组学生课间没有吃面包。由于少年儿童处于生长发育阶段,所需营养物质种类多,课间吃一个含赖氨酸的面包除可提供赖氨酸外还可提供其它营养物质,这些营养物质也是有益于少年儿童生长发育的,因此这两组学生在一个重要的非试验因素(即是否吃面包)上是不均衡的,故该案例的结论是不可信的。只有随机决定一组吃含赖氨酸的面包,另一组吃不含赖氨酸的面包(两组所用面包的质量、形状大小、颜色、口感等应相同、只是面包中是否含赖氨酸不同),其他如体育锻炼、作息时间、学业负担、其他饮食结构和数量(还应避免因某些原因学生中间离校,如寒暑假)等各方面两组学生都尽可能一致,一年结束时再比较(应选准合适的疗效与安全性评价指标),才有可能说明赖氨酸的价值到底有多大。
一个试验研究要想在均衡性上无可挑剔,需要研究设计者自身、同行专家和统计学工作者三方面的高度重视和深思熟虑。
3 生理学研究中如何遵循试验设计四原则
3.1 如何遵循随机原则
随机包括抽样随机和分组随机。在试验设计时严格遵循随机原则,应先确定受试对象的范围,然后对确定范围内的受试对象进行随机抽样(随机抽样的方法依实际情况选择,常用随机抽样方法包括单纯随机抽样、系统抽样、分层抽样、整群抽样和多阶段抽样),接下来对样本进行随机分组(随机分组的方法依实际情况选择,常用的随机分组方法有完全随机分组、区组随机分组、分层随机分组、分层区组随机分组、动态随机分组)。在遵循随机原则时,一定要注意“随机”不等于“随意”、“随便”、“自愿”,它要求先对受试对象进行编号,然后再抽取编号,而不是“随便”选或随手抓。通常情况下,先找准找全对评价指标有影响的重要非试验因素,再按其对受试对象进行分层随机化。
3.2 如何遵循对照原则
在试验研究中设立对照组,实际上就是寻找一个“参照物”,对照组设立不同,得出的结论是不同的。在试验研究中遵循对照原则,应当掌握对照的各种形式,再依试验目的合理选择对照形式从而设置合理且齐全的对照组。无论采取何种对照形式,都必须符合“齐同对比”这一前提条件,即符合同时、同地、同环境、同种、同重或同体表面积、同批号等要求,对照才有价值[11]。
3.3 如何遵循重复原则
试验研究中的重复是指试验研究中的受试对象要达到一定的数量,即在相同试验条件下要对足够数量的受试对象进行观察。样本过小,试验研究的结果可信度低;样本过大,会浪费人力、物力、财力和时间等。因此,遵循重复原则最重要在于对样本大小做出科学合理的估计。正确估计样本量需要在给定诸多前提条件(如试验设计的类型等)下正确选择样本量估计公式予以实现。
3.4 如何遵循均衡原则
为达到试验组与对照组间均衡的目的,首先要找出影响试验结果的各种非试验因素,然后按非试验因素中的重要者对受试对象进行分层,再在分层的基础上,对各层内的受试对象进行随机分组。在人体试验中,一般要求年龄、性别和病情轻重在各组间保持一致;在动物试验中,一般要求种属、窝别、性别、月龄和体重在各组间保持一致。
4 小结
对于一个科研课题来说,影响其试验研究结果可信度和准确度的除了试验设计四原则的遵循情况外,还有许多其他方面,比如对试验设计三要素把握的正确程度、研究中质量控制情况、处理数据时统计分析方法选择合适与否、对统计分析结果的解释合理与否、结论陈述恰当与否。本文仅是简要论述在生理学研究中如何严格遵循试验设计四原则,对于其他方面没有涉及。四原则有关的详细论述可参考文献[2,11],此不详述。
[1] 孙振球, 徐勇勇. 医学统计学[M]. 北京: 人民卫生出版社, 2014: 571.
[2] 胡良平. 科研设计与统计分析[M]. 北京: 军事医学科学出版社, 2012: 170-171.
[3] 武 磊, 刘晓华, 王天辉, 等. 组蛋白去乙酰化酶抑制剂对大鼠应激性心肌损伤的保护作用[J]. 中国应用生理学杂志, 2015, 31(2): 193-196.
[4] 胡良平. 医学期刊中常见的统计学错误及对策[J]. 中国卒中, 2006, 1(12): 865-878.
[5] 汤庆华. 传统体育对老年知识分子原发性高血压患者临床症状影响的观察研究[J]. 北京体育大学学报, 2009, 32(2): 67-69.
[6] 区大刚, 张栋武, 陈立新. 维生素D及日照时间对女性原发性高血压影响的临床研究[J]. 重庆医学, 2014, 43(16): 2049-2051.
[7] 景会锋, 王小梅. 褪黑素对过度训练大鼠胃肠动力及血浆中应激激素水平的影响[J]. 中国应用生理学杂志, 2015, 31(5): 411-413.
[8] 潘国凤. 基于雌激素受体西黄丸治疗乳腺癌的临床与实验研究[J]. 中国实验方剂学杂志, 2012, 18(23): 330-333.
[9] 刘艳芝, 郭景茹, 彭梦玲, 等. 应用iTRAQ结合质谱技术筛选冷应激大鼠血浆差异表达蛋白[J]. 中国应用生理学杂志, 2015, 31(5): 392-395.
[10]刘艳玲, 孙兴国, 高 华, 等. 心肺运动指导个体化心衰患者康复的初步总结报告[J]. 中国应用生理学杂志, 2015, 31(4): 374-377.
[11]胡良平. 面向问题的统计学——(1)科研设计与统计基础[M]. 北京: 人民卫生出版社, 2012: 62.
How to follow the four principles of experimental design in physiological research
HU Wan1, SUN Yan-song2△, HU Liang-ping1△
(1. Consulting Center of Biomedical Statistics, Academy of Military Medical Sciences, Beijing 100850;2. Academy of Military Medical Sciences, Beijing 100850, China)
Objective: To offer a series of efficient methods to physiological researchers in following the four principles of experimental design (hereinafter referred to as four principles). Methods: We expounded the concrete way of following the four principles through giving an outline of the four principles, elaborating the common mistakes and cases in the applications of four principles in physiological research and introducing briefly how to follow the four principles in physiological research. Results: We should choose the appropriate randomization method according to the actual situation, usually stratified randomization was a good way. We should strive to set reasonable control group to reflect the value of control principle veritably. Giving the appropriate sample size for each group rightly was the basic guarantee for the research result could be reproduced. Following the principles of randomized, controlled and repetition strictly could achieve an excellent balance between control groups ultimately, that was to say that the balanced principle was a principle of gatekeeper. Conclusion: Following the four principles strictly is critically important to assure the result accurately and reliably in physiological research.
physiology; experimental design; random principle; control principle; repeat principle; balanced principle
2016-01-05
2016-06-14
R181
A
1000-6834(2017)01-089-05
△【通讯作者】Tel: 010-66932127; E-mail: lphu812@sina.com