APP下载

中医院校研究生科研设计和统计分析常见问题

2019-01-29胡继宏靳利梅吴建军魏新民樊景春郑贵森

中国中医药现代远程教育 2019年14期
关键词:分组概率显著性

胡继宏 靳利梅 吴建军 魏新民 樊景春 邢 新 郑贵森

(甘肃中医药大学公共卫生学院,甘肃 兰州 730000)

研究生作为高校教育的重要组成部分,是高校为社会培养高层次人才的主要方式[1]。中医院校与西医综合院校相比,医学科研设计起步较晚,还存在诸多问题。本人就在甘肃中医药大学工作遇到的科研设计和统计常见问题总结如下。

1 科研设计常见问题

科研设计是科学研究的开始,也是关键。只有科学、严谨的设计,才能避免实施过程的错误。《流行病学》是讲述科研方法的一门课程,其根据研究和应用的方向,形成了不同的分支,如临床流行病学、分子流行病学、遗传流行病学、传染病流行病学等[2]。对流行病学中科研方法掌握的程度直接关系到科研设计的科学性。常见的科研设计问题包括:

1.1 科研方法选择和定位不准确 常见的科研方法分为观察法、实验法和数理法。观察法是研究方法的基础,分为描述性研究和分析性研究。描述性研究中常见的有现况研究(包括普查和抽查)、生态学研究、疾病监测、病例报告和系列病例分析。分析性研究包括病例对照研究和队列研究[3]。根据研究目的选择正确、适宜的最佳科研方法,再利用不同科研方法的设计步骤去设计课题。如,干预措施效果评价的研究,最佳的科研方法应该选择实验法;疾病预后的研究,最佳设计方案应该是队列研究。

1.2 临床试验没有设立对照组或者对照设立不全面 在评价干预措施效果时,直接观察到的往往是多种因素的效应交织在一起的综合作用,合理的对照能成功地将干预措施的真实效应客观地、充分地暴露或识别出来,使研究者有可能做出正确的评价[3]。常见的问题包括没有设立对照组,只是单纯进行实验组干预前、后的比较,这样很难判断干预前、后的差别到底是由于干预措施引起的,还是由干预措施以外的其他因素引起。另外,还存在对照组设立不全面。如,在观察某药物对模型动物影响的实验研究中,很多学生只是设立对照组、实验组,而没有考虑对照是否全面,应该要设立正常动物组、模型动物组、干预用药组、对照用药组,这样既考虑了模型对动物的影响,也观察了干预措施的效果。有时,如果模型建造有创伤,还需要加设假手术组;如果干预措施的溶剂对实验效应有影响,还需要设立溶剂对照组。

1.3 没有随机化或者假随机 随着循证医学的发展,人们逐渐重视文献证据的质量。随机对照试验(randomized control trial,RCT)研究质量评价的依据中包括“是否采用随机化”“是否对随机化进行详细描述”[4],可以发现很多文献只是简单描述是否采用了随机化,而具体的随机化方法很少进行描述。在研究生科研工作中也发现很多学生对随机化不理解,错误地认为按照病人就诊顺序随机化就是按照就诊顺序单号进入实验组,双号进入对照组。而真正的随机化是在设计阶段的任务,实施阶段只是按照已经设计好的分组方案进行。如要将50名病人随机分到实验组和对照组,我们可以先假设有50名患者,给他们排好序(未来的就诊顺序),利用随机数字表或者软件进行随机化分组。如果利用随机数字表分组,可以先从随机数字表中抄录50个随机数字,事先规定单号为实验组,双号为对照组。因为随机数字的出现是随机的,所以保证了分组的随机化,能够更好地控制混杂偏倚。

1.4 指标的检测 很多学生认为,干预后检测指标组间比较的差异具有统计学意义,就认为干预措施有效。这是错误的认识,因为我们不知道干预前两组是否均衡可比。因此,所有评价指标都应该在干预前、后检测,通过对干预前的均衡性检验,看看是否做到了可比;然后再进行干预后的比较,才能说明问题。

1.5 盲法的应用 盲法是指参与科学研究的人员不知道实验分组的情况。可以分为单盲(研究对象不知道分组)、双盲(研究对象和具体实施者不知道分组)和三盲(研究对象、具体实施和统计分析者均不知道分组)[5]。应用盲法的前提是安慰剂的使用,而中医药研究中安慰剂的选用存在困难,因此盲法的应用比较困难。

1.6 样本含量不做预先估计 样本含量的充足是为了满足统计分析的需要,将随机误差的影响予以控制的方法。很多学生在研究设计阶段不考虑样本含量,等到了实施阶段,有多少病人做多少,这样等到研究结束,进行资料的整理分析阶段,发现差异无统计学意义,这时很难解释是由于样本含量不足引起,还是本身就没有差异。所以需要对样本含量利用公式进行预先估算。

1.7 其他 还有一类研究属于文献分析。需要注意的是要根据研究目的确定文献的纳入标准。如果是对某种中医药方法治疗某病用药规律的分析,应该纳入这一中医药方法治疗有效的文献;如果是meta分析则是所有应用中医药方法的文献都纳入,分析时要选择经过质量评价的高质量文献;如果是对某一中药药方进行分析,应该是所有与这一中药相关的文献进行分析。

2 统计分析常见问题

统计分析是课题实施结束后的工作,不同的变量资料其统计描述指标和假设检验方法有所不同。因此,在统计分析阶段,要根据研究目的和变量的种类选择合适的统计分析指标和方法。研究生在资料的分析阶段常见问题包括:

2.1 临床试验研究分析策略的选择 对于临床试验而言,分析前首先要保证实施阶段收集了研究对象在试验过程中依从、失访等信息,以方便在统计分析阶段,不同统计分析策略(意向性分析、全方案分析和接受治疗分析)建立不同的数据库[3]。对于科学研究而言,通常应该选择意向性分析。

2.2 统计方法和结果描述不完整 数据的统计分析有两大任务,即统计描述和统计推断。因此,在统计方法描述时应该包含这两方面,还要根据研究的具体目的和评价指标进行描述。统计结果部分不应该只是描述概率P与小概率水准0.05比较的结果,还应该告知假设检验的统计量大小。

2.3 统计描述指标选择错误 统计描述是统计分析中最简单的初期工作。不同的资料类型和分布类型,其统计描述的指标不同。计量资料的统计描述工作包括集中趋势和离散趋势。其中集中趋势的描述主要有均值、中位数等;离散趋势描述的指标主要有极差、标准差、四分位间距等。不同分布类型,其集中趋势和离散趋势的描述指标不同。正态分布资料非近似正态分布使用均值和标准差描述,非正态分布或分布不明资料使用中位数和四分位间距描述。很多研究生不考虑资料的分布类型,计量资料全部都采用均值和标准差描述。

计数资料的统计描述指标包括率、相对比、构成比。学生最常犯的错误是以构成比代替率。如,死亡人群中因为心血管病死亡占65%,肺癌占10%,不能说心血管病比肺癌死亡风险高或者容易死亡,而要比较两种疾病的死亡率和病死率。另外,当有混杂偏倚存在时,不能直接进行粗率的比较,需要进行标准化率的比较。如,两组人群进行死亡率的比较,发现甲组人群总死亡率低于乙组人群,但不同年龄组死亡率甲组高于乙组,那么到底该接受哪个结论?通过分析,发现甲组老龄人口比例低于乙组,而年龄对死亡率有影响,因为两组人群年龄构成不同,造成结果的矛盾。因此,要进行两组人群总率比较时,需利用标准化法计算标准化率,控制年龄带来的混杂偏倚。标准化率比较的结果和年龄分层的结论应该一致。

2.4 显著性水准和概率的问题 显著性水准α是人为设定的,其实就是小概率的标准,一般设为α=0.05。在统计方法描述时,有很多学生描述“显著性水准为α=0.05,当P<0.05时认为差异具有统计学意义。”这样的描述是画蛇添足。通过统计得到的概率P值就是与显著性水准α进行比较,从而得出结论的,因此显著性水准和概率P在统计方法的描述中只阐述一个即可。另外,应该P≤0.05差异具有统计学意义,只不过当P=0.05是界限值,下结论需谨慎。

2.5 假设检验的方法错误 假设检验方法的选择要根据研究目的、资料类型和分布类型。最常见的错误包括多组均值比较采用方差分析接受H1时,需进一步进行两两比较,很多学生采用t检验进行组间比较,这增大了Ⅰ类错误概率,更容易接受有差别的结果。另外,计数资料进行组间比较时,单向有序资料不能使用卡方检验,而应该选择秩和检验或Radit分析。还有一些同学,没有区分配对资料和成组设计资料,这两种资料的数据库及统计分析方法均有所不同。当进行同一组研究对象不同时间点比较时,如干预后1天、1周、2周、1个月这4个时间点指标比较时,不能采用单因素方差分析,要采用重复测量的方差分析。还有一些同学想要分析剂量反应关系,发现随着剂量增高,效应增加或减少,这需要做趋势检验才可以得出结论。

2.6 统计结论 有些同学对假设检验的原理没有理解,造成计算了概率P值后,却不知道如何下结论。假设检验是以假设H0成立为前提的,因此,通过统计分析所得到的的概率P值实际上是H0成立的概率,将此概率与显著性水准进行比较,从而下结论。另外,还有一些同学对相对危险度(relative risk,RR) 和比值比(odds ratio, OR) 的意义不理解,认为只要P<0.05,就说明随着RR或OR值的升高发病或死亡的风险就增高,这是错误的。还需要根据RR值和OR值的大小进行判断,如果RR或OR>1,说明这个因素是危险因素,随着水平的升高,发病的风险是增高的;但如果RR或OR<1,说明这个因素是保护因素,随着水平的降低,发病的风险是降低的。

2.7 其他 对于文献类研究,要根据研究目的选择文献并进行合适的统计分析。在对方药用药规律进行分析时,常见的分析方法有关联分析、聚类分析、主成分分析等;如果对药物疗效的临床随机对照试验文献进行分析,常用meta分析。做meta分析前,首先要保证文献查全,然后要进行文献的质量评价,只有高质量的文献才纳入meta分析。

猜你喜欢

分组概率显著性
对统计结果解释和表达的要求
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
本刊对论文中有关统计学表达的要求
分组搭配
基于显著性权重融合的图像拼接算法
怎么分组
分组