APP下载

广西医学类科技期刊常见统计学错误浅析

2015-11-11梁明佩潘明志唐毓金黄照河黄研研

传播与版权 2015年5期
关键词:四格医学类科技期刊

梁明佩  潘明志  唐毓金  黄照河  黄研研

广西医学类科技期刊常见统计学错误浅析

梁明佩 潘明志 唐毓金 黄照河 黄研研

通过分析广西医学类科技期刊中常见的t/u检验、χ2检验错误类型,以具体的例子提醒广大作者及编者要重视医学科技论文中的统计学处理,以减少错误,提高论文的质量。

科技期刊;医学统计学;错误分析

[作者]梁明佩、唐毓金、黄照河、黄研研,《右江医学》编辑部;

潘明志(通讯作者),副编审,《右江医学》编辑部。

统计学方法在医学生物论文中的作用不言而喻,正确的统计学处理是确保论文结论经得起时间考验的重要保证,也是考量论文质量的重要评价内容之一。因此,统计学数据的客观性和准确性显得极其重要。我们在前期调查了广西医学类科技期刊统计学的应用现况,发现广西医学类科技期刊统计学使用现况与国内其他期刊相似,使用的统计学方法计量资料主要有t/u检验、方差分析,计数资料主要有卡方检验,等级分组资料主要有秩和检验。同时我们在研究中也发现这些期刊在统计学使用过程中或多或少存在一些错误,下面将针对这些错误归类进行浅析,以引起编辑同行在以后的工作中更加重视统计学审查。

一、t/u检验的常见错误

(一)t检验计算结果错误或判断不确切

这类的情况在广西的医学类期刊出现相对多些。计算结果错误多数是编辑未认真复核引起的,t检验的判断一般先通过公式计算出t值,然后根据t值判断P值大小,通常可分为P<0.05(有统计学意义)或P<0.01(有极显著统计学意义)。如果应该判断为P<0.01而判断为P<0.05则为判断不确切。如表1即为t值计算结果错误,表2为t值判断不确切。

表1两组的样本均为40例,作者目的是比较两组治疗后各种微量元素测量结果是否有差异,原结果P值判断是正确的,但t值计算错误,括号外为原来的结果,而括号内为正确的结果。出现这样的错误应该是编辑在审核修改过程中未对统计结果进行复核,或缺乏统计学知识,从而随作者原来的结果所致。而表2中各t值均比较大,经查t界值表,P均<0.001,差异是有极显著性统计学意义的,而非P<0.05,因此,作者在判断上是不够准确的。

表1:两组患者治疗后微量元素测量比较(±s)

表1:两组患者治疗后微量元素测量比较(±s)

组别钠 钾 氯 钙A组 135.69±4.92 3.78±0.78 99.52±7.23 1.93±0.55 B组 97.32±8.48 3.75±0.86 134.68±4.84 1.98±0.68 t 8.26(0.9256)7.15(0.1634)3.15(1.2486)2.01(0.3616)P >0.05 >0.05 >0.05 >0.05

表2:60例患者治疗前后血压比较(mmHg)

(二)以两两t检验替代方差分析及q检验

这类错误在广西医学类期刊中相对少见。t检验每次只能比较二个平均数,仅适用于单因素一、二水平的实验设计类型。而对于单因素多水平或多因素多水平等的设计,则不宜使用t检验,因为这样会破坏原来的整体设计,使结果出现假阳性的概率大大增加,其结果的可信度明显下降。因此,对于多个样本均数的比较,应根据资料是否符合正态分布、总体方差是否齐来选择统计学方法,如资料服从正态分布,且各组资料的总体方差齐,则选择方差分析。我们看下面的例子(表3)。

表3:各组麻醉持续时间比较(±s)

表3:各组麻醉持续时间比较(±s)

组别 n 持续时间(min)Ⅰ组 40 118±13Ⅱ组 40 114±16Ⅲ组 40 111±12

本例采用方差分析结果为:F=2.60,P=0.0785>0.05,即各组间麻醉持续时间差异无统计学意义,没有必要再进一步两两q检验。而本如果采用两两比较t检验,其结果为ⅠvsⅡ:t=1.2271,P=0.2235;ⅠvsⅢ:t=2.5024,P=0.0144;ⅡvsⅢ:t=0.9487,P=0.3457。从结果看,Ⅰ组与Ⅲ组比较是有统计学意义的,这与采用方差分析的结果完全相反。

(三)误以成组t检验替代配对t检验

配对设计主要有几种情况:(1)同一受试对象处理前后的数据;(2)同一受试对象两个部位的数据;(3)同一批样本用两种方法检验;(4)配对的两个受试对象分别接受两种处理所得到的数据。配对设计能缩小实验对象间的个体差异,减少实验误差,提高效率。如将成组t检验替代配对t检验,则无形中扩大了样本数量,增大标准差和标准误,从而使P值也增大,这样就有可能得出假阴性结果(从有统计学意义变为无统计学意义)。举例(表4):

表4:患者治疗前后AST变化情况(±s)

表4:患者治疗前后AST变化情况(±s)

观察时间 n AST(U/L)治疗前 24 35.5±9.5治疗后 24 28.5±8.1 t -3.232 P -0.002

本例是比较治疗前后AST的变化,采用自身对照研究,错误采用两样本成组设计的t检验,把同一样本视为两个样本,扩大的观察样本,使得检验效能降低。本例正确的处理方法是通过原始数据,计算出治疗前后AST的差值平均值和差值标准差,采用配对t检验进行处理,具体方法可查阅相关统计学书籍。

(四)误用配对t检验替代重复测量方差分析

重复测量数据是临床试验中常用的数据,是指同一观察对象的同一指标在多个不同时间点(3个或3个以上)进行多次测量所获得的资料,主要用来观察受试对象的观察指标在不同时间点的动态变化情况,如观察麻醉过程中的血压、心率等的变化,都属重复测量数据。该类数据常采用重复测量方差进行分析。表5即为典型的多样本重复测量的均数比较,如要比较A组(或B组)不同时间测量值是否有统计学差异,首选单因素重复测量资料的方差分析,推断不同时间测得的总体均数是否相等,若不同时间测得的总体均数不相等或不全相等,则进一步进行不同时间两两比较。

表5:两组患者PCEA期间镇痛质量评分(n=40,±s)

表5:两组患者PCEA期间镇痛质量评分(n=40,±s)

组别 2h 4h 8h 24h 48h A组 0.6±0.5 1.5±0.6 1.6±0.7 1.7±0.7 1.7±0.8 B组 0.8±0.7 1.6±0.8 1.8±0.7 1.8±0.9 1.9±0.8

二、χ2检验常见错误

(一)误将四格表χ2检验替代校正χ2检验或确切概率法

目前,关于四格表资料各种检验方法的应用条件虽仍有不同意见,但一般可根据以下三种条件选择:(1)总例数<40或最小的理论频数<1,应选择“确切概率法”;(2)总例数≥40且最小的理论频数≥1,但最小的理论频数<5,应选择“校正法”;(3)总例数≥40且最小的理论频数≥5,应选择“非校正法”。目前,在部分期刊中,误将四格表χ2检验替代校正χ2检验或确切概率法的现象仍不少,但只要掌握好四格表资料的检验方法的应用条件,该类错误是比较容易避免的。由于相关的报道比较多,在此不再举例。

(二)误将四格表χ2检验替代配对四格表χ2检验

举例(表6),应用高频彩色多普勒超声血流能量图(PDI)与弹性成像两种方法鉴别92个乳腺肿块良恶性,比较两种方法的鉴别情况。作者采用一般的四格表χ2检验,所得结果为χ2=11.52,P<0.01。而此例为比较典型的配对资料,应采用配对四格表χ2检验,结果为卡方值(校正)=0.1379,P=0.7103。

表6:PDI与弹性成像两种方法对乳腺肿块良恶性诊断的对照(n=92)

(三)误用χ2检验代替秩和检验

对于单向有序分类资料(等级资料),一般宜采用成组设计两样本比较的秩和检验(Wilcoxon两样本比较法)或用Ridit分析,但运用Ridit分析时要求样本含量足够大,因此,大多情况选择秩和检验。举例(表7),观察两组治疗后的临床效果。本例为典型的等级资料,经Wilcoxon两样本比较秩和检验,u=-1.1099,P=0.2670。而不宜采用2×C表资料的χ2检验,因为2×C表资料的χ2检验不考虑等级的差别,只能说明各组的“构成比”是否相同,而不宜判断各组在程度上的差异。所以,对于单向有序分类资料,最好用秩和检验或Ridit分析进行假设检验。此外,既往对应本例,也有界定“治愈+显效+好转=总有效”之后,进行四格表卡方检验的做法,检验结果为:χ2=2.2487,P=0.1337,看似统计判断结果与Wilcoxon两样本比较秩和检验一致,但实际上两者统计内涵不同,四格表卡方检验是推断两组总体率有无差别,而Wilcoxon两样本比较秩和检验是推断两组总体分布是否相同,显然,秩和检验或Ridit分析更能准确地反映表7的实际情况,是更合适的统计学方法。

总之,以上所列举的部分医学统计学常见的错误类型,应该说大部分还是可以避免的,这就需要广大科研工作者及编者要加强自身统计学知识的积累,掌握最基本的统计学分析方法及经典统计学方法的应用。这样通过对论文的二重把关,统计学错误的概率就会小很多。但对于编辑也无法把握的统计学内容,还是要聘请统计学专家审稿,这样才能进一步保证论文的科学性及结论的可靠性。[本文系2011年度广西医药卫生自筹经费计划项目(编号: 2011127)成果]

[1]潘明志,梁明佩,唐毓金,等.广西14种医学类科技期刊统计学应用调查研究[J].右江医学,2014(4)

[2]邱春晖,郭明兴,邱源.医学论文中统计学方法的误用及其防范措施[J].山东教育学院学报,2009(5)

[3]吴青.医学论文中常见的统计学错误分析[J].山东医学高等专科学校学报,2008(4).

表7:两组患者治疗后临床效果比较(n,%)

猜你喜欢

四格医学类科技期刊
科技期刊的分类
科技期刊的分类
科技期刊的分类
科技期刊的分类
爆笑四格
爆笑四格
爆笑四格
爆笑四格
医学类新闻的撰写原则与技巧
医学类论文中数字的用法