APP下载

中外医学期刊论文中的统计学方法应用情况分析

2012-03-11南方医科大学公共卫生与热带医学学院生物统计学系510515安胜利

中国卫生统计 2012年4期
关键词:出错率期刊论文外文

南方医科大学公共卫生与热带医学学院生物统计学系(510515) 刘 璐 安胜利

统计学作为科学研究的基础,在医学研究中,起着举足轻重的作用。随着医学以及统计学的日益发展,统计学方法在生物医学领域当中的应用越来越广泛,越来越多的论文作者也意识到了统计学的重要性。但是许多调查研究发现,在医学学术论文中仍存在不少统计方法使用错误及表达不当的情况。本研究对近年来中外医学学术论文中统计学分析方法的应用情况进行了调查和对比分析,以期发现常见的统计分析方法误用的原因,为提高论文的学术水平提供有益的建议。

资料与方法

本研究采用便利抽样方法,由本校的在读全脱产研究生随机收集2010~2011年公开发表的、本专业公认的权威杂志中英文医学期刊论文各一篇,共776篇原创性论文,其中中文、英文论文各388篇。对所用统计分析方法的应用情况进行分析,总结出常见的10种统计学方法使用错误及缺陷,对中、英文文献的统计学方法运用正误的情况进行比较。在SPSS 17.0软件上进行分析。对中英文各项目出错率采用 χ2检验或Fisher确切概率法,α取0.05。

结 果

1.各统计分析方法在论文中的应用情况,见表1。

应用频率较高(>10%)的统计分析方法,中外文文献基本相同,主要为配对t检验、两样本t检验、完全随机设计的方差分析、χ2检验、多重线性回归分析以及logistic回归分析。外文文献生存分析方法应用频率也超出了10%。平均每篇论文所用的统计分析方法数低于新英格兰杂志2004~2005年的4.2个/篇〔1〕。对中外文献各分析方法的应用率进行比较,结果显示,“率/构成比比较的χ2检验”中外文间差异有统计学意义,中文文献应用率较高;而“协方差分析”、“简单线性回归”、“logistic回归”、“cox回归”以及“聚类分析”等方法中外文对比差异亦有统计学意义,在外文文献中应用率较高。

2.对10种常用统计学方法误用情况分析

分别计算中文、外文文献常用统计学方法出错率,并进行比较,结果如下。

(1)实验对象分组、例数描述不清

在进行生物医学研究时,常常涉及到分组问题。有部分期刊论著在“材料与方法”部分,未对实验的分组情况进行清晰的描述,或未对各分组的例数进行交待。这样不仅难以使读者了解研究设计,而且易在即将进行的统计学处理中发生方法误用的情况。

本研究收集的776篇中外医学期刊论文中,共有564篇涉及到分组处理。其中中文论文对实验对象分组、例数描述不清的出错率为33.5%(95/284),外文论文的出错率为33.2%(93/280),χ2检验差异无统计学意义。

(2)缺检验统计量

在进行统计分析时,应根据不同的分析方法给出相应的检验统计量〔2〕,如 χ2值、t值或 F值等(多重比较的检验统计量除外)。这样,一方面可以使读者易判断出作者此处所用的统计分析方法;另一方面对于作者也是一种约束,使其不易弄虚作假;还可以作为判断是否需要进一步统计推断的依据。如在运用多重比较方法之前,须先说明总的比较结果(例如F、P),然后据此判断是否需要进行进一步的多重比较。

但研究发现有许多期刊论著在分析结果部分并未给出检验统计量,而仅仅给出P值,有的论文在进行多组比较时(如方差分析)只报告多重比较结果的P值,而不报告总的比较结果(例如F、P),无疑大大降低了论文的科学性和严谨性。

表1 统计学方法在中外医学期刊论文中的应用次数及构成比(%)

本研究收集的论文中,共有663篇论文涉及假设检验。中文期刊论文中竟有35.1%(110/313)在此问题上出错,高于外文论文的24.6%(86/350)的出错率(χ2=8.869,P=0.003)。

(3)缺P值或P值不精确

所有假设检验的P值均应给出精确P值(一般至少应为小数点后三位)而不是仅仅表达为“P>0.05”或“P<0.05”〔3〕。对于多重比较情形,限于表达难度,一般不必给出精确P值,而可以代之以在统计表中以备注符号形式表达出是否有统计学意义。目前计算机以及统计软件的应用已经相当普遍,得到假设检验的精确P值并不困难。而精确的P值能告诉读者拒绝H0,接受H1时犯Ⅰ类错误的概率。

本研究显示,这一问题的出错率较高,中文期刊论文的出错率为42.5%(165/388),高于外文期刊论文的22.2%(86/388)出错率(χ2=36.752,P <0.001)。

(4)同一指标精度不一致

论文中若同一指标因组别、时间等原因而多次报告,应该统一其精度。否则会影响论文严谨性,而且统计表也不美观。

本研究显示,中文论文出错率为5.9%(23/388),外文为3.9%(15/388),差异无统计学意义。说明绝大部分的论文作者都意识到了这个问题。

(5)配对t检验未给出差值的均数和标准差

配对t检验实际上是相当于对每对数据的差值做与0比较的单样本t检验,因此,除了配对的两组各自的描述性统计量外(如均数和标准差),也应给出差值的相应内容。

本次调查共有84篇论文涉及配对t检验,其中中文论文出错率高达46.3%(19/41)高于外文论文的25.6%(11/43)出错率(χ2=3.940,P=0.047)。

(6)对于多组设计资料反复用两样本比较

在进行多组比较时,如对于多组的完全随机设计计量资料/计数资料,常常被误用的方法是直接反复进行两样本t/χ2检验。这样做会大大增加犯Ⅰ类错误的概率。此时应先采用总的比较方法,如单因素方差分析或行列表的χ2检验,再选择合适的多重比较方法进行多重比较。需要说明的是对于多组比较的χ2检验和非参数检验(如Kruskal Wallis H),由于尚无得到公认的多重比较方法,各权威软件均未将其编入软件。此时,作者在得出总的比较结果后,可根据具体的统计量如率、平均秩次进行描述,也可采用有关文献报告的方法进行多重比较。

在本研究中,共有345篇涉及多组比较,在这些论文中共有76篇发生反复使用两样本比较的错误。其中中文论文出错率为24.1%(42/174),外文论文出错率为19.9%(34/171),χ2检验差异无统计学意义。

(7)多重线性回归分析未给出决定系数R2

由所搜集数据得到多重线性回归方程后,必须进一步对该回归方程进行方差分析,以确定其是否有无统计学意义。即使结论有统计学意义,还应同时报告决定系数R2的大小,以进一步说明该模型对数据的拟合程度及该模型的实用价值。

在涉及多重线性回归分析的75篇论文中,共有25篇论文未给出决定系数R2。其中中文论文出错率为26.7%(8/30),外文论文的出错率为37.8%(17/45),χ2检验显示差异无统计学意义。

(8)多因素回归分析未交代变量赋值

由于多因素回归分析(如linear/cox/logistic/ordinal等)中,一些自变量可能是二分类或多分类变量,读者若不知道这些变量如何赋值、以哪一类为对照,则无法判断自变量对应变量的影响方向,从而影响分析结果的专业解释。因此在进行这类分析前必须把可能的影响因素及其赋值说明列出。

在涉及多因素回归分析的194篇论文中,其中未交代变量赋值的有54篇。在此问题上,中文论文的出错率为35.1%(20/57),外文论文的出错率为24.8%(34/137),χ2检验显示差异无统计学意义。

(9)生存分析未报告中位生存期

对于适用于生存分析的资料,由于生存时间多为偏态分布,且有数据删失,在生存分析中平均生存时间并不能恰当地表达出研究对象的平均水平。若论文中涉及生存分析,应当提供中位生存期。

涉及生存分析的论文共86篇,其中中文论文此问题的出错率为54.3%(19/35),高于外文论文13.7%(7/51)的出错率(χ2=16.189,P <0.001)。

(10)相关分析结论,未考虑相关系数大小

对于相关系数的假设检验,所得到的P值越小,则下结论认为二者有相关关系的可靠性越大,但并不意味着其关系越密切。相关的密切程度及其相关方向应通过相关系数的大小来说明。而很多作者常常在得到较小的P值后,即下“二者关系密切”的结论。

涉及相关分析的论文共97篇,其中中文论文出错率为25.6%(11/43),而外文论文为25.9%(14/54),χ2检验显示差异无统计学意义。

其他较常见问题还包括:“研究样本不支持研究结论对应的总体”、“实验分组不合理”、“未设立对照组”等,但因出错文献较少,故未作分析。

讨 论

从统计学方法的使用情况来看,我国医学期刊论文中使用频率较高的大多是较初级的统计学方法,而协方差分析、简单线性回归、logistic回归以及cox回归等方法外文文献中的应用高于中文文献。这个现象与我国的统计学教育普及程度不足有很大的关系,同时也显示了国外医学科研工作者对统计学知识的重视程度较高。从中外文统计学方法误用比较的结果来看,统计学方法在我国生物医学期刊的应用仍不成熟,超过半数的论文都存在统计学处理上的缺陷,国外的生物医学期刊也有相当多的统计学应用错误。对比中外生物医学期刊的统计学应用情况,我国的生物医学期刊论文在“缺检验统计量”、“缺P值/P值不精确”、“配对t未给出差值的均数/标准差”、“生存分析未报告中位生存期”出错更为严重。这个现象与我国的统计学科起步较晚,以及重视程度不足也有很大的关系。

因此,医学院校不仅应重视医学统计学的教学,还应不断改进统计学教学方法,如采用“案例”教学模式〔4〕;加强基础理论、研究设计等弱势板块的教学〔5〕;尽量利用多媒体教学手段使统计学抽象理论形象化〔6〕等。在医学生中强调统计学在今后研究中应用重要性〔7〕,在研究生提交论文的时候,应建立健全的统计学审核制度,以确保论文的科学性和严谨性。医院以及生物医学科研机构亦应该对临床研究人员进行统计学方法的继续教育,在研究的设计环节、统计处理部分最好有专业统计人员参与指导〔8〕。针对我国医学期刊现行审稿模式的缺陷与不足,可借鉴国外期刊的审稿模式,编辑和审稿人的团队中也应该包括具有专业水准的统计学家,提高稿件的统计学审核标准〔9〕。

1.Horton N J,Switzer SS.Statistics methods in the journal.N Engl JMed,2005,353(18):1977-1979.

2.张功员,田庆丰.医学科研论文中统计结果表达和解释错误分析.郑州大学学报(医学版),2002(3):338-340.

3.李永红.医学科研论文中统计学内容的正确表达.中国热带医学,2008,8(12):2274-2275.

4.江梅.探讨“案例”教学模式在医学统计教学中的应用.中国卫生统计,2010,27(2):210-211.

5.陆守曾.对医学统计学应用现状的四点看法.中国卫生统计,2010,27(2):114-115.

6.张罗漫,盂虹,孙亚林,等.信息化条件下《医学统计学》分层次多目标教学探索与实践事.中国卫生统计,2009,26(3):311-313.

7.Jin Z,Yu D,Zhang L,et al.A retrospective survey of research design and statistical analyses in selected Chinese medical journals in 1998 and 2008.PLoS One,2010,5(5):e10822.

8.He J,Jin Z,Yu D,et al.Statistical reporting in Chinese biomedical journals.Lancet.2009,373(9681):2091-2093.

9.沈进,苟莉,汤洁,等.生物医学期刊的统计学方法应用情况分析.中国修复重建外科杂志,2007,21(5):541-543.

猜你喜欢

出错率期刊论文外文
我国体育学领域高被引学术期刊论文特征分析
外文字母大小写的应用规则
国际学术期刊论文中的互动元话语——语篇构件维度下的人际意义
纠错解惑,“圆”题重现
谈如何做好小学生的数学计算教学
从“浅谈”“浅议”“浅论”类论文标题看学术期刊论文标题的演变——一位学术期刊编辑的视角
降低“错位相减法”出错率我有诀窍
托盘天平上的化学计算
外文局期刊目录
对“外文字母”的看法