APP下载

医学论文统计描述性数据审核的问题与方法

2015-03-26■王

中国科技期刊研究 2015年4期
关键词:描述性医学论文均数

■王 曼

《郑州大学学报》编辑部,河南省郑州市科学大道100号 450001

随着医学研究领域的扩张和研究内容的深入,统计学在医学研究中的应用越来越受到重视。统计学是对数据进行科学处理的方法学,在选题确定的基础上,统计学处理的准确性、科学性直接决定了研究的质量。目前,许多医学科技期刊已经意识到统计学的重要性,邀请统计学专家审稿,严控论文的统计学缺陷[1-4]。但是,统计学审稿专家多是对实验设计是否科学、统计方法是否得当、统计结论是否正确等方面进行把关,他们一般不会对具体的数据进行细致的核对。而编辑同行们对论文中统计学方面的关注也多是针对统计推断部分,常常忽视对统计描述性指标的审核[5-8]。对数据资料的准确描述是统计推断的基础,选用的描述性指标不正确则不可能应用正确的假设检验方法;描述性指标的数值不准确,再正确的统计分析方法也得不到正确的结果;这将直接影响论文的科学性。因此,科技期刊编辑应该对论文中的数据,尤其是统计描述指标进行严格审核[9]。本文对医学论文中统计描述性数据审核的要点、存在的问题和审核方法进行了总结,以期促进编辑的编校水平,进一步提高论文质量。有些数据疏漏比较明显[10],文中没有详细叙述。对于一些隐蔽性很强的问题进行了举例辨析,案例均来源于本刊编辑加工的稿件。

1 常用统计描述指标

统计描述就是指在完成数据的收集并经过初步整理后,用相应的统计指标来反映数据的分布特征。统计学通常把数据分为定性资料和定量资料。描述定性资料的统计学指标主要有构成比、各种率和相对比,以及医学人口统计常用指标如出生率、总和生育率、死亡率、病死率等。定量资料的分布主要用集中趋势指标和离散趋势指标来描述。集中趋势指标反映了数据资料的平均水平,主要有均数、中位数、众数等,其中均数和中位数是医学论文中常见的指标。离散趋势指标反映了数据资料的变异程度,常见的指标有标准差、四分位间距、变异系数等。

2 定性资料的审核

2.1 描述性指标的使用是否得当

首先应该注意的问题是描述性指标的使用是否得当。常见的错误有构成比和率、病死率和死亡率的混淆以及数据精度的不统一。病死率和死亡率的区别已有很多编辑同仁进行了讨论。对于构成比和率,临床医生常常错误应用。区分的关键就是要严格把握好各指标的定义,分清楚分子、分母的含义。

例1某项研究分别对急性期和恢复期细菌性肺炎婴幼儿患儿进行了PCT检测,对2组检测结果进行了比较。PCT检测结果分为<0.5、0.5~2.0、2.0~10.0、>10.0μg/L 4个等级,设定≥0.5μg/L为PCT阳性。检测结果见表1。

表1 不同病程细菌性肺炎婴幼儿患儿PCT检测结果

辨析1该表中“PCT水平”其实是对PCT水平构成情况的描述,构成的各部分总和应等于总观察数(该例2组均为50),各部分的构成比总和应为1或100%。可以看出,表1中其实漏了一列数据,见表2。这种疏漏很不容易察觉,因为数据并没有错误,但描述不严谨。

辨析2该表中“阳性率”计算无误,但是小数点后的有效数字位数应该与“PCT水平”一致,见表2。这种疏漏比较常见,编辑在编校稿件时应着重关注。

表2 不同病程细菌性肺炎患儿PCT检测结果

2.2 描述性指标数值的核对

对于医学论文中的定性资料,一般通过上下文的阅读可以找出描述性指标的分子、分母的值,编辑应不怕麻烦,勤动手,对数据进行再次计算。另外一个核对重点是关联表之间数据的一致性问题。

例2 某项研究对足月正常妊娠(对照组)及足月胎膜早破(PROM组)产妇胎膜中M IF表达强度进行了比较,同时对PROM组中伴和不伴CAM的产妇胎膜中M IF表达强度也进行了比较。胎膜中M IF表达强度测定结果见表3、表4。

表3 对照组和PROM组产妇胎膜中M IF的表达

表4 PROM组中伴和不伴CAM的产妇胎膜中M IF的表达

辨析表3中PROM组产妇胎膜中M IF表达强度为-、+、++、+++的例数分别为8、20、17和5例。表4中的数据是PROM组中伴和不伴CAM的产妇胎膜中M IF的表达强度,这两个表的数据是有关联的,可以视为关联表。表4中M IF表达强度的合计例数应与表3中PROM组的数值一致。但很明显,目前两个表+和+++两个表达强度的数据不一致。许多稿件中不会列出合计项,故这种疏漏很不容易察觉,因此,编辑应该有意识地对关联表的数据进行一致性审核。

对于调查类文章,审核的数据较多,尤其是分层越多,计算量越大,编辑要有耐心,可以用不同的算法进行计算,核对最终结果。但调查类文章有一点应注意,在分层核对时,各层数据之和可以小于或等于、但不能多于观察对象总数。比如,498例住院重症手足口病患儿的临床资料中居住地为城市、农村、城乡结合部的例数分别为138、241和107例,可以看出居住地合计小于498。对于大样本的调查类研究,其数据收集有可能不全,允许有删失,但文内应在相应数据处标注清楚,也可以在居住地变量加上“居住地不详”这一分类。

3 定量资料的审核

3.1 描述性指标的使用是否得当

与定性数据一样,对于定量数据首先应该注意的也是描述指标的使用是否得当。主要错误是集中趋势指标选用不当,尤其是算数均数和几何均数、均数和中位数的不当应用。有的文章中甚至出现了标准差和标准误的误用。算数均数和几何均数的误用比较好理解,医学论文中几何均数主要用于抗体滴度资料,相关专业人员对几何均数的应用也较熟练。但是均数和中位数的应用较混乱,问题也较多。是选用均数还是中位数关键看数据的分布。对称分布或正态分布资料就要用均数和标准差分别用来描述资料的集中和离散趋势,而对于偏态分布的资料,一般选用中位数和四分位间距分别用来描述资料的集中和离散趋势。

例3某项研究采用ELISA法检测了37例肺癌患者化疗前及23例健康者血浆中TGF-β1水平。正常对照组23例年龄35~75(55.0±13.3)岁。肺癌组37例,年龄36~80(57.0±11.6)岁。

辨析对于癌症患者来说,年龄分布通常是非正态性的,所以不宜用均数和标准差来描述,宜选用中位数和上、下四分位数。医学论文中,一些测量指标的正态性容易被检测,作者也都比较能够理解。而像年龄这一类太常见的指标,反倒容易被忽视。一方面,这类指标太常见,作者们自然而然就采用了常规数据处理方法;另一方面,这类数据常态下是正态分布,但是在特定人群中的分布特征发生了改变。年龄在全体人群中是正态分布,但是在肿瘤患者这个特定人群中,该指标的分布发生了明显的负偏峰移动。所以,编辑在审核定量指标的描述时,一定要注意研究对象。

3.2 描述性指标数值的核对

医学论文中定量资料描述性指标数值的核对包括精度和准确性。测量工具直接限定了测量值的精度,因此,编辑在编校文章、核对数据时,一定要注意文中有关测量方法的描述,叙述不清时必须要求作者书写清楚。描述性指标的数值一般由原始数据计算得来,因此在没有原始数据的情况下很难进行核对,出现的数值问题一般也比较隐蔽,很难被发现。但是通过一些计算技巧,通过对关联数据的验算也可以发现问题。虽然很多时候不能说明数据就有问题,但是这种验算给了编辑质疑的理由,可以要求作者核对。这类数据的核对主要是掌握核对的思路,计算其实不难。下面举几个典型案例加以说明。

例4同例3。

辨析例3中,除了肺癌组不能用均数和标准差来描述年龄这个指标外,正常对照组的年龄分布数据也存疑。正常对照组的年龄范围为35~75岁,均数和标准差分别为55.0和13.3岁。这种描述方法默认在正常对照组中年龄呈正态分布,那么按照95%的概率计算,应有95%的年龄数值在(55.0±1.96×13.3)岁这个范围内,计算后这个年龄范围为28.93~81.07岁,该范围明显大于实际的年龄范围(35~75岁),推测标准差计算有误。

例5同例2。研究人员对足月正常妊娠(对照组)及足月胎膜早破(PROM组)产妇羊水中IL-6水平进行了比较,同时对 PROM组中伴和不伴CAM的产妇羊水中IL-6水平也进行了比较。羊水中IL-6水平测定结果见表5、表6。

表5 对照组和PROM组产妇羊水中IL-6的水平

表6 PROM组中伴和不伴CAM的产妇羊水中IL-6的水平

辨析这两个表属于关联表格,表6中羊水IL-6水平的测定对象就是整个PROM组的产妇,因此,两个表中PROM组产妇羊水IL-6水平的均值应该相等。由表5可知,该均值为183.2μg/L。表6中虽然没有直接给出均数,但可以推算出来。根据表6的数据,按照公式计算

可以看出,根据表6计算的PROM组产妇羊水IL-6水平均值与表5中的数值相差甚远,有理由推测数据有误。

例6某项研究对海口市767名老年人口腔健康相关生活质量现状进行了分析,其中以口腔健康影响程度量表(OHIP-14中文版)的总分和各维度得分反映口腔健康相关生活质量。对患和不患有口腔疾患的老年人的OHIP-14得分进行比较。在结果部分,767名老年人“OHIP-14总分为(17.74±9.73)分,独立能力减弱、心理不适、身体机能不适、疼痛与不适这4个维度的得分分别为(15.38±4.26)、(8.99 ±2.85)、(5.69 ±1.19) 和(7.70 ±2.97)分。”随后,文章对牙龈肿痛对口腔健康相关生活质量的影响进行了分析,结果见表7。

表7 牙龈肿痛对老年人口腔健康相关生活质量的影响

辨析1首先按照例5的数据核对方法对表内的总分数据与文字叙述的数据进行比照,根据表7计算出的767名老年人OHIP-14总分的均数为38.90,而文字叙述为17.74,差别非常大。仔细审读表7,可以看出,4个维度的得分与文字叙述也不相符。经与研究者核对,文字叙述部分修改为OHIP-14总分为(37.72±9.72)分。表7修改为表8。

辨析2观察表7中总分的数据,两组总分的标准差分别为0.53和0.40,而文字叙述中标准差为9.73。标准差越小,说明数据的变异越小,对于767名受试者,这么大的样本量,标准差仅有0.53和0.40,有理由怀疑表7中总分的标准差有问题。经与研究者核对,表7中标准差数据实为标准误。修订后的数据见表8。

表8 牙龈肿痛对老年人口腔健康相关生活质量的影响(修订)

4 结语

统计描述是对实验数据分布特征的反映,描述性指标数值错误将直接影响统计推断的结果。虽然已经有很多方法可以对假设检验的检验统计量的值进行核对,但是如果描述阶段就存在错误,那么验证结果自然也不可能正确。统计描述是后续进行统计推断的基础,因此对描述性统计指标的核对意义重大。本文对医学论文当中涉及的统计描述方面疏漏的审核方法进行了总结。编辑掌握了数据核对方法,可以对医学论文中描述性统计数据进行有效的审核,从而保证论文的质量,提高期刊的质量和影响力。

[1]接雅俐,唐震,陈汐敏,等.科技期刊同行评议审稿流程改革与初步成效[J].中国科技期刊研究,2013,24(5):988-990.

[2]邱芬,曾令霞,国荣.统计学审查在医学论文审稿中的必要性[J].中国科技期刊研究,2011,22(4):574-576.

[3]马英.国外医学期刊的审稿标准[J].编辑学报,2009,21(3):276-278.

[4]闻浩,鲁立.关于专家刊前审读的调查与分析[J].编辑学报,2011,23(5):428-429.

[5]李运明,陈长生,周炜,等.1篇SCI临床医学论文审稿意见中两个统计学问题的探讨[J].西南军医,2012,14(5):797-799.

[6]刘璐,安胜利.中外医学期刊论文中的统计学方法应用情况分析[J].中国卫生统计,2012,29(4):569-571.

[7]徐谦,沈耿,莫传伟,等.中医论文撰写中常见的统计学错误分析[J].广州中医药大学学报,2012,29(4):474-477.

[8]彭芳,董燕萍,金建华,等.重视医学期刊中统计学问题的审查[J].编辑与出版,2013(11):43-46.

[9]王曼.科技期刊编辑工作和职业追求[J].洛阳师范学院学报,2013,32(5):123-125.

[10]黄晨,袁平戈,张大志.医学期刊来稿中有关统计学错误分析[J].现代医药卫生,2013,29(15):2268-2269.

猜你喜欢

描述性医学论文均数
医学论文中引言的写法
医学论文实用性的判断
虚构人名的内涵意义分析*——描述性理论面临的挑战和反驳
医学论文中引言的写法
医学论文中引言的写法
浅析独立主格结构在大学英语四六级段落翻译中的运用
一种基于英文网页描述性信息的摘要算法
关于均数与偏差
关于均数与偏差