APP下载

浅谈统计学在论文撰写中的应用

2018-03-03王树阳孙崇睿

卫生职业教育 2018年15期
关键词:成组论文资料

王树阳 ,付 聪 ,孙崇睿 ,赵 华

(1.通化市卫生学校,吉林 通化 134000;2.通化市食品药品监督管理局,吉林 通化 134001)

统计学是研究数据的收集、整理、分析和结果正确解释与表达的一门应用性科学。广泛应用于各个学科领域,在论文撰写中,必须经过符合统计设计的数据收集、整理、分析,才能得到科学的结果与结论。但从一些期刊论文中发现,常出现统计学应用不当的问题,使读者无法获得正确、可靠的信息,影响了论文质量,为此,在论文撰写中如何正确应用统计学,是亟待解决的问题。

统计学在论文中起到两个作用。一是通过撰写和发表论文,对自己研究结果的数据资料进行正确地表达和分析,报告研究成果;二是阅读别人的论文,理解和评价别人研究成果的可信度,吸收新知识,了解学术进展[1]。只有正确掌握统计学的基本原理和方法,才能充分发挥其应有的作用。

1 正确进行统计设计,能保障论文研究的顺利进行

统计设计的内容包括资料收集、整理和分析全过程总的设想与安排[2]。统计设计正确与否,直接影响到论文研究结果的可靠性。任何设计的缺陷,都不能期望事后弥补。在进行研究工作之前,必须有一个周密的统计设计。在统计设计时,需要查阅大量的文献资料,了解研究问题的实际情况,明确研究目的,根据研究目的进行统计设计、资料收集、结果分析等;研究目的不明确,就无法进行统计设计。统计设计在明确研究目的的基础上,进一步明确研究假说、观察对象和观察单位、样本含量、资料类型和分布特征、随机分组、对照的选择、单变量还是多变量、统计方法的选择、统计结果的表达以及统计图表的应用等方面的统计问题,做好研究的统计设计,能保证研究的顺利进行。

2 准确、完整的收集和整理资料,能准确计算统计指标

根据论文的研究目的和统计设计要求,及时、准确、完整地收集原始资料[3];要重视原始资料,对原始资料的数据不能随意更改,确保其完整性和准确性;对于特殊数据,结合研究目的和统计要求进行处理。整理资料的任务是净化原始数据,必须要反复检查、核对,确保准确无误,使其系统化、条理化,能准确计算统计指标和进行统计分析。

3 正确应用统计方法是论文数据统计处理的重要因素

统计分析的目的是计算有关统计指标,反映数据的综合特征,阐述事物的内在联系和规律。统计分析包括统计描述和统计推断两个方面。统计分析方法很多,选择何种统计分析方法取决于研究的目的、统计设计类型、观察指标组成的资料性质和样本含量大小等因素。一般需要考虑以下问题:(1)反映变量是单变量、双变量还是多变量;(2)变量资料的类型;(3)影响因素是单因素还是多因素;(4)资料是单一样本、两组样本还是多组样本;(5)资料是否配对;(6)资料是否满足检验方法所需的前提条件。这些问题直接关系到论文中统计分析方法的选择。

常用的统计分析方法有以下几种。

3.1 数值变量资料统计方法

对于单变量正态分布数值变量资料两样本比较,选用均数描述其集中趋势,选用标准差描述离散趋势。根据统计设计选择统计推断,如是成组设计两小样本资料,选用成组设计两小样本均数比较的t检验;如是成组设计两大样本资料,选用成组设计两大样本均数比较的u检验;如是配对设计资料,选用配对设计差值均数比较的t检验。对于单变量正态分布数值变量资料多样本比较,选用单因素方差分析的方法。对于双变量正态分布数值变量资料两样本比较,选用线性直线回归分析和线性相关分析。

对于单变量对数正态分布数值变量资料,选用几何均数描述集中趋势、选用对数变换后的标准差来描述离散趋势。根据统计设计选择统计推断,如是成组设计两小样本资料,选用成组设计两小样本几何均数比较的t检验;如是成组设计两大样本资料,选用成组设计两大样本几何均数比较的u检验。

对于偏态分布数值变量资料,选用中位数描述集中趋势、选用极差或四分位数间距描述离散趋势;统计推断选用秩和检验等非参数检验。

3.2 分类变量资料统计方法

对于分类变量资料两样本比较,选用相对数描述其集中趋势,选用率的标准误描述离散趋势。根据统计设计选择统计推断,如成组设计,总例数n≥40,理论频数T≥1,选用4个表资料的卡方检验;如配对设计,选用配对设计4个表资料的卡方检验;如成组设计,总例数n≥100,且 nP和n(1-P)都大于5,选用成组设计两样本率比较的u检验或卡方检验。对于分类变量资料多样本比较,选择行×列表资料卡方检验。

4 统计表达直接影响论文的质量

4.1 统计表达决定论文摘要科技信息的可信度

摘要是论文实质性核心内容的浓缩,简述研究目的、方法、结果和结论。摘要中要有表示论文研究结果的重要统计指标的数值(或),可信区间及假设检验结果(值)。统计表达决定了论文摘要中科技信息的含量和可信度。

4.2 统计表达体现论文材料与方法的可靠性、合理性和重复性

在材料与方法中除了专业方面的描述以外,统计学描述包括以下两方面:(1)清晰地描述研究设计的内容。其中包括研究类型,观察对象类型、入选和剔除标准,观察方法和测量技术,以及实验、试验或调查资料的搜集过程等。尤其应具体地描述论文研究对象的来源和选择方法,包括研究对象基本情况、有无随机分组、样本含量等。若有随机分组,说明具体随机化分组方法。总体与样本的描述混淆是论文常出现的统计错误。此部分体现了论文所有统计分析结果的可靠性、研究结论的合理性及研究成果的重复性。(2)说明所采用的统计分析方法与统计软件。论文数据处理中用到的所有统计方法都要说明,而且,必须清楚地指出在何处用了何种统计方法。常用的统计方法只说出其统计方法的名称即可,但特殊的统计处理除说出方法的名称外,还需加注文献出处。统计计算软件一般给出名称即可,如Excel、SPSS、SAS 等。

4.3 统计表达体现论文结果的科学性和准确性

论文的统计结果主要用统计指标表示。统计指标较多时,可进行分组比较,利用文、表、图三者结合来进行统计表达,三者各尽所长,互相补充。正态分布的数值变量资料两组或多组比较,划出三线式或四线式统计表来表达统计指标,应给出各组例数、均数和标准差,同时,写出假设检验方法、相应的检验统计量值(t值、u值、F值)和概率值(值);分类变量资料,使用相对数时,分母(即样本含量)要交代清楚,小样本不宜计算相对数,列三线式或四线式统计表时,给出例数、率、标准误,写出假设检验方法、相应的检验统计量值(u值、值)和概率值(值);非参数统计分析方法时,数据的集中趋势用中位数表示,离散趋势用百分数表示,多选用秩和检验。

在结果项内,应专写自己的实验或调查结果,特别是自己的新贡献,不加分析推理的内容,也不夹杂前人的工作。结果中,不应以“有增多(或减少)的趋势”“有……倾向”这类含糊之词,来掩盖无明显统计学意义的结果。叙述实验、观察结果在内容上一定要客观,不允许用主观偏见来歪曲事实,要有其内在逻辑性,力求做到脉络清晰,结果严谨,层次分明,使人一目了然,自然而然地导出本文的结论,从而体现论文的科学性和准确性。

4.4 统计表达为论文讨论提供统计学依据

一篇论文学术水平的高低,与讨论部分阐述有密切的关系。如果说,结果部分是利用统计结果摆事实,讨论部分则是依据统计分析讲道理。对假设检验结果进行解释,重点阐述各种观察结果之间的关联与因果关系,标出概率值,论述其内在规律性,阐述本研究中所发现的新的、重要的事实,对结果做必要的综合分析说明,揭示事物本质。

综上所述,通过论证统计学在论文中的统计设计、资料的收集整理、统计指标的计算、统计方法的正确选择应用,以及统计表达对论文质量的影响等方面,明确了统计学在论文中正确应用的重要性,为论文撰写提供统计学应用经验。

猜你喜欢

成组论文资料
Party Time
PAIRS & TWOS
JUST A THOUGHT
航天典型结构件成组加工工艺方法
线性表成组链式存储结构研究
成组集中策略下滚装汽车堆场车位分配优化
成组条件下的研制批产混合调度方法
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登