研读医学统计学课程之新视角
2012-08-15保宏翔王煜辉
保宏翔,王煜辉,孙 娜
(西安陆军学院边防军医训练大队,新疆 呼图壁 831200)
研读医学统计学课程之新视角
保宏翔,王煜辉,孙 娜
(西安陆军学院边防军医训练大队,新疆 呼图壁 831200)
就医学统计学课程中的六大基本概念[1],即随机变量、同质与变异、总体与样本、参数与统计量、系统误差与随机误差、频率与概率切入,从另一个视角,即研究对象、研究内容、研究方法、具体抓手、基本步骤和注意事项6个方面进行对应性解读。
医学统计学;方法论;统计分析
医学统计学属自然科学,它把统计学的原理和方法应用于医学领域,具有自然科学的特点,即较强的数理逻辑推断特性。支撑这门学科的理论基础是概率论与数理统计原理[2]。医学统计学又是一门方法论,其突出的应用功能之一便是帮助我们由事物的数量特征去认识质量特性,即“质量数量化”。归纳起来,统计学主要功能有三:(1)它是认识自然的有力武器,特别是在帮助我们认识和发现事物数量特征和规律的方面具有不可替代的作用,如天气预报就是利用了历史数据来推断未来几天的天气情况。David Freedman曾指出,统计学是对令人困惑费解的问题做出数学设想的艺术[3],它是科学与艺术的完美结合。(2)统计学也是治国和管理的重要手段,这一点在社会科学领域体现得尤为突出,如政府领导通过调查研究可以获得最真实、最可靠、最准确的数据资料,以此了解社情民意,从而解决问题;商业、企业部门利用统计学分析投入效益比;银行等金融机构用统计学管理、规避风险;股票分析师用统计学预测潜力股,预判绩优股;另外,国民生产总值的计算、家电质保期的设定等无不渗透着统计学的思想。(3)医学统计学是进行医学科研的有效工具,这点已是不争的事实。
1 研究对象
统计学的研究对象是观察对象的某些特征或指标,即变量。
统计分析最基本的是随机变量,简称变量[4],即观察对象的特征或测量计数的结果[5]。在纯数学领域,变量即指变化的量,且在具体研究变量间关系时,可用函数关系式描述。医学统计学中的变量,除具有一般变量的特点,即观察结果事先不确定(随个体而不同)外,主要指实验/观察对象的某些特征或指标,如年龄、性别、体重、身高、血压、心率、肺活量等,此处列举变量均为数值(型)变量。另外,还有一类变量,其特点为计数结果,如分男女性别计算的观察单位数,不同血型的人数等。如果再细分,数值型变量又可再分为连续型和离散型两种。统计学正是通过对观察对象(包括人、动物、材料等)的某些特征,即对变量的研究来认识、了解事物,进一步掌握其规律的。案例1:为了解某文科类大学2007年在校男生体质,从该校2007年在校大学生中随机抽取了1 000名男生,分别测量了他们的身高、体重、肺活量、视力等。此例中,身高、体重等即为变量,而我们正是通过对这些变量的研究来了解2007年在校男生的体质情况。
2 研究内容
统计学研究内容为同质事物/生物体的变异性规律。
统计学的研究内容为变量的数量特征和规律,对单个变量,这些数量特征包括集中趋势、离散趋势及频数分布等,对多个变量而言,除研究上述特征外,还包括考察它们之间的关系等。离散趋势,即变异性,在具体研究这种变异性时,要求观察对象具有相同的自然属性/基线条件,即要求同质性。这种变异是同质基础上表现出来的差异性,有了同质,比较才有基础;有了同质,才能形成有若干观察对象的一个群,即总体。所以生物个体如果不同质,便不能形成总体,而生物个体的特征若没有了变异,统计学便没有用武之地。在案例1中,同质即均为2007年在校生且是男生,变异即他们的身高、体重等变量值各不相同。
3 研究方法
统计学的研究方法简述为:立足样本,面向总体。
统计学研究方法的精髓是通过样本来了解、推断总体的特征。在实际生活中这样的例子很多,如一位正在煮饺子的母亲尝过其中一个,便知道锅里饺子的生熟程度;在纳粮入库时,检验员通过随机挖取一勺粮食,就可以了解一袋粮食的情况等。在有些具有破坏性、损毁性的研究中,如汽车轮胎的耐磨系数,灯泡的使用寿命,炮弹的质量等,通过抽样去检验推断总体更是不可或缺的手段。
在抽样和分组时,我们需把握随机化的原则,即使各观察对象有同等被抽取的机会,也有同等机会被分配到实验组和对照组。在案例1中,总体即为该大学2007年在校男生身高、体重、肺活量、视力4个变量值(集合),而样本便是从中抽取的1 000名男生的4个指标的测量结果,随机化过程可结合分层(如按系别先分层)实施,这种随机不一定保证等概率(因为各系人数多少不等),但可以减少实施难度。
4 具体抓手
为了实现通过样本推断总体的目标,我们选用“统计量”作为抓手。
统计学中把描述样本的指标称为统计量,而把描述总体信息的指标称为参数,故常有样本统计量和总体参数之说。如总体均数、总体标准差、总体率等。在案例1中,根据这1 000名男生所得的身高均数、身高标准差等便是统计量,如果有条件能得到2007年所有男生的上述4个变量值,那么所得的这4个相应于总体的值就是参数。当然,我们不会也根本不必要做全部的测量,只需通过统计量,借助合理推断,求得总体参数的一个值(点估计)或一个范围(区间估计)即可。
5 基本步骤
统计的基本步骤为统计设计、搜集资料、整理资料、统计分析4步。
一个完整的统计步骤,除上述4步外,还包含对统计结果的表达、解释和呈现。其中,统计设计必须先于资料收集、搜集及统计分析之前,且统计设计的优劣直接决定着研究质量和成败。统计设计时,既要考虑对照、随机化如何实施,又要考虑样本量大小,此即实验设计三要素。最后对统计结果的表达、呈现和解释,可以用文字叙述,用统计表进行简单明了的展现,也可以选择统计图形象直观地呈现。大多数情况下,我们采用统计表结合统计图的形式,这样二者相辅相成,相得益彰。
6 注意事项
但凡涉及统计学处理,切记抽样误差不可避免,统计结论不能绝对。
从一开始的统计设计到之后的实验或观察,直至最后的统计分析,都要注意尽可能地消除系统误差和偏倚,尽量减小随机误差的发生;在最后做统计结论时,千万不要太绝对,同时应给出可能犯错的概率保证。
[1]罗家洪,徐天和.医学统计学(案例版)[M].北京:科学出版社,2006.
[2]罗家洪,薛茜.医学统计学(案例版)[M].北京:科学出版社,2008.
[3]孙振球,徐勇勇.医学统计学(供研究生用)[M].北京:人民卫生出版社,2002.
[4]徐勇勇.医学统计学[M].北京:高等教育出版社,2001.
[5]蒋庆琅.实用统计分析方法[M].方积乾,译.北京:北京医科大学、中国协和医科大学联合出版社,1998.
G420
A
1671-1246(2012)09-0071-02