统计分析在测评资料中的应用
2012-12-14姜波
姜波
【摘 要】 测评资料包括定性资料与定量资料,测评资料的统计与分析实际上是通过搜集、整理与分析的形式,对测评资料进行一次量化、二次量化、类别量化、顺序量化、当量量化及其运算的过程。下面按照实际的统计过程,分资料的搜集、资料的整理和资料的分析三个部分来介绍人员测评研究与实践中所需的统计学基本知识与基本方法。
【关键词】 统计分析测评资料应用
1. 测评资料的搜集
搜集测评的信息资料或搜集测评数据是测评过程中进行统计工作的第一个阶段,是全部统计工作的基础。常用的搜集方法大致省三种:一是收集,即从日常的工作记录、统计报表、档案资料中搜集。二是抽样调查,即采用科学的方法和手段深入实际搜集客观资料的一种方法。在抽样调查中,又有随机抽样(亦称无限制抽样)、分层抽样、多阶抽样、集团抽样和系统抽样五种形式。实践表明,把其中的多阶抽样与分层抽样结合起来,是抽样中最好的一种抽样方法。最后一种是测量,即依据一定的标准和系统的法则来把所测评对象的特质或度量的等级以数字记录下来,这些数据就是可以用于统计的资料。
2. 测评资料的初步整理
测评资料的统计分类又称统计分组。这是对测评资料进行初步整理的第一步工作。分类时所依据的特征称为分类的标志,分类标志按形式可分为性质标志和数量标志两种,也就是说分类的类别按形式分,可分为性质类别和数量类别两大类。性质类别反映测评对象所属组别与种类的不同。例如将测评客体按男女或年龄来分组,就是属于性质类别。数量类别就是将测评数据按其数值大小排列出一个秩序来。
2.1统计表。
统计表是以表格形式表达测评数据关系的重要工具,它可以化繁为简地反映表中各类测评对象或数据的情况,便于分析、对比、计算和记忆。统计表的形式通常有简单表、分组表和复合表三种。制表应该符合有关的基本原则。首先,要求表的结构简单明了。一张表只能有一个中心,避免包罗万象的大表。其次,要求表的层次清楚。项目排列要按照逻辑顺序合理安排。制表的具体要求是:①标题应简明扼要说明表的内容;②表的内容应分别以横、纵、总概等标题加以说明;③数据书写精确度要整齐划一;④表中的横竖线条不宜过多。表两侧的竖线可以省去。
2.2频数分布表。
频数分布表也称次表分布表。常见的有简单频数分布表、累积频数分布表和累积百分比分布表三种形式。
编制简单频数分布表的步骤是:①求全距:H=A—B,A、B分别为测评数据中的最大、最小的数值。②决定组数与组距。欲将所有数据分成若干组时,要先确定组数和组距。组数一般以10一15个为宜。组数确定后,则组距可以利用公式i=全距/组数来求。组距一般以3、5、7等奇数个单位为好。但有时也可先定组距之后再求组数;③决定组限。组限就是每组测评数据的起止范围。每组数据的最低值为下限,最高值为上限。组中值=(上限+下限)/2;④登记频数。分好组后,就可以将每个测评数据归入相应的组内,并以符号I、II、III或“正”字逐个登记,然后求出每组内的总数f。
2.3频数分布图及其绘制方法
2.3.1统计图。
统计图是以点、线、面、体来表示各种数据间关系及其变动情况的重点工具。它形象直观,便于整体比较。常见的统计图有条形、圆形、曲线形和象形图几种。制图的基本规则常有以下几条:①根据资料的性质和分析的目的。正确选择适合的图形;②图的标题要简明扼要,切合图的内容,标题一般写在图形的下方;③图的尺度线与图形基线要垂直。尺度分点要清楚,以便于读数和计数。不能用同—尺度表示性质不同的两种计数单位;④图的横坐标与纵坐标的数字,分别是按笛卡儿坐标形式自左向右、由小到大、自上而下、由大到小排列的;⑤图中线条的粗细,应依其重要性而区别;⑥在同一个图例中比较两个对象时,使用的比例要相同。数量大小最好用条形图的长短来表示,而固定其宽度;⑦图形中,如有必要分别加解释的地方,可用图注加以说明。图注应简明扼要,字体要小并写在图题的下方;⑧为了美观易看,对于有纵横轴的图形,其高度与宽度之比以接近3:5为宜。
2.3.2频数分布图
频数分布图也称次数分布图,是以曲线或折线来表示相应的频数分布表的—种统计图。常见的有直方图与多边图两种。直方图是以面积表示频数的分布,即用位于横轴上各组上下限之间的矩形面积,表示各组频数分布的情形。其作法如下:①作横轴,然后把各组的上下限或组中值分别于横轴上,但要在横轴的两端至少各空一个组距的位置;②作纵轴,在纵轴上标尺度及单位以表示频数;③按各组的频数定出在纵轴上的高度并作出与横轴平行的直线,这一直线便于与相加的上下限延长线交成一个直立矩形。由于横轴上各组距之间是连续的,故所有的矩形组成一个并立的直方图。多边图是以相应纵轴上的高度点来表示频数分布的图形。它的制作可以在直方图的基础上进行。所不同的是,它以各组的组中值点为横坐标,以各组的频数为纵坐标描出相应的代表点来,然后用直线段把相邻的两点连接起来.最后形成一根起于或止于横轴的折线。当其起止点均在横轴上,这一折线就与横线构成一个封口的多边图形。
3. 测评资料的分析
经过对测评数据与资料的归类、列表、绘图等初步整理工作后,测评对象的面貌和某些特征可能已经反映出来了。要进一步把握测评对象的本质特征,就必须进一步做些分析工作,分析与计算出一些统计量数来。一般只要进行如下一些测评数据分析工作:集中量数的计算、差异量数的计算、相关与回归的分析、总体平均数与比率的推断、显著性检验以及方差分析等。下面分别进行扼要介绍。
3.1集中量与差异量
集中趋势和离中趋势是测评数据频数(次数)分布的两个基本特征。前者是反映关于在分布中大量测评数据向某点集中的情况,它一般以集中量数来描述;后者是反映关于测评数据分布中大量数据彼此离散的情况,它一般以差异量数来描述。
所谓集中量数,指的是一组同类测评数据的代表数值,它表明了该测评对象群体的数量特征。它一般用来进行测评对象群体间的比较,以判明某一测评对象群体与另一测评对象群体的差别。
3.2差异检验法
当计算出两个人在50项测评指标各自得分的平均数、相关系数或其他统计量后,发现它们彼此不同时,为了确定其差异的程度,常常要进行显著性检验,即确定这种差异程度到底如何。
显著性检验也是统计推断的一种方法,它可以用来确定一个具有已知统计量的样本是不是来自某一个确定的总体。换句话说,样本统计与总体统计量的差异究竟是由于抽样所引起的随机误差造成的,还是两者之间存在实质上的差异,这也需要过异性检验才能确定。比如,某企业员工素质测评平均成绩为75分,人力资源部从某车间中随机抽取了26名员工,其测评平均成绩为76.6分,显然这26名员工的平均成绩比整个企业的平均成绩最高1.6分,但能否由此就说,该车间的员工素质水平比整个企业的员工素质高呢?还不能。因为产生1.6分的差异的原因可能有两个:一是抽样引起的,例如刚好抽到该车间一些素质较好的员工;二是该车间员工的素质水平的确高于整个企业其他部门员工的素质。要判断这种差异到底是由哪一种原因引起的,就需要进行显著性检验。因此,无论是两个样本统计量之间差异的显著性检验,还是样本与总体之间的差异的显著性检验,其目的都是确定差异是实际的还是抽样不当造成的。在这种两者必居其一的选择中,如果否定了其中之一也就相应肯定了另一个选择。因此,若否定了差异是由抽样误差造成的,则就肯定了差异是实际存在的。但事实上,很难有百分之百的把握断定差异是或不是由抽样误差造成的,一般只能进行大概的判断,这就要求我们借助于概率论的理论了。
参考文献:
[1] 黄明凤 兵团现代农业发展测评与分析[J]统计教育2009年03期.
[2] 周少华 统计分析在干部综合考评中的运用[J]党建研究2007年09期.
(作者单位:黑龙江农垦经济调查队)