“三数”知多少
2017-11-08陈芳
陈芳
一、“三数”的历史背景
历史上,平均数最早是用来估计总体的.公元4世纪,在古印度有一个故事:古印度国王图潘纳发现一棵枝繁叶茂的大树,他想估计这棵树上的树叶和果实的数目.他首先找到根部的一个粗细中等的树枝,并数出上面树叶和果实的数目,用這一个树枝上的树叶和果实数目乘上树枝的数目,从而估算出这颗树上的树叶和果实的总数目.在这个故事中,图潘纳选用粗细中等的树枝作为整棵树枝上树叶和果实的代表值,这可能是算数平均数的直觉使用,因为所选的树枝代表了其余所有的树枝,其数量处于“中间”位置.
平均一词源于海事法,与保险、公平分享利润和损失有关.一般地,平均是把一列累加起来,等量分配到每一个个体,使之相等,体现了一种公平、公正精神的诉求,在引申应用中,平均逐渐指代算术平均数.不同起源的算术平均数表现着它的不同内涵,直到19世纪,历史上的算术平均数才作为一种数据处理方法而出现,和估算有着密切的关系.
1874年,费歇尔试图用天文学中行之有效的方法描述心理和社会现象,他使用了中位数,还号召简化中位数的计算,使用中位数的重要原因是它计算的简化和直觉的清晰性.
二、“三数”的内涵及关系
平均数、中位数和众数这三个统计量的相同之处主要表现在:都是来描述数据集中趋势的统计量;都可用来反映数据的一般水平;都可用来作为一组数据的代表.但它们之间存在着区别,主要表现在以下方面.
1.定义不同.
平均数:一组数据的总和除以这组数据的个数所得到的商叫这组数据的平均数.
中位数:将一组数据按大小顺序排列,如果数据的个数是奇数,那么处在最中间位置的一个数叫做这组数据的中位数;如果数据的个数是偶数,那么处于中间位置的两个数的平均数叫做这组数据的中位数.
众数:在一组数据中出现次数最多的数叫做这组数据的众数.
2.求法不同.
平均数:用所有数据相加的总和除以数据的个数,需要计算才能求出.
中位数:将数据按照从小到大或从大到小的顺序排列,处于最中间位置的数,由位置决定,不需或只需简单的计算.
众数:一组数据中出现次数最多的那个数,不必计算就可求出.
3.个数不同.
在一组数据中,平均数和中位数都具有唯一性,但众数有时不具有唯一性.在一组数据中,可能不止一个众数,也可能没有众数.
4.呈现不同.
平均数:是一个“虚拟”的数,是通过计算得到的,它不是数据中的原始数据.
中位数:是一个不完全“虚拟”的数.当一组数据有奇数个时,它就是该组数据进行排序后最中间的那个数据,是这组数据中真实存在的一个数据;但在数据个数为偶数的情况下,中位数是最中间两个数据的平均数,它不一定与这组数据中的某个数据相等,此时的中位数就是一个“虚拟”的数.
众数:是一组数据中的原数据,它是真实存在的.
5.代表不同.
平均数:反映了一组数据的平均大小,常用来代表数据的总体“平均水平”.
中位数:像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的“中等水平”.
众数:反映了出现次数最多的数据,用来代表一组数据的“多数水平”.
这三个统计量虽反映有所不同,但都可表示数据的集中趋势,都可作为数据一般水平的代表.
6.特点不同.
平均数:与每一个数据都有关,其中任何数据的变动都会引起平均数的变动.主要缺点是易受极端值的影响,这里的极端值是指偏大或偏小数,当出现偏大数时,平均数将会被抬高,当出现偏小数时,平均数会降低.
中位数:与数据的排列位置有关,某些数据的变动对它没有影响;它是一组数据中间位置上的代表值,不受数据极端值的影响.
众数:与数据出现的次数有关,着眼于对各数据出现的频率的考察,其大小只与这组数据中的部分数据有关,不受极端值的影响,其缺点是具有不唯一性,一组数据中众数可能会有一个,也可能会有多个或没有.
7.作用不同.
平均数:是统计中最常用的数据代表值,比较可靠和稳定,因为它与每一个数据都有关,反映出来的信息最充分.平均数既可以描述一组数据本身的整体平均情况,也可以用来作为不同组数据比较的一个标准.因此,它在生活中应用最广泛,比如我们经常所说的平均成绩、平均身高、平均体重等.
中位数:作为一组数据的代表,可靠性比较差,因为它只利用了部分数据.但当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的集中趋势就比较合适.
众数:作为一组数据的代表,可靠性也比较差,因为它也只利用了部分数据.在一组数据中,如果个别数据有很大的变动,且某个数据出现的次数最多,此时用该数据(即众数)表示这组数据的“集中趋势”就比较适合.
(作者单位:江苏省宿迁市泗洪县第一实验学校)endprint