趣谈数据的“三个代表”
2024-05-24周奕生
周奕生
“数据家族”要召开年终总结大会了!这不,三个重要“代表”已经在主席台上就位.下面就给大家逐一介绍一下.
一 老“代表”——平均数
平均数是大家熟悉的老代表.它德高望重,深受人们的爱戴,是衡量数据平均水平的特征数,对于n个数据x1,x2,…,xn其平均数计算公式是:x=1/n(x1+x2+…xn).由此可以发现,平均数的大小与每个数据都有关,它对数据信息的反映是最充分、最有代表性的,因此应用广泛,例如,比较甲、乙两人学习成绩的高低,平均数的大小是最能说明问题的.但平均数也有它的局限性,有些情况下是不能用平均数来衡量的.例如,据水文站测定,某条河的平均水深为0.6m,身高1.5m的小新准备到这条河里练习游泳,不能认为水深的平均数小于小新的身高,就错误地认为没有危险.这说明平均数虽然应用广泛,但并非是万能的.
二 中层“代表”——中位数
中位数是一位代表数据中坚力量的后起之秀,它是衡量数据大小居中水平的一个特征数.把一组数据按从小到大(或从大到小)的顺序依次排列后,位于最中间位置的那一个数据或最中间那两个数据的平均数,叫作这组数据的中位数.如3,8,7,0,6这五个数,从小到大排列为0,3,6,7,8,最中问的数是6,所以这组数据的中位数是6.又如,1,5,6,8,10,12,最中间的数是6和8,而6和8的平均数是7,所以这组数据的中位数是7.
中位数的大小虽然与每个数据的大小有关,但当一组数据按从小到大的顺序排列后,中位数的大小却又同时与这组数据的最大数和最小数无关.这也就是说,把一组数据的最大数和最小数同时去掉并不影响中位数的大小.
一般地,当一组数据中出现极端值(特别大或特别小的数据)时,用中位数往往比平均数更能说明问题.
三 群众“代表”——众数
众数是一位最能代表广大群众利益的新代表,它是衡量数据集中趋势的一个特征数,在一组数据中,出现次数最多的数据叫作这组数据的众数,众数与数据的大小和排列顺序无关,只与出现次数最多的数据有关,一组数据的众数可能是一个也可能是多个,如3,5,8,3,5,2,5这组数据中,5出现了3次,其他的都是出现1次或2次,因此这组数据的众数是5.又如3,7,8,9,8,3,10,6这组数据,3和8都出现了2次,其余的都出现1次,因此,这组数据的众数是3和8.众数这个新代表虽然没有平均数和中位数那两位代表的名聲高、作用大,但它的作用也不容小觑,比如,商店在销售服装、鞋类时,往往要了解的是哪种商品最畅销,此时就需要用到众数.