方差教学中的“一般”和“非一般”
2020-12-29广东省佛山市顺德区顺德德胜学校
广东省佛山市顺德区顺德德胜学校
我们在方差教学时常常会遇到这样的问题:
例子市农科所收集统计了甲、乙两种甜玉米各10块试验田的亩产量后,得到其方差分别是0.002、0.001,则()
A.甲种好,因为甲比乙的亩产量稳定
B.乙种好,因为乙比甲的亩产量稳定
C.甲乙均可,因为甲、乙的亩产量稳定性相同
D.无法确定哪一品种的亩产量稳定
很多学生认为答案是B,因为课本P150已有小结“一般而言,一组数据的方差越小,这组数据就越稳定”.问题是—-到底什么情况是“一般”,什么情况又是“非一般”呢?
1 什么是数据的离散程度?
一组数据的“离散程度”与“集中趋势”是一组相对的概念,“集中趋势”刻画的是一组数据中所有数据的共性,“离散程度”则用来描述这组数据中所有数据的差异性.离散程度越小,平均数的代表性越大;离散程度越大,平均数的代表性越小.在北师大版八年级上的数学课本中,就是从平均数对两组数据的差异的描述力不足为切入点,激发学生对数据相对于集中趋势偏离程度的思考.
2 什么是方差?
方差是用每一个数据的离均情况来刻画整组数据的离散程度.为了防止正负偏差相互抵消,将离均情况进行平方之后求和,为了消除数据个数对离均平方和的影响,将差的平方和除以数据个数得到方差.和极差相比较它的优点是每一个数据都参与其中,故具有较好的代表性.
在理解方差的过程中学生仍然会发现一些明显的问题,第一,消除正负偏差的影响,为什么不用绝对值? 因为如果将绝对值作为运算符号来看待,其运算的麻烦程度远高于平方运算,去绝对值符号时候的分类讨论也的确是学生的一个软肋.事实上,平均差也是常见统计量,但因为笔算难度较大不适合对初中生介绍,绝对值函数的特殊性也使得平均差在更为复杂的统计研究中算不上一个性质优良的统计量.第二,离均差进行了平方,会不会将差异扩大(差值大于1)或者缩小(差值小于1)? 也就是说,方差在离均差大于1的数据那儿,是用放大镜在看差异,而在离均差小于1的数据那儿,则是用了缩小镜.这些问题说明了两点:第一,方差是一个刻画数据离散程度的较为方便的方法,但并不是最好的方法;第二,方差的使用并不是无条件的,只有在一定的条件下其对于离散程度的解释才是有意义的.
3 教学时需要注意的“一般”和“非一般”.
在分析了“离散程度”与“方差”两个基本概念之后,我们来看看到底什么是方差的“一般”和“非一般”呢?
第一,初中数学中的方差命题通常是在决策问题当中,例如课本P151 知识技能T1:给出甲乙两个厂的20个螺丝的直径数据,通过计算决策购买哪个厂的螺丝.一般而言,方差小的更稳定,稳定意味着被选择.但在这类实际问题当中,就有可能出现另外一种“非一般”的情况——稳定的那一组数据是稳定在一个相对较低甚至是一个“不合格”的平均数附近,此时方差的差异就不能成为决策的依据.
第二,初中数学中在研究方差时所提供的数据一般都是平均数接近的数据,在这种情况下,方差刻画离散程度的优势显而易见.那么“非一般”的情况是,如果两组数据的平均值相差很大,方差是否还能用来刻画他们的波动情况呢? 比如数据一:1、3、5,易计算得数据二:96、98、100,易计算得如果将数据看做一组学生的成绩,那么数据一可以看做一个5分制的成绩单,很明显三个成绩波动非常大; 数据二可以看做一个百分制的成绩单,三个成绩波动较小.可见,即使是单独比较波动情况而不需要做出决策,方差所表示的意义也受到平均数的约束.为了消除平均数的影响,真正在不同数据间比较数据的波动情况,更好的指标是标准差变异系数这是一个衡量相对波动大小的无量纲的统计量,它不但可以屏蔽平均数的影响,还可以屏蔽数据单位,使不同性质之间的统计数据之间可以进行离散程度比较,但因为标准差的计算比较麻烦,故教材没有在此处对学生介绍.
4 对教学的启发.
由上文可知,文初的那道问题答案应该是D.同时,在方差教学中,我们应该注意以下几个方面的问题:
(1)应该让学生首先自己思考表示离散程度的统计量可能是什么样? 在对思考的结果进行比对和整合,让学生更好的理解方差公式,以及方差这个统计量使用的条件;
(2)在试题的选择和命题上,要注意严谨,不要在细节上误导学生;
(3)对于程度较好的学生以及对统计有兴趣的学生,可以做平均差和标准差变异系数两个统计量的拓展,为以后阶段的统计量学习做好铺垫.