“以想代算”在统计问题中的应用
2020-12-14福建林红红
◇ 福建 林红红
(作者单位:福建省龙岩市第二中学)
利用样本数据估计总体的数字特征是统计学的重要应用.数字特征主要包括平均数、中位数、众数、方差、标准差等,这些数字特征虽然都有相应的计算方法,但有些问题的求解中只要求我们比较某两个量的大小,或其在统计图表中的位置,因此这些量是不需要计算的.只要我们能把握相应数字特征的具体含义,便可以想代算,简捷处理.
1 准确利用数字特征的含义
例1某影视公司推出了一部影片,为了解观众对该影片的满意度,从甲、乙两地分别随机调查了100位观众,根据观众对该影片的满意度评分,分别得到两地观众满意度评分的频率分布直方图(如图1).
图1
若甲、乙两地观众满意度评分的中位数分别为m1,m2,标准差分别为s1,s2,则下面所给关系中正确的是( ).
A.m1>m2,s1>s2B.m1>m2,s1<s2
C.m1<m2,s1<s2D.m1<m2,s1>s2
首先要明确数字特征的具体含义.中位数,即数据的中间数,是衡量集中趋势的一种方法.标准差,方差的平方根,能反映数据的离散程度.
本例以频率分布直方图为背景,中位数左、右两侧直方图的面积相等.故观察两图可知,m1在60~70之间,m2在70~80之间,所以m1<m2.从图容易看出,甲地区数据的离散程度大于乙地区数据的离散程度,所以s1>s2.故选D.
2 深度挖掘数字特征的本质
例2某网上商城对某时间在该网站购物的顾客中随机抽取10000名进行统计调查,将这10000名顾客按年龄分成5组,即[10,20),[20,30),[30,40),[40,50),[50,60],并整理得到频率分布直方图(如图2所示).
图2
(1)求a 的值;
(2)估计该时间在该商城网络购物顾客的平均年龄.
(1)a=0.035(求解过程略).
(2)根据题意,平均年龄估计为15×0.1+25×0.35+35×0.3+45×0.2+55×0.005=32.5(岁).
3 巧妙借助数字特征间的关系
图3
例3据研究得出,空气的相对湿度较大或较小时,都有利于某种细菌的繁殖、传播.经科学测定,在相对湿度大于65%或小于40% 时,该 细 菌繁殖滋生较快,当相对湿度在45% ~ 55% 时,该细菌死亡较快.现根据部分城市空气月平均相对湿度的300个数据,得到如图3所示的统计图(其中为了记录方便,将空气相对湿度在a%~b%时记为区间[a,b)).若同一组中的每个数据可用该组区间的中点值代替,则估计样本中空气月平均相对湿度的平均数所在的区间为________.
求样本的平均值时,若数据中含有极端值,则平均数并不能准确反映样本的平均水平,而中位数可以起到反应平均水平的作用.因此,为了简化计算,可用中位数的值来代替平均值.采用这种方法可知,相对湿度的平均数所在的区间为[65,75).