APP下载

聚焦统计学习中的数学素养

2019-02-26吕泽晟

中学生数理化·高一版 2019年2期
关键词:样本容量平均数回归方程

■吕泽晟

高考对统计的考查主要是围绕三种抽样方法、样本的数字特征、用样本估计总体以及线性相关性和回归方程等展开的,凸显数据收集处理以及运算推理素养的应用。

聚焦1:三种抽样方法

例1某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本,如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果样本容量增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n的值。

解:明确系统抽样的间隔和分层抽样的抽样比是解决问题的关键。总体容量为6+12+18=36。当样本容量为n时,由题意知系统抽样的间隔是分层抽样的抽样比是,所以抽取工程师人数为,技术员人数为,技工人数为,可知n应是6的倍数,36的约数,即6,12,18,24。当样本容量为时,总体容量是35,系统抽样的间隔为,因为必须是整数,所以n只能取6,即样本容量n=6。

素养:三种抽样在抽样过程中,每个个体被抽到的可能性相等,三种抽样之间又相互联系,对抽取的样本来说,可谓异曲同工。在抽样时应结合三种抽样方法的特点和实际情况,灵活选择抽样方法解决问题。

聚焦2:计算样本的数字特征

例2某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下其中分别表示甲组研发成功和失败分别表示乙组研发成功和失败。

若某组成功研发一种新产品,则给该组记1分,否则记0分。试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平。

解:由研发成功与否,转化为得分情况,求出其平均数与方差,再依据数字特征来比较两组的研发水平。

甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数为,易得方差

乙组研发新产品的成绩为1,0,1,1,0,

素养:平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义。平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小。

聚焦3:用样本估计总体

例3从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:h)的数据,整理得到数据分组及频数分布表(如表1)和频率分布直方图(如图1)。

表1

图1

(1)从该校随机选取1名学生,试估计这名学生该周课外阅读时间少于12h的概率。

(2)求频率分布直方图中a,b的值。

(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论)。

解:(1)根据频数分布表,可知100名学生中课外阅读时间不少于12h的学生人数为6+2+2=10,所以样本中的学生课外阅读时间少于12h的频率是,即从该校随机选取1名学生,估计这名学生该周课外阅读时间少于12h的概率为0.9。

(2)课外阅读时间落在区间[4,6)上的有17人,频率为0.17,所以

课外阅读时间落在区间[8,10)上的有25人,频率为0.25,所以

(3)估计样本中的100名学生课外阅读时间的平均数在第4组。

素养:样本数据的频率(数)分布表和频率分布直方图,反映整个样本数据的频率分布情况,并由此可估计总体的分布情况。

聚焦4:线性相关性与线性回归方程

例4表2提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(t)与相应的生产能耗y(吨标准煤)的几组对应数据。

表2

(1)请画出表2中的数据的散点图。

(2)根据表2提供的数据,用最小二乘法求出y关于x的线性回归方程

(3)已知该厂技术改造前100 t甲产品能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100 t甲产品的生产能耗比技术改造前降低多少吨标准煤。(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)

解:(1)把产量x作为横坐标,相应的生产能耗y作为纵坐标,在直角坐标系中描点(xi,作出散点图如图2所示。

图2

(2)由图可知,这些点大致分布在一条直线附近,故生产甲产品的产量x和相应的生产能耗y的线性相关关系显著,所以求回归直线方程是有意义的。

(3)当x=100 时,70.35,所以预测生产100t甲产品的生产能耗比技术改造前降低90—70.35=19.65(吨标准煤)。

素养:利用散点图判断两个变量是否具有相关关系是比较简便的方法。由部分数据得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性的相关关系问题转化成确定性的函数关系问题进行研究的。由于回归直线将部分观测值所反映的规律进行延伸,所以它在情报预测、资料补充等方面有着广泛的应用。

猜你喜欢

样本容量平均数回归方程
加权平均数的应用
采用直线回归方程预测桑瘿蚊防治适期
采用无核密度仪检测压实度的样本容量确定方法
走进回归分析,让回归方程不再是你高考的绊脚石
广义高斯分布参数估值与样本容量关系
多种检测目标下样本容量设计的比较
两类错误条件下方差检验中样本容量的确定