APP下载

统计常见典型考题赏析

2019-02-26张文伟

中学生数理化·高一版 2019年2期
关键词:中位数直方图频率

■张文伟

题型一:简单随机抽样

(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况。(2)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便,二是号签是否易搅匀。一般地,当总体容量和样本容量都较少时可用抽签法。

例1某班级有男生20人,女生30人,从中抽取10人作为样本,其中一次抽样结果是抽到了4名男生、6名女生,则下列命题正确的是( )。

A.这次抽样可能采用的是简单随机抽样

B.这次抽样一定没有采用系统抽样

C.这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率

D.这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率

解:这次抽样可以采用的是简单随机抽样,A正确。这次抽样可以采用系统抽样,男生编号为1~20,女生编号为21~50,间隔为5,依次抽取1号,6号,…,46号即可,B错误。这次抽样中每个女生被抽到的概率等于每个男生被抽到的概率(等可能抽样),C和D错误。应选A。

跟踪练习1:总体由编号为01,02,…,19,20的20个个体组成。利用随机数表(如表1)选取5个个体,选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )。

表1

提示:选出的5个个体的编号依次是08,02,14,07,01。应选D。

题型二:系统抽样

系统抽样的步骤:①先将总体的N个个体编号。②确定分段间隔k(k∈N*),对编号进行分段,当(n是样本容量)是整数时,取③在第1段用简单随机抽样确定第1个个体编号l(l≤k)。④按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加上k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本。

例2为规范学校办学,省教育厅督察组对某所高中进行了抽样调查。抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号,33号,46号同学在样本中,那么样本中还有一位同学的编号应是( )。

A.13 B.19 C.20 D.51

解:由系统抽样的特点,可知抽样的间隔为,故抽取的样本的编号分别为7,7+13,7+13×2,7+13×3,即7,20,33,46。应选C。

跟踪练习2:将参加夏令营的600名学生按001,002,…,600进行编号。采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003。这600名学生分别住在3个营区,从001到300在第一营区,从301到495在第二营区,从496到600在第三营区,这3个营区被抽中的人数依次为( )。

提示:由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每组各有12名学生,第k(k∈N*)组抽中的号码是3+12(k—1)。令3+12(k—1)≤300,得k≤,因此第一营区被抽中的人数是25。令300<3+12(k—1)≤495,得,因此第二营区被抽中的人数是42—25=17,由此可得第三营区被抽中的人数为50—25—17=8。应选B。

题型三:分层抽样

分层抽样的常见求法:①依据各层总数与样本数之比,求出抽样比。②直方图中纵轴表示由某层总体个数(或样本数)求出该层的样本数(或总体个数)。③利用抽样比,求出各层的样本数。

例3甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测。若样本中有50件产品由甲设备生产,则乙设备生产的产品总件数为____。

解:分层抽样中各层的抽样比相同。若样本中甲设备生产的有50件,则乙设备生产的有30件。在4800件产品中,甲、乙设备生产的产品总数比为5:3,所以乙设备生产的产品的总件数为

跟踪练习3:某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查。已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取的学生人数为____。

提示:由分层抽样的特点,可知从一年级本科生中应抽取的学生人数为300=60。

题型四:频率分布直方图

解决频率分布直方图问题要注意的几点:①直方图中各小长方形的面积之和为1。,每组样本的频率,即小长方形的面积。③直方图中每组样本的频数=频率×总体数。

例4在样本的频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个小长方形的面积和的,且样本容量为140,则中间一组的频数为( )。

解:设中间一个小长方形的面积为x,则其他8个小长方形的面积为x。由x+,解得,所以中间一组的频数为应选B。

跟踪练习4:某校为了解高一年级全体学生的体能情况,抽取了部分学生进行1m i n跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图1所示),图中从左到右各小长方形的面积之比为2:4:17:15:9:3,第二小组的频数为12。

图1

(1)第二小组的频率是多少?样本容量是多少?

(2)若次数在110以上(含110次)为达标,则该校高一年级全体学生的达标率是多少?

提示:(1)频率分布直方图是以面积的形式反映数据落在各小组内的频率大小的,因此第二小组的频率为0.08。又因为第二小组的频率=所以样本容量 =

(2)由频率分布直方图可估计该校高一年级全体学生的达标率为

题型五:茎叶图

由茎叶图可以清晰地看到数据的分布情况,这与频率分布直方图类似。从茎叶图中能看到原始数据,没有任何信息损失,茎叶图便于记录和表示。当样本容量较大时,作图较烦琐。

例5图2所示的茎叶图是某班学生在一次数学测试时的成绩。

图2

根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )。

A.15名女生成绩的平均分为78

B.17名男生成绩的平均分为77

C.女生成绩和男生成绩的中位数分别为82,80

D.男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重

解:由图可知15名女生成绩的平均分为78,A正确。17名男生成绩的平均分为77,B正确。观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确。根据女生和男生成绩数据分析可得两组数据的中位数均为80,C错误。应选C。

跟踪练习5:在某杂志的一篇文章中,每个句子中所含的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17。在某报纸的一篇文章中,每个句子中所含的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22。

(1)将这两组数据用茎叶图表示。

(2)将这两组数据进行比较分析,得到什么结论?

提示:(1)画出茎叶图,如图3所示。

图3

(2)杂志文章中每个句子的字数集中在10~30之间,中位数为22.5;而报纸文章中每个句子的字数集中在10~40之间,中位数为27.5。可以看出杂志文章中每个句子的平均字数比报纸文章中每个句子的平均字数要少,说明杂志作为读物更通俗易懂、简明扼要。

题型六:样本的数字特征

平均数和方差都是重要的数字特征,是对总体的一种简明的阐述。平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小。平均数、方差公式的推广:若数据的平均数为x,方差为s2,则数据的平均数为方差为

例6为了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1m i n仰卧起坐的成绩(次数),将数据整理后绘制成如图4所示的频率分布直方图,根据统计图的数据,下列结论错误的是( )。

图4

A.该校九年级学生1m i n仰卧起坐的次数的中位数为26.25

B.该校九年级学生1m i n仰卧起坐的次数的众数为27.5

C.该校九年级学生1m i n仰卧起坐的次数超过30的人数约为320

D.该校九年级学生1m i n仰卧起坐的次数少于20的人数约为32

解:由频率分布直方图可知,中位数是频率分布直方图中的左右面积等分线对应的数值(横坐标),容易判断中位数位于第三组,可计算得到中位数为26.25。众数是最高小矩形底边中点的横坐标,即众数为27.5。1m i n仰卧起坐的次数超过30的频率为0.04×5=0.2,所以估计1m i n仰卧起坐的次数超过30的人数为320。1m i n仰卧起坐的次数少于20的频率为0.1,所以估计1m i n仰卧起坐的次数少于20的人数为160。应选D。

跟踪练习6:甲、乙两位选手参加射击选拔赛,其中连续5轮比赛的成绩(单位:环)如表2所示。

表2

则甲、乙两位选手中成绩最稳定的选手的方差是____。

题型七:线性回归方程及其应用

求回归直线方程前应通过散点图或相关系数进行相关性检验,确定是否有必要根据公式求回归直线方程,从而有依据地进行预测。求线性回归方程的步骤:①计算②计算③计算系数b=;④写出回归方程

例7在一组样本数据(x1,y1),(x2,的散点图中,若所有样本点都在曲线附近波动,经计算,则实数b的值为____。

解:令t=x2,则曲线方程变为线性回归方程,即,此时,把的坐标代入可得,解得

跟踪练习7:某单位为了制订节能减排的计划,随机统计了某4天的用电量y(单位:度)与当天气温x(单位:℃),并制作了对照表(如表3)。由表中数据,得线性回归方程,当某天的气温为—5℃时,预测当天的用电量约为____度。

表3

提示:气温的平均值10—1)=10,用电量的平均值34+38+64)=40。因为回归直线必经过样本中心点,所以40=—2×10+a,解得a=60,故回归方程为

为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图5所示的散点图(x轴,y轴的单位长度相同),用回归直线方程ˆy=b x+a近似地刻画其相关关系,根据图5,以下结论最有可能成立的是( )。

图5

A.线性相关关系较强,b的值为1.25

B.线性相关关系较强,b的值为0.83

C.线性相关关系较强,b的值为—0.87

D.线性相关关系较弱,无研究价值

提示:由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且为正相关,所以回归直线方程的斜率为正数。从散点图观察,回归直线方程的斜率应该比直线y=x的斜率要小一些。应选B。

猜你喜欢

中位数直方图频率
符合差分隐私的流数据统计直方图发布
振动与频率
用直方图控制画面影调
中位数计算公式及数学性质的新认识
极限频率
基于空间变换和直方图均衡的彩色图像增强方法
基于直方图平移和互补嵌入的可逆水印方案
导航频率源的同步与控制
导学案不能沦落为“习题单”:以“中位数和众数”的导学案为例
大跨人行天桥的自振频率初探