概率与统计高考直击
2018-06-16陈健
陈健
考纲解读
(1)抽样方法的选择、与样本容量相关的计算,尤其是分层抽样中的相关计算,A级要求.
(2)图表中的直方图、茎叶图都可以作为考查点,尤其是直方图更是考查的热点,A级要求.
(3)方差、标准差计算都是考查的热点,B级要求.
(4)随机事件的概率计算,通常以古典概型、几何概型的形式出现,B级要求.
真题感悟
1.(2015·江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为 .
解析:这组数据的平均数为16(4+6+5+8+7+6)=6.
2.(2016·江苏卷)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 .
解析:=4.7+4.8+5.1+5.4+5.55=5.1,
则方差s2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.
3.(2017·江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件.
解析:所求件数为60×3001000=18.
4.(2015·江苏卷)袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机摸出2只球,则这2只球颜色不同的概率为 .
解析:用a表示1只白球,b表示1只红球,c1,c2表示2只黄球,从中一次随机摸出2只球的所有基本事件有如下6种:(a,b),(a,c1),(a,c2),(b,c1),(b,c2),(c1,c2),其中除了(c1,c2)余下的5种均表示取出的两球颜色不同,故所求概率为56.
5.(2016·江苏卷)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是 .
解析:基本事件共有36个.如下:(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6),其中满足点数之和小于10的有30个.故所求概率为P=3036=56.
6.(2017·江苏卷)记函数f(x)=6+x-x2的定义域为D.在区间[-4,5]上随机取一个数x,则x∈D的概率是 .
解析:由6+x-x2≥0,即x2-x-6≤0得-2≤x≤3,根据几何概型的概率计算公式得x∈D的概率是3-(-2)5-(-4)=59.
考点整合
1.概率問题
(1)求某些较复杂的概率问题时,通常有两种方法:一是将其分解为若干个彼此互斥的事件的和,然后利用概率加法公式求其值;二是求此事件A的对立事件的概率,然后利用P(A)=1-P()可得解;
(2)用列举法把古典概型试验的基本事件一一列出来,然后再求出事件A中的基本事件,利用公式P(A)=mn求出事件A的概率,这是一个形象、直观的好办法,但列举时必须按照某一顺序做到不重复,不遗漏;
(3)求几何概型的概率,最关键的一步是求事件A所包含的基本事件所占据区域的测度,这里需要解析几何的知识,而最困难的地方是找出基本事件的约束条件.
2.统计问题
(1)统计主要是对数据的处理,为了保证统计的客观和公正,抽样是统计的必要和重要环节,抽样的方法有三:简单随机抽样、系统抽样和分层抽样;
(2)用样本频率分布来估计总体分布一节的重点是:频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是:频率分布表和频率分布直方图的理解及应用;
(3)用茎叶图的优点是原有信息不会抹掉,能够展示数据分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.
热点聚焦
热点一 统计中的命题热点
1.抽样方法
例1 (1)某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽出55人,其中从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为 .
(2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是 .
解析:(1)由题意可得从高二年级学生中抽取的人数为20400×360=18,故从高三年级学生中抽取的人数为55-20-18=17.
(2)由题意知,将1~35号分成7组,每组5名运动员,落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.
评注:系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.
2.用样本估计总体
例2 (1)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有 株树木的底部周长小于100cm.
(2)某射击选手连续射击5枪命中的环数分别为97,99,101,102,101,则这组数据的方差为 .
解析:(1)由频率分布直方图可知,抽测的60株树木中,底部周长小于100cm的株数为(0.015+0025)×10×60=24.
(2)由题意得这组数据的平均数为15×(9.7+99+10.1+10.2+10.1)=10,则其方差为15×[(97-10)2+(9.9-10)2+(10.1-10)2+(10.2-10)2+(10.1-10)2]=0.032.
评注:(1)频率分布直方图是表达和分析数据的重要工具,求解此类问题的关键是准确把握数与形的相关转换,注意频率分布直方图中每一个小矩形都是等宽的,且宽都等于组距,高是“频率组距”.因此,每一个小矩形的面积表示这一组的频率,所有小矩形的面积之和等于1.(2)准确把握方差的计算公式.
热点二 概率中的命题热点
1.古典概型
例3 (1)从1,2,3,6这4个数中一次随机地取2个数,则所取2个数的乘积为6的概率是 .
(2)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是 .
解析:(1)取两个数的所有情况有:(1,2),(1,3),(1,6),(2,3),(2,6),(3,6),共6种情况.乘积为6的情况有:(1,6),(2,3),共2种情况.所求事件的概率为26=13.
(2)从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,共有6种选法.红色和紫色的花不在同一花坛的有4种选法,根据古典概型的概率计算公式,所求的概率为46=23.
评注:求古典概型概率的关键是求试验的基本事件的总数和事件A包含的基本事件的个数,这就需要正确列出基本事件,基本事件的表示方法有列举法、列表法和树形图法,具体应用时可根据需要灵活选择.
2.几何概型
例4 (1)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是 .
(2)设复数z=(x-1)+yi(x,y∈R),若|z|≤1,则y≥x的概率为 .
解析:(1)如图所示,画出时间轴:
小明到达的时间会随机的落在图中线段AB中,而当他的到达时间落在线段AC或DB时,才能保证他等车的时间不超过10分钟,根据几何概型得所求概率P=10+1040=12.
(2)由|z|≤1可得(x-1)2+y2≤1,表示以(1,0)为圆心,半径为1的圆及其内部,满足y≥x的部分为如图阴影所示,由几何概型概率公式可得所求概率为:
p=14π×12-12×12π×12=π4-12π=14-12π.
评注:几何概型的概率求解,一般要将问题转化为长度、面积或体积等几何问题.在转化中,面积问题的求解常常用到线性规划知识,也就是用二元一次不等式(或其他简单不等式)组表示区域.几何概型的试验中事件A的概率P(A)只与其所表示的区域的几何度量(长度、面积或体积)有关,而与区域的位置和形状无关.
要点总结
1.几何概型与古典概型的异同:几何概型与古典概型是经常用的两种概率模型,二者的共同点是基本事件是等可能的;不同点是几何概型的基本事件数是无限的,古典概型的基本事件数是有限的.
2.在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积和为1.
3.众数、中位数及平均数的异同:众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
4.当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布.
①总体期望的估计,计算样本平均值=1n∑ni=1xi.
②总体方差(标准差)的估计:方差=1n∑ni=1(xi-)2,标准差=方差,方差(标准差)较小者较稳定.
预测训练
1.某报社做了一次关于“什么是新时代的雷锋精神”的调查,在A,B,C,D四个单位回收的问卷数依次成等差数列,且共回收1000份,因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本,若在B单位抽30份,则在D单位抽取的问卷是 份.
2.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为 人.
3.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为 .
4.为了解某校高三学生联考的数学成绩情况,从该校参加联考学生的数学成绩中抽取一个样本,并分成五组,
繪成如图所示的频率分布直方图,已知第一组至第五组的频率之比为1∶2∶8∶6∶3,第五组的频数为6,则样本容量为 .
5.某天下课以后,教室里还剩下2位男同学和2位女同学.若他们依次走出教室,则第2位走出的是男同学的概率是 .
6.盒中有3张分别标有1,2,3的卡片,从盒中随机抽取一张记下号码后放回,再随机抽取一张记下号码,则两次抽取的卡片号码中至少有一个为偶数的概率为 .
7.设x∈[0,π],则sinx<12的概率为 .
8.点P在边长为2的正方形ABCD内运动,则动点P到定点A的距离|PA|<1的概率为 .
预测训练答案与解析
1.60 解析:由题意依次设在A,B,C,D四个单位回收的问卷数分别为a1,a2,a3,a4,则30a2=1501000, ∴a2=200.又a1+a2+a3+a4=1000,即3a2+a4=1000,∴a4=400.设在D单位抽取的问卷数为n,∴n400=1501000,解得n=60.
2.12 解析:按照系统抽样的规则,将840名职工分成42组,每组抽取1人,其中编号481在第25组,编号720在第36组,其中共有12组.因而编号落入区间[481,720]的人数为12.
3.367 解析:由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,x=4.s2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.
4.40 解析:因为第一组至第五组的频率之比为1∶2∶8∶6∶3,所以可设第一组至第五组的频率分别为k,2k,8k,6k,3k,又频率之和为1,所以k+2k+8k+6k+3k=1,解得k=120=0.05,所以第五组的频率为3×0.05=0.15,又第五组的频率为6,所以样本容量为60.15=40.
5.12 解析:已知2位女同学和2位男同学走出的所有可能顺序有(女,女,男,男),(女,男,女,男),(女,男,男,女),(男,男,女,女),(男,女,男,女),(男,女,女,男),所以第2位走出的是男同学的概率P=36=12.
6.59 解析:對立事件为:两次抽的卡片号码中都为奇数,共有2×2=4种抽法.而有放回的两次抽了卡片共有3×3=9种基本事件,因此所求事件概率为1-49=59.
7.13 解析:由sinx<12且x∈[0,π],借助于正弦曲线可得x∈[0,π6]∪[5π6,π],∴P=π6×2π-0=13.
8.π16 解析:在正方形ABCD中,其中满足动点P到定点A的距离|PA|<1的平面区域如图中阴影所示,则正方形的面积S=4,阴影部分的面积S阴影=π4,故动点P到定点A的距离|PA|<1的概率P=π16.