探析高考中概率统计系列试题及命题走向(下)
2020-03-02王慧兴特级教师
王慧兴(特级教师)
3 概率应用
概率计算被广泛应用于我们生活与生产当中,近些年高考命题无一例外地以概率计算为背景立意数学应用试题.但考查的知识点全部基于教材(如表4),坚持学什么考什么立意的命题原则.
表4 概率应用
3.1 随机变量
表5
一位旅客8:20到站,求他候车时间的数学期望.
表6
因此,该旅客候车时间X的数学期望为
(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0.
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
(ⅰ) 若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX;
(ⅱ) 以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验.
令f′(p)=0,得p=0.1.当p∈(0,0.1)时,f′(p)>0;当p∈(0.1,1)时,f′(p)<0,所以f(p)的最大值点p0=0.1.
(2) 由(1)知,p=0.1.
(ⅰ) 令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),则X=20×2+25Y,即X=40+25Y,所以EX=E(40+25Y)=40+25EY=490.
(ⅱ) 如果对余下的产品作检验,则这一箱产品所需要的检验费为400元,由(ⅰ)可知EX>400,故应该对余下的产品作检验.
3.2 统计分析
表7 未使用节水龙头50天的日用水量频数分布表
表8 使用了节水龙头50天的日用水量频数分布表
(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图.
图1
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表).
图2
(2)根据图2中的数据,易知该家庭使用节水龙头后,日用水量小于0.35 m3的频率为
0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此,该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.
(3) 由题意知,该家庭未使用节水龙头50天日用水量的平均数
该家庭使用了节水龙头后50天日用水量的平均数
因此,估计该家庭使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45 m3.
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ) 试说明上述监控生产过程方法的合理性;
(ⅱ) 若检验员在一天内抽取的16个零件的尺寸如表9所示.
表9
经计算得
其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
附:若随机变量Z服从正态分布N(μ,σ2),则
P(X≥1)=1-P(X=0)=1-0.997416≈0.0408.
X的数学期望EX=16×0.0026=0.0416.
(2) (ⅰ)如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程中可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
因此μ的估计值为10.02.
3.3 相关分析
图3
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
利用模型②,该地区2018年的环境基础设施投资额的预测值为
(2)利用模型②得到的预测值更可靠,理由如下.
(ⅱ) 从计算结果看相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值增幅比较合理,说明利用模型②得到的预测值更可靠.
3.4 统计案例
第一种生产方式第二种生产方式86556899762701223456689877654332814452110090
图4
(1) 根据茎叶图判断哪种生产方式的效率更高,并说明理由;
(2) 求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入表10中.
表10
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
表11
(ⅰ) 由茎叶图可知,用第一种生产方式,有75%的工人完成生产任务所需时间至少80min,用第二种生产方式,有75%的工人完成生产任务所需时间至多79min,因此,第二种生产方式的效率更高.
(ⅱ) 由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间的中位数为85.5min,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5min,因此,第二种生产方式的效率更高.
(ⅲ) 由茎叶图可知,用第一种生产方式的工人完成生产任务平均所需时间高于80min;用第二种生产方式的工人完成生产任务平均所需时间低于80min,因此,第二种生产方式的效率更高.
(ⅳ) 由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间分布在“茎8”上的最多,关于“茎8”大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在“茎7”上的最多,关于“茎7”大致呈对称分布,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.
以上给出的4种理由,考生答出其中任意1种或其他合理理由均可得分.
表12
4 数学建模
从数学学科核心素养看,数学建模是应用数学知识和方法解决实际问题的基本手段,也是推动数学发展的动力.高中数学教育肩负着发展学生关键能力、培育数学素养与提升数学境界的时代重任.因此,教师在教学设计时,应注重应用信息技术建构数学动态模拟试验,以应对大数据时代的变化,引领学生学习数据处理方法,培养学生数据分析与计算能力,以教学方式转变引领学生学习方式转变.同时,高考命题已经直击数学建模,以数学模型的方式检测学生数据分析与数学计算能力,引领数学教育注重数学建模,以培育学生数学应用意识,概率统计问题一跃成为压轴题就是一个明确的信号——数学建模真的来了. 从这一信号也可以预见随着数学学科核心素养的深入落实,注定会将数学建模引入高考试题,同时也流露出将会从考查模型的方式命制试题.例如,由命题组构建一个数学模型,针对数据捕获、数据分析与运算、检验与评价模型等进行考查,进而逐步把数学建模能力的考查引入高考试题.
(1)求X的分布列;
(2)若甲药、乙药在试验开始时,都赋予4分,pi(i=0,1,2,…,8)表示“甲药累积得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,
pi=api-1+bpi+cpi+1(i=1,2,…,7),
其中a=P(X=-1),b=P(X=0),c=P(X=1).假定α=0.5,β=0.8.
(ⅰ) 证明:{pi+1-pi}(i=0,1,2,…,7)为等比数列;
(ⅱ) 求p4,并由p4值解释该试验方案的合理性.
P(X=0)=αβ+(1-α)(1-β),P(X=1)=α(1-β).
随机变量X的分布列如表13所示.
表13
(2) 根据(1)可得
即pi+1=5pi-4pi-1(i=1,2,…,7).
①
(ⅰ) 对①作同构转化,得
pi+1-pi=4(pi-pi-1) (i=1,2,…,7).
若p1-p0=0,则pi-pi-1=0,∀1≤i≤8,所以{pn}是常数列,1=p8=p0=0矛盾,故p1-p0≠0,所以{pi+1-pi}(i=0,1,2,…,7)是公比为4,首项为p1的等比数列.
(ⅱ) 由增量恒等式,得
②
③
由②③消去p1,得
由试验数据得出p4≈0.00389,按其定义p4=P(∑X+4=4)=P(∑X=0),表示在甲药累计得0分,被认为比乙药更有效的概率是0.00389,这是一个小概率事件,表明试验数据与甲、乙两种新药的统计数据“甲药治愈率为0.5,乙药治愈率为0.8”相符(在甲药治愈率明显低于乙药治愈率的前提下,试验得出甲药反而更有效,这种可能性应该很小,也就是错误判断两种药物有效性的概率极低),因此,该试验方案合理.
简评本题是以新药效果试验为题根的数学应用问题,题目新颖别致,替代导数应用问题作为试卷压轴题,释放来年新高考信号:数学建模将引入新高考试卷,很可能会继续作为压轴题出现. 但题目给出数据pi的关系式,学生一不小心就会看错题,有一定的误导性. 如果把已知p0,p8以及数列{pi}的递推关系改为由学生建立,既能回避这个问题,更能深入检测学生对数学本质的理解.
事实上,每一轮试验两种药物得分之和都是0分,所以两种药物累计得分一直是8分,p0表示“甲药的累积得分为0时,最终认为甲药比乙药更有效”的概率,这时,乙药累计得分恰好是8分,因此乙药比甲药多治愈4只小白鼠,试验停止,所以这时甲药被认为比乙药更有效的概率是0,即p0=0.同理,p8=1.
因为甲药累计得分为i对应的事件是3个事件的和事件:甲药累计得分为i-1,再进行一轮试验,甲药又得1分,由每轮试验的独立性,可知这一事件的概率为p(X=1)·pi-1=a·pi-1;甲药累计得分为i,再进行一轮试验,甲、乙均得0分,这一事件概率为p(X=0)·pi=b·pi;甲药累计得分为i+1分,再进行一轮试验,甲药得-1分,这一事件的概率为p(X=-1)·pi+1=c·pi+1. 由互斥性,可得pi=api-1+bpi+cpi+1(i=1,2,…,7)(注意:这个构建过程本质上是基于全概率公式,但由独立性,相应的条件概率简化了).
2010年,苏淳教授也命制过一个“漂亮”的模型检验试题,如例15.
现设n=4,分别以a1,a2,a3,a4表示第一次排序时被排为1,2,3,4的四种酒在第二次排序时的序号,并令X=|1-a1|+|2-a2|+|3-a3|+|4-a4|,则X是对两次排序的偏离程度的一种描述.
(1)写出X的可能值集合;
(2)假设a1,a2,a3,a4等可能地为1,2,3,4的各种排列,求X的分布列;
(3)某品酒师在相继进行的三轮测试中,都有X≤2.
(ⅰ)试按(2)中的结果,计算出现这种现象的概率(假定各轮测试相互独立);
(ⅱ)你认为该品酒师的酒味鉴别功能如何?说明理由.
在1,2,3,4中奇数与偶数各有两个,所以a2,a4中的奇数个数等于a1,a3中的偶数个数,因此|1-a1|+|3-a3|与|2-a2|+|4-a4|的奇偶性相同,从而X=(|1-a2|+|3-a3|)+(|2-a2|+|4-a4|)必为偶数.X的值非负,且易知其值不大于8,所以X的可能取值的集合为{0,2,4,6,8}.
(2)可用列表或树状图列出1,2,3,4的24种排列,计算每种排列下的X值,在等可能的假定下,得到X的分布列,如表14所示.
表14
5 结束语
2019年高考数学试卷出现较多变化,教师需要根据这些变化进行适度调整,为2020年的新高考做准备,譬如解答题的压轴题可能要从导数应用调整为以概率统计为主干的数学建模,重在对概率问题的理解与分析. 这一重大变化释放出改革信号——全面落实数学学科核心素养下的高考压轴题将以概率统计为载体,对数学建模进行考查,流露出概率与统计系列试题的走向. 高考基于实际情境立意、真实地提出数学问题,引导学生应用数学知识与方法解决身边问题,达到立德树人、五育并举、助力德智体美劳全面发展的目的,同时,又能激发学生对试题的亲切感、成就感与自豪感. 在一定程度上助推素质教育,扭转以应试为主的目标教学,营造整体把握数学知识与方法的教学环境.