“素养立意”背景下的2018年高考中的概率统计应用题
2018-12-06湖南罗礼明
湖南 罗礼明
“收集数据、整理数据、分析数据,从大量数据中抽取对研究问题有用的信息,并做出判断”,这是统计的主要任务,而“用样本估计总体”是统计的基本思想.由于概率、统计与实际问题的联系非常紧密,概率与统计的实际应用题在历年高考中备受命题者的青睐,成为考查学生数学抽象、逻辑推理、数学建模、直观想象、数学运算和数据分析等核心素养的“常态”题型.近两年高考试题特别注重考查学生整理、分析数据、处理数据的能力及统计与概率知识的整合,概率与统计方面的高考题与以往的高考题比较更新了,更广了,更活了,成为高考的一大“亮点”.本文结合2018年高考题中的概率与统计应用题解读这方面的知识.
一、统计图表的考查
例1.(2018·全国卷Ⅰ理·3)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
建设前经济收入构成比例
建设后经济收入构成比例
则下面结论中不正确的是
( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
【答案】A.
【点评】本题以实际生活与统计图为背景,考查考生的化归与转化、识图与用图的能力.考查的核心素养是数学运算、数据分析.审题时若没有注意到“新农村建设后经济收入增加了一倍”而直接观察饼图进行比较,就会得出错误的选项.
二、线性回归分析的考查
例2.(2018·全国卷Ⅱ理·18)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
(Ⅰ)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(Ⅱ)你认为用哪个模型得到的预测值更可靠?并说明理由.
(Ⅱ)利用模型②得到的预测值更可靠.理由略.
【点评】本题以现实生活中的实际问题为背景,综合考查折线统计图、线性回归分析的基本思想与初步应用,意在考查数据处理、运算求解、图形的识别等能力.考查的核心素养是数据分析、数学建模、数学运算.(Ⅰ)对变量值的预测主要是由给出的变量的值预测与其有相关关系的变量的值,一般方法是:若已知回归方程,则直接将数值代入求得预测值;若回归方程未知则先要画出散点图并根据散点图选择恰当的回归方程建立回归模型.(Ⅱ)回归模型的拟合效果主要有两种途径判断:一是利用数据的散点图,观察数据对应的点与回归图象的位置关系进行分析;二是利用残差进行分析,最简单的做法是选择数据中具有代表性的点进行预报,比较预报值与真实值的差距进行分析.
三、用样本的数字特征估计总体的数字特征
例3.(2018·北京卷理·17)电影公司随机收集了电影的有关数据,经分类整理得到下表:
电影类型第一类第二类第三类第四类第五类第六类电影部数14050300200800510好评率0.40.20.150.250.20.1
好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.
(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;
(Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;
(Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等.用“ξk=1”表示第k类电影得到人们喜欢,“ξk=0”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差Dξ1,Dξ2,Dξ3,Dξ4,Dξ5,Dξ6的大小关系.
【分析】(Ⅰ)读表,可得出是在2 000部电影中随机抽取1部,而第四类电影中获得好评的有50部,结合古典概型,可求得概率.
(Ⅱ)从第四类和第五类电影中各随机选出1部,恰好有1部获得好评包含第四类获得好评的同时第五类没有获得好评和第五类获得好评的同时第四类没有获得好评两种情况,由互斥事件的概率加法公式可求得.
(Ⅲ)两点分布,随机变量的期望Eξ=p,方差Dξ=p(1-p),很容易求得它们的方差并比较出大小.
【答案】(Ⅰ)0.025.
(Ⅱ)0.35.
(Ⅲ)Dξ1>Dξ4>Dξ2=Dξ5>Dξ3>Dξ6.
【点评】本题将电影好评率和概率与统计知识相结合,考查了古典概率的计算、互斥事件、两点分布、期望等相关知识,问题源自生活又高于生活,突出了数学的应用价值.考查了学生分析问题、解决问题的能力及数据处理能力和应用意识.考查的核心素养是逻辑推理、数学运算与数据分析.
四、用样本的频率分布估计总体分布
例4.(2018·全国卷Ⅰ文·19)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
使用了节水龙头50天的日用水量频数分布表
(Ⅰ)作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(Ⅱ)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(Ⅲ)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)
【答案】(Ⅰ)
(Ⅱ)0.48.
(Ⅲ)47.45 m3.
【点评】本题考查频数、频率、频率分布直方图及运用统计知识解决简单实际问题的能力、数据处理能力和应用意识. 考查的核心素养是数学运算与数据分析.在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.频率分布直方图中,小长方形的高等于每一组的频率除以组距,它们与频数成正比,小长方形的面积等于这一组的频率.频率分布直方图中的平均数等于频率分布直方图中每个小长方形的面积乘以底边中点的横坐标之和.
五、独立性检验
例5.(2018·全国卷Ⅲ理·18)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
第一种生产方式第二种生产方式86556899762701223456689877654332814452110090
(Ⅰ)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(Ⅱ)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m不超过m第一种生产方式第二种生产方式
(Ⅲ)根据(Ⅱ)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
【答案】(Ⅰ)第二种生产方式的效率更高.理由略.
列联表如下:
超过m不超过m第一种生产方式155第二种生产方式515
【点评】本题以社会生活中的生产效率为背景,融入茎叶图、统计案例等知识,主要考查茎叶图中数据的读取与分类汇总、中位数的计算、卡方的观测值的计算与应用等及分析问题、解决问题的能力.考查的核心素养是数学运算与数据分析.独立性检验可检验“两个分类变量X和Y是否有关系”,而且能较为精确地给出这种判断可靠程度的一种统计方法.计算出的K2的观测值越大,表示两个分类变量之间的关系越强.
六、概率与统计知识的综合应用
例6.(2018·全国卷Ⅰ理·20)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为p(0
(Ⅰ)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0;
(Ⅱ)现对一箱产品检验了20件,结果恰有2件不合格品,以(Ⅰ)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
(ⅰ)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX;
(ⅱ)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
【分析】(Ⅰ)由每件产品不合格的概率为p,结合独立重复试验,即可求出20件产品中恰有2件不合格品的概率f(p),对f(p)求导,利用导数的知识可求得f(p)的最大值点p0,但要注意p的取值范围;
(Ⅱ)(ⅰ)利用(Ⅰ)的结论,设余下的产品中不合格品的件数为Y,则Y服从二项分布,利用二项分布的期望公式和Y与X的关系式求出EX;(ⅱ)求出检验余下所有产品的总费用,再与EX比较,即可得出结论.
【答案】(Ⅰ)0.1.
(Ⅱ)(ⅰ)490.
(ⅱ)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.由于EX>400,故应该对余下的产品作检验.
【点评】本题主要考查相互独立事件的概率、离散型随机变量的期望、导数的应用、二项分布、决策性问题等.考查的核心素养是逻辑推理、数学建模、数学运算与数据分析.破解此题的关键:一是认真读题,读懂题意;二是会利用导数求最值;三是会利用公式求服从特殊分布的离散型随机变量的期望值;四是会利用期望值,解决决策型问题.