数据分析,从真实情境出发
2020-07-17王小亮
王小亮
近几年全国卷统计知识部分,主要基于现实世界中生产、生活等真实情景,结合图表(频率分布直方图、折线图、饼图或频数(率)分布表,2×2 列联表等),考查同学们的数据分析能力.数据分析包括:快速收集、整理数据,分析数据,最终利用数据给出正确合理的判断.以下就通过高考题一起来看看吧。
一、平均值、方差
例1 (2019 年全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200 只小鼠随机分成A,B 两组,每组100 只,其中A 组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
甲离子残留百分比直方图
乙离子残留百分比直方图
记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P C( )的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b 的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
分析
(1) 文字 图形 知识点条件 P C( )的估计值为0.70 [6.5,7.5),[7.5,8.5]对应小矩形的高频组率 距 分别为0.20,0.15(乙图)所有小矩形面积(即频率)之和为1转化 [5.5,8.5]的频率和0.70 两组频率和(0.20 0.15) 1+ × (组距)=0.35结论a=0.70 0.35( )1组−距 =0.35,b= − − − =1 0.70 0.15 0.05 0.10
(2) 文字 图形 知识点条件 提供真实情境 提供组中值和对应频率相关信息 平均值公式转化 数据的实际意义 根据图甲、乙可求组中值和对应频率(略)结论 甲,乙平均值分别为4.05,6.00(解答过程略)n 1 x x p=∑i=i i
【归纳提升】
二、独立性检验
例2 (2017 年全国Ⅱ卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
旧养殖法
新养殖法
(1)记A 表示事件“旧养殖法的箱产量低于50 kg”,估计A 的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50 kg 箱产量≥50 kg旧养殖法新养殖法
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.
二是利用现代化手段,建立信息化服务平台。Z公司累计投入300余万元,建立军民融合资源信息服务系统。首先,构建由技术资源、专家资源、科技项目、技术需求等信息共同组成的技术创新信息库。信息库内共包含各类相关信息近七万条。其次,建立信息集成发布平台。将与智能制造、新材料相关的产业政策、研发成果、科技动态等信息在平台上进行汇集、整合、发布,使平台上的信息既有深度又有广度,充分发挥了该平台的资源共享功能。
(2) 文字 图形 知识点条件 各随机抽取100 个网箱 新、旧养殖法各组分布特征 (1)小矩形面积(频率)=高 频率组距 ×底(组距);转化 样本容量均为100 新、旧养殖法(<50,≥50)两组频率(2)独立性检验χ2 公式参数与列联表对应关系;(3)由χ2 值查表.结论 χ2 = >15.705 6.635,有99%的把握认为两个变量有关. (3) 文字 图形 知识点条件 提供真实情境 提供各组分布特征 统计集中(分散)常用参数:(1)平均值:(2)中位数;(3)方差.转化 数据的实际意义 数据分布的集中特征(平均数、中位数、方差)结论 新养殖法的箱产量(平均数或中位数)较高且(方差或标准差)稳定.【结论由图表估算】
【归纳提升】
独立性检验与计算平均值、方差比较:
(1)相同点:
① 筛选文字语言有效数据,理解相关数据实际含义;
② 主要抓住图表提供数据信息;
(2)不同点:独立性检验计算量略显复杂,特别是代数据找好与列联表对应关系.
三、成对数据的相关性
例3 (2016 年全国Ⅲ卷)下图是我国2008 年至2014 年生活垃圾无害化处理量(单位:亿吨)的折线图
年份代码t
(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;
(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016 年我国生活垃圾无害化处理量.
分析
(1) 文字 图形 知识点条件 提供真实情境 变量y 与t 变化关系 相关系数r 的实际意义转化 数据的实际意义 变量t的取值,确定t=4结论 结合参考数据及公式r ≈0.99,变量y 与t 线性相关性强(2) 文字 图形 知识点条件 同(1) 同(1) 线性回归方程的求解及应用转化 同(1) 同(1)结论 结合参考数据及公式ˆy t= +0.92 0.10 ,并据此估算2016年生活垃圾无害化处理量约为1.82亿吨.
【归纳提升】
成对数据相关性与独立性检验相比而言,虽都是套公式,但前者计算量更大,注意用好所给相关数据、公式外,建议把公式分成若干部分,分步计算.
高考中统计的考查更多的是和概率结合问题,而且难点出现在概率问题中.因此对概率问题的深度研究是解决高考中概率与统计问题的保障!
敲黑板
应对统计相关试题,同学们需要做到:
(1)抓住图表中主要数据;
(2)快速认清真实情景,筛选有效数据(特别是文字量大的问题);
(3)准确快速运算;
(4)解答过程的规范书写.