APP下载

“统计与统计案例”高考考向归类解析

2014-11-04邓军民

广东教育·高中 2014年10期
关键词:负相关直方图考点

邓军民

从广东高考数学考试说明以及近几年广东高考数学题来看,统计与概率是交相辉映的,而统计的核心是在数据处理能力考查的背景下重点关注统计图表及其数字特征,以及与此相关的数字特征和简单的概率计算.在当前的高考要求下,很难有别具一格的突破,未来高考对这一块的考查,应该会保持当前的模式,适度追求应用特征,更加突出统计概率在实际生活中的应用价值. “统计与统计案例”主要会从如下几个方向进行考查.

考向一、抽样方法与总体分布的估计

预测考点1:抽样方法

【例1】将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003. 这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( )

A. 26, 16, 8 B. 25, 17, 8 C. 25, 16, 9 D. 24, 17, 9

答案:B.

解题感悟:(1)系统抽样的特点——机械抽样,又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.(2)系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.

【练习1】(1)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取 所学校,中学中抽取 所学校.

(2)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是 .

(2)由题意可知,系统抽样的组数为20,间隔为8,设第1组抽出的号码为x,则由系统抽样的法则可知,第n组抽出个体的号码应该为x+(n-1)×8,所以第16组应抽出的号码为x+(16-1)×8=123,解得x=3,所以第2组中应抽出个体的号码为3+(2-1)×8=11.

答案 (1)18,9;(2)11.

预测考点2:频率分布直方图的绘制及应用

【例2】某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:

(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;

(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.

思维启迪:利用各小长方形的面积和等于1求分数在[70,80)内的频率,再补齐频率分布直方图.

解析:(1)设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.

(2)平均分为x=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).

【练习2】某班同学利用国庆节进行社会实践,对[25,55]岁的人群随机抽取n人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念,称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:

(1)补全频率分布直方图;(2)求n,a,p的值.

【例3】甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:

甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.

(1)分别计算两组数据的平均数;

(2)分别计算两组数据的方差;

(3)根据计算结果,估计一下两名战士的射击水平谁更好一些.

又∵ s2 甲>s2 乙,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定.

解题感悟:平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.

【练习3】(1)如右图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )

A. 84, 4.84 B. 84, 1.6 C. 85 ,4 D. 85, 1.6

(2)在某次测量中得到的A样本数据如下:82,84,84, 86,86,86,88,88,88,88. 若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是( )

A. 众数 B. 平均数 C. 中位数 D. 标准差

(2)对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.

答案:(1)D;(2)D.

考向二、变量间的相关关系与统计案例

预测考点1:两个变量间的相关关系

【例4】5个学生的数学和物理成绩如下表:

画出散点图,并判断它们是否具有相关关系.

解析:以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示.

由散点图可知,各组数据对应点大致在一条直线附近,所以两者之间具有相关关系,且为正相关.endprint

解题感悟:判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关性,是不是存在线性相关关系,是正相关还是负相关,相关关系是强还是弱.

【练习4】对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )

A. 变量x与y正相关,u与v正相关

B. 变量x与y正相关,u与v负相关

C. 变量x与y负相关,u与v正相关

D. 变量x与y负相关,u与v负相关

解析:由图(1)可知,各点整体呈递减趋势,x与y负相关;由图(2)可知,各点整体呈递增趋势,u与v正相关. 答案为C.

预测考点2:线性回归分析

【例5】某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:

(2)设工厂获得的利润为L元,依题意得:

L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(x-8.25)2+361.25.

当且仅当x=8.25时,L取得最大值. 故当单价定为8.25元时,工厂可获得最大利润.

解题感悟:回归直线过样本点中心(x,y)是一条重要性质;利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.

【练习5】为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:

小李这5天的平均投篮命中率为 ;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为 .

答案:0.5;0.53.

预测考点3:独立性检验

【例6】在调查男女乘客是否晕机的事件中,已知男乘客晕机为28人,不晕机的也是28人,而女乘客晕机为28人,不晕机的为56人.

(1)根据以上数据建立一个2×2的列联表;

(2)能否在犯错误的概率不超过0.05的前提下认为晕机与性别有关系?

P(K2≥3.841) = 0.05. 所以可以在犯错误的概率不超过0.05的前提下认为晕机与性别有关系.

解题感悟:解决独立性检验的应用问题,首先要根据题目条件列出两个变量的2×2列联表,通过计算随机变量K2的观测值k,依据临界值与犯错误的概率得出结论.注意观测值的临界值与概率间的对应关系.

【练习3】某学生对其亲属30人的饮食习惯进行了一次调查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)

(1)根据以上数据完成下列2×2列联表:

(2)能否有99%的把握认为其亲属的饮食习惯与年龄有关?并写出简要分析.

解析:(1)2×2列联表如下:

预测考点4:统计与概率交相辉映

【例7】电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.

(1)根据已知条件完成下面2×2的列联表,并据此资料你有多

(2)大把握认为“体育迷”与性别有关?

(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X. 若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).

解题感悟:这是一道典型的把统计的独立性检验与概率知识中的随机变量的数学期望与方差的计算相综合的高考题,题目设计中规中矩,考点的考查全面、巧妙,将高考概率统计的多个考点如此完美地综合在一起,可谓一道很漂亮的统计与概率融合的解答题.

【练习8】“行通济”是广东佛山一带在元宵节期间举行的游玩祈福活动,每到这一天,家家户户都会扶老携幼,自清晨到夜幕,举着风车、摇着风铃、拎着生菜浩浩荡荡地由北到南走过通济桥,祈求来年平平安安、顺顺利利. 为了了解不同年龄层次的人对这一传统习俗的参与度,现随机抽取年龄在20~80岁之间的60人,并按年龄层次[20, 30), [30, 40),[40, 50), [50, 60), [60, 70), [70, 80)绘制频率分布直方图如图所示,其中参与了2014年“行通济”活动的人数如下表.若规定年龄分布在[20, 60)岁的为“中青年人”,60岁以上(含60岁)为“老年人”.

(1)根据已知条件完成下面的2×2列联表,并判断能否有99%的把握认为“老年人”比“中青年人”更认同“行通济”这一民俗?

(2)用样本估计总体,从全佛山市民中随机抽取3人,记抽到“老年人”的人数为?孜,求随机变量?孜的分布列和数学期望.

从近几年广东高考数学卷来看,统计与统计案例相关的高考试题主要是以选择、填空题的形式出现,但是从全国各地的高考题来看,这个章节的高考题也有可能以解答题的形式出现,并且很有可能是以统计与概率相结合的形式呈现,当然,按照考试大纲的要求,这部分试题难度不会很大,多以知识立意为主,设计的知识点主要是抽样方法、频率分布直方图、线性回归、独立性检验以及分布列、期望与方差的计算等,譬如2014年高考广东理科数学统计概率解答题就考查了频率分布表、频率分布直方图以及随机变量的概率计算问题.我们只要掌握好本文中的上述考点,就能在高考考场上运筹帷幄,让统计概率考题迎刃而解.

(作者单位:广州市第二中学)

责任编校 徐国坚endprint

解题感悟:判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关性,是不是存在线性相关关系,是正相关还是负相关,相关关系是强还是弱.

【练习4】对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )

A. 变量x与y正相关,u与v正相关

B. 变量x与y正相关,u与v负相关

C. 变量x与y负相关,u与v正相关

D. 变量x与y负相关,u与v负相关

解析:由图(1)可知,各点整体呈递减趋势,x与y负相关;由图(2)可知,各点整体呈递增趋势,u与v正相关. 答案为C.

预测考点2:线性回归分析

【例5】某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:

(2)设工厂获得的利润为L元,依题意得:

L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(x-8.25)2+361.25.

当且仅当x=8.25时,L取得最大值. 故当单价定为8.25元时,工厂可获得最大利润.

解题感悟:回归直线过样本点中心(x,y)是一条重要性质;利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.

【练习5】为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:

小李这5天的平均投篮命中率为 ;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为 .

答案:0.5;0.53.

预测考点3:独立性检验

【例6】在调查男女乘客是否晕机的事件中,已知男乘客晕机为28人,不晕机的也是28人,而女乘客晕机为28人,不晕机的为56人.

(1)根据以上数据建立一个2×2的列联表;

(2)能否在犯错误的概率不超过0.05的前提下认为晕机与性别有关系?

P(K2≥3.841) = 0.05. 所以可以在犯错误的概率不超过0.05的前提下认为晕机与性别有关系.

解题感悟:解决独立性检验的应用问题,首先要根据题目条件列出两个变量的2×2列联表,通过计算随机变量K2的观测值k,依据临界值与犯错误的概率得出结论.注意观测值的临界值与概率间的对应关系.

【练习3】某学生对其亲属30人的饮食习惯进行了一次调查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)

(1)根据以上数据完成下列2×2列联表:

(2)能否有99%的把握认为其亲属的饮食习惯与年龄有关?并写出简要分析.

解析:(1)2×2列联表如下:

预测考点4:统计与概率交相辉映

【例7】电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.

(1)根据已知条件完成下面2×2的列联表,并据此资料你有多

(2)大把握认为“体育迷”与性别有关?

(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X. 若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).

解题感悟:这是一道典型的把统计的独立性检验与概率知识中的随机变量的数学期望与方差的计算相综合的高考题,题目设计中规中矩,考点的考查全面、巧妙,将高考概率统计的多个考点如此完美地综合在一起,可谓一道很漂亮的统计与概率融合的解答题.

【练习8】“行通济”是广东佛山一带在元宵节期间举行的游玩祈福活动,每到这一天,家家户户都会扶老携幼,自清晨到夜幕,举着风车、摇着风铃、拎着生菜浩浩荡荡地由北到南走过通济桥,祈求来年平平安安、顺顺利利. 为了了解不同年龄层次的人对这一传统习俗的参与度,现随机抽取年龄在20~80岁之间的60人,并按年龄层次[20, 30), [30, 40),[40, 50), [50, 60), [60, 70), [70, 80)绘制频率分布直方图如图所示,其中参与了2014年“行通济”活动的人数如下表.若规定年龄分布在[20, 60)岁的为“中青年人”,60岁以上(含60岁)为“老年人”.

(1)根据已知条件完成下面的2×2列联表,并判断能否有99%的把握认为“老年人”比“中青年人”更认同“行通济”这一民俗?

(2)用样本估计总体,从全佛山市民中随机抽取3人,记抽到“老年人”的人数为?孜,求随机变量?孜的分布列和数学期望.

从近几年广东高考数学卷来看,统计与统计案例相关的高考试题主要是以选择、填空题的形式出现,但是从全国各地的高考题来看,这个章节的高考题也有可能以解答题的形式出现,并且很有可能是以统计与概率相结合的形式呈现,当然,按照考试大纲的要求,这部分试题难度不会很大,多以知识立意为主,设计的知识点主要是抽样方法、频率分布直方图、线性回归、独立性检验以及分布列、期望与方差的计算等,譬如2014年高考广东理科数学统计概率解答题就考查了频率分布表、频率分布直方图以及随机变量的概率计算问题.我们只要掌握好本文中的上述考点,就能在高考考场上运筹帷幄,让统计概率考题迎刃而解.

(作者单位:广州市第二中学)

责任编校 徐国坚endprint

解题感悟:判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关性,是不是存在线性相关关系,是正相关还是负相关,相关关系是强还是弱.

【练习4】对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )

A. 变量x与y正相关,u与v正相关

B. 变量x与y正相关,u与v负相关

C. 变量x与y负相关,u与v正相关

D. 变量x与y负相关,u与v负相关

解析:由图(1)可知,各点整体呈递减趋势,x与y负相关;由图(2)可知,各点整体呈递增趋势,u与v正相关. 答案为C.

预测考点2:线性回归分析

【例5】某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:

(2)设工厂获得的利润为L元,依题意得:

L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(x-8.25)2+361.25.

当且仅当x=8.25时,L取得最大值. 故当单价定为8.25元时,工厂可获得最大利润.

解题感悟:回归直线过样本点中心(x,y)是一条重要性质;利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.

【练习5】为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:

小李这5天的平均投篮命中率为 ;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为 .

答案:0.5;0.53.

预测考点3:独立性检验

【例6】在调查男女乘客是否晕机的事件中,已知男乘客晕机为28人,不晕机的也是28人,而女乘客晕机为28人,不晕机的为56人.

(1)根据以上数据建立一个2×2的列联表;

(2)能否在犯错误的概率不超过0.05的前提下认为晕机与性别有关系?

P(K2≥3.841) = 0.05. 所以可以在犯错误的概率不超过0.05的前提下认为晕机与性别有关系.

解题感悟:解决独立性检验的应用问题,首先要根据题目条件列出两个变量的2×2列联表,通过计算随机变量K2的观测值k,依据临界值与犯错误的概率得出结论.注意观测值的临界值与概率间的对应关系.

【练习3】某学生对其亲属30人的饮食习惯进行了一次调查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)

(1)根据以上数据完成下列2×2列联表:

(2)能否有99%的把握认为其亲属的饮食习惯与年龄有关?并写出简要分析.

解析:(1)2×2列联表如下:

预测考点4:统计与概率交相辉映

【例7】电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.

(1)根据已知条件完成下面2×2的列联表,并据此资料你有多

(2)大把握认为“体育迷”与性别有关?

(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X. 若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).

解题感悟:这是一道典型的把统计的独立性检验与概率知识中的随机变量的数学期望与方差的计算相综合的高考题,题目设计中规中矩,考点的考查全面、巧妙,将高考概率统计的多个考点如此完美地综合在一起,可谓一道很漂亮的统计与概率融合的解答题.

【练习8】“行通济”是广东佛山一带在元宵节期间举行的游玩祈福活动,每到这一天,家家户户都会扶老携幼,自清晨到夜幕,举着风车、摇着风铃、拎着生菜浩浩荡荡地由北到南走过通济桥,祈求来年平平安安、顺顺利利. 为了了解不同年龄层次的人对这一传统习俗的参与度,现随机抽取年龄在20~80岁之间的60人,并按年龄层次[20, 30), [30, 40),[40, 50), [50, 60), [60, 70), [70, 80)绘制频率分布直方图如图所示,其中参与了2014年“行通济”活动的人数如下表.若规定年龄分布在[20, 60)岁的为“中青年人”,60岁以上(含60岁)为“老年人”.

(1)根据已知条件完成下面的2×2列联表,并判断能否有99%的把握认为“老年人”比“中青年人”更认同“行通济”这一民俗?

(2)用样本估计总体,从全佛山市民中随机抽取3人,记抽到“老年人”的人数为?孜,求随机变量?孜的分布列和数学期望.

从近几年广东高考数学卷来看,统计与统计案例相关的高考试题主要是以选择、填空题的形式出现,但是从全国各地的高考题来看,这个章节的高考题也有可能以解答题的形式出现,并且很有可能是以统计与概率相结合的形式呈现,当然,按照考试大纲的要求,这部分试题难度不会很大,多以知识立意为主,设计的知识点主要是抽样方法、频率分布直方图、线性回归、独立性检验以及分布列、期望与方差的计算等,譬如2014年高考广东理科数学统计概率解答题就考查了频率分布表、频率分布直方图以及随机变量的概率计算问题.我们只要掌握好本文中的上述考点,就能在高考考场上运筹帷幄,让统计概率考题迎刃而解.

(作者单位:广州市第二中学)

责任编校 徐国坚endprint

猜你喜欢

负相关直方图考点
统计频率分布直方图的备考全攻略
符合差分隐私的流数据统计直方图发布
考点展示
考点展台
N-末端脑钠肽前体与糖尿病及糖尿病相关并发症呈负相关
不等式(组)考点大扫描
用直方图控制画面影调
统计常见考点追踪
更 正
翻译心理与文本质量的相关性探析