2017年中考“抽样与数据分析”专题命题分析
2018-03-16吴增生
吴增生
(浙江省仙居县教育局教研室)
一、考点分析
根据《义务教育数学课程标准(2011年版)》(以下简称《标准》)对数据分析观念的解释可知,其对数据分析观念的基本要求是:(1)体会数据中蕴含着信息;(2)根据问题的背景选择合适的数据分析方法;(3)通过数据分析体验随机性.统计是研究随机现象的科学,它是基于数据归纳的推断随机现象的规律.在统计试题中体现数据分析观念,应该重点考查以下内容:了解现实生活中有许多问题应当先做调查研究,收集数据,通过分析做出推断,体会数据中蕴含着信息;了解对于同样的数据可以有多种分析方法,需要根据背景选择适当的方法;体会抽样获得数据的随机性,即同样的总体每次抽样得到的数据可能会不同,但独立重复多次抽样中,只要抽样的次数足够多,则能从中发现数据的规律.
《标准》对统计内容的具体要求如下.
(1)经历收集、整理、描述和分析数据的活动,了解数据处理的过程,能用计算器处理较为复杂的数据.
(2)体会抽样的必要性,通过实例了解简单随机抽样.
(3)会制作扇形统计图,能用统计图直观、有效地描述数据.
(4)理解平均数的意义,能计算中位数、众数、加权平均数,了解它们是对数据集中趋势的描述.
(5)体会数据的离散程度的意义,会计算简单数据的方差.
(6)通过实例,了解频数和频数分布的意义,能画频数直方图,能利用频数直方图解释数据中蕴含的信息.
(7)体会样本与总体的关系,知道可以通过样本平均数、样本方差推断总体平均数和总体方差.
(8)能解释统计结果,根据结果做出简单的判断和预测,并能进行交流.
(9)通过表格、折线图、趋势图等,感受随机现象的变化趋势.
二、命题思路分析
1.对考查内容及题型整体分析
为了分析2017年全国各地中考试卷中“抽样与数据分析”试题的权重、考试内容、试题类型、试题背景,笔者从2017年全国各地的中考试卷中抽取了31份试卷进行分析,重点分析考查内容的平均权重及其稳定性.由于不同内容的平均权重差异较大,因此,采用变异系数来刻画不同组数据的相对稳定性,变异系数C.V=(标准偏差/平均权重)×100%.分析结果如表1和表2所示.
表1:考查内容平均权重和变异系数分析
表2:考试题型分布分析
由表1可知,2017年全国各地中考试卷中对统计类考查的平均权重约为7.72%,而且变异系数约为25.89%,其变异系数小于不同内容的变异系数,相对稳定,说明不同试卷对统计部分考查的权重比较一致.这也与近三年全国各地中考试卷对权重的考查基本一致,说明对统计内容的考查在不同年份的试卷中整体上是比较稳定的.
由表1还可以发现,对统计概念(统计量的含义)的考查,以及根据图表简单分析数据(如给出图表,理解图表的意义,阅读图表获得信息,根据图表做简单的分析推断等),权重都超过4%,是统计类试题考查的主要内容,统计图表分析题的变异系数较小,说明不同试卷对此知识点考查的倾向相对一致.而对概念理解考查的变异系数大于图表分析,说明这部分内容考查的一致性略差于统计图表分析推断型试题.统计与概率综合试题的权重约为1.4%,变异系数相对大一些,说明有相当一部分试卷重视这类试题.相比而言,选择合适的统计量分析数据并做出推断、用统计分析解决实际问题(这里排除简单的根据图表做出推断的试题)、数据的收集(如全面调查、抽样调查的合理选择)等类型的试题则明显不足,而且变异系数很大,说明只有少数试卷出现了这些试题.
由表2可知,统计类试题的题型分布,最多的是解答题,几乎每套试卷都有1道题,其次是选择题,平均题数为0.6,最少是填空题,平均题数为0.2.但是选择题的变异系数最大,说明分歧也最大,而填空题和解答题则变异系数最少,表明不同试卷对这两类试题的使用倾向一致.
2.典型试题分析
(1)重视统计量意义的考查.
在2017年全国各地的中考试卷中,都比较重视对统计量的考查.试题中通过直接给出数据、用统计图表给出数据等不同背景,要求学生计算统计量,理解统计量的含义,考查学生对平均数、中位数、众数、方差等常用统计量的含义及计算.
例1(福建卷)某校举行“汉字听写比赛”,5个班级代表队的正确答题数如图1所示.这5个正确答题数所组成的一组数据的中位数和众数分别是().
图1
(A)10,15(B)13,15
(C)13,20(D)15,15
【评析】此题以条形统计图为背景,考查学生是否能计算一组数据的中位数和众数.在考查统计量计算的同时,考查学生对统计图的理解.
例2(贵州·毕节卷)甲、乙、丙、丁参加体育训练,近期10次跳绳测试的平均成绩都是每分钟174个,其方差如表3所示.
表3
则这10次跳绳中,这四个人发挥最稳定的是().
(A)甲(B)乙(C)丙(D)丁
【评析】此题考查方差的意义,已经给出了方差的值,要求在比较方差的基础上评价不同数据的稳定性,试题不纠结于计算,重在考查方差的意义.
例3(贵州·六盘水卷)已知A组四人的成绩分别为90,60,90,60,B组四人的成绩分别为70,80,80,70,用下列哪个统计知识分析区别两组成绩更恰当().
(A)平均数(B)中位数
(C)众数(D)方差
【评析】此题给出两组不同的数据,需要学生先分析数据的集中趋势,发现两组数据的平均数相同、中位数相同、众数不可比较.在此基础上分析数据的稳定性,选择用方差分析数据.此题计算量少,但综合、全面地考查了常用统计量的含义及其简单应用,是不可多得的好题.
例4 (四川·凉山卷)一列数4,5,6,4,4,7,x,5的平均数是5,则中位数和众数分别是().
(A)4,4(B)5,4
(C)5,6(D)6,7
【评析】此题需要学生先根据平均数的意义列出方程,求出数据x的值,再确定中位数和众数.
(2)重视对统计图表阅读分析能力的考查.
在2017年全国各地的中考试卷中,都比较重视对统计图表的考查,且基本倾向于解答题题型,所占的权重也是统计题中最高的(达整卷权重的4.2%左右).基本题型与往年比较相对稳定,采用通过图表给出数据,要求学生阅读图表理解数据,根据图表做出简单推断,解释数据分析结果的含义.
例5(安徽卷)为了解某校学生今年五一期间参加社团活动时间的情况,随机抽查了其中100名学生进行统计,并绘制成如图2所示的频数直方图,已知该校共有1000名学生,据此估计,该校五一期间参加社团活动时间在8~10小时之间的学生数大约是().
图2
(A)280(B)240(C)300(D)260
【评析】此题通过频数分布直方图给出数据,要求学生阅读统计图获得数据信息,并用样本估计总体的思想,根据样本数据在8~10之间的频率,推断总体数据在这一范围内分布的频率,并计算出总体中分布在这一范围的数据个数.
例6(湖南·郴州卷)某报社为了解市民对“社会主义核心价值观”的知晓程度,采取随机抽样的方式进行问卷调查,调查结果分为“A.非常了解”“B.了解”“C.基本了解”三个等级,并根据调查结果绘制了如图3所示的两幅不完整的统计图.
图3
(1)这次调查的市民人数为___,m=____,n=____;
(2)补全条形统计图;
(2)若该市约有市民100000人,试根据抽样调查的结果,估计该市大约有多少人对“社会主义核心价值观”达到“A.非常了解”的程度.
【评析】此题要求学生在阅读条形统计图和扇形统计图的基础上,通过比较、计算来推断各自的未知数据,在此基础上用样本估计总体的思想,根据样本数据在某一类别中的频率估计总体的频率,并进一步计算总体在某一类别数据中的频数,这类试题使用的很普遍.
例7(浙江·丽水卷)在全体丽水人民的努力下,我市剿灭V类水“河道清淤”工程取得了阶段性成果.表4是全市十个县(市、区)指标任务数的统计表;图4是截止2017年3月31日和截止5月4日,全市十个县(市、区)指标任务累计完成数的统计图.
图4
表4:全市十个县(市、区)指标任务数统计表
(1)截止3月31日,完成进度(完成进度=累计完成数÷任务数×100%)最快、最慢的县(市、区)分别是哪一个?
(2)求截止5月4日全市的完成进度.
(3)试结合图表信息和数据分析,对I县完成指标任务的行动过程和成果进行评价.
【评析】此题以当地的真实数据为背景,考查学生从统计图中获取数据的能力.根据问题的背景选择适当的数据来分析方法、分析数据,并做出合理推断的能力,考查了频率、平均数等统计量的意义,特别是第(3)小题,考查学生能否自己创新地选择和创造适当的统计量分析数据,并做出推断的能力.其根据学生不同答题的思维水平给予不同的评分方法与PISA的评价标准的系统分层次评价要求相吻合.
(3)重视统计与概率的整合.
近年来,对统计与概率的考查逐渐增多.原因是,命题者对统计和概率的认识进一步深化,认识到统计和概率作为研究随机现象的基本方法,相互之间具有必然的联系.本质上,统计是基于数据,通过归纳的方法研究随机现象,而概率,特别是计算概率则是通过构建模型演绎地研究随机现象.在这些试题中,基本上是通过同一背景把统计和计算概率两种问题进行综合,没有用到联系统计和概率的桥梁——用频率估计概率.
例8(贵州·安顺卷)随着交通道路的不断完善,带动了旅游业的发展,某市旅游景区有A,B,C,D,E等著名景点,该市旅游部门统计绘制出2017年五一长假期间旅游情况统计图(如图5),根据以下信息解答下列问题.
图5
(1)2017年五一期间,该市周边景点共接待游客的人数为____,扇形统计图中A景点所对应的圆心角的度数是_____,并补全条形统计图.
(2)根据近几年到该市旅游人数增长趋势,预计2018年五一劳动节将有80万游客选择该市旅游,试估计有多少万人会选择去E景点旅游?
(3)甲、乙两个旅行团在A,B,D三个景点中,同时选择去同一个景点的概率是多少?试用画树状图或列表法加以说明,并列举所有等可能的结果.
【评析】此题的第(1)(2)小题考查统计图表阅读和简单推断,第(3)小题则设计了用列举法求概率.此题虽然综合考查了用统计与列举法求概率,但是第(3)小题与第(1)(2)小题是没有本质联系的,此题应加强同一问题背景下统计和概率题型的联系.
(4)重视对统计分析过程的考查.
在一些试卷中,设计出了合适的情境,要求学生根据问题的背景,经历数据的收集、整理、分析推断的过程,整体考查学生统计分析的能力,较好地体现了对数据分析观念的考查.
例9(北京卷)某工厂甲、乙两个部门各有员工400人,为了解这两个部门员工的生产技能情况,进行了抽样调查,过程如下,试补充完整.
收集数据:从甲、乙两个部门各随机抽取20名员工,进行了生产技能测试,测试成绩(百分制)如下.
整理、描述数据:按如表5所示分数段整理、描述这两组样本数据.
表5
说明:成绩80分及以上为生产技能优秀,70~79分为生产技能良好,60~69分为生产技能合格,60分以下为生产技能不合格.
分析数据:两组样本数据的平均数、中位数、众数如表6所示.
得出结论:
(1)估计乙部门生产技能优秀的员工人数为___;
(2)可以推断出____部门员工的生产技能水平较高,理由为_______(至少从两个不同的角度说明推断的合理性).
【评析】此题创设了数据的收集、整理、描述、分析等统计过程.首先让学生进行分段整理数据,并制作频数统计表进行描述,为了减少计算量,直接给出三个统计量,要求学生根据数据背景选择适当的统计表分析数据,体会数据分析方法的多样性.
(5)重视对用统计分析方法解决实际问题能力的考查.
少数试卷中出现运用数据分析结果结合函数模型解决实际问题的试题,这是一种新的有益的探索.
例10(福建卷)自2016年国庆后,许多高校均投放了使用手机就可随用的共享单车.某运营商为提高其经营的A品牌共享单车的市场占有率,准备对收费做如下调整:一天中,同一个人第一次使用的车费按0.5元收取,每增加一次,当次车费就比上次车费减少0.1元,第6次开始,当次用车免费.具体收费标准如表7所示.
表7
同时,就此收费方案随机调查了某高校100名师生在一天中使用A品牌共享单车的意愿,得到如表8所示的数据.
表8
(1)写出a,b的值.
(2)已知该校有5000名师生,且A品牌共享单车投放该校一天的费用为5800元.试估计:收费调整后,此运营商在该校投放A品牌共享单车能否获利?说明理由.
【评析】此题以共享单车这一新经济现象为背景,设计出了运营盈利分析这一真实的问题.在解决这个问题的过程中,首先需要对收集到的数据(100名师生中使用单车意愿的数据)进行分析,通过样本频数估计总体频数,进一步估计5000名师生中不同使用次数的频率,然后结合收费标准计算收入,并进一步通过计算分析是否获利.这是用统计分析解决实际问题的试题创新的有益探索,值得学习和借鉴.
三、2018年中考命题与复习教学的建议
1.命题趋势
从近三年的命题走向来看,对于统计内容的考查的权重基本稳定,对抽样调查、图表阅读与分析、统计量分析等考查基本稳定.从2016年开始,逐步出现了统计与概率相结合的试题,2017年有增多的趋势.但是,用同一问题背景下组合统计问题和列举法求概率问题的题型基本没有变化.2017年出现了一些运用抽样与数据分析作为工具解决有价值的实际问题的新题型,也出现了重视对数据收集、整理、描述、分析的处理相对完整的过程考查的试题.
2.命题建议
数据分析是大数据时代描述和研究随机现象,解决不确定问题的重要数学素养,这已经引起了数学教育研究者和课程建设者的普遍重视.在新一轮高中课程改革中,数据分析作为数学核心素养,提出并要求在课程建设和今后教学中加以贯彻落实.数据分析素养具体指的是收集数据、提取信息,利用图表展示数据,构建模型分析数据,解释数据蕴含的结论.这与《标准》中的数据分析观念基本一致,只是要求更高.因此,重视对数据分析观念的考查,应该是今后统计类试题命题改革的基本价值取向.
发展数据分析素养引领下的抽样与数据分析内容的考查,需要考查学生是否能根据实际问题背景的需要确定合理的数据收集方式,考查学生能否合理使用全面调查和抽样调查获取数据,考查学生是否能进行合理抽样;考查学生是否会用适当的数据描述方法合理、有效地描述数据;考查学生能否体会到数据分析方法的多样性,是否能根据数据背景选择和运用合适的统计量(包括自定统计量)分析数据,并对数据分析结果做出合理的解释,进一步,考查学生能否利用统计分析解决实际问题.统计与概率作为分析随机现象的两种重要的方法,相互之间具有必然的、内在的联系,而用频率估计概率则是建立这种联系的桥梁和纽带,应在这一联系点上命制联系统计和概率内容的试题.
3.复习建议
统计是一门实践性的学科,对于统计内容的考查需强调应用统计知识解决实际问题的基本价值取向.一般来说,统计与概率的试题难度不会很大,着重考查学生统计的基础知识和数据分析的观念.因此,在复习教学中建议注意以下几点.
(1)让学生经历数据处理的过程,引导学生在统计实践中学习统计分析,发展数据分析观念.用典型的统计实践过程让学生举一反三,要重理解和实践,轻记忆和重复的题型训练.
(2)重视引导学生在具体背景下学习数据收集的方法,体会全面调查与抽样调查的特点,体会抽样的必要性和合理性.
(3)在具体问题背景下引导学生理解常用统计量(平均数、加权平均数、中位数、众数、方差)的含义,学习选择适当的统计量分析数据的集中趋势和波动水平,注重对统计量含义与特点的理解,淡化计算技巧.
(4)重视对学生数据分析观念的培养.让学生学会根据问题背景选择适当的数据收集、整理、描述和分析方法,体会数据分析的多样性.要特别重视根据问题背景选择和确定合理的统计量分析数据,做出推断,解释数据分析结果;让学生知道在同一个问题中,每次抽样得到的数据可能会不同,但在独立多次抽样中,只要抽样的次数足够多,则能够反应出数据的规律.
四、模拟试题
1.在下列调查中,只适合采用抽样调查方式收集数据的是().
(A)班级里选班干部
(B)烧汤时确定咸淡是否符合口味
(C)调查分析七年级学生某次数学考试的平均成绩
(D)举行会议时为了节约开支,安排两个人同住一个标准间,需要调查参加会议的男、女代表人数
答案:B.
提示:选项A需要做全面调查,选项C可以进行全面调查也可以进行抽样调查,选项D必须进行全面调查,只有选项B必须进行抽样调查.
【命题意图】考查学生用合适的统计方法收集数据的能力.
2.为了保护视力,学校开展了全校性的视力保健活动.活动前,随机抽取部分学生,检查他们的视力,结果如图6所示(数据包括左端点不包括右端点,精确到0.1);活动后,再次检查这部分学生的视力,结果如表9所示.
图6
表9:抽取的学生活动后视力频数分布表
(1)求所抽取的学生人数.
(2)若视力达到4.8及以上为达标,估计活动前该校学生的视力达标率.
(3)试选择适当的统计量,从两个不同的角度分析活动前后相关数据,并评价视力保健活动的效果.
解:(1)所抽取的学生人数为40.
(2)因为10+5=15,所以15÷40=37.5%.
所以估计活动前该校学生的视力达标率约为37.5%.
(3)角度1:视力达标率.
活动前,视力达标率为15÷40=37.5%;活动后,视力达标率为22÷40=55%.
角度2:视力的平均数.
活动前,学生视力的平均数为
3×4.1+6×4.3+7×4.5+9×4.7+10×4.9+5×5.1 40=4.66;
活动后,学生视力的平均数为
角度3:视力的中位数.
活动前,视力的中位数落在4.6~4.8内;活动后,视力的中位数落在4.8~5.0内.
从视力达标率、平均数、中位数可以看出,所抽取学生的视力在活动后好于活动前.
根据样本估计总体,该校学生活动后视力的总体情况好于活动前,说明该活动有效.
【命题意图】抽样与数据分析广泛地运用于对比研究中.在实际问题背景下,让学生比较活动前后的数据,体会数据分析方法的多样性,知道需要根据数据背景选择适当的数据分析方法,如此题中若选择众数和方差进行分析,则不太合理.
3.某超市要进一批鸡蛋进行销售,有A,B两家农场可供货.为了比较两家提供的鸡蛋单个大小,超市分别对A,B两农场的鸡蛋进行抽样检测,通过分析数据确定鸡蛋的供货商.
(1)下列抽样方式中比较合理的是哪一种?
①分别从A,B两家提供的一箱鸡蛋中拿出最上面的两层(共40枚)鸡蛋,并分别称出其中每个鸡蛋的质量.
②分别从A,B两家提供的一箱鸡蛋中每一层随机抽4枚(共40枚)鸡蛋,并分别称出其中每个鸡蛋的质量.
(2)在用合理的方法抽出两家提供的鸡蛋各40枚后,分别称出每个鸡蛋的质量(单位:g),结果如表10所示(数据包括左端点不包括右端点).
表10
①如果从这两家农场提供的鸡蛋中随机拿一个,分别估计两家鸡蛋质量在50±3(单位:g)范围内的概率;
②如果你是超市经营者,试通过数据分析,确定选择哪家农场提供的鸡蛋.
解:(1)选择方法②比较合理.
(2)根据频率估计概率,得PA==0.825,PB==0.8.
方法1:计算两种鸡蛋的平均数,得-xA=-xB=50.4,这两种鸡蛋平均每个质量相同.
再分别计算方差:
方法2:质量落在50±3(单位:g)范围内的鸡蛋数量的频率,A农场比B农场高,A农场的鸡蛋质量在50±3范围内比较集中,因此选择A农场的鸡蛋.
【命题意图】此题考查学生体会抽样的合理性,频率与概率的关系,用样本估计总体,体会数据分析方法的多样性,根据数据背景选择适当的数据分析方法.
[1]中华人民共和国教育部制定.义务教育数学课程标准(2011年版)[M].北京:北京师范大学出版社,2012.