近三年概率统计内容的高考特点及相关教学思考
2018-12-21龙正武陈星春
龙正武 陈星春
(1.人民教育出版社课程教材研究所 100081;2.北京二中 100010)
2004年开始实施的《普通高中数学课程标准(实验)》,将“发展学生的数学应用意识”作为高中数学课程的十大基本理念之一.作为对这一理念的响应,也为了引导一线师生充分重视数学知识的应用,从2007年至今,依照课程标准命制出来的高考题,都体现了对学生数学应用意识的考查,而承担这一考查功能的主要是概率统计题.事实上,课程标准实施后的高考概率统计试题注重对其思想方法进行考查,强调图表、数据的计算,强调运用统计与概率知识解决实际问题的能力,强调发挥考生的主体作用,对其探究精神、建模能力等等提出了新要求[1].
新颁布的《普通高中数学课程标准(2017年版)》,同样重视了学生数学应用意识的培养,并将“数学建模”“数据分析”都列在了六大数学学科核心素养之中.而且,为了深化高考内容和形式的改革,教育部考试中心针对数学学科研制了5种新题型,其中正式提出了数据分析题:给出一些材料背景以及相关数据,要求考生自己读懂材料,获取信息,根据材料给出的情境、原理以及猜测等,自主分析数据,得出结论,并解决问题[2].无疑,数据分析题与概率统计的内容有关.
由此可以预见,今后的高考题中,概率统计题仍然会是考查学生数学应用意识的主要载体,除了体现考查学生的数据分析能力之外,还可能承担考查学生的数学建模能力和数学探究能力等功能.
1 近三年概率统计题的考查特点
最近三年数学高考全国卷的18套试卷中,概率统计题每年一般都是2道,共17分,但是2016年全国III卷文科、2018年全国I卷理科和2018年全国III卷文科都是3道,共22分.而且,概率统计题的考查具有以下特点:
1.1 考查面全,重点突出
事实上,对照近些年的考试说明可以看出,高考要求的概率统计内容,在这三年都有考查.统计图表、用统计知识进行决策、古典概型、几何概型、用频率估计概率、随机变量、二项分布等核心知识几乎每年都有所涉及;抽样方法、互斥事件的概率加法公式、正态分布、线性回归、独立性检验、用模拟的方法估计概率等内容也不止一次出现;重点内容一般都出现在大题中.这充分体现了“核心知识反复考察、重点知识重点考察”等数学高考要求.
1.2 考查体现基础性,而且试题的综合性强
纵观这些年的概率统计高考题可以看出,不管是大题还是小题,考查的内容都很好地体现了基础性,考生只要掌握了相关知识点的基础知识,不需要使用特殊的技巧就可以顺利地得出答案.
例如,2018全国III卷文科的第14题如下.
某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异. 为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是.
命题者为了方便学生得到正确答案,不仅给出了“评价有较大差异”的提示,而且还指明了可选择的抽样方法只有三种,从而也就限定了能填的内容,完全属于基础题.
再例如,2018全国I卷理科的第20题如下.
某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品. 检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验. 设每件产品为不合格品的概率都为p(0
(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0.
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值. 已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
(ⅰ)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X);
(ⅱ)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
可以看出,考生只要能够根据题意得出不合格品的数量服从二项分布,并由此得出有关数学期望的值,就可以顺利地解答此题.
不过,值得一提的是,概率统计题的综合性也是比较强的.以上述2018年I卷理科的第20题为例,其中的第(1)问还涉及了利用导数求函数极值的内容.事实上,概率统计题中涉及函数的知识,在这些年的高考中并不鲜见.另外,在考查线性回归或独立性检验知识的同时,穿插统计图表、用统计知识进行决策等内容,也是常见的命题方式.
1.3 概率统计题着重考查学生的数据处理能力和应用意识
目前高考数学中,涉及的数据处理能力要求学生会收集、整理、分析数据,能从大量数据中抽取对研究问题有用的信息,并做出判断;而且,数据处理能力主要指针对研究对象的特殊性,选择合理的收集数据的方法,根据问题的具体情况,选择合适的统计方法整理数据,并构建模型对数据进行分析、推断,获得结论[3].
近些年的概率统计大题,完全是按照上述能力要求来进行命题的.例如,2017全国III卷理科的第18题如下.
某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完. 根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关. 如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶. 为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高气温[10,15)[15,20)[20,25)[25,30)[30,35)[35,40)天数216362574
以最高气温位于各区间的频率代替最高气温位于该区间的概率.
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元). 当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?
这个题目中,为了得到第(1)问的答案,考生首先需要做的就是判断给定的信息中,哪些是关键的,哪些需要进一步整合,这体现了“能从大量数据中抽取对研究问题有用的信息”的要求;在解答第(2)问时,考生需要去思考进货量n与利润Y的关系,并联想到利润与需求量X有关,进而想到要对n进行分类讨论,这些体现了“根据问题的具体情况,选择合适的统计方法整理数据,并构建模型对数据进行分析、推断,获得结论”的要求.顺便提及的是,在完整解答该题的过程中,还需利用函数的单调性等函数知识,这再次说明了概率统计题的综合性.
2 概率统计内容的教学
近些年的概率统计高考题,背景更加贴近实际,更能体现使用数学工具解决实际问题的作用,但是考生的得分率明显偏低,2015年、2016年、2017年这3年的概率统计大题,理科的得分率分别只有0.349,0.353,0.221;文科的得分率连续三年没有超过0.2,分别为0.140,0.159,0.197[4]. 因此,探索概率统计内容的教学,是值得广大高中数学教师等教育工作者研究的课题.从前述的考查特点不难看出,相关内容的教学应该帮助学生夯实基础,并在此基础上引导学生从整体上把握概率统计知识.这可以从以下几方面着手.
2.1 使学生了解概率统计知识之间的联系
与其他高中数学知识一样,概率统计的知识点彼此之间是相互联系的.
例如,各种统计图表都是为了直观地呈现有关数据而引入的,不同的统计图表有不同的特色:扇形图能够直观地表示出各部分数据在整体中所占的百分比,直方图能够展示数据的整体分布情况,折线图可以呈现出数据的变化情况,茎叶图可以在不丢失原始数据的情况下展示数据的分布情况,等等.不过,需要注意的是,有时还可以从统计图表中得出数字特征的一些信息:从茎叶图中可以方便地得到数据的极差、中位数;利用茎叶图并通过估算,可以对两组基本对称的数据进行比较;利用频率分布直方图,可以对两组数据的平均数与方差进行比较;等等.以2008年全国III卷文科、理科所涉及的茎叶图(如下图所示)为例,不需要计算,从图中可以很明显地看出,第一种生产方式的平均数大于第二种生产方式的平均数,它们的中位数也有同样的特征.
再例如,给定一组数据之后,可以求出这组数据的平均数和标准差;在知道一个随机变量的分布之后,一般来说可以求出这个随机变量的均值和方差.但是,学生需要进一步了解的是,求得数据的平均数和标准差,或者随机变量的均值和方差,并不是最终的目的,求得这些值是为了去说明数据或者随机变量本身的特征,从而根据这些特征去做出合理的决策.
还例如,由于随机变量及其分布列是高考中考查的重点,学生对随机变量的分布列及其数字特征都是比较熟悉的.不过,学生往往容易忽视特殊情况下两个随机变量之间的关系以及它们的数字特征之间的关系.两个随机变量之间的一元线性关系并没有超出高中学生的理解能力,而且该内容与函数知识紧密联系.事实上,教师在课堂上必须讲解以下内容:如果Y=aX+b,其中a,b都是常数,则E(Y)=aE(X)+b,D(Y)=a2D(X).
2.2 帮助学生初步理解统计学知识与传统数学知识的区别
毫无疑问,统计学知识与传统的几何、代数等数学知识之间存在较大的差异,如果学生了解了这种差异,就能提升对统计内容的认识.
“统计学也是一门艺术.这是因为依赖于归纳推理的统计学的方法论不是完全能变成条例或者没有争议的.不同的统计学者对同一组数据的分析处理可能得到不同的结论.比起由统计学工具所获得的信息来说,通常实际给出的数据所含的信息量要多得多.”[5]“统计学关心更多的是好与不好,而中小学传统数学关心更多的是对与错.”[6]再延伸一点,统计学追求的是“更好”.就像为了刻画一组数的集中趋势,既可以用平均数,也可以用中位数,还可以用众数;刻画一组数的离散程度,既可以使用极差,也可以使用方差(或标准差).到底该用什么,是与问题的实际背景息息相关的,甚至到底是利用数据的集中趋势还是利用离散程度,也与实际问题和个人偏好有关.
而且,可以提醒学生的是,类似的知识在日常生活中经常可以见到.例如,每年高考成绩发布之后,各学校的解读方式并不完全一样,有些强调最高分,有些强调平均分,还有些会强调高考成绩相对于学生入学成绩的增长率等,从不同的方面解读得到的结论并不完全一样,但这些都是合理的.
2.3 通过各种示例让学生了解常见的概率统计错误认识
由于概率统计知识的特殊性,不管是在日常生活中还是在数学课堂上,都存在一些常见的错误认识.
再例如,二项分布的频率分布直方图表示与正态曲线之间的关系,很多人会有一个错误的印象:随着频率分布直方图组距的不断缩小,由此得到的频率分布折线图会越来越光滑,也越来越接近于正态曲线.但事实上,二项分布B(n,p)作为正态分布的近似,是指n越来越大时,二项分布的频率折线图将越来越趋向于正态分布的密度曲线.
另外,课堂上一般都会强调有放回的抽样和无放回的抽样之间的差别,并会给出相应的例题让学生加以练习.但是,很多学生其实并不了解,由于二项分布可以作为超几何分布的近似,因此,当总体的容量足够大时,有放回的抽样和无放回的抽样相差很小.
“用样本估计总体时方法是唯一的”也是现在一线课堂中一种常见的错误认识.这种错误认识的产生,固然与目前高中数学中概率统计内容的容量有关,但我们还是可以通过实例向学生进行解释的.例如,在用样本的频率分布直方图估计总体的平均数时,虽然常用的是区间的中点,但如果没有特别要求,使用区间的左端点或者右端点其实都是可以的.
总而言之,对于概率统计内容来说,从近些年的高考考查特点可知,为了做好这一内容的教学,需要帮助学生夯实基础,想方设法让学生了解常见的错误认识,从而使学生从整体上全面地掌握有关数学知识,提升他们对相关知识的认识.