基于挖掘拓展小概念的探究学习路径开发*
——以对百分位数的挖掘拓展为例
2023-10-08广东省广州市第十六中学510080何嘉颖
广东省广州市第十六中学(510080) 何嘉颖
1 探究离散数据的百分位数
1.1 高中课本定义的百分位数
在新人教A版高中数学必修第二册中,给出了百分位数的定义以及一种计算百分位数的方法.
高中课本定义(新人教A版)一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100−p)%的数据大于或等于这个值[1].
设x1,x2,...,xn是取自总体分布函数为F(x)的样本,若将样本观测值由小到大进行排列为x(1),x(2),...,x(n),则x(1),x(2),...,x(n)称为有序样本[2].样本p分位数mp定义如下[2]:
挖掘课本内容,在课本中提到“分位数的定义众多,我们取一种简单便于计算的[1]”,可见百分位数的定义不止一种.同时在课本所给引例中提到百分位数的取值,可以是某个区间内任意一个数,该值为便于计算可取区间的中点值,为实际操作的方便样本百分位数的取值还可作近似处理等,可见百分位数的不唯一性.
因此,针对课本中百分位数的定义与计算方法,可从两方面进行探究:一是对百分位数定义的探究;二是对百分位数的存在性与唯一性以及计算方式的探究.
1.2 插值法计算百分位数
课本中百分位数的定义与计算方法是与学生已学的中位数概念吻合的,因此为学生理解与计算百分位数提供了方便.基于课本中百分位数的定义,挖掘教师教学用书的内容,在书中提供了“电子表格软件和R软件计算一组数据的百分位数的方法[3]”.无论是书中提到的电子表格软件和R软件还是一些常用软件,它们计算百分位数所使用的的方法为插值法.
线性插值定义已知区间[xk,xk+1]端点处函数值yk=f(xk),yk+1=f(xk+1),设线性插值多项式L1(x),有L1(xk)=yk,L1(xk+1)=yk+1,则L1(x)=
假设已知百分位数xp所在位置为t,且已知所在位置为[t],[t]+1的值分别为x[t],x[t]+1,则有
于是,当x=t时,xp=x[t]+·(t−[t]).其中,t的值有多种计算方式,如np(R-4,SAS-1,Maple-3),(n+1)p(R-6,SAS-4,Maple-5,Excel,Python),(n−1)p+1(R-7,Maple-6,Excel,Python)等.
会出现上述多种的百分位数计算方式,究其原因在于对离散数据的百分位数所在位置的理解.若百分位数xp落在(x[t],x[t]+1)内,此时t∈([t],[t]+1),应如何界定t和[t]以及[t]+1的距离,这涉及区间的连续性问题.
由此可见,计算百分位数的关键为:确定百分位数的位置,以及计算百分位数的值;其中,前者更为关键.同时,通过探究离散数据的百分位数,可知离散数据的百分位数不唯一.因此,也可作进一步探究:如果把离散数据连续化,那么这些数据的百分位数会有什么特点.
2 探究离散数据连续化的百分位数
已知百分位数的值随着位置的变化而变化,即两者之间存在函数关系.此时可考虑两种连续化:一是位置的连续化,二是数值的连续化.
先挖掘数值的连续化,可使用经验分布函数.
经验分布函数定义[2]用有序样本定义如下函数则是一个非减右连续函数,且满足Fn(−∞)=0,Fn(∞)=1.
通过经验分布函数,此时离散的有序样本x(1),x(2),...,x(n)在整个实数集内均有定义.而数据的百分位数的位置对应频率,此时只有有限的取值.即在经验分布函数下,部分百分位数不一定存在.
再挖掘位置的连续化,可使用频率分布直方图.若以连续化后的有序样本作为横坐标,选定一定的组距绘制频率分布直方图.此时无论是数值还是位置都实现连续化.因此,利用频率分布直方图可计算任意百分位数且百分位数的数值唯一.挖掘课本,在频率分布直方图下有两种计算百分位数的方法.一是插值法,二是面积法(S左=p%).但利用频率分布直方图计算百分位数的缺点在于所得值只是估计值,与真实数据之间有一定误差.
由此可见,仅选择一定的组距用各个长方形来表示对应频率是不够的;而是需要各个长方形足够小,小至微元才行.由此作进一步探究:如果用极限思想或微积分思想,能否唯一得到对应的百分位数.
3 探究连续数据的百分位数
根据上文的探究,可把课本百分位数的定义拓展至概率统计中百分位数的定义.
分位数定义设连续随机变量X的分布函数为F(x),密度函数为p(x).对任意p∈(0,1),称满足条件F(xp)=的xp为此分布的p分位数,又称下侧p分位数[2].同理,满足条件1−为此分布的上侧p分位数[2].
由于分布函数F(x)在实数集上单调非减,因此当分布函数严格单增时一定有反函数,则对任意p∈(0,1),存在唯一的xp与之对应.此时,任意位置的百分位数都存在且唯一.
因此,已知分布函数F(x)计算百分位数只需作一一对应;已知密度函数p(x)计算百分位数有两种计算方法,一是用面积法,二是先求分布函数F(x)再计算百分位数.
新课标强调要引导学生把握数学内容的本质,提倡学生独立思考以激发学习数学的兴趣,同时要促进学生的创新意识的发展;引导学生会用数学眼光观察世界,会用数学思维思考世界,会用数学语言表达世界,探究事物的变化规律[5].
探究学习无疑是一种帮助学生数学学习的一种途径,通过小概念的挖掘学习,学会探究的一般方法,更能帮助学生去研究大概念大问题.
本文对百分位数的挖掘和探究实际上是对百分位数概念的再发现过程.从课本例题和所给定义以及小提示出发,给学生提供一些处于“最近发展区”的问题与思考;从而可以促进学生对百分位数做深入探究,而并非只局限于学习课本概念,完成相应要求的习题.
在挖掘和探究的过程中,除了能加深对百分位数的认识外,还可以学到许多的知识和数学思想,如插值法,经验分布函数,软件中的数学等知识,如连续思想,极限思想,积分思想;同时还能加深其他已学知识的理解与联系和串联整个概率统计大单元,如加深对频率分布直方图的理解,抓住概率统计的主脉络,如抓住函数与微积分在概率统计中存在的合理性必要性并学会从数学人思考的角度去思考问题.
本文仅对百分位数的定义与计算作了挖掘和拓展,除此以外,还可以对百分位数的应用进行挖掘,如课本专门给出了四分位数的概念,第1、5、95分位数的概念,那么他们究竟有什么实际应用;如对四分位数,可探究五数概括与箱线图;对第1、5、95分位数,可探究独立性检验.在教师教学用书中,提到“第0百分位数为数据组中的最小数,第100百分位数为数据中的最大数[3]”,可探究最大值、最小值与极差和百分位数的关系.更进一步,百分位数,极差等都需要把数据从小到大排序构成有序样本,可探究有序样本与次序统计量的关系.