新课标初中数学“统计与概率”部分的主要变化与教学实施策略
2022-11-28栾长伟
栾长伟
(大连教育学院)
《义务教育数学课程标准(2022年版)》(以下简称“新课标”)中“统计与概率”部分内容相对于《义务教育数学课程标准(2011年版)》(以下简称“2011年版课标”)有了较大变化,新增了四分位数、百分位数、组内离差平方和等新知识的同时,也对简单随机抽样等知识的能力要求层次进一步提高,这种变化对教师是一种挑战。笔者对新课标与“2011年版课标”中“统计与概率”部分内容进行对比,对新增加的内容如何在教学中进行实施提出了建议。
“统计与概率”的核心是培养学生的数据观念。新课标中关于数据观念的描述如下:数据观念主要是指对数据的意义和随机性有比较清晰的认识。知道数据蕴含着信息,需要根据问题的背景和所要研究的问题确定数据收集、整理和分析的方法;知道可以用定量的方法描述随机现象的变化趋势及随机事件发生的可能性大小。形成数据观念有助于理解和表达生活中随机现象发生的规律,感知大数据时代数据分析的重要性,养成重证据、讲道理的科学态度。
自2001年以来,课程标准中“统计与概率”部分在不断调整,《义务教育数学课程标准(实验稿)》第一次将统计与概率作为与代数、几何平行的独立学习领域设置,第一次在小学设置概率内容,且在第一学段就要求学习概率内容。
在2011年版课标中,概率内容后移一个学段,在小学第二学段学习概率,只要求定性描述随机现象发生可能性大小。主要原因是对于第一学段的学生来说,他们很难理解“随机现象发生的可能性大小”。有学者曾对第一学段的学生进行过调查,“若不透明袋子中有大小相同的2个白色乒乓球、1个黄色乒乓球,随机摸出一个,摸出哪个颜色乒乓球的可能性大?”,学生回答“黄色”。纠其原因,学生说:“我喜欢黄色。”这说明第一学段的学生还不具备区分可能性大小的能力。同时,在2011年版课标中,统计的一些内容也后移一个学段,小学第一学段平均数移到第二学段,第二学段中中位数、众数移到第三学段。同样,在新课标中,“统计与概率”部分也发生了较大的变化。
一、新课标中“统计与概率”的主要变化
(一)内容结构的变化
如下页表1,与2011年版课标相比较,新课标将以前的三个学段分为小学部分、初中部分共四个学段,即第一学段(1~2年级),第二学段(3~4年级),第三学段(5~6年级),第四学段(第7~9年级);“统计与概率”的内容螺旋上升,尤其是统计部分,分为数据的分类,数据的收集、整理与表达,随机事件发生的可能性,抽样与数据分析,随机事件的概率五个主题组成。
表1课程标准中“统计与概率”部分的变化
(二)内容呈现方式的变化
“统计与概率”内容的设计思路有所变化,2011年版课标中的课程内容按照“学段+领域”的思路设计,即“统计与概率”领域的内容分散在三个学段呈现。新课标中的课程内容按照“阶段+领域+学段”的思路设计,即小学与初中部分,“统计与概率”领域集中呈现各学段内容要求。其更加体现了同一领域下不同学段的纵向要求,更加体现了各学段之间的关联性。
(三)内容表述形式的变化
新课标中各领域最大的变化就是内容表述形式的变化,其主要分为内容要求、学业要求、教学提示三个方面,不仅说明了学什么,同时说明了学到什么程度,怎样学。
例如,“概率”部分的内容要求为“知道通过大量重复试验,可以用频率估计概率。”
学业要求为:知道经历大量重复试验,随机事件发生的频率具有稳定性,能用频率估计概率;体会数据的随机性以及概率与统计的关系;能综合运用统计与概率的思维方法解决简单的实际问题。
教学提示为:引导学生通过大量重复试验,发现随机事件发生频率的稳定性,感悟用频率估计概率的道理,会用频率估计概率。
在这样的过程中,引导学生会从统计与概率的角度认识、理解和表达现实世界中大量存在的随机现象;这样的教学实践活动会涉及大量的数据计算(样例84和样例85),建议与信息科技教师合作,设计跨学科的项目式学习课程,引导学生会使用计算机处理数据,养成利用信息技术开展研究的习惯。
(四)内容要求的变化
新课标以下内容发生变化:通过实例认识简单随机抽样(内容要求从了解层次提升到理解层次);理解中位数、众数的意义(增加);经历数据分类的活动,知道按照组内离差平方和最小的原则对数据进行分类的方法(增加);会计算四分位数,了解四分位数与箱线图的关系,感悟百分位数的意义(增加);分布式计算平均数和百分数(样例86)(增加)。
二、新课标中“统计与概率”的内容分析
新课标指出,数学课程要培养的学生核心素养,主要包括“会用数学的眼光观察现实世界”“会用数学的思维思考现实世界”“会用数学的语言表达现实世界”三个方面。其中,“统计与概率”在整个义务教育阶段分为五个主题,即第一学段的数据分类,第二、三学段的数据收集、整理与表达,第三学段的随机事件发生的可能性,第四学段的抽样与数据和概率。
第一学段的“数据分类”是其他四个主题的基础,包括对具有共同特征的“事物”的分类和对调查等取得的“数据”进行分类,旨在培养学生的数据意识和应用意识,后期的第二、三、四学段我们都要用统计图整理与表达数据,以及新增加的利用组内离差平方和最小的原则进行数据分类,都是第一学段“数据分类”的具体方法。如条形统计图是直观呈现不同类别数据的数量情况;折线统计图不仅呈现不同类别数据的数量情况,还反应出增减变化;扇形统计图直观呈现不同类别数据数量在整体中的占比情况;频数分布直方图是直观呈现不同类别数据出现的频数分布情况。
第二、三学段数据的收集、整理与表达旨在培养学生的几何直观、运算能力、模型观念、数据观念和应用意识。同时,引进了统计量,设置了如平均数、百分数等内容,对统计图进一步进行了强化和应用。
第三学段中的随机事件发生的可能性旨在培养学生的推理能力、数据观念和应用意识,通过实例帮助学生认识到生活中有些事情发生是不确定的,而不确定事件中可能发生的不同结果的可能性是有大小的,引导学生初步学会根据所有可能发生的情况正确判断某种结果发生的可能性大小,但是仅仅限于定性描述。
第四学段中的抽样与数据分析旨在培养学生的抽象能力、几何直观、创新意识、运算能力、推理能力、模型观念、数据观念和应用意识;使学生经历收集(即简单随机抽样),利用统计图表对数据进行整理与描述,再借助统计量(平均数、众数、中位数)反应数据的集中趋势,借助方差、组内离差平方和反应数据的离散程度以及新课标中新增加的四分位数、百分位数来反应数据的分布位置。教学内容围绕数据分析的整个过程展开,以推断性统计分析为主。
第四学段中的随机事件的概率旨在培养学生的抽象能力、创新意识、运算能力、推理能力、模型观念、数据观念和应用意识。主要包括两方面:一是用古典概型刻画概率,需要满足简单随机抽样的特征——简单随机抽样要求被抽取的样本的总体个数N是有限的;简单随机样本数n小于等于样本总体的个数N;简单随机抽样的每个个体发生的可能性均为n/N(概率相同);样本的每个单位(个体)完全独立,彼此间无一定的关联性和排斥性。二是用频率刻画概率。主要分为全样本抽取法,即制作N个签(标号为1到N),将总体的单元分别编上1到N的号码,然后均匀混合制作的N个签,从中抽取n个签,则这n个签上的号码对应的单元组成的样本即为随机样本。全样本抽取是一种自然抽取方法。但对于较大的N,这种方法操作起来不方便,通常用逐个抽取法代替,即在总体的N个单元中,等概率抽取1个单元,然后在剩余的(N-1)个单元中等概率抽取1个单元;接着,在剩余的(N-2)个单元中等概率抽取1个单元,依次继续抽取,每次都在尚未抽取的单元中等概率抽取1个单元且不放回,直到抽取n个单元为止。
三、新课标中“统计与概率”的实施策略
(一)理解“分布式计算”
“分布式计算”是一种计算方法,它和“集中式计算”是相对的。随着计算技术的发展,有些应用需要巨大的计算能力才能完成,如果采用“集中式计算”,需要耗费相当长的时间才能完成。“分布式计算”将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大提高计算效率。
例题:(1)已知若干网站的用户日人均上网时间,估计这些网站所有用户的日人均上网时间;(2)已知若干网站的用户对某个热点话题的关注度,估计网民对这个热点话题的关注度。
【说明】以两家网站为例进行分析,设这两家网站分别为A网站和B网站。
教师要启发学生思考这样的现实情境:知道两家网站的用户日人均上网时间分别为a和b,希望知道这两家网站所有用户的日人均上网时间。显然,基于这些信息不可能得到结论,教师要通过启发最终使学生理解,如果还知道两家网站平均每天的上网用户人数分别为n和m,那么就可以得到两家网站所有用户的日人均上网时间,即这是两家网站的用户日人均上网时间a和b的加权平均数。
教师还要启发学生:对于某一个热点话题,知道两家网站认为“这个话题重要”的用户所占百分比分别为75%和62%,希望知道这两家网站所有用户中认为“这个话题重要”的用户所占比例。与上一个问题类似,基于这些信息不可能得到结论,教师要通过启发最终使学生理解,如果还知道两家网站参与评价的用户人数分别为n和m,那么可以得到两家网站所有用户中认为“这个话题重要”的用户比例为这也是两家网站认为“这个话题重要”的用户所占百分比75%和62%的加权平均数。最后,只需要把这个结果化成百分数就可以了。
通过上面例子可以看到,如果按照定义,无论是平均数还是百分数的计算,都需要用数量总数除以参与计算的个数。如平均数的问题,需要用两家网站用户上网的总时间除以用户总人数;百分数的问题,需要用两家网站认为热点话题重要的用户总人数除以参与评价的用户总人数。而现在利用已经计算出的两家网站各自的平均数或者百分数,可以非常方便地通过加权直接计算得到两家网站的所有用户日人均上网时间或对某个热点话题的关注度。这样的计算,在形式上是加权平均,在程式上是分别计算,是分布式计算的最简单形式,是大数据计算的热门算法。
(二)理解“四分位数”
如果把一组数据从小到大排序,用m50表示中位数,称为第50百分位数,那么中位数把这组数据分为两部分,分别记为S和T;进一步,用m25和m75分别表示S和T的中位数,那么,所有数据中小于或等于m25的占25%、小于或等于m75的占75%。这样,m25,m50,m75这三个数值把所有数据分为个数相等的四个部分,因此称为“四分位数”。
例如,共有12个数据,从小到大排列为2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.44。用m50表示这组数据的中位数(第50百分位数或50%分位数),则m50是第6个和第7个数据的平均数,m50=(3.85+3.98)/2=3.915;中位数m50把这组数据分成两部分;用m25表示S的中位数(第25百分位数或25%分位数或第一四分位数),则m25是第3个和第4个数据的平均数,m25=(3.18+3.21)/2=3.195;意义是:所有数据小于或等于3.195的占25%(12×25%=3);用m75表示T的中位数(第75百分位数或75%分位数或第三四分位数),则m75是第9个和第10个数据的平均数,m75=(4.11+4.77)/2=4.44;意义是:所有数据小于或等于4.44的占75%。(12×75%=9)
(三)理解“组内离差平方和”
新课标要求“会计算一组简单数据的离差平方和,经历数据分类的活动,知道按照组内离差平方和最小的原则对数据进行分类的方法”。在大数据分析中,数据的分组是重要的方法之一。虽然可以有多种方法对数据进行分组,但是,使得“组内离差平方和最小”的方法是最传统的,也是非常合理的。下面来说明理由。
假设有n个数据,不失一般性,假设这些数据都不相等,表示为x1,x2,……,xn,如果把这些数据分成两组,如前m个数据为一组(称为第一组),后(n-m)个数据为一组(称为第二组)即x1,x2,x3,x4,……,xm,xm+1,xm+2,……,xn。假设前m个数据平均数为后(n-m)个数据的平均数为xˉ2=,这n个数据的平均数为则组内离差平方和为:S12=(xm+2-;组间离差平方和为:S22=m(x1-
S12为组内离差平方和,它表达了两个组内数据的离散程度;S22为组间离差平方和,它表达了两个组间的差异。一个合理的分组原则是使S12达到最小,S22达到最大。由于总体离差平方和S2不变,只需考虑使组内离差平方和达到最小即可。
例题,下页表2中记录了我国10个省份2020年人均地区生产总值(人均GDP)的数据,数据表明,这10个省份的人均GDP是有区别的。如果要把这10个省份依据人均GDP的多少分为两个组,你认为应当如何划分?请说出你划分的道理。
表2 2020年10个省份人均GDP数据
计算结果表明,将排序后的前7个数据分为一组、后3个数据分为另一组,可以使组内离差平方和达到最小值。最后,依据数据对应的省份,分出的两组是:{省份2,省份3,省份4,省份7,省份8,省份9,省份10};{省份1,省份5,省份6}。
通过数据也可以看到,这样的分组是合理的。
四、关于“统计与概率”的教学建议
(一)制订指向核心素养的教学目标
1.教学目标要体现核心素养的主要表现
“统计与概率”部分的内容,其核心素养的表示如表3所示。
表3“统计与概率”内容的核心素养表现
2.处理好核心素养与“四基”“四能”的关系
教师要引导学生关注统计的全过程,从对“事物”的分类到对“数据”的分类,从简单随机抽样到数据的整理与描述,使学生经历从生活中的实际问题抽象数学问题,在发现问题、提出问题的同时,会用数学的眼光观察现实世界;在对数据处理过程中,培养学生分析问题、解决问题的同时,学会用数学的思维思考现实世界;在用数据的分析结果解决现实问题过程中,会用数学语言表达现实世界。
3.教学目标的设定要体现整体性和阶段性
教师要依据核心素养的内涵和在不同学段的表现,结合“统计与概率”的具体教学内容,全面分析主题、单元和课时特征,基于主题、单元整体设计教学目标,围绕单元目标细化具体课时的教学目标。
(二)整体把握教学内容
教学内容是落实教学目标、发展学生核心素养的载体。教师要重视对教学内容的整体分析,帮助学生建立能体现数学学科本质、对未来学习有支撑意义的、结构化的数学知识体系。
新课标各领域均有一定变化,教师要理解变化意图,明确设计理念,将数学核心素养落实到课堂中,为了学生的终身发展全力以赴。