借助GeoGebra开展“统计”单元可视化教学
2024-04-14周李晓
《普通高中数学课程标准(2017年版2020年修订)》(以下简称“课标”)明确要求在“统计”的教学中,教师应教会学生合理使用信息技术,将其从机械、烦琐的数据处理中解放出来,把更多的精力集中在“统计”概念和方法的理解上,从而提高效率[1]。在“统计”单元中有大量数据需要师生处理分析,且过程复杂,一般包括收集、整理、提取、建模、得出结论五步。教师以传统方式教学难以落实课标要求。教师如果直接人工计算,费时费力,将极大程度地降低教师备课的效率和教学的积极性,且计算之后得到的结果无法直观呈现给学生,影响教学效果。从学生的角度来看,计算烦琐、过程冗长及刻板呈现数据表格和图形会大大降低学生学习的积极性。为弥补传统教学的不足,在“统计”单元教学中,教师可以合理地使用信息技术。教师要重视教材边注中的提示信息,包括信息技术工具的使用、选学栏目中信息技术的应用、统计软件的应用。笔者将“统计”单元中与信息技术及统计软件相关的内容进行整合,借助GeoGebra软件做案例研究,开展可视化单元教学,提高教学效率和质量。
一、确定单元可视化教学目标与内容
在高中数学课程中,“统计”内容主要分布于必修课程和选择性必修课程。在必修课程中,教师主要教授收集数据的方法和单变量的“统计”方法;在选择性必修课程中,教师主要教授两个变量的“统计”方法。教师按以下步骤设计教学目标 :首先,研读教材和教师教学用书,结合课标明确“统计”单元的教学要求;然后,筛选“统计”单元中与信息技术相关的内容用于单元可视化教学,并且确定“统计”单元可视化教学目标;最后,选择可视化教学的案例,准备所需素材或数据,便于开展课堂教学,帮助学生积累数据分析的经验,培养学生的数学学科核心素养和信息技术核心素养。
单元可视化教学的具体目标:
第一,结合具体的例子,掌握简单随机抽样、分层抽样方法,认识抽样的必要性;明确两者各自适用的范围及特点,根据具体问题特点,选择不同的抽样方法获取数据,设计具体的方案解决问题,并借助GeoGebra有效计算样本均值、方差、中位数、众数等。
第二,理解统计图表的应用原理,会列频率分布表,能绘制频率分布直方图、散点图等基础的统计图表;根据实际问题、数据分析的需求,选择合适的统计图表进行可视化描述,切身感受合理使用统计图表的重要性;借助GeoGebra软件绘制统计图表[2]。
第三,结合实例,了解相关系数的统计意义,并通过相关系数比较多组成对相关数据的相关性;理解一元线性回归模型的含义[3];借助 GeoGebra软件进行可视化探究,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关统计软件进行数据处理,建模并优化。
单元可视化教学内容设计如下(如图1)。
二、可视化教学案例及分析
(一)四个样本图表的绘制和四个数字特征的计算
案例源自人教A版《普通高中教科书 数学 必修 第二册》第九章9.2.1“总体取值规律的估计”问题1。
1.研究意图
解决上述问题涉及大量的计算和统计图表的绘制,特别是在涉及频率分布表以及频率分布直方图时,师生需要对大量数据进行分组、计算频率、绘制图形等。在学生掌握了特征数字的计算方法,以及频率分布表的作法与频率分布直方图的画法,理解了它们的统计意义之后,对于其中的一些繁杂的计算任务,教师可以指导学生借助GeoGebra软件完成。课堂上,教师使用GeoGebra的运算功能及统计图表的绘制功能,展开系列可视化探究问题,让学生观察教师的演示操作,掌握基本的操作步骤,引导他们学会借助软件计算四个特征数字,学会绘制四个样本图表。在教师的引导下,学生观察GeoGebra绘制的图表及计算结果,进行可视化描述及分析,开展探究活动,掌握本节课的内容。
2.探究内容
探究1:频率分布直方图与频数分布直方图有什么区别?
探究2 :观察频率分布表和频率分布直方图,你觉得这组数据中蕴含了哪些有用的信息?居民用户月均用水量有何分布规律?你能准确描述吗?
探究3:分别以3和27为组数,对数据进行等距分组,画出100户居民用户月均用水量的频率分布直方图。观察图形,不同的组数对于直方图呈现数据分布规律有什么影响?
探究4:频数分布直方图、条形图、扇形图、折线图分别适用于哪些方面?
探究5:平均数、中位数、众数各自有何特点?
3.GeoGebra可视化探究步骤
具体的操作步骤指引如下(如图2)。
步骤1:打开GeoGebra软件,同时按下“Ctrl+Shift+S”调出表格区,在表格区内A列输入教材问题1中的数据。
步骤2:选中A列的数据,在工具栏中单击“单变量分析”,单击“分析”,即可得到频数分布直方图。
步驟3 :单击“选项”按钮,分别勾选“频数表”和“正态化”,即可得到频率分布表和频率分布直方图。
步骤4:单击“直方图”右侧的下拉选项,得到“条形图”,输入指令“扇形图(l1)”得到扇形图。
步骤5:单击“显示统计”按钮,得到常见的统计量,如平均数(均值)、标准差、最值、百分位数等。如果想得到方差、众数,可以输入指令进行计算。首先选中“A列”,右键“创建列表”得到“列表l1”;然后在指令框中分别输入“方差(l1)”“众数(l1)”,即可计算出该组数据的方差及众数。
步骤6:单击“显示数据”按钮,剔除极端值,使统计结果更准确。
步骤7:拖动“分组滑动条”进行分组。也可勾选“手动设置分组”实现预设的设置分组[4]。
4.可视化探究内容解读
对于探究1,教师指导学生操作步骤1到步骤3,可以得到频数分布直方图与频率分布直方图。此时教师引导学生观察GeoGebra绘制的两个图表,进一步探究两者之间的区别,让学生进行可视化描述。在学生回答之后,教师总结:两者的横坐标是一样的,区别在于纵坐标,一个是“频数”,另一个是“频率/组距”,两者都可以用来描述数据的取值规律。借此进一步深化学生对频率分布直方图的理解。
对于探究2,教师可以在结束探究1之后,直接向学生提出。同样,分别引导学生观察GeoGebra绘制的图表。学生不难得出:观察频率分布表,可以清晰看出样本数据落在各个组别所占比例的大小。观察频率分布直方图(如图2b)可知,居民用水量的样本数据分布不是对称的,图形呈现出“左高右低”,并且右边呈现出一个较长的“尾巴”,这表明大部分居民的用水量集中在一个较低值的范围。此时,教师可以引导学生思考现实生活中,用水量标准的确定与该图形呈现出来的分布有什么联系,让学生学会观察样本数据的特点进而推断整体的分布规律,体会统计基本思想,感受直方图的优点和不足之处。以此促使学生用数学的眼光看问题,体会通过建立数学模型去分析实际问题的方法。
对于探究3,教师通过步骤7,改变组数,让学生体会不同组数对频率分布直方图的形状的影响(如图3)。学生观察动态变化情况,不难得出:同一组数据,组数不同,得到的频率分布直方图形状也不尽相同。当组数少、组距大时,原始数据损失较多,无法得到详细的数据分布情况,但能够看出数据整体的分布特点。当组数多、组距小时,保留了较多的原始数据,但是图形会显得不规则,不容易看出总体数据的分布特点。最后教师强调合理分组、合理使用图表的重要性。
对于探究4,教师通过步骤4的操作,可以实时生成不同统计图,但教学中不能直接总结各种统计图的特点和适用范围,应该引导学生观察辨析。教师基于学生的认知基础,结合熟悉的例子让学生在对比中体会区别与联系,让学生体会到数学来源于实际,来源于生活,使学生感受知识生成的合理性,水到渠成得出结论。
对于探究5,在学生掌握了样本平均数、众数、方差、百分位数等特征数的统计意义及计算方法之后,教师在课堂上借助GeoGebra实时演示,通过步骤5的操作,让学生感受GeoGebra软件统计的便捷性。同时,为了更好地开展“总体集中趋势的估计”与“总体离散程度的估计”两个课时的可视化探究,让学生分组合作思考相关问题,探究得出平均数、中位数、众数各自的特点及优缺点。步骤6的目的是教师勾选更改样本数据,进行可视化演示,直观得到样本平均数会随着抽取的样本的不同而改变,让学生体会样本平均数等数据的随机性。
(二)一元线性回归模型的建立与优化
案例源自人教A版《普通高中教科书 数学 选择性必修 第三册》第八章8.2“一元线性回归模型及其应用”。
1.研究意图
意图二:在第一课时一元线性回归模型的概念的基础上,进一步研究如何估计模型的参数a和b。学生借助GeoGebra,进行可视化探究,寻找合适的方案确定参数a和b。在确定回归曲线原则的过程中引导学生:从数到形,引出“用一条直线拟合样本数据”的思想;从形到数,建立刻画样本数据与直线整体接近程度的数学表达式q,即随机误差的平方和。借此,找出拟合度最高的一元线性回归模型,确定a和b。最后借助GeoGebra软件计算残差,绘制残差图并分析,判断模型是否具有有效性。
2.探究内容
探究1:如何绘制散点图,观察散点图,图中的点在分布上呈现何种特点?
探究2:观察散点图,成对样本数据具有什么关系?借助哪个样本数据统计量佐证判断?如何计算?
探究3:成对样本数据的关系可以利用函数模型刻画吗?应该用什么数学模型刻画呢?
探究4:在建立一元线性回归模型之后,怎样利用样本数据寻找一条“最好”的直線,使得成对样本数据的散点与这条直线最“接近”。如何用数学的方法刻画各散点与直线的接近程度?
探究5:如何利用残差分析一元线性回归模型的有效性?分析并修正回归模型。
3.GeoGebra可视化探究步骤
步骤1:打开GeoGebra软件,同时按下“Ctrl+Shift+S”调出表格区,在表格区内A列、B列,分别输入教材第105页表8.2-1中的数据。
步骤2:选中A、B两列的数据,在工具栏中单击“双变量回归分析”,单击“分析”,即可得到散点图。
步骤3:分别选中A、B两列,分别单击右键选中“创建列表”得到列表l1、l2。在指令栏中输入“相关系数(l1,l2)”,计算出相关系数r。
步骤4:同时按下“Ctrl+Shift+1”调出绘图区,选中A、B两列的数据,用右键选中“创建点列”得到列表l3,此时绘图区同时出现了14组数据所形成的散点图。
步骤5:在工具栏中选择“描点工具”,在散点图中单击得到O、P两点,指令栏中输入“直线(O,P)”得到直线f。以同样的方法操作可以得到两条可移动的直线g和h,从而得到动态交互课件,开展试验探究活动。
步骤6:在指令栏中分别输入“q_1=误差平方和(l1,f)”,“q_2=误差平方和(l1,g)”, “q_3=误差平方和(l1,h)”,得到3个数字,进行对比。
4.可视化探究内容解读
对于第二个案例中的探究1和探究2,学生已经学习过散点图及相关系数r的知识,教师演示步骤1和步骤3,是为了引导学生用GeoGebra软件绘散点图并计算相关系数r。在绘制出散点图之后,学生观察总结散点图呈现的分布特点:“大致分布在一条从左下到右上的直线附近”。由此,得出结论:成对样本数据具有线性关系,且是正相关。学生输入指令进行计算,得到相关系数r的值,进一步佐证正相关关系,且相关程度较高。借助GeoGebra软件进行可视化探究,通过散点图定性推断两个变量之间的关系,再根据样本数据进一步定量推断两个变量相关的正负性及相关性程度。
对于探究3,经历了探究1和探究2之后,师生已经共同抽象概括出“散点大致分布在一条直线附近”这一特点。教师设问“能否利用函数模型来刻画其关系”,引导学生直观感受散点图,结合函数的一一对应关系,发现这组变量(儿子的身高和父亲的身高)无法用函数关系来刻画。此时,教师引导学生思考发现这组变量的影响因素并不是单一因素。学生结合生活经验得出结论:还有其他因素影响子女的身高,如母亲身高、生活环境、饮食习惯等因素。如此,在函数模型的基础之上,引入随机误差,得到一个新的数学模型——一元线性回归模型。
对于探究4,在建立模型之后,为了找到一条“最好”的直线,课堂上教师可以借助GeoGebra进行步骤5的操作创设交互动态课件,与学生一同开展可视化试验探究。教师结合几何直观和数学逻辑,引导学生寻找不同方法得出与样本数据点整体上最“接近”的直线,在寻找最好的直线的过程中,适时引入“残差”“残差平方和”的概念。以此,发挥学生的自主性,鼓励学生有不同的想法,发展学生的发散性思维。
师生共同探究,得到以下四种方案。教师利用GeoGebra开展四种方案的可视化探究,引导学生探究哪种方案更好及其原因。
方案一:使直线两侧点的个数相同。
方案二:使直线过尽可能多的点。
方案三:在散点图中多取几对点,确定出几条直线的方程,分别求出这些直线的斜率、截距的平均数,将这两个平均数作为所求直线的斜率和截距。
方案四:使散点均匀地分布在直线两侧,那怎么量化“均匀”呢?或者说,可以借助一个怎样的数学量来刻画散点与直线的整体接近程度呢?
针对方案一,教师借助GeoGebra创设的动态交互课件,让学生上台拖动点O、P进行探究,不难发现:能使两侧点的个数相同的直线不止一条。因此,在这种标准下,回归直线没有最优解。
针对方案二、方案三,进行同样的操作。师生发现按以上三种方案操作,得到的直线并不是唯一的(如图4),即在一个方案标准之下无法得到最优解。所以,前三个方案不是理想方案。
针对方案四,教师引导学生确定刻画样本数据与直线整体接近程度的数学量,即“各散点到直线的竖直距离的平方之和”,从而引入残差平方和q。学生剖析q的表达式,推导展开,最终求得能使q最小的a、b。在学生理解这一过程之后,以上师生共同利用q求a、b的过程就是本节的核心知识点——最小二乘法。在经历问题数学化后,学生按照步骤6,输入指令得到三个残差平方和的值,在探究的过程中直观感受到残差平方和q的大小。
三、可视化教学实现正反馈
(一)个性、高效:数字化教学有利于减负增效
技术与教育有机融合对提高教学效率有积极影响。统计软件的应用不仅为教师提供了处理大量数据的工具,而且为学生提供了更具吸引力和互动性的学习方式。这种融合不仅有利于教师解决教学中的问题,而且有利于激发学生学习数学的兴趣。教师借助统计软件能够更轻松地处理和分析大量数据,可以更好地个性化教学,因材施教。同时,自动化工具的应用可以减轻教师的工作负担,让他们有更多时间专注于教学水平的提升。
(二)直观、有趣:可视化激发学生潜能
在教学中,可视化技术发挥了关键作用,学生学习更加生动,互动性更强。学生可以观察实时的图形或动态模拟探究,更深入地理解抽象的知识。这种互动性和可视性激发了学生的兴趣,使他们更愿意积极参与学习过程。例如,在案例中,教师借助散点图、图表和动态演示,让学生直观地理解抽象概念、观察数据及模型的效果。这种可视化教学使学生学习更生动、有趣,同时有助于提高学生数据分析和图形解释的能力。
(三)互动、实践:探究学习贯穿全过程
在单元教学中,教师可以采取问题驱动的方式来开展探究和实验导向的学习活动。教师设置与单元主題相关的实际问题,激发学生的好奇心,鼓励他们主动探究和寻找答案。参与问题导向的学习活动,学生能够更好地理解概念和目标。教师鼓励学生主动参与探究和实验,强调学生的主动参与,引导他们提出问题、制订实验计划、收集和分析数据,最终得出结论。学生在解决问题的过程中独立思考,增强了创造性思维和批判性思考能力。学生参与实际的实验和探究活动,能够更深入地理解课程内容。他们不是被动地接受知识,而是在亲身经历和互动性学习中更好地掌握并应用概念。这种深刻的理解有助于长期记忆并应用知识。学生根据模拟和实际数据进行实验,不断改进模型和分析方法,其思维能力不断进阶。
技术与教学的融合以及可视化、探究导向的学习方法的运用为教学带来了积极的变革。这样不仅能满足学生的学习需求,而且能提供更好的学习工具,为培养更具创新力和解决问题能力的学生锦上添花。
注:本文系广州市教学成果培育项目“技术赋能,素养提升:GeoGebra与数学教学深度融合的实践探索”(项目编号:2023127958)的研究成果。
[1] 中华人民共和国教育部.普通高中数学课程标准:2017年版2020年修订[S].北京:人民教育出版社,2020.
[2] 高用.关于“成对数据的统计分析”的教学理解与思考[J].中学数学教学,2021(6):6-8.
[3] 张唯一.结合典型案例学习数据分析方法 加强统计概念和方法的形成过程:人教A版普通高中教科书《数学》(选择性必修第三册)第八章“成对数据的统计分析”编写思考[J].中学数学教学参考,2022(13):10-13.
[4] 周李晓.GeoGebra与高中数学教学深度融合的案例研究[J].理科考试研究,2022(21):25-26.
[5] 程海奎,章建跃.通过成对数据的统计分析发展学生的数据分析素养[J].数学通报,2022(3):7-17.