培养建模能力提升核心素养

2023-07-06陈平

中国数学教育(高中版) 2023年6期

陈平

摘要：以“学生身高、体重的数据分析”为总课题，引导学生经历选题、开题、做题和结题的数学建模活动全过程. 在信息技术的支持下，学生自主收集数据，自选子课题，完成对身高和体重数据的分析. 积累数据分析活动经验，提升应用意识和创新能力，促进数学核心素养的发展，同时形成统计教学的单元整体设计.

关键词：数据分析；数学建模；单元整体设计；信息技术

大数据和深度学习的发展，推动了数字中国强国战略的实施. 数学建模活动既是高中数学课程的四大主线之一，也是《普通高中數学课程标准（2017年版2020年修订）》（以下简称《标准》）要求的六大核心素养之一. 而基于概率统计实践品质和应用取向的数学建模活动，对学生实践能力和用数据说话的理性精神的培养发挥着重要作用.

一、教学内容解析

1. 内容

本课题是对学生身高、体重数据的分析，研究内容和方法主要基于人教A版《普通高中教科书·数学》（以下统称“教材”）必修第二册第九章“统计”和《标准》附录2“教学与评价案例”中的案例13“分层抽样”确定，并涉及教材选择性必修第三册第八章“成对数据的统计分析”的部分内容，形成了体系完整的高中统计内容的单元整体教学设计.

2. 内容解析

作为高中数学课程的重要内容之一，统计分为必修课程和选择性必修课程两部分. 必修课程中主要学习收集数据的方法和单变量的统计问题；选择性必修课程中主要学习双变量的统计问题. 本次数据分析活动是在学生学完教材必修第二册第九章“统计”之后进行的，以对具体的身高、体重数据的分析为依托，借助信息技术，让学生自主体验数据收集、分析、计算、建模的全过程，发现数据分析的应用价值.

本次数据分析活动以课题研究的形式展开，包括选题、开题、做题和结题四个环节. 教师在开题研讨会上介绍了选题的背景，以及做题的步骤、方法和使用的工具，学生经过小组讨论初步确定了子课题. 做题的过程中召开了两次小组交流会，进一步明确和完善各小组的研究方向和研究方法，最后各小组形成了子课题的研究报告. 本节课是学生做题后的展示和探究环节.

课堂教学分为如下三个部分展开.

第一部分，首先回顾开题研讨会和做题交流会的部分内容，然后分组展示如何收集数据，多角度分析身高、体重数据，完成直观图表的制作和分析. 鉴于教材必修第二册和选择性必修第三册多次介绍了R软件的统计功能，因此本次数据分析活动主要借助R软件进行作图和计算.

第二部分，主要探究分组数据均值和方差公式的计算与拓展，这是教材新增的内容.《标准》第32页明确指出：“结合具体实例，掌握分层随机抽样的样本均值和方差.”课前，学生可以通过R软件计算出当身高、体重数据分两层时，各层样本的均值、方差，以及总样本的均值和方差，而通过教材必修第二册“9.2.4 总体离散程度估计”的例6，学生已经学习了计算分层抽样数据均值和方差的方法，可以利用软件计算的结果验证当总体分两层时利用各层均值和方差求总样本均值和方差的合理性. 课堂上，教师引导学生通过推理论证和小组讨论，把分组数据的均值和方差公式从两层推广到三层和多层，进一步得到一般性的结论，引导学生体会公式对简化运算的作用，对前面所学公式进行巩固和拓展.

第三部分，主要探究双变量数据的统计分析方法，为即将学习的“成对数据的统计分析”作好铺垫. 学生利用所学知识，分组展示用函数拟合的方法研究身高和体重之间的关系，同时展示在高三学长的指导下，用一元线性回归模型刻画身高和体重的相关关系. 教师通过对研究方法的提问和点评，让学生认识到函数模型和统计模型的区别，体会统计思维和确定性思维之间的差异.

根据以上分析，确定本节课的教学重点为：针对所研究的问题，运用适当的方法和模型分析数据.

二、教学目标设置

数据分析素养是《标准》要求的六大核心素养之一. 这就要求我们在教学过程中不能只教会学生计算，更要提升学生获取有价值的信息并进行定量分析的意识和能力. 本次数据分析的目的在于增强学生对数据分析过程的认识，通过课堂展示、小组合作、演算推理等活动，积累基于数据的基本活动经验，突出数据分析的基本过程，促进学生实践能力和创新意识的发展. 基于此设置以下教学目标.

（1）通过收集数据的实践活动，让学生掌握获取数据的基本途径和相关概念，提升学生主动获取信息、定量分析的意识和能力.

（2）通过选择恰当的统计图表对数据进行可视化描述的展示，掌握合理使用统计图表描述数据的方法，在实际统计问题的解决过程中培养学生的数据分析素养.

（3）通过对分组数据均值和方差公式从特殊到一般的推导，熟练掌握利用公式对分层抽样数据的均值和方差进行计算，提升学生的数学运算和逻辑推理素养.

（4）通过对一元线性回归等统计模型的简单介绍，了解一元线性回归模型的含义，体会统计思维和确定性思维之间的差异.

三、学生学情分析

本次数据分析活动的对象为高一学生，基于在小学和初中阶段掌握的统计知识，以及对教材必修第二册第九章“统计”内容的学习，学生能够在课前完成数据的收集，并利用R软件进行统计图表的制作及对样本数据取值规律进行初步的分析和计算. 虽然R软件的程序语言编写有一定难度，但是在班内部分精通程序语言的学生的指导下，各小组可以完成统计图表的制作.

虽然学生具有一定的自主探究和合作学习能力，但是提出新问题的意识和解决新问题的能力仍然有所欠缺. 课前，学生只能仿照前面学过的方法推导出总体分两层时的均值和方差公式，为了让学生更好地掌握重点内容，把分层抽样公式的拓展（即《标准》案例13“分层抽样”）放到课堂上重点突破. 教材在必修第二册第九章首次引入求和等符号，多数学生对抽象符号的表示和理解有一定困难. 为了降低学生的理解难度，在拓展探究环节对《标准》案例13中的符号也进行了适当的改变和调整.

由于学生只在必修课程中学习了单变量统计问题，对分析两个变量关系的统计问题的知识储备不足，在研究身高与体重之间的关系时遇到了困难. 教师引导学生通过查阅资料、向学长请教等多种学习方式，了解两个或多个变量关系问题的研究方法.

根据以上分析，确定本节课的教学难点为：对于不同的问题，构造相应的统计模型分析随机现象的本质；分层抽样均值和方差公式的拓展.

四、教学策略分析

基于统计单元的整体教学，本课题设计了开放情境下的课题研究问题，包括对数据收集方式的选取、分析方向的确立、简化计算的探求、模型建构的尝试等.

（1）采用“小组讨论确定课题—组内合作完成课题—课堂展示课题成果—师生互动深化成果”的流程突出数据分析的基本过程，帮助学生建立对统计的整体认识.

（2）通过课堂展示、独立思考、合作探究和请教研讨等多种学习方式，提升学生用数学的眼光观察现实世界、用数学的思维思考现实世界和用数学的语言表达现实世界的能力，树立善于思考、严谨求实的科学精神.

（3）通过对《标准》案例13“分层抽样”中难点问题的适当分解和情境式问题串的设置，让学生有效突破难点，提升学好数学的自信心，养成良好的学习习惯.

（4）通过信息技术与数学课程的深度融合，提高教学的时效性. 让学生快速、准确地完成列表、画图、计算等数据处理，将更多精力集中于对统计概念和方法的理解上.

五、教学过程设计

本节课按照“前情回顾—展示交流—拓展探究—模型建构—总结升华”五个环节展开，重点是拓展探究环节.

1. 前情回顾

教师展示兩周前举行的开题研讨会和做题交流会的片段.

在开题研讨会上，教师先介绍数据分析的背景，即国家卫健委对中学生身高和体重健康的调查情况，旨在激发学生的学习兴趣，引导学生发现数学的科学价值和应用价值. 再通过教师提问和学生作答复习回顾本章中用到的数据分析的基本步骤和方法，落实“四基”. 接着，学生在开题研讨会上现场演示利用R软件作图的过程，让所有学生了解统计软件的功能和使用方法，最后通过小组讨论确定子课题.

做题期间，通过召开组长交流会，进一步明确和完善各小组的研究方向，各小组完成自己的子课题研究报告，以备课堂展示.

【设计意图】让学生体会数学建模活动需要经历选题、开题、做题和结题四个环节，培养学生发现问题、提出问题、分析问题和解决问题的能力. 通过课前的前情回顾，提升学生课堂展示和探究的积极性.

2. 展示交流

（1）分层抽样收集数据.

收集数据的志愿者展示数据收集方式的选取、方案的制订、数据的录入等环节，最后形成身高、体重数据的Excel表格，以备分析使用.

【设计意图】分析数据之前先让学生清楚研究对象的意义和价值. 如何收集数据获得研究对象是统计研究的重要内容，也是统计最先学习的内容，让学生针对实际问题设计收集数据的方法，积累数学基本活动经验.

（2）总体取值规律直方图.

第一小组分别展示男生、女生的身高和体重数据的频率分布直方图（略），全面描述了男生、女生身高和体重数据的总体取值规律.

【设计意图】对于单变量观测数据，先全面、客观地分析原始数据的总体取值规律，有利于把握原始数据的全貌，获得样本的规律. 而利用频率分布直方图来整理和表示数据，比较直观和清晰.

（3）BMI值取值规律直方图及统计量.

第二小组展示确定用BMI值衡量胖瘦标准的讨论过程，并播放利用Excel表格计算BMI值的步骤的微课视频，最后结合如图1和图2所示的男生和女生BMI值的频率分布直方图和描述数据特征的统计量，分析BMI值的取值规律.

模型分析：男生数据的中位数和平均数均略高于女生数据，但是都在正常范围之内. 而由标准差和方差可以看出，女生数据比男生数据更为集中，但是男生数据的极差远大于女生数据，可见男生的胖瘦差异更大，这一点在统计图上有很好的反映. 男生BMI的最大值为35，而女生BMI的最大值在30左右. 另外，从整体上来看，男生数据的BMI值主要集中在15到25之间，较为分散，而女生数据的BMI值主要集中在15到24之间，后面数据呈阶梯式下降，男生和女生中均有少数学生偏瘦，女生中偏瘦的人数略高一些.

【设计意图】设计开放性问题，放手让学生讨论胖瘦标准的制订，培养学生发现问题和解决问题的能力，以及合作意识. 在学生已经知道如何计算统计量的情况下，让学生用R软件计算出样本的统计量，可以节约时间，把更多的精力用在理解特征数的含义上.

（4）胖瘦比例复合条形图和扇形图.

第三小组展示描述胖瘦比例的讨论过程，学生在讨论如何更直观地呈现男生和女生的胖瘦比例的过程中，分别提出了使用表格、复合条形图和扇形图.

【设计意图】通过采用不同的统计图表对胖瘦比例进行描述，引导学生多角度地思考问题，发散学生的思维.

（5）总体分为两层时总样本的均值和方差公式.

除了选择恰当的统计图表描述数据，还可以选择恰当的数字特征刻画数据. 均值和方差是描述数据集中趋势和离散程度的重要统计量. 第四小组学生依据均值和方差的定义，猜想加验证，推出了总体分为两层时的均值和方差公式.

记男生数据样本数为[m，] 均值为[x1，] 方差为[s21；] 女生数据样本数为[n，] 均值为[x2，] 方差为[s22，] 则总样本均值[x=][1m+nmx1+nx2，] 方差[s2=1m+nms21+x1-x2+][ns22+x2-x2.]

利用公式进行计算，不仅不需要依赖原始数据，减少了运算量，而且可以清晰地展现数据之间的关系.

【设计意图】在学生已经掌握定义及基本计算公式的前提下，引出本節课需要突破的难点——分层抽样总样本的均值和方差公式. 对于难点问题，采用从特殊到一般的方式进行研究，符合学生的认知规律.

3. 拓展探究

探究1：总体分为三层时总样本的均值和方差公式.

问题1：在获取了高一年级学生BMI值样本的均值和方差的基础上，我们又用同样的方法获取了高二和高三年级学生BMI值样本的均值和方差. 那么，如何计算全校学生BMI值总样本的均值和方差呢？

师生活动：学生先独立演算，然后分组讨论，最后由学生代表讲解推导过程，教师进行点评.

【设计意图】在前一节已经学习了总体分两层时总样本的均值和方差计算方法的前提下，引导学生推导总体分三层时的均值和方差公式. 由于学生对求和记号的表述普遍感到困难，故本环节采取“独立演算—小组交流—学生讲解—教师点评”四个步骤进行教学，以让学生更好地掌握数学抽象符号的表达与计算，培养学生的数学抽象、逻辑推理和数学运算等素养.

探究2：用各层样本权重表示总样本的均值和方差.

问题2：若由于保管不慎，导致高二年级学生BMI值原始数据样本量丢失，还能计算出全校学生BMI值总样本的均值和方差吗？

学生活动：学生各抒己见，自由发言，有的学生认为不能，因为需要知道公式中[m，n，l]的具体数值才能计算；有的学生认为通过公式中各项的系数可以看出各层数据在总样本中所占的比重，可以进行计算.

教师点评：只需要知道各层数据的权重，就可以算出总样本的均值和方差，把公式用权重形式来呈现，可以得到更简洁的形式.

【设计意图】引导学生用权重来表示分层抽样的均值和方差公式，不仅可以促进学生深刻理解公式的本质，还可以用更简洁的形式呈现公式，并为将公式推广到[k]层作好铺垫. 通过情境式的设问，让学生树立善于思考、敢于质疑、严谨求实的科学精神.

探究3：总体分[k]层时总样本的均值和方差公式.

问题3：某市25所高中都采用同样的方法获取了本校学生BMI值样本的均值和方差，你可以由此计算出全市高中生BMI值总样本的均值和方差吗？

学生活动：学生先独立寻找规律写出推广公式，再进行组内交流活动，然后在黑板上写出总样本均值和方差公式[x=i=1kwixi， s2=i=1kwis2i+xi-x2，] 并讲解将公式推广到[k]层的规律.

教师点评：总体分为[k]层的分组数据方差公式是统计学中重要的公式之一. 功能强大的软件加上方便快捷的算法，必将使我们的数据分析如虎添翼，更加精准和高效.

【设计意图】引导学生观察、发现运算规律，写出总体分为[k]层时的均值和方差公式. 由于《标准》案例13中所呈现的推导过程[s2=1nj=1kt=1njxjt-x2]对高一年级的学生来说理解难度较大，故在教学时采用权重的形式来呈现. 有了前面总体分为三层时的均值和方差公式的权重形式作铺垫，学生只需要发现运算规律，进行归纳推理便可以得到总体分为[k]层时的均值和方差公式.

4. 模型建构

前面4个小组利用已学知识分别把身高或体重数据看成单个变量的观察数据进行了分析. 其实还可以把身高和体重看成两个变量，研究它们之间的关系. 第五小组根据原始数据作出了散点图，教师借此机会让学生认识身高与体重数据之间的随机关系.

问题4：身高和体重这两个变量之间是否为函数关系？

学生活动：学生各抒己见，有的学生认为通过观察原始样本数据可以看出，同一身高下体重的取值不同，同一体重下身高的取值也不同，所以身高和体重两个变量之间不是函数关系；有的学生认为，身高和体重数据之间不像函数关系那样有着明确、严格的依存关系，不确定性很大，所以不是函数关系.

教师点评：无论是观察原始样本数据，还是根据生活经验，都可以判断身高和体重数据只是相关，但是并没有确定性的函数关系，所以需要引入新的模型来研究身高和体重数据之间的随机关系.

模型1：借助函数模型研究身高和体重的关系.

学生活动：第五小组展示课前研究成果，即把身高和体重数据处理后再用函数模型进行拟合. 他们先将男生的身高数据每间隔3 cm进行分组，并计算出对应的体重均值，得到10组数据并作出散点图，发现男生身高和体重数据之间大致呈现正比例关系，分别用一次函数、二次函数、指数函数、对数函数进行拟合，Excel软件显示了对应函数表达式和相应的[R2]（如图3 ～ 6），学生通过查阅资料得知[R2]越大拟合效果越好，所以认为二次函数拟合效果最好. 用同样的方法对女生的身高和体重数据进行处理，也是二次函数拟合效果最好.

教师点评：第五小组用我们熟悉的几种函数模型拟合数据来分析身高和体重变量间的关系. 这提示我们，身高和体重数据间的随机关系尽管不能用函数模型精确地刻画，但可以借助函数工具来研究.

【设计意图】利用已经学过的函数模型来研究身高和体重的关系，即用函数来刻画身高对体重的影响，为建立一元线性回归模型作铺垫.

模型2：建立一元线性回归模型刻画身高和体重的关系.

第六小组为了和其他小组的研究方向不重复，一直都没能找到很好的方向来研究，后来在高三学长的指导下，发现身高和体重数据具有一定的线性相关性，也就是在一次函数模型的基础上，通过引入随机误差项，建立了可以刻画两个变量之间随机关系的一元线性回归模型. 但是，他们还是感觉身高和体重数据之间的相关性不强，带着这个疑问，他们又去请教了三峡大学数理统计方向的博士. 通过请教，学生知道进入大学后，还会通过建立多元线性回归模型、时间序列模型等更多方法来刻画变量之间的随机关系.

【设计意图】鉴于高一学生学习的数据分析方法和模型有限，在学有余力的情况下，让学生通过自学、探讨和请教等方式了解更多数据分析的模型和方法. 课后的探索和研讨不仅是对学生当下统计学习的延伸，更是在更高站位上对统计内容的整体把握.

问题5：一元线性回归模型是不是刻画身高和体重关系最合适的模型？

学生活动：学生提出体重会受到遗传、生活习惯等多种因素的影响，可能更适合用多元的回归模型来刻画，仅用一元线性回归模型来刻画可能与实际误差较大.

教师点评：高中阶段用一元线性回归模型来刻画身高和体重的关系，只是一种简化处理. 在大学的学习中，我们将探寻更多模型，学习更多检验模型的指标来帮助我们分析更多类型、更复杂的数据. 当然，任何数学模型都只是对现实世界的一种近似的数量描述，所以模型没有最好，只有更好. 正如统计学家乔治·博克斯所说：所有模型都是错误的，但有些是有用的.

【设计意图】通过第六小组建立的一元线性回归模型，让学生认识到函数模型和统计模型的区别，学会用统计的思想去建立模型，刻画两个变量之间的不确定性关系.

5. 总结升华

（1）提升对统计学习的认识.

學生回忆本节课的主要内容，体会统计的基本思想方法. 在由确定性向不确定性转变的过程中，要建立随机思维方式和相应的世界观，统计的魅力也正在于此——从随机中寻找规律性.

（2）明确统计学习的基本素养.

积极肯定学生在整个建模活动中的出色表现，培养学生的学习兴趣和思维品质.

（3）巩固、完善建模结题成果.

课后对建模成果进行整理总结，完成本校学生体质情况调查报告，并开展成果汇报交流会，组织学生进行自评和互评，形成结题成果.

（4）增强数据分析的责任和担当.

数据，不仅是科技符号，更是文化符号. 数据文化，就是尊重事实、强调精确、推崇理性和逻辑的文化. 中华民族特有的数据文化，如结绳记事、河图洛书、珠算计数，都是祖先留给我们的宝贵财富. 作为大数据时代的有志青年，我们理应肩负起数字未来的时代担当，始终保持奋发有为的姿态，争做数字中国的创新者和引领者.

【设计意图】将对函数模型和统计模型的比较上升到对统计学习的认识，培养学生用统计眼光看问题的意识. 对本次数据分析活动进行总结回顾，不仅给学生积极的评价和鼓励，更让学生树立数据分析的科学精神和历史责任感，提升课程的思政价值.

六、教学反思

《标准》强调，要培养学生的数学应用意识，力求让学生深切体会到数学在解决实际问题中的作用，以及与其他学科之间的关系. 作为高中数学课程的四条主线之一，数学建模活动与数学探究活动正是数学应用价值的重要载体和着力点. 本次数据分析活动，以《标准》为基本指导思想，进行了大胆的尝试和实践，收获了很多成功和惊喜.

首先，坚持学生为本的理念. 教学过程中始终坚持以学生为主体、教师为主导的教育理念，让学生成为学习的主人，放手让学生收集数据、自选角度研究数据、寻找途径验证数据，再根据教师的设问自主研究、演算推理、展示交流、获得结论，最后自主完成课题研究报告. 由于整个过程由学生自主完成，教师只是教学活动的组织者和引导者，学生在探究式、体验式学习中的获得感显著增强，这一点通过学生做题过程中的积极参与可以很好地体现.

其次，尝试教学模式的创新. 基于单元整体教学的思路，本次数据分析活动采用课题研究的方式进行，教师先引导学生完成选题、开题环节，然后学生利用课余时间完成做题过程. 由于课前学生有充足的时间进行思考和讨论，完成了对统计软件的学习和使用，所以课堂上的五组展示非常顺利和高效. 对分层抽样的均值和方差公式的三次探究层层递进，符合学生的认知规律. 根据课堂小组讨论时巡视的情况来看，大部分学生对抽象符号的运用掌握较好.

再次，注重学习方式的转变. 在教学过程中，教师除了引导学生借助已有的知识和方法进行数据分析，还鼓励学生了解选择性必修课程和大学统计课程中相关的统计方法. 通过网络搜索、合作探究、交流请教等多种方式，引导学生进行多样化、个性化、有时代特征的学习和实践. 学生课堂上的精彩展示，体现了各小组在合作探究过程中集体智慧的结晶. 在向高三学长和大学博士请教的过程中，学生学到了更多关于统计的知识和方法. 由于课堂时间有限，没有过多展示，课后学生分享了自己录制的更详细的视频学习资源，极大调动了学生数据分析的兴趣和热情，开阔了学生的眼界.

最后，融入信息技术的运用. 本次数据分析活动大胆尝试，采用R软件进行数据分析，让学生将更多的精力集中于对统计概念和方法的理解上，这与我们学习统计的目的和意义相契合. 不仅快速、准确地完成了列表、画图、计算等数据处理，还详细、深入地从多个角度对数据进行了描述和刻画.

教学是遗憾的艺术，教学的设计和实施没有最好，只有更好. 本节课的遗憾之处在于对于分层抽样均值和方差公式中数学抽象符号的理解和表达，以及公式的变形和推导，部分学生仍然存在一定困难. 鉴于课堂时间有限，课后准备考虑再设计一些计算问题让学生及时巩固，或者在后面的学习中再次强化. 一些课堂教学的细节处理也可以做得更好. 课堂上在对分层抽样均值和方差公式进行拓展后，对分层公式的意义，即对数据分布进行分析的思想阐述不够. 课堂小结部分，对数据分析文化的介绍还可以更丰富一些. 例如，西周的平均数分析法，宋代的中位数分析法和图表分析法等.

参考文献：

［1］中华人民共和国教育部. 普通高中数学课程标准（2017年版2020年修订）［M］. 北京：人民教育出版社，2020.

［2］史宁中，王尚志.《普通高中数学课程标准（2017年版2020年修订）》解读［M］. 北京：高等教育出版社，2020.

［3］章建跃，张艳娇，金克勤. 数学建模活动的课程理解、教材设计与教学实施［J］. 中学数学教学参考（上旬），2020（5）：13-19.