数据分析素养为本的教学实践与反思
2022-05-30孙军波
孙军波
[摘 要] 针对如何在教学中培养数据分析素养的问题,研究者以“频率与概率”单元教学为例,使学生经历知识探索和发现过程,感悟如何获取有用的数据、如何选择有效的方法、如何得到有意义的结论,进而探讨了培育数据分析素养的方法:实践收集和整理数据的操作过程;课堂上突出数据分析处理过程,包括从分组试验到汇总统计的各环节;提升使用信息技术辅助数据分析的能力;设计开放性作业,在解决问题中提升数据分析素养.
[关键词] 数据分析;频率与概率;教学实践与反思
[?]问题提出
信息化社会的高速发展伴随着大数据时代的到来,数据分析变得越来越重要. 新课标中把数据分析作为六大核心素养之一,期望培养学生能用数据来研究问题的习惯. 因此,教学中要求教师注重培养学生收集、整理、分析数据的能力,提升学生提取有用信息和形成结论的能力.
在传统教学中,师生往往不重视统计和概率的教与学,压缩了学习过程和时长,只学习与解题相关的几个公式和结论. 随着教学改革的推进,越来越多的教师开始意识到,“概率与统计”课程承担的是培养学生理解和处理随机现象的能力. 它的价值不仅在于概念与技能的学习,更在于对学生数据分析素养的提升. 所以在“统计和概率”的课堂教学中,如何提升学生数据分析的能力,成了一线教师关注的热点.
[?]数据分析素养的内涵
数据分析是指针对研究对象获取数据,运用数学方法对数据进行整理、分析和推断,形成关于研究对象知识的素养. 主要过程包括:收集数据,整理数据,提取信息,构建模型,进行推断,获得结论. 为提升学生数据分析的能力,新课程大大提高了“概率与统计”的地位与比重. “概率与统计”不仅是必修课程的五大主题之一,也是选择性必修课程的四大主题之一,而且在选修课程中做了进一步的深化与拓展.
[?]以新人教A版高中数学教材“频率与概率”单元设计为例的理由
新课标指出:“概率的研究对象是随机现象,为人们从不确定性的角度认识客观世界提供重要的思维模式和解决问题的方法. 统计的研究对象是数据,核心是数据分析. 概率为统计的發展提供理论基础.”其中“频率与概率”单元包括频率的稳定性、频率与概率的联系与区别、用频率估计概率、随机模拟等知识,体现概率为统计的发展提供理论,统计为概率的发展提供工具.
在新人教A版高中数学教材中,“频率与概率”位于第十章第三节,与原人教A版高中数学教材中的“随机事件的概率”和“整数型随机数”的内容有很大关联.在该知识单元中,充分体现了学生的数据分析素养的培育过程:通过实例介绍用频率估计概率的必要性和合理性,培养学生学习频率与概率的联系与区别;再介绍随机模拟方法,高效实现大量重复试验.教学过程围绕核心问题寻找解决办法,针对研究对象获取有用的数据,借助图表对数据进行整理和分析,然后学习随机模拟方法提高试验效率,最后通过分析数据获得有意义的结论.
[?]案例:以数据分析素养为导向的“频率与概率”单元教学设计
1. 学习内容分析
(1)知识产生的背景与固着点.
生活中有许多不确定性现象,人类需要去解决这些随机问题. 最早将生活中的随机问题提升到理论化高度,就是赌博中的点数问题:两人玩游戏约定先赢六局者胜,但当甲赢5局乙赢3局时,中途因故停止,应如何分赌金?这一问题引起了很多数学家的兴趣. 后来数学家帕斯卡和费马成功地解决了这一问题,赌金问题的研究是现代概率知识产生的固着点.
(2)知识生长的过程与阶段.
概率定义的产生和发展经历了漫长的过程:①早期概率的描述性定义为“概率是随机事件发生的可能性大小的度量”,但这对确定随机事件的概率没有任何帮助.②后来人们发现早期的概率问题以古典概型为主,所以把随机事件A发生的可能结果数k与试验的可能结果总数n的比值作为事件A的概率定义,数学家把它称为概率的一般定义,但发现许多随机现象不符合古典概型的特征. ③随着经验的积累,人们逐渐认识到“随着试验次数的增加,事件出现的频率总在一个定数p的附近摆动”,频率显示出了一定的稳定性.数学家伯努利对这一规律给予了严格的描述和数学证明,数学家米泽斯把定数p称为概率的频率定义. “频率与概率”单元揭示的正是这一含义. ④数学家布丰在前人基础上,进行了著名的“投针问题”试验,提出了几何概率. 但上述定义都有其局限性和不完善之处. ⑤直到1933年,数学家柯尔莫哥洛夫提出了概率的公理化定义,才使概率成为严谨的数学分支. 所以概率定义的产生和发展是“频率与概率”单元知识的生长点.
(3)知识建构的策略与方法.
“频率与概率”知识建构的策略:首先由特殊到一般的归纳方式,即采用硬币试验这一特例来说明随机现象中存在的“频率的稳定性”;其次注重结合实例和实践,围绕实际问题操作确认,掌握数据分析的一般步骤和方法,渗透数据分析思想;另外要考虑数形结合,即通过频率折线图等来观察频率的变化规律,感悟随机性背后蕴含的稳定性.
(4)知识间的联系与结构.
统计与概率既有联系又有区别.统计的研究对象是数据,核心是数据分析;概率为统计的发展提供理论,统计为概率的发展提供数据支持. 例如,通过古典概型推导硬币“一正一反”的概率,从而可以观察频率和概率之间的关系,为归纳大数定律提供支持. 另一方面,通过统计可以解决古典概型解决不了的一些概率问题. 所以统计的发展离不开概率,概率的发展离不开统计.
(5)知识的要点与本质.
“频率与概率”知识单元的要点与本质就是大数定律,它揭示了大量偶然事件发生背后隐藏着的必然性. 针对一些古典概型无法计算的概率问题,提供了用频率稳定性来估计概率的方法;而数据是估计概率的基础,所以通过数据分析揭示了知识的要点与本质.
(6)知识的学科意义与教学价值.
数学家把频率估计概率的方法作为解决问题的重要工具,人口统计、养老金、保险等方面广泛地应用了这一理论. 通过频率与概率之间的关系,人们发现即使在难以计算的事件中,概率仍能给予人们最可靠的判断依据. 例如,几何概型的研究就是建立在此基础上. 后续研究概率与统计时引入函数等工具,促进了现代概率论的飞跃发展.
2. 学生认知分析
(1)学生认知基础分析.
在初中阶段,学生已经学习过概率和统计的一些知识,对随机事件的概率等相关知识有了一定的认识. 在高中阶段,学生进一步学习了统计和概率的一些知识,为本节课数据分析提供了认知基础.
(2)学生认知障碍分析.
虽然通过硬币这一实例,学生直观感受到频率与概率之间的关系,但很难回答为什么其他随机事件也遵循这一规律. 另一方面,伪随机数的生成原理也比较复杂,学生对伪随机数的理解也是一个难点. 对于这些深层次问题在课堂上不宜过度强调,学生能够有一些感性认识即可,以免影响他们对后续探究的理解和接受.
(3)学生认知风格分析.
多数学生喜欢动手实践,但不习惯主动提出问题,而是习惯被动接受教师布置的学习任务. 所以教师需要设计好问题,带着学生一起经历数学分析的整个过程.
(4)学生认知差异分析.
由于认知存在基础、潜能等多方面的差异,因此能力不同的学生应以不同的方式学习,即允许部分学生以接受式的方式学习,学到的知识停留于表面化.
3. 素养为本的教学目标
(1)通过具体实例了解古典概型在解决实际问题中的局限性,体会引入“频率估计概率”的意义和作用,培养学生用数学的眼光看待生活问题.
(2)围绕核心问题经历搜集整理数据和运用统计工具分析数据的过程,理解频率的稳定性,培养学生的数据分析素养.
(3)结合实例学习使用伪随机数实现大量重复试验,进一步理解频率的稳定性,提升学生使用信息技术辅助数据分析的能力.
[?]以数据分析为主线的教学过程(2个课时)
1. 呈现背景,提出研究問题
呈现背景:在足球比赛开球抛硬币时,裁判会指定硬币两面分别代表两队,然后抛掷硬币,正面朝上的球队可以选择场地或选择开球.
子问题①:请问裁判的做法是否公平?
子问题②:真的公平吗?有没有质地完全均匀的硬币?
子问题③:一枚质地不均匀的硬币,如何研究它正面向上的概率?
师生活动:师生通过问答,发现可以通过抛掷试验观察硬币质地是否均匀. 同时发现现实生活中大多数随机事件,人们往往不能掌握足够的信息,所以仅仅研究等可能事件的古典概型是远远不够的. 对无法通过古典概型公式计算的随机事件的概率,需要寻找新的求概率的方法.
单元核心问题:对于一些无法通过古典概型计算概率的随机事件,如何估计它的概率?
设计意图:通过呈现背景提出问题,指出在硬币质地均匀的前提下,抛硬币是古典概型问题.但如果质地不均匀就无法直接通过古典概型公式计算事件的概率,体会寻找新的求概率方法的必要性.
2. 寻找方法,收集整理数据
引导语:如何估计未知的随机事件的概率?我们回忆一下初中是如何说明硬币正面向上的概率是的,这种用频率来估计概率的方法可靠吗?
师生活动:师生共同探讨,提出再研究两枚质地均匀硬币的概率问题,观察频率与概率之间的关系. 设事件A=“一个正面朝上,一个反面朝上”,统计A出现的次数并计算频率,再与理论推导的概率进行比较,观察现象推测规律.首先,师生把硬币“正面朝上”记为1,“反面朝上”记为0,得出试验的样本空间为Ω={(1,1),(1,0),(0,1),(0,0)},事件A={(1,0),(0,1)},根据古典概型可得P(A)=. 其次,让学生两人为一组,一人抛一人记,重复做20次试验,记录事件A发生的次数,计算频率,将结果填入下表(表1):
设计意图:通过师生共同回忆初中的硬币试验,研究频率与概率之间的关系,通过设计两枚硬币的试验,为探索频率的稳定性做好数据支持.
3. 立足图表,分析数据内涵
引导语:将所得数据用Excel制作成频率统计表和频率折线图,观察事件A发生的频率有什么变化规律,结合图表(图1和表2)进行分析.
子问题④:各小组的试验结果一样吗?为什么会出现这种情况?
子问题⑤:将各小组的试验结果数据先小组累加,再全班累加,为什么要这样做?
子问题⑥:将各小组频率和累加数据做成折线图(图1),观察图1,推测事件A发生的频率和概率有什么变化规律.
师生活动:通过上述问题,师生共同分析随机试验的结果具有随机性.通过频率折线图,师生可以发现,随着试验次数的增加,频率的变化幅度越来越小,即频率越来越稳定在0.5的附近.
子问题⑦:如果有足够的试验次数,就可以发现频率稳定于某一个定值的附近,那这个定值的意义是什么?
子问题⑧:频率与概率有哪些区别和联系?
设计意图:通过统计图表汇总整理试验结果,经历数据的收集和整理过程;通过“问题串”的思考,经历整个数据的分析过程,体会频率与概率之间的关系.
4. 模拟试验,高效获取数据
引导语:通过试验发现,随着试验次数的增加,事件A发生的频率f(A)会逐渐稳定于事件A发生的概率P.这个性质被称为频率的稳定性.不过手工试验有什么优点又有什么缺陷?如果采用这样的方法去估计其他随机事件的概率,能保证估计出的概率的准确性吗?
师生活动:师生共同分析,动手试验真实但因为个人的操作手法等问题,存在着一定瑕疵;另外,试验次数不够多时,由于事件的随机性可能会影响到概率的估计,所以要保证用频率估计概率的办法可靠,须做大量的重复试验.
子问题⑨:信息化时代有没有其他方法可以替代动手试验呢?
子问题⑩:如何创建试验结果和数字的对应关系,使得计算机能够模拟抛硬币?
师生活动:师生共同讨论提出计算机模拟的思路. 规定硬币“正面向上”为1,“反面向上”为0,接着在计算机中寻找随机等可能返回0与1的函数. 师生共同在Excel软件中输入randbetween(0,1),模拟抛掷两枚硬币20000次(指出这个是伪随机数,相对应的试验获得的是随机数);接着对模拟结果进行分析,计算不同次数下的频数、频率;通过统计结果绘制图表(图2和表3),分析试验数据,判定计算机模拟出的频率稳定值和古典概型推理结果基本吻合.
设计意图:通过指出动手试验的局限性,体会引入随机数的必要性. 通过伪随机数模拟试验的使用,肯定信息技术为大量重复试验提供了可行性. 借助模拟试验生成的数据进行分析,体会计算机模拟可以高效呈现大量重复试验的结果,为更准确地探究随机现象背后的本质规律奠定了基础.
5. 實践提升数据分析能力
单元回顾:为什么设计抛掷两枚硬币的试验?频率的稳定性是通过怎样的过程与方法发现的?
实践问题:在生活中挖掘一个概率问题,设计试验方案估计它发生的概率.例如,袋子中装入数目确定但未知的白球和黑球,设计试验方案推测袋子中黑球与白球的比例.
设计说明:单元回顾的目的在于引发师生进一步思考.通过开放性作业使学生再次经历数据分析过程,巩固所学知识提升学生的数据分析素养,同时促进学生学习方式的转变.
[?]反思
作为经典的教学案例,笔者先后在全国优质课大赛及浙江省优质课大赛中,分别展示过相关的“随机事件的概率”和“整数型随机数”这两节内容,也参与了全国继续教育网的“如何开展统计与概率单元教学”讲座. 通过上述实践,笔者认为培养数据分析素养,最好的方式就是呈现问题,在问题的解决过程中培养学生收集、整理、分析数据的能力. 在培育学生数据分析素养的过程中,还应注意:
1. 呈现合适的背景问题,在问题的解决中培养学生数据分析素养
统计问题的完整解决包括从收集数据到获得结论的一系列过程,学生在较为系统的数据处理过程中学习统计方法,才能理解方法的目的和本质.例如,从足球比赛选硬币的问题入手,引导学生感受未知概率的问题是真实存在的. 教学自始至终结合实例围绕这一问题的解决而展开,选择合适的方法获取数据,分析数据蕴含的信息,从而克服大数定律因抽象而带来的理解困难.
选择问题背后情境时,要注意体现概念、方法引入的必要性和对问题解决的适切性,还要符合这个阶段学生的认知特点. 教学中应尽量采用学生熟悉的数据背景,使学生在问题解决中学习有关知识. 本单元可供选择的背景还有:游戏中的随机现象(骰子、扑克牌),生活中的随机现象(彩票、出生月份)等,要注意避免人为虚构背景脱离实际的数据案例.
2. 突出基于试验的数据分析,培养学生全面系统的分析处理能力
数据分析素养的提升,具体表现为学生通过课堂学习,提高了获取有价值信息的能力以及分析意识和能力. 所以试验不是目的,而是要培养学生全面系统的分析处理能力,即培养学生学会选择适当的统计图表来描述和表达数据,并从数据中提取需要的数字特征、估计总体的统计规律等. 例如,课堂教学中通过制作频率折线图,重点认识硬币“一正一反”的频率与古典概型推导出的概率之间的关系,进而理解随机现象的随机性和背后隐藏的稳定性. 只有在研究“频率与概率”这个大目标下,我们才需要再次设计不同的硬币试验. 所以试验不是目的,应突出基于试验结果的数据分析,理解数据分析的思路,运用所学概念和方法解决问题才是核心.
3. 合理使用信息技术,培养学生使用伪随机数辅助试验的能力
运用计算器、计算机等信息技术工具,不仅可以实现快速、准确地列表、画图、计算等数据处理,而且能使大量人工难以完成的数据处理变成可能,学会使用信息技术是培养学生数据分析素养的重要组成部分. 合理使用信息技术,可以把学生从机械、烦琐的数据处理中解放出来,把更多精力集中于数据分析.例如,在“频率与概率”单元教学中,通过随机数模拟硬币试验,使课堂上进行大量重复试验变成了可能,大大提高了教学的效率和质量. 所以在教学中,应鼓励学生尽可能运用随机模拟的方法,培养学生使用信息技术辅助数据分析的能力.
4. 设计开放性作业,在解决问题的过程中培育数据分析素养
现行多数课外作业所用的策略和方法与课堂上的例题、习题相近,这种作业在很大程度上是巩固型、模仿型的.本课中若仅进行硬币试验,学生对大数定律的感受不会深刻.建议课后布置类似的随机试验,例如袋子中装入数目确定但未知的白球和黑球,要求学生设计试验方案推测袋子中黑白球的比例.通过这样的亲身实践,学生可以进一步掌握数据分析的操作过程.因为数据分析素养是在研究问题的过程中体现出来的一种意识和习惯,需要在具体问题的解决中反复巩固并提升.