APP下载

新课程背景下发展学生数据分析素养的教学策略

2021-03-19王欣

数学教学通讯·高中版 2021年12期
关键词:数据分析教学策略核心素养

王欣

[摘  要] 数据分析素养是新课程所提出的数学核心素养之一,这是顺应“大数据”以及“互联网+”时代要求的. 如何准确识别数据信息,如何快速收集数据信息,如何正确处理数据信息,如何个性化推断数据信息是这个时代人们的必备品格,也是适应社会变革的一种关键能力. 高中阶段发展学生的数据分析素养,可以从以下五个方面进行. 第一,帮助学生正确认识数据分析的意义;第二,将课堂教学模式由验证式转变为建构式;第三,培养学生对数据的敏感性;第四,培养学生处理数据的方法;第五,鼓励多角度运用统计学知识生成不同的问题解决策略.

[关键词] 数据分析;核心素养;教学策略

[?]问题的提出

统计学的核心是数据分析,《普通高中数学课程标准(2017年版)》[1]指出,数据分析是针对研究对象获取数据,运用数学方法对数据进行整理、分析和推断,形成关于研究对象知识的素养. 数据分析的过程包括:收集数据,整理数据,提取信息,构建模型,进行推断,获得结论.

数据是数据分析的基础. 只有赋予客观事物属性,蕴含着一定信息的“数”才能称之为数据. 数据的表现形式可以是数字、符号、文字、语音、图像、视频等等[2]. 统计学所进行的数据分析就是指分析以上这些带有随机性的数据. 史宁中教授指出,数据的随机性主要有两层含义:第一,对于同样的事情,每次收集到的数据可能会是不同的;第二,只要有足够的数据就可能从中发现规律[3].

如今的时代是“大数据”以及“互联网+”的时代. 它的特点是现代科学技术特别是计算机科学、人工智能都在迅猛发展,因此这个时代对人们获取数据信息、处理数据信息、应用数据信息的能力要求很高. 这些数据信息常以数字、文本、声音、图像、网络等形式呈现,如何准确识别数据信息,如何快速收集数据信息,如何正确处理数据信息,如何个性化推断数据信息是这个时代人们的必备品格,也是适应社会变革的一种关键能力.

高中阶段的教育就是要培养学生这种必备品格与关键能力,即核心素养. 史宁中教授指出,高中数学学科的核心素养就是会用数学的眼光观察世界,会用数学的思维思考世界,会用数学的语言表达世界[4]. 用数学的眼光观察世界,是数学抽象的过程,也是信息收集整理的过程;用数学的思维思考世界,是数学分析的过程,也是信息提取构建的过程;用数学的语言表达世界,是数学解决的过程,也是信息推断输出的过程. 而信息是以数据的形式呈现的,以上三个过程也可以认为是数据分析的过程. 因此,学生的数据分析素养是核心素养的一个重要构成. 此次新课程的改革将数据分析素养列在数学核心素养中,是顺应时代要求的.

[?]发展学生数据分析素养的教学策略

1. 帮助学生正确认识数据分析的意义

“大数据”(BIG DATA)这个词,是2008年在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》这本书中首次提出的. “大数据”指不用随机分析法(抽样调查)这样的捷径,而是对所有的数据进行分析处理的一种方法.

“大数据分析”已经渗透到我们生活中的方方面面,其实离我们并不遥远. 比如我们打开手机淘宝,呈现在我们面前的界面是不一样的. 它推送给我们的商品是不同的,而且这些商品往往真的能够抓住我们的需求和心理,这是为什么呢?其实这就是大数据分析下得出的结论. 淘宝这个平台,对每一个浏览过商品的人,购买过商品的人,都进行了全数据分析,可以轻松获取我们的很多信息,例如我们的性别、年龄、家庭成员、喜好、是否结婚、是否有孩子、孩子的性别,甚至可以细致到你是爱穿休闲类的服饰,还是喜欢小清新类的服饰,或者是职业装类的服饰等等. 通过你的每一次操作,收集到了这些数据之后,它经过分析和处理,进一步推测出了你可能会订购的商品,从而推送给你,让你花更多的钱进行消费. 例如你购买了一些孕妇类产品,可能在不久之后,它就会推送相关联的一些婴儿用品给你. 而我们消费后的评价与反馈,又使得他们不断改进自己,例如不同卖家的钻石星级,或者清退一些不合格的卖家等等这些行为,就是淘宝对自身的调整. 这种互利互惠的双回路的运转模式,可以看作是卖家与买家间的一种良性的互动方式,而这种互动方式在传统的卖场里面是不可想象,也难以实现的.

以上这个关于手机购物的案例,恰恰体现了大数据分析的三大特征,即反馈、个性化以及概率预测. 要想成功实现数据信息的反馈,就要准确收集整理买家消费数据;要想成功实现数据信息的个性化推送,就要正确提取加工处理买家购物数据,建立模型分析买家需求,从而准确预测出买家未来最有可能的消费领域.

还有一个关于可汗学院的案例. 2004年,一个刚从哈佛商学院毕业一年的基金分析师,给自己的表妹辅导数学. 由于他们生活在不同的城市,因此,他在互联网上为她进行辅导,从此永远地改变了教育的世界. 他编写了若干程序来协助教学,这些程序能生成数学习题,并显示孩子们提交的答案是否正确. 同时,也收集数据,程序可以追踪每个学生的答对和答错的习题数量,以及他们每天用于作业的时间等等. 后来在此基础上创建的可汗学院,之所以可以闻名于世,就是因为它收集有关学生行为的数据,从中获取有用的信息来改变教学内容的设计,为每个学生定制个性化的学习方案,可以说数据就是可汗学院运作的核心所在.

教师可以通过分析身边的这些生活案例,帮助学生体会数据分析的实际意义和作用,体会数据分析的整个过程,以及每个过程所能实现的目标,激发学生学习统计概率的兴趣.

2. 将课堂教學模式由验证式转变为建构式

传统的课堂教学模式往往是教师直接给出概念以及定理,然后在特殊的情境中加以应用,即使是定理的证明,也是在结论已知的前提下进行的,因此可以说这种课堂教学方式是一种验证式的教学,即检验结论的正确性. 例如讲授“随机事件及其概率”这节课,验证式的教学往往让学生分组进行扔硬币实验,随着实验次数的增多,发现频率接近0.5,但是由于课堂上的条件有限,实际上概率是0.5这个结果通过实验是得不到的,这让学生对于频率与概率产生疑惑,还有学生认为,既然已经知道扔一次硬币的概率是0.5,那为什么还要扔那么多次硬币去验证呢?实际上又验证不出来0.5这个值. 还是这节课,如果我们转换一种教学方式,例如这样提出问题:盒子中一共有5个质地、大小完全一样的小球. 请设计一个方案,检测盒子中都有哪些颜色的小球,每个颜色的小球有多少个?(也可以告知学生有哪些颜色的小球,只判断每种颜色小球的个数)要求:每次只能从盒子中拿出一个球,并且取后要放回. (红球4个,白球1个). 全班分为6个小组,每个小组5名同学,每个组均放置相同的实验材料. 实验开始后,首先由各个小组进行讨论,确定实验方案,然后动手操作,分析数据,最终得到实验结论. 学生讨论后确定要想知道盒子中有哪些颜色的球,必须要重复进行摸球实验,每名学生摸10次,记录下每次摸出球的颜色. 学生可以很快发现盒子中有红球和白球两种颜色的球. 进一步学生还会发现摸出红球的次数明显大于摸出白球的次数,因此可以推断出红球比白球的个数多. 通过进一步计算每个学生取到红球的频率,每个小组取到红球的频率,全班取到红球的频率,来估计盒子中红球与白球的个数. 需要学生体会的是如何通过实验来得到数据,体会每次实验得到的数据具有随机性,体会多次实验得到的数据具有可重复性,而统计学就是要发现这些重复的数据背后所隐藏的信息从而解决问题. 因此,在教学过程中,要充分留给学生动手实验的时间,重视实验过程中学生得到的过程性结论,例如红球比白球多等结论. 在整个实验过程中,得到取到红球与取到白球的概率分别是0.8和0.2这两个精确值的可能性并不大,但如果增加实验次数,求得的频率能够接近这两个值,在一定取值范围内就可以判断出红球与白球的个数. 此外,数据分析可以从不同的角度进行,例如在实验的过程中,学生可以不计算频率,而是比较取得红球的次数是取得白球次数的多少倍,从而估算出红球与白球的个数,这种数据处理的方法也是可以接受的. 只要学生在实验过程中,能抓住数据的随机性和可重复性的特点,能体会统计的意义是从数据中归纳结论,那么本节课的教学目标就实现了.

学生数据分析素养的培养,不是一蹴而就的,更不是通过一个知识点、一个公式的教学就能培养的,因此从统计的起始课,就要培养学生数据的意识,了解数据的作用,体会数据分析的过程,用数学的语言来表达世界. 统计的教学与传统数学知识的教学最大的区别就在于出发点的不同,统计的出发点是客观真实而又具有随机性的数据,有一定的不确定因素,而传统数学知识的出发点往往是已知的公理定理,具有确定性. 此外,统计学结论的得到,取决于对数据的分析和判断,运用的方法是数学中的归纳推理,即要经历从特殊到一般的过程,而传统数学知识的教学,往往是给定或者证明出结论,然后利用结论解决特殊情境下的问题,例如平面几何、立体几何的证明,运用的方法是数学中的演绎推理,即要经历从一般到特殊的过程,熟练应用所学知识解决问题. 在教学过程中,教师尽量要遵循统计学的规律,多让学生通过数据分析,推断结论,而不是让学生来验证或者运用结论解题.

数学学科是一门逻辑严谨,层次分明的学科,很多数学结论都是经过数学家们千百次的试谬,经历无数次的推证才得到的,因此在课堂上短短的时间里,学生几乎不可能真正去发现更谈不上创造,所以验证式的课堂活动并不是学生真正意义上的参与. 而基于数据分析的教学,由于要挖掘数据反映出来的规律和结论,因此采用的推理方法是归纳法. 教师在授课时,要尽量建构恰当的问题情境,这种情境要为学生的学习和思考提供背景,使学生有着自己的主观体验,能够在这个情境中用到所掌握的统计研究方法,例如统计量与统计图表,分析数据,做出决策,体验成功.

3. 培养学生对数据的敏感性

所谓数据的敏感性包括两层含义,第一当需要解决一个问题时,有要收集数据寻找规律的意识;第二面对收集到的数据能够快速捕捉重要信息,恰当整理数据.

新课程标准指出,数据分析是源于实际问题而集统计思想、方法、理论和决策于一体的思维活动过程. 数据分析素养是在解决实际问题获得数据分析过程中形成的. 所以培养学生对数据的敏感性,首先要给学生真实的问题. 例如调查学生对学校食堂饭菜的满意程度. 第一,学生要意识到,解决这个问题一定要做调研,用数据说话. 第二,如果不方便对全校师生进行普查,那么就要做抽样调查. 第三,要抽样调查,就要思考样本应该如何产生,是利用简单随机抽样还是需要分层抽样,如果需要分层抽样,是按照年级划分,还是按照男女生比例进行划分,还是只需要在食堂用餐的人员中进行抽样. 解决类似的问题,一定要让学生实际动手操作,在问题解决的过程中,慢慢培养其对数据的兴趣与敏感性.

此外,在收集数据后,要培养学生能够对数据进行快速反应和整理的能力,例如如下两组数据:

78,85,89,92,96

95,88,102,106,99

这两组数据初看之下没有任何规律,但是将两组数据进行如下整理:

78,85,89,92,96

88,95,99,102,106

整理后发现,这两组数据的均值相差10,方差是一样的. 虽然只是简单地调整了数据的顺序,但是隐藏在数据中的规律性就自然呈现出来了. 在平时的教学中,教师不要刻意去提醒学生面对数据应该如何整理,要让学生在问题解决的过程中,很自然地对数据进行整理,例如关注极端数值,关注众数,关注数据的顺序等等,在经验的积累上,提升对于数据的敏感性,恰当地对数据进行整理.

4. 培养学生处理数据的方法

在学生已经有了收集数据、整理数据的意识后,应适时地指导学生如何分析数据,提取有用信息,从而构建模型. 在高中阶段,常见的数据分析方法有求平均数、中位数、众数、方差、标准差等,数据分析结果呈现的方式可以是茎叶图、频率分布直方图、折线图、饼图等等,构建的模型例如线性回归模型,拟合函数模型等等. 在教学中,当需要分析多个变量之间关系的时候,还可以适当引入计算机辅助教学,例如对两个变量进行函数拟合,找到规律,还可以适当借助计算机软件进行变量间的相关性分析、单(多)因素方差分析等等. 借助分析软件,我們可以清楚地知道语文成绩与数学成绩之间是否存在相关性,相关系数是多少. 我们也可以清楚地知道是学习数学哪方面的能力影响了学生的物理成绩等等. 这些都是数据分析反馈给我们的结论.

数据分析的方法有很多,可以从不同侧面反映总体的情况. 在教学中,重点不是让学生学会用公式计算,学会绘制各种统计图形,而是要明白各种统计量背后的意义. 例如要调查一个小区的居民收入水平,从而设计小区周边配套设施建设方案. 那么是平均数更能反映小区居民收入水平,还是中位数更能反映小区居民收入水平呢?抑或是众数更能反映小区居民收入水平呢?各自有哪些弊端?首先说平均数,它非常容易受极端数据的影响,假如这个小区住着一个收入非常高的住户,可能这个用户的收入就使得小区整体的平均收入提高很多,那么依据这个平均值对该小区居民收入水平进行判断所做出的决策就会存在问题. 再来看中位数,虽然它不易受到某一两个极端数值的影响,但是当极端数值的个数比较多时,也会使得中位数不能客观反映出小区居民的收入水平,众数也存在相同的问题. 此时,最好的数据分析方法是绘制频率分布直方图,看居民收入落在每一个范围内的频率,制定一个标准,例如75%的居民收入都集中在什么水平,从而进行决策.

总之,分析数据的方法有很多,不仅仅是要学会计算,更重要的是在解决问题时,选择什么样的方法进行计算,构建什么样的概率模型,制定什么样的标准来衡量优劣. 这些才是教师教学的重点问题.

5. 鼓励多角度运用统计学知识生成不同的问题解决策略

数据分析最终的目的是形成决策,解决实际问题,数据分析本身并不是目的. 在教学中,我们不但鼓励学生多角度地分析数据,也应该鼓励学生根据数据分析的结果,提出不同的解决问题策略,不追求单一的标准答案. 一个比较常见的例子是给比赛选择选手. 甲、乙两名射击选手,表1记录了他们平时射击的5次成绩:

若现在团体射击比赛进入最后关头,对方5名选手已经完成比赛,总环数为48环,我方目前已经上场4名选手,总环数为40环,现在只能从甲、乙两名选手中选择最后上场的选手,如果你是教练,会选择哪名选手上场?

学生解决这个问题的固有思路是先算一算两名选手射击成绩的平均值,选择平均值高的选手上场,当两名选手射击成绩的平均值相同时,会选择进一步计算两名选手射击成绩的方差,一般会选择成绩稳定的选手上场,所以解决这个问题可能按照思维惯性会选择乙选手. 但是进一步分析数据我们会发现,乙选手虽然成绩稳定,但是他的最好成绩是8环,即使上场,最好的比赛结果也只能是双方打成平局,而如果选择甲选手,虽然他的成绩不稳定,有0.6的概率会输掉比赛,但是他成绩的极差比较大,也就是他的最好成绩比较高,有0.4的概率会赢得比赛,所以在这种情况下,应该选择甲选手上场进行比赛.

通过以上案例,我们应该意识到统计与概率的教学,不应该追求问题解决的标准答案,形成惯性思维,关键要制定合理的标准,做出恰当的解释. 例如下面这个关于决策的案例:

【提出问题】小张在一个国家5A级景区的附近经营两家不同类型的餐饮店A与B. 经过一年的经营,小张有些疲惫,觉得自己的精力有限,决定关闭其中一家餐饮店,专心经营好剩下的一家餐饮店,请你运用所学到的统计学知识,帮小张想一想,应该关闭哪一家餐饮店?并给出恰当的理由和分析.

【初步讨论】关闭哪一家餐饮店最直接的原因就是挣钱少,因此解决这个问题首先要对两家餐饮店的营业收入进行调研,收集数据. 这也就是运用数学分析进行决策的第一步. 我们可以收集两家餐饮店12个月的营业额进行对比.

【得到数据】假设两家餐饮店12个月的营业额如表2:(单位:万元)

【做出决策】

决策1:从统计学的角度,由数据分析可知,两家餐饮店12个月的营业额的平均数是相同的,即全年的总收入是一样的,所以小张随便关闭哪家店均可.

决策2:从统计学的角度,由数据分析可知,两家餐饮店12个月的营业额的平均数相同,而A店营业额的方差较小,B店营业额的方差较大,所以A店的收入比较稳定,因此小张应该关闭B店.

决策3:从统计学的角度,由数据分析可知,A店的营业额逐月呈上升趋势,B店的营业额最终呈下降趋势,有可能消费者的消费热情已经过了,因此从趋势上看,应该关闭B店.

决策4:从统计学的角度,由数据分析可知,B店在1-3月,6-8月的营业额非常高,这有可能受到季节或者假期的影响,因此可以选择关闭A店,集中全部的精力经营好B店,使得其在以上的这6个月的时间里,能创造更大的价值,其余的时间只要平稳经营维稳即可.

上述案例中,学生能够想到去考察平均数与方差,知道平均数与方差的实际意义,能从平均数与方差角度进行决策,就说明学生掌握了统计的基本方法. 此外,学生能够发现数据的走势,说明学生头脑中有了创建图形解决问题的意识. 除了上述这四种决策的方案以外,学生还有可能从更多其他的角度分析这个问题,选择关闭的店面,只要言之有据,能充分应用这些已有数据,做到用数据说话,尊重客观事实,熟练运用统计量,那么无论做出什么样的决策都是值得鼓励和肯定的,教学不必追求结果的唯一性.

[?]综合讨论

数据分析具有较强的应用性,而且在实际生活中经常会用到,因此课堂教学不能只是教方法,更重要的是培养思维习惯,提高分析能力. 统计概率部分的课堂教学呈现给学生的习题,避免过多地进行没有问题背景的数值计算,这样学生不知道计算的目的和意义.

学生的数据分析素养的提高,要建立在亲身经历的基础上,即经历提出问题、收集数据、整理数据、分析数据、做出决策、进行交流、评价优化的过程. 教师要鼓励学生自己选择主题并亲自收集资料提出问题进行解决,培养学生应用数学的意识,发展数据意识,尽量多地掌握数据分析的方法,在解决问题的过程中,使素养得到内化.

在数据分析的基础上,学习统计概率,应该使学生首先养成统计意识,知道数据的重要性,知道如果能正确地收集数据,就能从中发现规律,从而进行决策.

教学时,教师不能将生活中的案例直接引入课堂,需要经过一定的加工和提炼. 上面那个案例在真实生活中,关闭哪一家餐饮店不可能只考虑营业额这一个变量,还可能需要考虑到进货成本、人工成本、流水等,还有可能对消费群体进行调研等等. 此外,收集上来的真实数据,几乎不可能做到两个餐饮店的营业总额完全相等,方差有明显差异,其中某家餐饮店的营业额一直呈上升趋势等等,真实情况的数据分析可能十分复杂,需要用到很多统计学的知识,也会用到更加复杂的数据分析模型,因此我们不可能直接让学生在课堂上解决真实的实际问题. 教师应该将来源于真实生活的案例进行加工,数据经过处理后,要使得蕴含在其中的统计量便于学生计算发现规律,因此可以说教学中的统计案例是经过教师改编,重新构建的. 那么运用这些经过加工过的案例进行教学是否与统计是为了解决实际问题服务的这一说法矛盾呢?答案是不矛盾. 因为我们的课堂教学重点是要培养学生的统计思维方式,熟悉数据分析的过程,让学生养成多角度看问题的习惯,鼓励学生在解决问题的过程中,给出不同的决策,并且能运用学到的统计基础知识加以解释,言之有据. 总之,统计概率的教学,教师一定要提炼出经典的案例. 让学生通过这些案例,既可以调动所学的一切统计学知识,又能体现出数据在统计过程中发挥的作用,而案例中问题最终的解决方案还能体现多样性,可以得到完全不同的答案.

新课程背景下,运用统计学的知识进行数据分析,要围绕三个方面思考解决这个问题,第一数据已经收集整理完毕,应该确定分析哪些统计量,是计算均值进行比较,还是计算方差进行比较,或者是计算频数进行比较;第二当统计量计算完成后,应该制定什么样的标准衡量测量结果最合理;第三根据制定的评价标准,给出最终的结论或者是决策,这也是解决实际问题的最终目的. 这三个问题,恰恰就体现出数据分析的基本过程.

决策没有正确与错误之分,要看能把实际问题解决到什么程度,是否合理. 教师要鼓励学生充分应用统计知识和原理,做出个性化的决策方案,这也正是大数据分析时代的一大特色,更是需要培养学生的核心素养.

培养学生的数据分析素养与培养学生的其他素养比起来有很大的難度. 因为数据分析素养培养的基础是数据,不是数学知识本身,而数据是多变的,具有不确定性,又与实际问题紧密结合,学生要从数据中解读归纳出结论,形成决策,这远比依据已有的确定的数学知识进行演绎推理要困难得多. 所以,数据分析素养的培养非一朝一夕之功,只有通过教师每一节课的渗透才能实现,而这其中最重要的就是形成数据意识,学会收集数据、分析数据、提取信息、形成决策. 这个过程要在实际问题的解决过程中让学生慢慢体会并养成习惯.

参考文献:

[1]  中华人民共和国教育部. 普通高中数学课程标准(2017年版)[S]. 北京:人民教育出版社,2017.

[2]  陈鑫. 核心素养视域下数据分析理念的培养策略研究[J]. 中小学教学研究,2018(11).

[3]  史宁中. 高中数学课程标准修订中的关键问题[J]. 数学教育学报,2018,27(2).

[4]  刘祖希. 访史宁中教授:谈数学基本思想、数学核心素养等问题[J]. 数学通报,2017,56(5).

猜你喜欢

数据分析教学策略核心素养
低年级写话教学策略
谈以生为本的群文阅读教学策略
写话教学策略初探
浅谈复习课的有效教学策略
Excel电子表格在财务日常工作中的应用
浅析大数据时代背景下的市场营销策略
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
作为“核心素养”的倾听
“1+1”微群阅读