百分数“统计意义”的内涵、育人价值及教学建议
2023-09-15刘加霞马晓丹陶安慧
□刘加霞 马晓丹 陶安慧
统计学与数学、物理学等自然科学相比,最大的不同是统计学具有“容错性”,其依据的理论、采用的方法、思维的形式,在很多情况下并不是为了寻求永恒不变的定律和准确无误的定值(也许不存在定律和定值),而是为了从瞬息万变的混沌世界中抽象出社会经济现象的本质特点进行推断和估计。
“统计意义”是指人们无法确定未来社会经济等方面的具体发展结果,只能作出概率的估计与推断。《义务教育数学课程标准(2022年版)》(以下简称“2022年版课标”)中有11次提及“统计意义”,除2次谈到“平均数的统计意义”、1次谈到“数据的统计意义”外,其他几次主要说的是“百分数的统计意义”。“理解百分数的统计意义”是2022年版课标的重要修改之处。
那么,百分数的“意义”指什么?何谓百分数的“统计意义”?统计意义的具体表现是什么?学生理解百分数统计意义的价值是什么?教学中如何处理百分数的统计与非统计意义?理解百分数统计意义的教学建议有哪些?
一、当用百分数描述随机数据的倍数关系时才具有“统计意义”
百分数的起源可以追溯到早期的商业活动中,涉及利息、纳税和货币兑换等。最初百分数是作为一个具体的数量出现的,是“每一百个单位”对应的具体数量。例如,百分数的意大利语为“per centro”,意思是“每一百中有多少”,后来演变为德语“procentro”,之后又演变为现代的词语“procent”。百分数的现代英语单词是“percent”,其含义愈加抽象,表示部分与整体、一个量与另一个量的倍数关系或者是两个度量对象之间的相对大小。百分号“%”来源于15世纪的意大利商人,当货物降价时,他们会使用一种特定的缩写符号“PC0”,之后逐步演化为“per”,直至现代的“%”,才不再具有“量”的含义。也有研究者[1]舍弃百分数的现实意义,从“数”的角度将其定义为“繁分数(两个分数的商)”,但这样的定义不适用于小学阶段。
百分数主要用于描述一种关系或进行比较,这里的比较既可以发生在部分与整体之间,也可以发生在不相交的两个量之间。[2]因此,把百分数称为百分率或百分比更能凸显其表示两个量之间的倍数关系。“两个量”既可以是确定数据,也可以是随机数据。其中,用百分数描述两个确定数据之间的倍数关系可以称为百分数的“数学意义”。例如,某人某月工资是1000 元,其中包括奖金200 元,则奖金占工资总额的20%。又如,将5mL 蜂蜜放到95mL 的温水中,蜂蜜占整杯蜂蜜水的5%,配相同浓度的1000mL 蜂蜜水就“百分之百”地需要50mL蜂蜜。此时的百分数(浓度)不具有“统计意义”,它只描述蜂蜜与蜂蜜水的倍数关系,用它可以衡量蜂蜜水的甜度或浓度。这种对不具有随机性数据的分析称为描述性分析(描述统计),这里的信息是数据“自身携带”的,只需要描述出来,不需要进行推断、估计等思维活动。
用百分数描述随机数据之间的倍数关系则是百分数的“统计意义”。例如,小明一共投了20 个球,投中了12个,投球命中率是60%,但不能说,投10个一定命中6个,投100个一定命中60个。类似地,出勤率、合格率、发芽率等概念的获得都要涉及抽样或通过调查得到随机数据,此时利用百分数进行分析、判断或者作预测所得到的结论不能“百分之百”地成立,要考虑其具有“随机性”。这种对随机现象进行的概率估计和抽样推断都是百分数“统计意义”的具体体现。
百分数体现“倍数关系”、体现“程度”(百分数的“度量”含义,有统计含义,也有非统计含义),利用百分数制定“标准”(误差程度、随机性大小)等都是2022年版课标要求的内容。尤其是学会制定标准和基于标准作出判断,都涉及重要的数学思维,是小学数学教育的较高目标。例如,根据投篮的命中率决定谁参加比赛,如比赛获胜的可能性大小;根据科学抽样所得到的样本情况来推断总体的情况,如确定某年级学生跳绳的合格标准。
制定标准与按标准做事是非常重要的两件事,既涉及能力问题,也涉及情感态度甚至是价值观的问题。因此,学生认识百分数要经历“从低到高”的三个阶段,具体包括:每一百个单位所对应的“具体量”、两个确定数据之间的倍数关系(数学意义)、两个随机数据之间的倍数关系(统计意义)。让学生“理解百分数的统计意义”对他们的思维水平要求较高,需要具有一定水平的随机思维(或者称为统计思维)能力。无论是自然现象还是社会经济现象,时时处处都充满着因个体的差异性而引起的不确定性,在大多数情况下,我们缺乏足够的信息或知识去利用有效信息。但是,人们总是期望通过量化事物的不确定性去发现规律、揭示真相,认识不确定性背后的必然性。由此就产生了“统计学”,其根本任务是探究规律、发现关系、推断未知(由于不确定性,人们在一定概率下作出判断)。
如果说数学给出的是唯一正确的答案,那么统计学给出的只是多个可选择的答案中最有可能接近实际的结果。因此,人们需要具备统计思维,这是一种在获取数据、从数据中提取信息、论证结论可靠性等过程中表现出来的思维模式[3],具有辩证性、批判性等特点,比传统的数学思维要求更高。统计思维是一种由经验到理性的认识,一种运用偶然发现规律的科学思维。它既是一种方法和技术,又含有世界观的成分——认识世界的一种方式。2022 年版课标将百分数的内容调整到“统计与概率”领域,并增加理解它的统计意义的要求,目的就是试图提高学生的统计思维水平,但这在小学阶段的难度很大。
二、“百分数”的重要育人价值在于提高学生的统计思维水平
百分数的学习不是在传递如何把结果转化为分数的孤立规则,而是把百分数与更广泛地理解数学思想或者自身的经验联系起来。[4]虽然《义务教育数学课程标准(2011 年版)》(以下简称“2011 年版课标”)也强调了数据意识以及随机性,但教材中有关“对数据的需要”和“变异”两个维度的内容所占的比例却非常低,教学时,教师也更多地从习题的表层要求出发,而忽视了渗透其中的数据意识以及随机性认识。[5]小学阶段的统计教学以统计知识与方法为基本内容,在此过程中培养学生的统计思维甚至统计思想,2022 年版课标在小学阶段强调“数据、平均数、百分数的统计意义”即是为了实现这个目标。然而,在初中阶段却没有提及“统计意义”,其在“内容要求”和“学业要求”中提到的都是统计知识与方法,反而小学阶段的要求“更高”一些。因此,笔者认为初中阶段也应该提出“理解统计意义”的要求,而不只是学习统计知识与方法。
统计学家C.R.劳指出:“对统计学的一知半解,常常造成不必要的上当受骗;对统计学的一概排斥,往往造成不必要的愚昧无知。统计学是人类探究真理时必不可少的工具。”[6]其基本逻辑就是统计学提供专门的方法帮助人们通过量化事物的不确定性去不断产生新的知识,从而发现或接近真理。人们从经验或实验中所获取的知识是含有不确定性的,统计学关注的是这些知识当中所含不确定性的度量问题。一旦能得到不确定性的度量,人们的知识就得到扩充,对世界的认知就朝前跨越。这个过程在人类知识积累的进程中不断重复。
克莱因在《西方文化中的数学》一书中虚构了“决定论先生”和“概率论先生”,以对话的方式探讨“无序的宇宙:用统计观点看世界”,最终得出结论:宇宙是无序的,科学、社会经济方面所得出的相关原理、定律等只不过在“统计学意义(通过数据而得到的规律)”上成立,唯一的真理就是“没有绝对的真理”。从“统计的角度”看问题,可称之为“统计思维”。它具有辩证性,即从偶然中发现必然但又不能“百分之百”地相信“必然”,属于人类的高级思维。对小学生甚至初中生而言都较难形成,但又非常重要。我国历次义务教育数学课程标准对其“要求”也较为“纠结”。例如:《全日制义务教育数学课程标准(实验稿)》中提出的是“统计观念”;2011年版课标将“统计观念”改为了“数据分析观念”;2022年版课标在小学阶段将其改为“数据意识”,并且特别强调“统计意义”,初中阶段则采用“数据观念”。这些修改反映了统计思维是一种非常重要却又难以培养的思维能力。
统计思维比形象思维和逻辑思维更为复杂,它是人们自觉地运用数据对客观事物的数量特征和发展规律进行描述、分析、判断和推理的一种思维方式。数据要尽可能地排除人为干扰和系统误差,这样通过统计推断所得到的结果才能“更好”,但所得出的结论并没有“对错”之分。这与数学结论具有唯一性、确定性等的特征不同,也是统计思维与数学思维的本质区别,由此也可以看出在小学阶段培养学生的统计思维非常有难度。但是,统计思维的习惯要从早期学习就开始培养[7],即使有困难也要在日常教育教学中逐步渗透,否则成年后会更难。
总之,统计思维的基本思维方式是归纳推理。例如,所获得的一些数据既有差异性,又有规律性。数据越多(不同样本类别、样本容量),其规律性越明显,所获得的规律也越“可靠”。所以,统计思维本质上是证据思维,是辩证思维和逻辑思维的综合体,但辩证思维的特征更明显,而不是“非黑即白”的二元式逻辑性、因果性思维。在数学学习过程中一直渗透“统计思维”,浸润式地培养学生的统计思维是非常必要的,这对教师的数学专业能力、教学能力也提出了更高的要求。
三、“理解百分数的统计意义”的教学建议
认识“百分数”重在让学生感悟运用百分数衡量两个量之间相对大小的必要性、理解百分数的含义以及初步感悟百分数的统计意义。通常在教学“百分数”时,教师会创设比较“绝对量(如投中球的数量、森林面积等)”与“程度量(如命中率、森林覆盖率等)”等问题情境,帮助学生体会用百分数进行比较的必要性。但在这些问题情境中,学生所理解的仍然是百分数的“数学意义”,而不是它的统计意义。他们仍然是按照“每一百个投中多少个”来理解用百分数描述命中率,进而理解百分数可以表示投中的次数与所投总数之间的倍数关系的。虽然按这种方式教学,学生会“认可”百分数不是教师“告知的”,而是通过比较分母是20、100、200 等数时逐步感悟得到的。学生这样理解的根本原因是“十进制”思想在他们心目中“根深蒂固”,他们认可用“百分数表达倍数关系”便于比较、便于作判断和下结论。但是这样的教学并没有让学生理解百分数的统计意义。那么,如何让学生理解百分数的统计意义呢?
(一)在讨论与辩论中感悟数据的随机性
“统计”的研究对象主要是随机事件,并通过对随机事件展开调查或试验得到随机数据。随机数据包括两类:一是完全随机状态,即概率试验所得到的数据,例如抛硬币、掷骰子试验所得到的数据;二是来自现实的数据,具有一定的随机性,但又不完全随机,属于半随机状态。完全随机和完全不随机的数据,属于数学研究或数学阐释的范畴,半随机的数据则由于历史原因归于统计研究领域。随机性与不确定性不一样,当然二者之间也有一定的关系,有的不确定性事件具有随机性,有的则不具有随机性。例如,本周日午餐“可能吃鱼”,该事件具有不确定性,但它不具有随机性,周日是否吃鱼可以由“妈妈”决定。对数据随机性的价值认识较晚的原因是“对其研究的难度很大”,研究者很难对“数据随机性”的内涵给出操作性定义,而且很难弄清楚学生理解数据随机性的过程。
以“命中率”为例,学生在理解百分数便于比较、能够刻画两个量之间的倍数关系之后,还需要进一步认识投球所得到的数据具有随机性。为突破学生已有的确定性思维的定式,教师需要引导学生从“统计”的角度认识“百分数”,即所得到的命中率只是“统计意义”上的命中率,不具有“确定的因果关系”。比如,命中率60%并不意味着“投10 个球一定命中6 个”。因此,在教学“百分数”的过程中,教师要激发学生展开讨论与辩论:“假如再比赛一场,命中率一定是60%吗?”“既然命中率不是确定的,那么推荐谁去参加比赛呢?”……这就要求学生“能够根据情境,利用统计知识进行批判性的质疑,并用统计语言进行表达与解释”[8]。
教学“百分数”的统计意义时,要让学生知道在现实世界中随机现象普遍存在,感知随机现象的基本特征:可能发生,也可能不发生;可能以这样的程度发生,也可能以那样的程度发生。还要让学生感知许多随机现象发生可能性的大小是可以预测的。统计思维就是用部分数据推断总体情况,不能保证“百分之百”正确,但要保证出错的可能性尽可能小。这种根据数据作出推断的方式就是统计的本质。
(二)与已有的统计经验建立链接,感悟“数据蕴含信息”
一般而言,我们说“百分位数是一类统计量”,但不说“百分数是统计量”。平均数、中位数、众数、加权平均数、方差、标准差等都可称为“统计量”,能够描述一组数据的“集中趋势(集中量数)”或“离散趋势(差异量数或变异量数)”。百分位数是百分位所对应的数据,即将一列数据由小到大(或由大到小)排列,第一个数据就是第1百分位数,中位数就是第50 百分位数。要特别指出的是,第一个四分位数就是这组有顺序数据中第25%所对应的数据,第二个四分位数就是中位数,第三个四分位数就是第75%所对应的数据。
虽然不说“百分数”是统计量,但是“百分数”的教学能够与统计量的教学建立联系。二者都通过对原始数据进一步加工获得“新数据(即原始数据蕴含的信息)”,再根据数据所蕴含的信息作出合理的决策。比如,在“推荐参赛选手”的问题上,仅从投篮“命中次数”这一个量是不能获得有效信息的。“命中次数”仅在数量上具有可比性,但在统计意义上是不可比的。学生最直接的感受是“仅比较投中次数是不公平的,我们并不清楚他们各投篮多少次”。可见,学生需要从两个量建立的关系(“投篮次数”与“命中次数”的倍数关系)中挖掘数据蕴含的信息。
“百分数”教学能否唤起学生学习统计量时的相关经验呢?在学习“平均数”时,学生曾有过质疑“公平”的经历。而在比较两个小组的投篮水平时,直接比较两个小组“投中总数”的做法也是不公平的。所以,学生需要从“投中总数”与“人数”的等分关系里挖掘数据信息。“百分数”和“平均数”都不是根据一个量的大小判断事物的程度的,而是通过相关数据之间的关系挖掘有效信息,进而作出更加客观的判断。它们的共性是把统计意义下不可比的数据变得具有可比性,为合理决策提供重要依据。
(三)让学生感悟“命中率的来源”决定其可信度
如前所述,学生已经通过研讨交流感受到,利用“投中的数量”不能做决策,利用“命中率”更科学,感悟到百分数这一概念产生的必要性。此外,还需要让学生初步了解怎样求得的“命中率”更可信,利用其作出的决策更可靠。统计思维需要超越数据本身,并与数据的来源背景进行连接。[9]
例如,教师可以创设这样的情境:从甲、乙、丙3 人中选1 人参加投篮比赛,甲的命中率是100%,乙的命中率是90%,丙的命中率是80%。从命中率高低来看,当然选甲参加比赛,但是,甲参加比赛却输了。学生会很自然地反问:“命中率100%怎么会输呢?”他们还会追问:“甲的命中率100%是怎么得来的?”教师告知学生选拔赛的过程:原来,选拔赛时,甲只投了1个球,结果投中了,命中率100%;乙投了10 个球,投中了9 个,命中率90%;丙投了50个球,投中了40个,命中率80%。这时教师提问:你会相信谁的“命中率”?学生可能会说:当然是丙的。
前述教学情境的讨论真正涉及事件发生的随机性问题。随机性主要体现在两方面:一是对于同样的事件每次收集到的数据可能不同。如让甲投篮1 次,投中1 次,命中率100%;另一次预赛,让他投篮10 次,投中6 次,命中率60%。哪个“命中率”能代表他的水平呢?很难说。只有当他投篮的次数更多一些,才能发现“规律”。二是只有拥有足够多的数据才可能从中发现规律。如让甲投篮50次,投中29 次;投200 次,投中122 次;投500 次,投中300次……乃至投更多的次数。这时可以说,他的投篮命中率大约是60%,此时的“命中率”才能代表他的投篮水平,使用这个“命中率”作判断、作预测才能“更准”。此外,还有一个基本假设:人的投篮水平基本是稳定的,但也会受偶然因素的影响。因此,一个人的投篮命中率是60%,决不能说“投100 次肯定投中60 次”。然而,在真正比赛时,两个人的命中率分别是50%和60%,仍会派命中率60%的人参加比赛,因为他获胜的可能性更大。所以在理解百分数统计意义时,不要简单地被百分数所迷惑,而要考查百分数背后的统计过程。
推断统计的核心是通过已经历过的事件来推断未经历过的事件,或者说通过样本推断总体。因此,抽样问题至关重要,但小学阶段的统计内容中只是略有涉及,初中阶段更应该提出“理解统计意义”的要求。统计分析的过程是一个循序渐进的过程,它既容忍误差的存在,又在认识过程中不断控制和降低误差,同时还及时对分析结论进行评估。因此,“理解百分数的统计意义”很难,需要学生辩证地看待存在的“现象或事实”,从“统计角度”看待事件发生的过程与结果。