高观点下一个中学概率问题的分析与启示①
2020-06-23李杰民廖运章
李杰民 廖运章
(1.广州大学数学与信息科学学院 510006;2.岭南师范学院数学与统计学院 524048)
1 问题提出
《数学通报》2017年第5期刊登了文章《一个概率问题的解决及其启示》,该文介绍了一个“不起眼”的概率题以及如何寻找问题解答的过程和思考[1]. 问题是:抛掷一枚硬币,若出现正面记1分,出现反面记2分,连续抛掷多次,问恰好得到3分的概率为多少?
为了解决该“困扰”,文[1]由赛制启发得到了一种“虚拟解法”. 形式上,它是一个类似赛制的表格;本质上,是将“2维”的样本点升级到“3维”,统一到一个样本空间,回到“古典概型”框架下解决问题.
2 高观点下问题的探究与解决
以“高观点下的初等数学”为主题的研究日渐增多,不少高师院校还专门开设了此类课程,但要找出中学数学与高等数学的联系并非易事,学习了高等数学而不能很好的指导中学数学教学的情况也普遍存在,以致很多学生错误的认为高等数学的学习并不能为初等数学教学带来多少帮助. 文[1]关于一个概率问题的探究为我们提供了一个难得的案例,我们在大学教学中引入该案例,让学生清晰地看出了问题的本质与内涵,深刻领悟到大学知识与方法对中学问题及其解决的指导意义,以及大学概率课程与中学概率知识一脉相承的关系,引发了学生的强烈共鸣.
马尔可夫过程是随机过程的重要组成部分,也是随机过程研究中最为成熟一个分支,离散时间离散状态的马尔可夫链更是因其通俗易懂、应用广泛而广为人知. 学完马尔可夫链的定义后,书本介绍了几个“随机游动”的例子,但“随机游动”也是概率统计学家从实际问题中抽象出来的模型,尚未与学生的认知建立深刻的联系. 此时我们开始向学生介绍文[1]中的问题,首先让学生思考,由于文[1]的问题比较简单,又来自高中,学生非常兴奋,很快解答出来,解法大多与文[1]中“教师B的方法”相同. 然后,告知学生该问题的本质是一个马尔可夫链,学生难以置信,怎么突然和马尔可夫链联系起来了?
事实上,引进随机变量Yn,n=1,2,…. 若第n次抛掷时出现反面,令Yn=2;若第n次抛掷时出现正面,令Yn=1;再引进随机变量Xn,n=0,1,2,…,令Xn=Y1+Y2+…+Yn,n=1,2,…,规定X0=0. 显然,这里的Xn表示抛掷n次后的得分情况.
要计算得到3分的概率,即研究n取何时Xn=3,并计算该事件发生的概率. 由前面教师B的解法可知,所求概率为P(X2=3)+P(X3=3),但如此继续下去,与教师B的解法并无实质不同. 其实,n取何时Xn=3并不是问题的重点,n取何时Xn=0也无关紧要,问题的核心是:计算“Xn从0分变到3分的概率”,抓到了这个本质,问题转化为一个条件概率的计算问题.
我们将随机变量序列Xn,n=0,1,2,…的取值情况作图如下(图1).
图1 随机变量序列取值状态变化图(等可能情形)
这是一个有向图,赋权图,这不正是马尔可夫链的状态转移图吗?图中数字0,1,2,…原本表示“得分”,经过抽象,称其为随机变量序列所处的“状态”,图中的其他数字即“权”,正是马尔可夫链的“一步转移概率”,表示随机变量序列从一个状态转移到另外一个状态的概率.
具体的说,pij=P(Xn+1=j|Xn=i)表示随机变量序列Xn,n=0,1,2,…从“n时刻处在状态i”转移到“n+1时刻处在状态j”这样一个条件概率,很明显,此条件概率的值与随机变量序列在n时刻之前的时刻所处的状态无关,即满足“马尔可夫性”,也称“无后效性”.
因此,随机变量序列Xn,n=0,1,2,…描述的正是一个马尔可夫链,而且是齐次马尔可夫链,文[1]中的问题转化为求此马尔可夫链由状态“0”转移到状态“3”的概率.
学生恍然大悟,原来,求马尔可夫链由一个状态转移到另一个状态的概率并非概率统计学家凭空想象出来的,而是存在实际问题的需求与驱动,马尔可夫链也不仅仅是教材上的概念,而是在生活中广泛存在的,抛掷硬币这样简单的试验竟然“抛出”一个马尔可夫链. 事实上,马尔可夫链正是概率统计学家从随机现象研究中发现并抽象出来的一类随机模型,通过对该类模型的研究反过来可以指导解决一大批实际问题.
接下来,考虑由状态“0”转移到状态“3”的概率的计算.
方法1:从图1可以看出,从状态“0”变成状态“3”,有三条不同的“道路”,所求的概率为
如此简明,如此清晰.
不仅如此,即使没有等可能性,问题解决没有任何难度增加. 比如,若硬币是非均匀的,假设出现正面的概率是1/3,出现反面的概率是2/3,只需将图1中的表示概率的数字改动一下,如图2.
图2 随机变量序列取值状态变化图(非等可能情形)
此时,所求的概率为
可见,“等可能性”并非文[1]问题的本质特征.
方法2:正如图的矩阵表示一样,马尔可夫链的状态转移变化图可以用矩阵表示,而且根据C-K方程,马尔可夫链的“多步转移概率矩阵”是“一步转移概率矩阵”的幂,写出“一步转移概率矩阵”A,然后计算矩阵的幂A2,A3,…,令B=A+A2+A3,矩阵B的第一行第四列的元素就是我们要求的概率. 由于这里的矩阵都是无限矩阵,限于篇幅,我们仅仅写出A如下,矩阵A2,A3和矩阵B省略了.
如此严谨,如此细致.至此,学生不但对问题的本质有了清晰的了解,而且认识到大学概率知识对中学概率问题的指导意义,也理解了大学为什么要引进“可达”、“首次到达”以及后面还要学习的“常返性”,“极限定理与平稳分布”等概念与知识,感受到大学课程的严谨与深度.
3 启示与建议
通过对文[1]问题进行高观点视域下的解读与分析,不但看清了问题的实质,了解了大学方法的严谨与深刻,至少还可以得到以下三个方面的启示.
3.1 关于虚拟解法的价值与局限
文[1]的探究过程围绕如何构造一个“古典概型”的样本空间展开,加深了师生对“古典概型”的认识,让师生意识到构造一个合适的“样本空间”的重要性.
但该方法使用起来并不方便,文[1]谈到了树形图,树形图实际上是该方法的另一种表现形式,“树”是一种数据结构,“虚拟解法”可以编程实现,但编写程序是另外一个专业问题,不编写程序,“虚拟解法”无论在高中阶段还是大学阶段,使用起来都不方便. 特别是,随着样本空间“维数”的上升,对计算机影响不大,人类却难以忍受这种枯燥乏味、费时且容易出错的方法,另外,“虚拟解法”适用范围有限,如果没有等可能性,该方法失效.
但教师B的方法仍然可行!教师B的方法简单而实用,易于被学生掌握,建议高中阶段采用教师B的解法,当然,需要将问题的探究时机调整到“独立事件的概率乘法公式”知识点之后,这要求教师对概率知识的全貌有较好的把握,并了解其在高中数学教材中的分布情况,特别是前后有紧密关联的知识点. 比如,人教版将“古典概型”安排在必修3的§3.2[2],“独立事件的概率乘法公式”安排在选修2-3的§2.2“二项分布及其应用”[3],这两个知识点一般都出现在大学“概率论与数理统计”课程的第一章“概率论的基本概念”[4],高中阶段却分开出现在两本书,教师应该意识到这些差异.
文[1]的探究过程为我们提供了一个难得的案例,如果意识到“虚拟解法”的不足,将其作为阶段性成果,继续展开探究,寻找更合适的解法,结果将更加深刻.
比如,可以采用随机变量这个研究随机现象的核心工具,使用随机变量表示事件(随机事件简称)比使用集合表示事件更深刻、更入微、更动态,更能找出不同事件之间的联系,更能发现问题的本质. 正如数理逻辑中“谓词逻辑”与“命题逻辑”的关系一样[5].
bi-square权函数相对于全局线性回归(oLS)模型来说,基于函数之下的局部空间回归(GWR)模型拟合优度最高,其对于城市旅游效率的影响因素分析更为明确。
如果将问题的探究时机安排在人教版选修2-3的§2.2之后,此时不但学完了“独立事件的概率乘法公式”,也学完了“随机变量”以及“二项分布”,为深入探究提供了知识保障. 事实上,前面介绍的随机变量Yn,n=1,2,…独立同分布,但Xn,n=1,2,…并非独立,而是存在相依关系:Xn=Xn-1+Yn,n=1,2,…. 可见,此问题在高中阶段其实存在一定的难度,不要被其简单的外表所蒙蔽.
3.2 关于“古典概型”的把握
前面的高观点解读已经发现文[1]中的问题与“等可能性”关系不大,其实,认真考察教师B的方法也能看出这一点. 教师B的方法实际上用到了分类讨论思想或者加法原理:要得3分,应该是连续抛掷2次或者3次,这是两种不同的得分途径,因此采用加法原理. 此外,教师B的方法还用到了独立事件的概率乘法公式. 如果将该方法完整的表达出来,应该是:设A表示事件“恰好得3分”,B表示事件“连续抛掷两次后得3分”,C表示事件“连续抛掷三次后得3分”,问题为求事件A发生的概率P(A).
因为P(A)=P(B)+P(C),转而计算P(B)和P(C). 设Bi表示事件“第i次抛掷出现正面”,Ci表示事件“第i次抛掷出现反面”,i=1,2,…,由题意得P(Bi)=1/2,P(Ci)=1/2,i=1,2,…,因为B=B1C2∪C1B2,所以P(B)=P(B1)·P(C2)+P(C1)P(B2)=1/2,因为C=B1B2B3,所以P(C)=P(B1)P(B2)P(B3)=1/8,因此,所求的概率为P(A)=P(B)+P(C)=5/8.
注意,这里P(Bi)、P(Ci)的值是默认的,即通常情况下,默认抛掷硬币试验满足“等可能性”. 但是,从以上解题步骤可以看出,教师B的方法并不依赖于“等可能性”. 因为该测试题被意外的安排在“古典概型”之后,学生尚未学习“独立事件的概率乘法公式”,导致文[1]对教师B的解法出现了另外一种解读:将P(B)、P(C)的计算改用如下的方法:考虑样本空间Ω2={(正,正),(正,反),(反,正),(反,反)},于是,P(B)=2/4;考虑样本空间Ω3={(正,正,正),(正,正,反),(正,反,正),(正,反,反),(反,正,正),(反,正,反),(反,反,正),(反,反,反)},于是,P(C)=1/8.
注意,这里计算P(B)、P(C)并没有用到“独立事件的概率乘法公式”,而是用到了“古典概型”概率计算公式. 设Ω={正,反},则Ω2=Ω×Ω=Ω2,Ω3=Ω×Ω×Ω=Ω3,即集合的笛卡尔积,这里的计算用到了三个样本空间:Ω、Ω2、Ω3,样本空间从“1维”上升到“2维”、“3维”,问题变得复杂,但即使采用不同的样本空间来分别计算P(B)与P(C),只是繁琐,并没有使问题变难,而本文开头部分提到的那个错误解法试图将不同“维数”的样本点放在一起构成一个样本空间,导致了错误的出现.
以上解法出现了三个不同的样本空间,且样本点的“维数”也不相同,而教科书的例题[2]与高中新课标附录中的“案例12”(投掷骰子问题[6])的样本空间都是确定的,样本点的“维数”是固定的. 因此,基于教材例题与新课标案例的示范作用,教师A提出了质疑,认为应该具体指出抛掷次数. 但教师B的解法借助“独立事件的概率乘法公式”与“加法原理”进行解题,避免了出现不同“维数”的样本点,只用到了一个最简单的样本空间Ω={正,反}.可见,问题是不是“难题”与解法的选择有密切关系,仅仅借助“古典概型”去解决问题反而增加了问题的难度.
此案例表明,单纯依靠“古典概型”解题不但不会使问题简化,反而可能变得棘手,因此,解决问题应该是多个知识点的综合运用,需要正确把握“古典概型”的定位.“古典概型”之所以“古典”,不仅是因为其历史较为悠久(拉普拉斯于1814年最早给出了“古典概型”的定义[7]),而且是因为“古典概型”是概率论学科发展过程中最简单的模型. 因此,“古典概型”是概率课程学习与研究的起点与基础,教学中不宜过多的停留,应该引导学生往前走,去学习和掌握更便利、更现代的研究方法与工具.
事实上,现实中满足“等可能性”的随机现象占比是少数,一味地尝试回到“古典概型”去解决复杂的随机现象是“概率与统计”教学中存在的一个误区,并非个案,以下是笔者最近听到的一个案例.
问题:一个酒鬼的钥匙串上有k把看起来相同但实际上不同的钥匙,其中只有一把可以打开他家的大门,午夜回家,他一把钥匙、一把钥匙的尝试开自家的大门,如果每一次他都随机地选择没有试过的一把钥匙,那么在试到第n(1 我们知道,事件“门被打开”等价于事件“选对钥匙”,k把钥匙中,1把可以打开家门,k-1把不能打开家门,设Ai(i=1,…,k)表示事件“第i次取到对的钥匙”,显然P(A1)=1/k,然后,利用条件概率与乘法定理可以计算出P(A2)=1/k,…,P(An)=1/k,至此,问题已经解决,但令人惊讶的是,主讲人抛出第二种解法:设样本空间Ω={A1,A2,…,Ak},由“古典概型”可知,所求概率为P(An)=1/k. 虽然是有限个样本点,但“等可能性”从何而来呢?因为第一种解法已经证明了这个问题与“无放回摸球模型”[8]实际上是同一个概率模型,旨在说明“条件概率”与“乘法定理”的重要作用,而不是归功于“古典概型”. 高中数学新课标比之前的实验版增加了“有限样本空间”的内容,新课标解读指出:“古典概型”是有限样本空间的重要特例,如果不讲有限样本空间,直接从“古典概型”说起,会对学生理解概率造成一定的影响[9]. 突出“有限样本空间”,将“古典概型”作为其特例,新课标给出了明确的导向,有利于学生对概率的理解,也有利于概率教学,特别是对“古典概型”的把握. 俄罗斯著名教科书《概率》[10]第一节“有限种结局试验的概率模型”,正是采用了这样一种编写思路. 在讲授“马尔可夫链”知识点时,由于文[1]案例的引入,学生产生了强烈的共鸣,是多次讲授该内容以来学生参与程度最高,理解最好的一次. 可见,大学课堂需要加强与高中阶段的联系,要通过各种渠道了解、研究高中数学教学情况,寻找合适的案例,合适的切入点,使大学教学更有活力和吸引力. 时代的发展促进了人们对“概率统计”重要性的认识,基础教育阶段数学课程也加强了“概率与统计”的教学,但数学师范生所学的“概率统计”知识有限,储备不足,对随机现象研究的复杂性认识不够,对“随机变量”这个重要的研究工具领悟不深. 比如,我校数学专业使用的概率统计教材[4]含有马尔可夫链的内容,但多数同类教材并没有介绍该内容,需要教师适当补充介绍,这也涉及到学时和任课教师本身的知识储备问题. 高师“概率统计”教学应当做好与高中阶段的衔接,为此,应当调整大学“概率统计”的教学内容,将与高中阶段重复但高中阶段已经掌握较好的教学内容进行“泛读”,适当减少学时避免简单的重复;而高中阶段迫切需要却被大学阶段忽略的知识点应当增加学时补充讲授;开展大学与高中的教学交流与联系等等. 一个看似“不起眼”的“小问题”,隐藏着随机数学中的“大道理”,问题及其求解建立了高中与大学概率教学的联系,不仅值得中学教师探究与思考,也为大学教学提供了一个难得的案例. 在高中概率教学中,教师应在课前对概率知识的全貌及其在教材中的分布情况做好了解,精选课后测试题;正确把握“古典概型”的定位,了解“古典概型”的局限性,寻找更合适的工具与方法,既会用集合表示事件,也应当熟悉使用随机变量来刻画事件. 高师院校“概率统计”课程教学应当认真研究与高中阶段数学教学的衔接问题,努力提升师范生“概率统计”知识储备水平.3.3 关于高师概率统计课程教学改革
4 结束语