基于知识学术形态的概率空间的教学探讨
2018-09-10魏立力李晶晶
魏立力 李晶晶
摘 要:概率空间是概率论的平台,文章从概率空间的三个要素分别讨论了教学中应该注意的一些问题,样本空间由基本事件构成;事件域的构造原则是够用就好;概率是面积的泛化,强调测度属性。
关键词:概率空间;事件域;概率测度
中图分类号:G642 文献标志码:A 文章编号:2096-000X(2018)08-0119-03
Abstract: Probability space is the platform of probability theory. For the three elements of probability space, some problems that should be paid attention to in teaching are discussed respectively in this paper. The sample space consists of elementary events; the principle for constructing event field is good enough; probability is the generalization of area, emphasizing the measure property.
Keywords: probability space; event field; probability measure
所謂概率空间指的是三元体(Ω,F,P)。其中Ω表示样本空间,F表示事件域,P表示概率。(Ω,F,P)在概率论中, 是一个基础性概念,随机变量及其概率分布的都是建立在此基础之上。 概率空间是概率论的舞台,随机变量及其概率分布是在该舞台上的精彩演出。如何搞好概率空间相关内容的教学显得非常重要,我们结合多年概率论的教学实践,从其三个要素出发分别讨论教学中应该注意的一些问题,旨在不失学术水准的条件下,探讨概率空间的教学形态。
一、样本空间——表示试验的所有可能结果
概率论是一门研究随机现象的学科,对随机现象的观测称为试验,试验的每一个可能的结果称为(随机)事件。
定义1[1] 我们把不能或不必再分的事件称为基本事件,基本事件的全体称为样本空间,通常用希腊字母Ω表示。
如果用一个单点集{Ω}表示一个基本事件,则样本空间就是对应元素组成的集合,其中的元素也称为样本点。这样一来,随机事件就是样本空间的子集,这就是样本空间的集合论定义。
样本空间是概率论的最基本概念之一,在教学过程中,学生常常能够较好地理解样本空间的概念。但在一些具体问题,尤其是古典概率的计算问题中,如何构造相应的样本空间,会遇到困难,甚至犯一些错误。
一些文献[2-7]从古典概率的求解角度,讨论了构建样本空间的基本技巧,提出了一些教学建议。对同一问题,可以构建不同的样本空间,导致具体问题求解的难度有所不同。这种差异本质上只是基本事件的粒度不同,在计算古典概率时所运用的计数模式也不一样。不难理解,适宜于具体问题的粒度越粗,计算越简单,但能够表示的问题也就越少。
比如抛掷一枚骰子考察出现偶数点,样本空间可以是 Ω={1,2,3,4,5,6},也可以是Ω={奇数,偶数},后者对于考察出现偶数点这个事件比较简单,但不能表示诸如出现小于4点这样的事件。
我们认为关于样本空间的教学应该主要强调它是随机试验的所有可能结果的表示,其中的基本事件尽可能要求具有均匀性,粒度宜细不宜粗. 在教学过程中,举一例说明即可。
例1(抽签模型)10个球中有3个黑色,7个白色。10人依次各摸一球, 试写出该试验的样本空间。
解一:考虑10个球被摸到的先后顺序,则10个球的任意一个全排列对应一个基本事件,共有10!种不同排列,样本空间共有10!个样本点。
解二:考虑小球时除了颜色外,不可分辨,则只有两种元素:一种有7个(白色球),另一种有3个(黑色球),它们共有C种可能的顺序(只要分清哪些人摸到白球,哪些人摸到黑球即可),所以基本事件总数为C。
上述两个样本空间都可以作为抽签模型,区别在于粒度不同,第一个样本空间是第二个的细化,第二个是第一个的粗化,后者的一个样本点相当于前者的7!3!个样本点。
至于具体问题最优样本空间的选择实属技巧性问题,学生很容易忘记,教育价值非常有限,在教学和考查过程中应该淡化。
二、事件域——够用就好
事件域是概率空间的第二个要素,粗略地讲就是样本空间中某些子集组成的集族,它是定义事件概率的基础。 然而,在教学实践中,学生往往认识不到事件域的作用,甚至认为考虑事件域是多此一举。我们根据多年的教学经验,对事件域的作用和构造原则做一些分析,旨在对教学和学习都有所帮助。
当样本空间为不可数集时,一般不会取其幂集作为事件域。
例6 考虑一个测量误差的试验,样本空间是一个实数区间,此时事件域几乎都取的是Borel域(一个由开集逐步扩展形成的集类[8])。值得注意的是我们这里没有把所有子集都看成是事件(存在不是Borel集的实数集),这有两个方面的考虑。一是实数集的幂集太大,在其上不可能定义一个恰当的概率;另一是我们只需将有用的子集看成是事件即可,对于研究的随机试验,够用就好。
第三,事件域确定之后,只有出现在事件域中的才是事件,否则就不是。这可能与随机事件的实际背景有一些冲突,初学者不必太计较这个出入。
如果考虑的事件太多,我们就要对太多的事件求概率(参见后文),问题就很复杂,不易甚至不能处理;若考虑的事件太少,两个事件的运算结果有可能不再是事件,就不能满足我们的需要。所以,把哪些子集看成事件,要根据试验的目的来决定,够用就好。
虽然事件域定义抽象,如果教师们能在教学过程中引导学生用以上直观的想法重新考量其中的三个条件,相信学生会感受到公理化语言的独特魅力,使学生体会冰冷的形式化语言背后那火热的思考。
三、概率——面积的泛化
概率空间的第三个要素就是概率。事件A的概率以P(A)表示,它是一次随机试验中,事件A发生可能性大小的数量指标。
一个随机事件发生可能性的大小是其自身的特性,就好比一支粉笔的长度,一块桌面的面积。概率是随机事件发生可能性大小的度量,因此我们认为在教学实践中首先应该强调概率的测度属性——概率是面积的泛化。概率的测度属性是其最本质的数学特征。
如何确定一个给定事件的概率大小? 答案是采用适当的方法去“测量”它。
古典概率就是在古典概型中概率的赋值方法。这个模型要求满足两个条件:一是样本空间是有限集;二是样本点是匀质的。在这样一个模型中概率的计算公式就是有利样本点的个数除以总的样本点个数,这是容易理解的,但需要注意三个问题。
一是样本空间的粒度与具体问题的关系。正如前文所言,不同的样本空间的粒度可能会带来解决问题的难度不同,也就是说模型有优劣之分,但我们认为这不应该成为教学的重点。学生经常犯的错误是分子分母使用的计数方式不一致,比如分母考虑了顺序,而分子没有考虑,这相当于分子和分母是从不同的样本空间计数得到的。
二是样本点匀质性是个基本假设,在实际应用中,往往由对称性或某种均衡性来判断基本事件的等可能性。但有些时候只凭主观对物理性质或几何对称性的判断是不完全确切的。例如一个平常的掷骰子试验,出现1点,2点,……,6点的可能性似乎都是一样的,但仔细分析可知,由于骰子各面所刻点数不同而导致其重心偏离其几何中心。这属于模型与现实的问题,模型总是现实的近似。
三是计数的繁杂性。计数的精巧训练无助于对概率的理解,计数问题有些是很有难度的,老师们常常也是先看答案,再想推导。我们认为计数方法的教学不宜太深入,学生能够掌握几种基本模式就可以了。
几何概率是在几何概型中概率的赋值方法。这个模型和古典概型相同点是要求样本点的匀质性,不同点是样本空间是无限集。概率计算公式不能再用“计数”(测度),而应该用“长度”、“面积”、“体积”等测量值。在具体问题中样本点的匀质性通常都是近似满足,与古典概型一样,这属于模型与现实的问题。
回到前文关于事件域的论述,我们只要对事件域中的事件赋值一个合适的概率就可以了。也就是说,我们要确定一个定义域是事件域的函数P:F→[0,1],在数学中我们暂且不管如何确定这个集函数,而是关心它应该满足什么样的性质,这正是数学的公理化思想。
定义3[1] 设F是一个事件域,P(·)为定义在F上的实值集函数,若它满足:
则称P(·)为事件域F上的概率(测度)。其中P(A)就称为事件A的概率。
概率的公理化定义是概率本质属性的体现,本身不能计算概率。古典概率、统计概率、几何概率都是在一定的场合下,给概率赋值的方法,它们都满足公理化定义,都是概率。可见概率的公理化定义刻画了概率的数学本质。事实上,在事件域F上给出一个函数,且满足定义3的条件,就被称为概率;否则,就不能称为概率。
根据这一定义,我们就能对概率执行各种运算,并得到逻辑演绎下的很多有用的结果,因此我们还是别对这种抽象的定义抱有怨言了,对公理条件给出朴素而直观的理解才是正道,接受公理化方法是现代数学的基本方法之一。
学生在学习概率论时,已经在先修课程(比如线性代数中)有了数学公理化思想的初步训练,因而在概率空间的教学过程中概率的公理化定義是能够接受的。最重要的是,在教学过程中引导学生直观地理解其中的三个条件,尤其是对概率可加性,可以结合后面概率的性质(如单调性和连续性)进行研究性学习。同时鼓励学生大胆探索,了解一些在人工智能领域非常有用但不满足可加性的非概率测度,比如信任测度与似然测度,可能性测度与必然性测度等。旨在使学生感受到抽象的形式化表示,背后蕴涵的想法是直观的。
有了概率空间这个平台,随机变量就可以出场表演了。通俗地讲,随机变量就是一个会随着试验结果不同而变化的量。正式地讲,随机变量是定义在样本空间,取值于实数(向量)的一个函数而已,对这个函数的唯一限制由事件域完成,即要求这个函数不超过任意一个实数所对应的样本点组成一个事件。与微积分研究函数不同,对于随机变量,人们更多地关心其取值(值域)情况。具体而言,对随机变量的描述有两个角度。一是研究随机变量的所有可能的取值及其伴随的概率大小,二是考察随机变量的一些特征描述,这两个角度分别对应了随机变量的分布函数和数字特征,概率论的内容大体如此。
四、结束语
学习三元组(Ω,F,P)能够帮助我们迅速理解概率论中的很多理论,借助概率空间,很多原本似是而非的概念与性质将变得清晰而严密。学生在感受形式化语言所特有魅力的同时,受到数学演绎逻辑思维的训练。
在教学活动中,如果教师能适时而巧妙地启发学生,从朴素的想法出发,学生对形式化语言所描述的抽象定义是可以理解的。教师应当帮助学生理解冰冷的形式化背后,数学家是怎么思考问题的,从而获得数学思想的熏陶,得到良好的情感体验。
很多学生大学毕业进入社会后,感觉大学所学的数学知识没有什么用,很快就忘掉了。但是,不论他们将来从事什么职业,那种具有朴素想法支撑的数学思想、数学思维方法、数学表达方法等,却会潜移默化地发挥作用,使他们终生受益。
本文是笔者多年来在概率论教学和研究的结果,主要是从概率空间的学术形态考虑,针对概率空间的三个要素的教学,得到的一些体会和经验。目的是探讨在一定的学术水准上如何能够精准把握教学内容,实现知识学术形态向师范形态的有效转换,帮助学生克服对形式化描述公理化定义的恐惧心理,让学生理解形式化背后的朴素想法,有利于创新思维的培养。
参考文献:
[1]魏立力,马江洪,颜荣芳.概率统计引论[M].科学出版社,2012.
[2]兰旺森.概率论教学中与样本空间有关的几个问题[J].高师理科学刊,2017,37(11):50-52.
[3]付守才,朱坤.多角度构建样本空间[J].长春师范大学学报,2006,25(6):100-101.
[4]何继刚.概率论中审视样本空间的思维策略[J].数学通讯,2005(17):6-7.
[5]杨洋,张燕,居艳.概率解题中样本空间的选择[J].高等数学研究,2007,10(1):96-98.
[6]程学理.古典概型中样本空间选取教学法探讨[J].贵州师范大学学报(自然科学版),1998,16(1):101-104.
[7]赵岗.古典概型中样本空间的选取和做题技巧几例[J].山东教育学院学报,1995(4):15-16.
[8]严士健,刘秀芳.测度与概率(第2版)[M].北京师范大学出版社,2003.