相对概率
2020-05-11方万里
方万里
【摘要】对连续型随机变量的概率密度,如果从几何或者物理角度去解释,对初学者特别是一般高校的文科生存在理解和接受上的困难,通过引入相对概率这一概念,概率密度就如离散型随机变量的分布律那样容易理解和接受.
【关键词】分布律;概率密度;相对概率
在大学开设的高等数学、线性代数和概率论与数理统计这几门数学课程中,概率论对学生来说是最难的.百度贴吧有个帖子做了个提问式调查,问这三门课程哪门最难,在明确给出答案的56个回帖中,有34个选择了概率论,占比60.7%,可见概率论在学生的心目中的地位.概率论之所以难,其中一个原因就是学生对连续型随机变量的概率密度函数以及常见特殊连续型变量复杂概率密度函数的理解和记忆存在困难,比如,服从正态分布、T分布、x2分布和F分布随机变量的概率密度函数.
在教学过程中,针对连续型随机变量的概率密度的讲解,往往从几何或者物理角度去解释,对初学者来说还是较为抽象,存在理解和接受上的困难.此时可以借助于他们对高数基本知识以及离散型随机变量及其特性的理解和掌握,通过引入相对概率这一概念展开叙述,概率密度函数就如离散型随机变量的分布律那样容易理解和接受.
一、连续型与离散型随机变量定义
设随机变量X所有可能的取值只有有限个或者可列无限多个,则称X为离散型随机变量,假设X可能的取值为x1,x2,…,且取xk的概率为p(X=xk)=pk,k=1,2,…,称之为离散型随机变量X的概率分布或分布律,其分布函数为:
对随机变量X,如果存在非负可积函数f(x),对任意x∈(-∞,+∞),都有:则称X为连续型随机变量,f(x)为X的概率密度函数,简称密度函数或概率密度.
在以上两个定义中,离散型随机变量的概念及其分布律较为容易理解,而连续型随机变量的定义及概率密度理解起来却较为困难.通过“灯泡的寿命”等例子的讲解,可以使初学者对连续型随机变量有一个比较直观的认识,而对其概率密度的讲解,往往从几何或物理角度进行.
二、概率密度的常规解释
常规解释即从字面进行解释,首先回顾中学物理中的密度公式:(1)对均匀物质,其密度公式为ρ=mV;(2)对非均匀物质,每点的密度可能不同,其中a点的密度为包含a点小块物质质量与体积的比值极限ρa= limΔV→0ΔmΔV.
同理,连续型随机变量X在任意点x(x∈(a,b))处的概率密度可以表示为:
所以称f(x)为随机变量X的概率密度函数,简称概率密度或密度函数.
这种解释对学生来说理解起来存在三个方面的难点.首先,同样是概率问题,离散型变量的分布律很直观,易于理解接受,而连续型随机变量的概率密度函数的解释好像与离散型随机变量的分布律完全不同,割裂了其与离散型变量的区别与联系,有些初学者可能会理解,却不大容易能接受.其次,很多学生特别是经济管理类专业的文科生之前根本就没有接触非均匀物质的密度公式,接受起来尚需要一个过程,更何况是在此基础上引申出概率密度函数这个高阶概念.第三,连续型随机变量中的那个非负可积概率密度函数f(x)出现的太突然,它是怎么来的,学生表示很懵.
三、相对概率——概率密度的另一种解释
我们完全可以基于学生对离散型随机变量及其概率分布律的领会来解释说明连续型随机变量的概率密度函数.
從之前教学内容的两个命题开始,“不可能事件的概率为0”,反之“概率为0的事件却不一定是不可能事件”,对后者常用例证,如灯泡的使用寿命X(小时),有P(X=300)=0,但{X=300}却不是不可能事件.实际上,这里P(X=300)=0中的“0”不是真正的0,而是无穷小量0(当然,有的时候是真正的0,比如,P(X=-300)=0),即灯泡的寿命取300的概率非常非常小,以至于无法像离散型随机变量取某个值的概率那样用一个非0的数字来表示.
灯泡的寿命X便是一个连续型随机变量,要用非0数字来表示连续型随机变量取某值的概率不是不可以,只要将这个无穷小量除以另一个无穷小量将其放大即可,我们将这个放大后的概率称为相对概率,即概率密度.推导如下:
与之相对的是,离散型随机变量的概率可理解为绝对概率.
四、概率密度函数两个性质证明
即通过离散型随机变量分布律的性质,利用相对概率,推导出连续型随机变量概率密度函数的性质,即:
五、结束语
离散型随机变量的定义、分布律及其性质很容易理解,引入相对概率这一概念之后,连续型随机变量的概率密度及其性质就与离散型随机变量的分布律及性质相对应起来,也变得容易理解和接受.推导过程可能不够严谨,但是对于数学基础比较薄弱的学生理解课程内容还是有一定的价值.
【参考文献】
[1]孙荣恒.应用概率论:第三版[M].北京:科学出版社,2016.