泊松分布的几点说明
2018-11-30河南质量工程职业学院基础教学部赵晓艳
河南质量工程职业学院基础教学部 赵晓艳
在介绍泊松分布之前,我们先介绍二项分布。泊松分布符合二项分布前提条件,是在二项分布基础上的一种特殊分布。
一、二项分布
二项分布适合的类型:二项分布适用伯努利概型,即随机事件A只有两种结果,要么发生,要么不发生。如果我们假设事件A发生的概率为p,那么不发生的概率就是1-p。生活中比较典型的例子,比如投篮球、扔一枚硬币、彩票中奖、射击目标等,这些例子都是比较典型的伯努利概型。比如射击,对于一个人来说,在某段时间内射击水平稳定,每射击一次,命中的概率为p,未命中的概率就是1-p。又比如一个人在某段时间内投篮球命中率也是固定的,假设命中率是百分之六十,那么未命中的概率就是百分之四十。下面我们给出伯努利概率的具体定义。
n重伯努利试验:独立重复进行n次伯努利试验,这一独立重复试验序列为n重伯努利试验。
伯努利定理:假设独立重复进行n次试验,在一次试验中,事件A发生的概率为p,在n重伯努利试验中,事件A发生K次概率为
下面介绍伯努利概型前提下的几种分布。两点分布:当随机变量X取值只有两个,假设为对应的概率为其中,如果则随机变量X服从参数为p的两点分布,记为用式子表示为则依此公式可列出随机变量X的分布,也可以用表格,表格更加简单明了,学生更容易理解运用。有一种特殊情况,如果这时,随机变量X的分布称为0-1分布,容易看出,0-1分布是二项分布的一种特殊情况,它符合二项分布的所有特征,包括前提条件等。现实生活中,比如投篮球、射击等,就是非常典型的两点分布,也是0-1分布。比如射击,我们可以把命中记为未命中记为如果命中概率为百分之七十,那么未命中概率就是百分之三十,如果看作0-1分布的话,令即可。下面我们来介绍二项分布,此试验独立重复进行n次,假设事件A发生的概率为p,记随机变量X为n次独立重复试验中事件A发生的次数,当随机变量X所有可能取值为0、1….n,则随机变量X的分布用式子可以表示为:若随机变量X分布列为此形式,则称随机变量X服从参数为np的二项分布,记为当然,也可用表格形式表示。此分布称为二项分布,因其表达式和中学里的二项式定理展开式非常类似,因此叫作二项分布。当二项分布中随机变量X取值只有两个时,二项分布即为两点分布。由此我们可得:两点分布是二项分布的特例,而0-1分布又是两点分布的特例。
二、泊松分布
二项分布中当n非常大,但是同时事件A发生的概率p又非常小时,此时用二项分布中求概率公式已经很难求出其值,例如,因为n很大,p很小时,导致展开式非常难计算,有时候必须借助计算机才可以计算最终结果,这时候我们引入泊松分布,泊松分布在离散型分布中具有非常重要的意义,例如在一个医院中,每个病人来看病都是随机并独立的概率,则该医院一天(或者其他特定时间段,如一小时、一周等等)接纳的病人总数可以看作是一个服从poisson分布的随机变量。但是为什么可以这样处理呢?最好的解释方法是从poisson的两种不同定义上着手。Poisson分布的第一个定义泊松分布:假设随机变量X的分布为:,其中则称随机变量X服从参数为 的泊松分布,记为这个定义就是我们平时考试或者理论工作时用的poisson随机变量的定义。
泊松定理:在n重伯努利试验中,事件A在一次试验中发生的概率为p,我们取则对任意确定非负整数k,有注意Poisson还有一个知名度比较小的第二个定义,或者说是Poisson Process定义:假定一个事件在一段时间内随机发生,且符合以下条件:(1)将该时间段无限分隔成若干个小的时间段,在这个接近于零的小时间段里,该事件发生一次的概率与这个极小时间段的长度成正比。 (2)在每一个极小时间段内,该事件发生两次及以上的概率恒等于零。(3)该事件在不同的小时间段里,发生与否相互独立。 则该事件称为poisson process。这个第二定义就更加利于大家理解了,回到医院的例子之中,如果我们把一天分成24个小时,或者24×60分钟,或者24×3600秒。时间分得越短,这个时间段里来病人的概率就越小(比如医院在正午12点到正午12点又一毫秒之间来病人的概率是不是很接近于零?)。条件一符合,如果我们把时间分得很细很细,条件二也符合。条件三的要求比较苛刻,应用到实际例子中就是说病人们来医院的概率必须是相互独立的,如果不是,则不能看作是poisson分布。问题是为什么现实生活中的情况(如医院例子)会服从poisson分布的第一定义?现在有了第二定义作为桥梁,应该就很容易理解了。现实生活中的例子中如果事件相互独立,那么它就是符合poisson分布的第二定义的。而从poisson第二定义到poisson第一定义之间是有严格的数学证明的。因为泊松分布在实际生活应用中有广泛的现实背景和意义,比较典型的例子有在某一个红绿灯路口发生交通事故的件数、一个纱线厂纱线在某一段时间内出现的断头数、某县年龄在100岁以上居民人口数、火山在某时间段内喷发次数等等,这些例子都有一个共同特征,那就是这些事件都是稀有事件,发生次数服从或者近似服从泊松分布。所谓稀有事件,即为每次试验中事件发生的概率非常小,如洪水、火山喷发、地震、工厂出现次品乃至银行印钞机印出错钞都属于此事件,这种情况一般都是n很大,p很小,这时候虽然试验都符合伯努利概型,也可以用二项分布概率公式求出,但是出现一个很难解决的问题:大部分概率利用此公式计算起来都非常困难,这时候二项分布可以近似为泊松分布,利用泊松分布概率分布表,即可求出概率。
接下来我们看一个例子:设某保险公司的某人寿险种有2000人投保,每个人在一年内死亡的概率为0.002,且每个人在一年内是否死亡相互独立,试求在未来一年这2000人中死亡人数不超过8人的概率。此问题属于伯努利概型,符合二项分布,且从题中可以看出,n=2000,p=0.002,我们先用二项分布解决这个问题:如果利用二项分布公式计算,需要计算8个式子,况且每一个式子都需要计算机才能计算出结果,但同时我们发现此案例中,n很大,p很小,np=4,符合泊松分布,因此我们转换思路,利用泊松分布计算。我们假设2000个投保人在一年内死亡人数为X,则2000个投保人在一年内死亡人数不超过8人的概率为:由此可得2000个投保人在一年内死亡人数不超过8人概率为0.9781,非常接近百分之百,由此结果我们可以看出,虽然投保人达到2000人,但是因为概率非常小,最后得到一年内死亡人数不超过8人几乎是绝对的,由此保险公司可制定出适宜的政策,从而获得最大收益。
本文主要讲了泊松分布的几点重要的说明。首先介绍0-1分布和两点分布,给出了具体形式和适用前提条件,然后引出二项分布,通过分析我们得出0-1分布是两点分布的特例,两点分布是二项分布的特例,进而我们又通过二项分布引出泊松分布,给出了泊松分布的背景和研究意义,又得出二项分布可视为泊松分布的条件,并且给出在此条件下为何二项分布可视为泊松分布。同时我们又给出读者典型案例,说明泊松分布在计算中的重要性,最后给出本文小结。
[1]盛骤 谢式千等.概率论与数理统计[M].北京:高等教育出版社,2008:P71.
[2]陈希孺.概率论与数理统计[M].北京:中国科学技术出版社,2017:P68.
[3]谢寿才.概率论与数理统计[M].北京:中国人民大学出版社,2014:P89.
[4]程依明等.概率论与数理统计教程[M].北京:高等教育出版社,2008:P56.
[5]张帼奋.概率论数理统计与随机过程[M].浙江:浙江大学出版社,2005:P120.