APP下载

正态分布的应用研究

2022-05-15张璇

民族文汇 2022年15期
关键词:正态分布概率性质

张璇

摘 要:在实践中,我们可以找到大量的满足正态分布的例子。由于正态分布的应用价值及理论重要性,正态分布得到广泛的研究。由于一些学生基础不扎实或课程设置的因素等,不少学生对正态分布的理解存在偏差。本文回顾了正态分布的起源及相关定义,阐述了其重要特性并给出了大量的应用例子,包括在现实生活的应用,例如在质量管理的应用。本文的研究成果有助于帮助学生更好的理解正态分布的起源、定义、性质及其在具体问题中的灵活应用。

關键词:正态分布;性质;应用;概率

1.正态分布的来源及概念

1.1正态分布的来源

正态分布,也称高斯分布,是由著名的数学家Moivre首先提出并且被众所周知的大数学家高斯首次在天文学研究中使用的。高斯在天文学中使用正态分布的结果催生了曲线拟合中闻名的最小二乘法。由于高斯在正态分布发展史上的重要贡献,直到今天,德国的10马克纸币上仍然印着正态分布的概率密度曲线还有高斯的头像。在一开始的时候,该研究成果并没有受到广泛关注。直到小样理论的出现。具体而言,拉普拉斯注意到了高斯关于正态分布的理论成果,开始思考其与拉普拉斯提出的中心极限定理的联系,并猜想该定理应该存在满足正态分布的元素。该猜想后来被海根证实并导致了元误差学说的诞生。

1.2正态分布的概念

1.2.1正态分布的定义

定义1:设连续型随机变量的密度函数 (也叫概率密度函数)

式中x是自变量,表示随机抽样的样本的值,f(x)是概率密度函数的函数值。该概率密度函数中包含两个参数。其中,参数 μ表示样本数据的平均值,参数σ表示样本数据的标准差。给定两个参数的值,则式子(1.1)所示的函数的曲线可以直接绘制出来。

定义2:在 (1.1) 式中,假如两个参数满足μ=0,σ=1, 那么该概率密度函数对应的分布就是标准正态分布。将两个参数的值代入式子(1.1)中,则概率密度函数可以化简为如下函数:

1.2.2参数µ和σ的意义

从前面的结果我们知道,正态分布的概率密度函数存在两个参数,分别是和,并且从图1中我们知道,对于不同的参数值,正态分布的概率密度函数绘制出来的曲线是不一样的。换言之,对于给定的一组参数值,我们可以得到对应的概率密度函数的曲线图。因此,这里有必要探讨下这两个参数对正态分布的概率密度函数的曲线的形状和位置的影响。研究表明,参数决定了正态分布的概率密度函数曲线的对称轴的位置,因此,我们称它是正态分布概率密度函数的位置参数。该参数的值直接决定了正态分布概率密度曲线的对称轴对应的轴的取值。当参数固定的情况下,如果改变参数,我们可以发现正态分布的概率密度函数的曲线的形状不改变,呈现一种平移的效果。具体可见图2。相比之下,参数则决定了正态分布的概率密度函数的曲线的形状。具体而言,当位置参数的取值不变的情况下,如果减小参数的值,那么正态分布的概率密度函数的曲线会变得更加陡峭或者说高瘦;反之,如果保持位置参数的取值不变,增大参数的值,那么正态分布的概率密度函数的曲线会变得更加平缓,或者说矮胖。

实际上,对正态分布的概率密度函数的两个参数可以从多个角度进行分析。具体而言,如果从其几何意义来看,参数对应的是正态分布的概率密度函数的曲线的极大值所对应的横坐标的值而参数则是正态分布的概率密度函数的曲线的拐点对应的横坐标上的点距离该曲线的对称轴的大小。换言之,参数是正态分布的概率密度函数的函数的凸曲线与凹曲线接连的处的横坐标值。就该两个参数的物理含义而言,参数表示正态分布的概率密度函数的曲线和轴所包围起来的平面图形的重心所对应的横坐标值。就该两个参数的数理统计意义而言,参数对应的是样本的均值,而参数则对应的是样本数据的标准偏差。就该两个参数的计量学意义而言,参数表示被测量的物理量的真值,而参数则表示测量值的分散程度的高低。具体而言,如果增大,那么我们得到的观测值出现在附近的可能性就减小,导致观测得到的值的分散程度增大吗,进而使得测量精度降低;反之,如果参数较小,那么我们得到的观测值出现在附近的可能性就会增大,导致观测值的分散程度减弱,也就是更加地集中,进而提高我们的测量精度。综上所述,正态分布的概率密度函数中,参数体现了观测所得到的值的集中趋势,而参数则体现了观测所得到的值的分散程度。显而易见的是,减小可以导致得到的观测效果更好[1].

2.正态分布的性质

2.1如果X ~N (μ, σ2) 且a与b是实数,那么aX+b ~N (aμ+b,(aσ2)) 。

2.2给定统计独立的正态随机变量X ~ N (μX,σX2) 与Y ~N (μY,σY2 ),我们有如下结论:

(1)它们的和也满足正态分布U =X+Y~N (μX+μY,σY2+ σY2 )。

(2)它们的差也满足正态分布U =X-Y~N (μX-μY,σY2+ σY2 )。

(3)随机变量U 和随机变量V 相互独立的。

2.3给定独立标准正态随机变量X 1, , , X n。则X12+X22+, , ,+Xn2满足卡方分布且其自由度n。正态分布存在一个很好的特性,该特性被称为中心极限定理。具体而言,当某些要求得到满足时,许多相互统计独立的随机变量的和形成的分布趋向于满足正态分布。该定理的有趣的地方,基于其给出的结论,我们可以用正态分布去逼近其他的分布,从而利用正态分布的性质是简化问题的求解。

参考文献

[1]Efficient processing of k nearest neighbor joins using MapReduce. Wei Lu,YanyanShen,SuChen,Beng Chin Ooi. Proceedings of the VLDB Endowment . 2012

[2]刘宗鹤等译.概率与统计入门.北京:农业出版社,1986

[3] 周富臣等.机械制造计量检测技术手册[J].北京:机槭工业出版社. 2000.10

猜你喜欢

正态分布概率性质
弱CM环的性质
彰显平移性质
概率与统计(1)
概率与统计(2)
生活常态模式
双曲线的一个性质与应用
概率与统计解答题集锦
二项分布及其应用、正态分布
高考正态分布问题例析
圆锥曲线“准点”的又几个性质