APP下载

关于对统计推断中抽样分布的总结及判别

2019-10-20曲天尧

中国乡镇企业会计 2019年1期
关键词:正态分布数理统计方差

曲天尧

摘要:数理统计是一门以概率论为理论基础,研究随机现象统计规律性的数学学科。在经济全球化和信息化的今天,经济、管理等学科领域越来越侧重数理统计的应用,尤其是在大数据时代下,统计数据浩如烟海,数理统计的地位就更加凸显。随着社会的发展,推断统计已经取代传统的描述统计,成为现代统计的核心,而抽样分布作为统计推断的开篇内容,同时也是连结概率论与数理统计的桥梁,因此在统计推断中占据重要地位。本文主要对统计推断中常用的抽样分布及其应用作总结,并结合例题对统计量的抽样分布作出合理地判别。

关键词:简单随机抽样;正态分布;χ2分布;F分布;t分布

一、基本概念

(一)总体与个体

在数理统计中,总体就是研究对象的全体,个体即为构成总体的每个成员。对应到概率论中,总体是一个分布,总体的相关数量指标是服从这个分布的随机变量。

(二)样本

样本是对应于总体而言的。为了深入了解总体X的分布,从总体X中随机抽取的n个个体即为样本。样本具有二重性:一方面,由于样本是从总体中随机抽取的,在抽取前它们的数值是未知的,所以样本是随机变量,可以记为X1,X2,...,Xn;另一方面,样本在抽取后经观测就可以得到相应的观测值,所以样本又可以说是一组数据,用x1,x2,...,xn表示。在本文中,样本用X1,X2,...,Xn表示,而x1,x2,...,xn表示相应的样本观测值。

(三)简单随机抽样

简单随机抽样是数理统计中最常用的一种概率抽样方法。简单来讲,简单随机抽样要求在每次抽取中,所有待抽取的个体均具有相同的可能性被抽中。具体来说,简单随机抽样要求样本具有随机性和独立性。利用简单随机抽样方法所得到的样本即为简单随机样本,本文所涉及到的样本都是简单随机样本。

(四)统计量与抽样分布

假设X1,X2,...,Xn是取自总体X,容量为n的样本,若样本函数T=T(X1,X2,...,Xn)中不含有任何未知參数,那么T就是统计量。换言之,统计量就是把样本加工成函数,统计量的分布就是抽样分布。

在数理统计中,常见的统计量主要有样本均值、样本方差与标准差、样本矩、次序统计量等。本文涉及到的统计量主要是样本均值、样本方差与样本标准差,其计算公式如下:

公式

其中,X、S2、S分别表示样本均值、样本方差及样本标准差。根据无偏性的要求,本文中的样本方差指的是修正样本方差S,而并非未修正样本方差公式。

二、抽样分布的基本理论

(一)正态分布正态分布是概率论中连续型随机变量最常见的一种

分布,它也是后面三大抽样分布的理论基础。设随机变量X~N(m,s2),则其密度函数j(×)、分布函数Φ·()分别为

公式

其中,-?0。

对于一般的正态变量都可以通过一个线性变换,使其服从标准正态分布,即若设正态变量X~N(m,s2),则有

公式

下文中采用的是上侧a分位数。

在统计推断中,正态分布主要应用于推断正态总体的均值。对于单个正态总体而言,当样本容量n≥30时,或者当样本容量n<30但总体方差σ已知时可以利用正态分布。若设x1,x2,...,xn是来自总体X~N(m,s2)的样本,样本均值为X,且n330,则有

公式

对于两个正态总体而言,不妨设x1,x2,...,xn1,Y1,Y2,...,公式

的样本,样本均值分别为X和Y,并且n1,n2330,则有公式

(二)c分布

假设总体X~N(0,1),X1,X2,...,Xn是取自总体X,容量为n的样本,则统计量

公式

关于c2分布的定义,也可以这么理解:若设x1,x2,...,xn是取自总体X~N(0,1)的样本,令Y=X2,相应的样本函数为Y=X2,则

公式

独立且同分布,这样便可轻易求得c2分布的数字特征:

公式

当n很大时,根据中心极限定理可知

公式

x^分布是一种非负连续型随机变量的分布,具密度

函数的图形位于第一-象限,峰值向左偏,随着n的增大,峰值将会向右移动。x'分布的上侧a分位数定义如下

公式

其中,fx()表示x2分布的密度函数。

在统计推断中,x2分布主要应用于推断单个正态总体的方差,即若设.....。是来自总体x~N(μ,σ2)的样本,样本方差为S,则有

公式

(三)F分布

假设X~x*(m),Y~x2(n),并且X与Y相互独立,则统计量

公式

就是服从第--自由度为n,第二自由度为n2的F分布,记为F~F(n,m2)

F分布也是-.种非负连续型随机变量的分布,其密度函数含有两个参数n和n2,密度函数曲线的形状与x2分布相似。F分布的上侧a分位数定义如下

公式

其中,fr(:)表示F分布的密度函数。

在统计推断中,F分布主要应用于推断两个正态总体的方差之比,即若设Xi,y,是分别来自两个独立的总体X~N(A,σ)和Y~N(14,σ2)的样本,样本方差分别为

公式

其中,i12.2...,.2=..特别地,如果σ=σ:则有

公式

(四)分布

假设X~N(0,1),Y~x2(n),并且X与Y相互独立,则统计量

公式

就是服从自由度为n的t分布,记为t~t(n)。根据t分布的定义可得

公式

分布是-一种连续型随机变量的分布,其密度函数的图形关于直线x=0(y轴)对称,形状与标准正态分布曲线相类似。当自由度n足够大(n≥30)时,t分布就可以用标准正态分布近似代替。但对于较小的n,t分布与标准正态分布相差较大。t分布的,上侧a分位数定义如下

公式

其中,f,()表示t分布的密度函数。

与正态分布类似,在统计推断中,t分布主要应用于推断正态总体的均值。对于单个正态总体而言,当样本容量n<30且总体方差σ未知时便可运用t分布。。若设.2...X。是来自总体X~N(u,σ2的样本,样本均值为义,且n<30,则有

公式

对于两个正态总体而言,不妨设xX.,....川,.,.....是分别来自两个独立的总体X~N(n,σ})和Y~N(μ2,σ3)的样本,样本均值分别为x和Y,并且几,”2<30,如果o},o;未知但相等,即o?=σ3=σ2,则有

公式

其中,s:是σ和吃的合并估计量,且有

公式

如果o,σ3未知且不相等,即σ°≠σ3,则有

公式

此时的自由度D满足

公式

三、对抽样分布的总结

公式

通过对抽样分布经典模式的分析可以看出:正态分布是理论基础,x2分布、F分布以及t分布都是在正态分布的基础。上衍生而来,于是便有了如下的三个关系

公式

四、对抽样分布的判别

在实际中,除了要理解这几个抽样分布的经典模式之外,还要对统计量所服从的抽样分布作出合理地判别。

例1设x,X,X,x是来自总体x~N(,σ2)(σ>0)的简单随机样本,试判断统计量.X-X-所服从的分

|X;+X.-2|

布。

解:由题意可得

公式

例2設X,Xx,X,是来自总体X~N(0,σ2)(σ>0)的简单随机样本,试判断统计量2X,-X,

√2|x,|所服从的分布。

解:根据题意得

公式

例3设x..x(n≥2)是来自总体x~N(1,1)的简单随机样本,记x=-Zx,则下列结论中不正确的是()

公式

因此,本题应选B。

参考文献

[1]何志华.经济分析中概率与数理统计的应用评价[].现代营销(下旬刊),2017年01期.

[2]吴风庆,王艳明统计学[M]科学出版社,2016.

[3]茆诗松,程依明,濮晓龙.概率论与数理统计教程[M].高等教育出版社,2010.

[4]张小斐统计学[M].中国统计出版社,2013.

猜你喜欢

正态分布数理统计方差
大数据分析思维在数理统计教学中的应用
线上线下混合教学模式在概率论与数理统计课程中的应用
生活常态模式
方差生活秀
揭秘平均数和方差的变化规律
方差越小越好?
方差在“三数两差”问题中的妙用
概率统计教学中培养学生创新思维和实践能力的探索与实践
二项分布及其应用、正态分布
高考正态分布问题例析