APP下载

利用Excel讲解参数估计中的区间估计

2014-04-04卢方芳

河南科技 2014年18期
关键词:样本容量正态置信区间

卢方芳

(湖北文理学院 数计学院,湖北 襄阳 441053)

理工科专业均开设概率与统计作为公共必修课,要求是掌握关于原理的证明还有模型的构造过程。 根据二类本科院校的实际情况, 应该进行适当的应用性教学, 而不是按照原来的要求,掌握逻辑证明过程。

在完成概率论部分及统计基本概念的教学后,就进入参数估计。在本校使用的教材中主要是点估计和区间估计两种,中间还有点估计的评判标准[1]。 点估计一般课本中介绍两种方法:矩估计和极大似然估计。 这两种方法需要进行积分、级数和求导,Excel 不能解决这类问题,所以这部分仍然需要运用高等数学的知识进行理解和解答。本文主要是利用Excel 中的函数简化区间估计的计算过程。

正态总体有两个参数,均值μ 和方差σ2。

1 正态总体均值的区间估计

总体X~N(μ,σ2),均值的估计有两种情况,(1)σ2已知,均值μ 置信度1-α 的置信区间为σ2未知,均值μ 置信度1-α 的置信区间为其中为样本均值,s 为样本标准差,n 为样本容量为标准正态分布的分位数为自由度为n-1 的T 分布的分位数。

来自正态总体的样本为x1,x2,…xn在数理统计的基本概念中关于样本均值、 样本方差的计算还有分位数的查找都已进行了说明,但是如果样本容量较大的话计算比较麻烦。 在理解原理的基础上,利用软件计算可以简化过程,减少学生学习的抵触情绪。

大部分实际情况下σ2都是未知的,主要介绍这部分。

例:设某种砖头的抗压强度X~N(μ,σ2),今随机抽取20 块砖头,测得数据(单位:kg·cm-2)如下:64,69,49,92,55,97,41,84,88,99,84,66,100,98,72,74,87,84,48,81。 求μ 置信度为的95%置信区间,α=0.05。

分析:首先需要计算样本均值x¯和样本标准差s,在Excel 中输入20 个数据,利用统计函数AVERAGE,STDEV[2]计算出x¯=76.6,s=18.14 097。 然后根据函数TINV(α,n-1)得出本题的分位数t0.025(19)=2.093 024,再就是按照区间估计的公式计算相应的结果。 利用计算公式76.6-2.093 024*18.140 97/SQRT(20),算出置信区间的下限为68.109 77, 将上面公式里的减号改成加号得到上限85.090 23, 所以μ 置信度为95%的置信区间是(68.11,85.09)。

如果是σ2已知的情况,就不用计算样本标准差,使用标准正态分布的分位数,使用的函数为NORMSINV(α/2)。 当样本容量大于46 时,T 分布近似于标准正态分布,也就是说这个时候公式里的T 分布分位数由标准正态分布的分位数代替。

2 正态总体方差σ2 的区间估计

总体X~N(μ,σ2),对于方差σ2的估计,一般理工科课本都只涉及到μ 未知的情况,已知方差σ2置信度1-α 的置信区间为其中分别是自由度为n-1 的χ2分布的分位数。

使用1 中例题的数据,计算σ2置信度为95%的置信区间,α=0.05。

分析:按照公式,需要计算样本方差,也就是样本标准差的平方,这部分已经计算得s2=329.094 7。 再就是需要χ2分布的两个分位数,利用函数CHIINV(,自 由 度),得 出(19)=32.852 33,χ20.975(19)=8.906 517。再利用计算公式得出置信区间下限190.330 5,上限702.047 8,所以σ2置信度为95%的置信区间是(190.330 5,702.047 8)。 如果是要σ 的置信区间,只需要将上限下限开方就可以。

统计学部分的公式其实比较容易理解,但是通常计算起来比较麻烦,利用软件计算,可以简化过程,省掉大量的计算时间,那么就可以在课堂上增加更多的知识点, 或者给出更为实际的例题给学生练习,提高学生的学习兴趣。 数理统计对大部分的理工科专业来说是一种工具,如果学习过于枯燥,会降低学生学习的积极性,这样也不利于后面知识的掌握。 课堂中使用Excel 教学,也可以提高学生的应用能力。 对于数学专业的学生,需要学习的内容会更多,计算量也会更大,使用软件同样可以提高学习的效率,而不会使他们觉得统计学就是不停地简单计算,一点实用性都没有。

[1]韩旭里,谢永钦.概率论与数理统计[M].复旦大学出版社,2010.

[2]李朋编.Excel 统计分析实例精讲[M].科学出版社,2006.

猜你喜欢

样本容量正态置信区间
定数截尾场合三参数pareto分布参数的最优置信区间
p-范分布中参数的置信区间
多个偏正态总体共同位置参数的Bootstrap置信区间
利用二元对数正态丰度模型预测铀资源总量
采用无核密度仪检测压实度的样本容量确定方法
列车定位中置信区间的确定方法
双幂变换下正态线性回归模型参数的假设检验
基于泛正态阻抗云的谐波发射水平估计
半参数EV模型二阶段估计的渐近正态性
广义高斯分布参数估值与样本容量关系