浅析分析化学教学中平均值标准偏差的概念
2012-09-25蒲雪梅文志宁王智猛祝团飞李梦龙
蒲雪梅 文志宁 王智猛 祝团飞 李梦龙
(四川大学化学学院 四川成都 610064)
1 问题的提出
(1)
对于无限次测量,则为:
(2)
按上述陈述,又将出现了第2个问题,为什么公式中出现的是测量次数n而不是样本数m(即平均值的个数m)?
其实,出现这两个问题的根源主要是对统计学方面知识了解得不深。为了帮助大家理解平均值标准偏差的概念,我们在这里根据一些相关的统计学知识,并结合在教学和科研实践中的体会,谈谈对这两个问题的一些粗浅理解。
2 问题的解答
上面摘录的文献[1]中的陈述可以表达为:从样本总体X中抽出m个样本,每个样本平行测定的次数为n,即有:
……
需要指出的是:这里提到的“一个样本”并不是通常分析化学测量中所指的一个具体的实物试样,而是自总体中随机抽出的一组测量值,又叫子样,样本中所含个体(测量值)的数目n,称为样本容量,即样本的大小[2]。从统计学角度出发,m和n应该足够大才有意义。
关于如何得到平均值的标准偏差,文献[1]明确指出,可以通过单次测量结果的标准偏差来估计它的值(这里的“单次”指的是m=1,即只取一个样本进行n次平行测量),也就是采用式(1)或式(2)计算得到。在推导平均值的标准偏差与单次测量结果的标准偏差之间的关系前,我们先介绍一些有关随机变量方差的性质。要提请注意的是,以下的数学推导和表达都是以满足统计学要求的大量随机变量为基础的。
2.1 几个关于独立同分布随机变量的重要方差性质[3]
所谓独立同分布是指:如果一组随机变量有着相同的概率分布,并且相互之间的取值互不影响(即独立),那么这组随机变量就满足独立同分布。
假设有一总体X,其期望E(X)、方差D(X)存在,且方差D(X)=σ2,对于服从总体X的一组独立随机变量y1,y2,…,yn,(其中n可为任意的有限正整数),它们有以下的方差性质:
D(yi)=σ2
(3)
D(Cyi)=C2D(yi) (C为常数)
(4)
D(y1+y2+…+yn)=D(y1)+D(y2)+…+D(yn)=nσ2
(5)
(6)
因此有:
(7)
将式(7)代入式(6),并结合方差性质式(4)可得:
(8)
又由于xij是一组服从总体X的独立随机变量,根据方差性质式(5),可得:
(9)
当用单次测量(即对m个样本的其中一个进行n次平行测量)的标准偏差来估计平均值的标准偏差时,因为m=1 ,所以式(9)可以简化为:
上式即为式(2),故式(2)只与单次测量的次数有关。
同样地,当进行有限次测量时,有:
(1)
由此可见,式(1)和式(2)中没有出现m的原因在于:式(1)和式(2)中平均值的标准偏差是通过单次测量的标准偏差(即m=1)来估计的。
3 平均值标准偏差的分析化学意义
其实,在教学中并不需要学生掌握此公式的推导,重要的是要理解此公式在分析化学中的意义。我们认为此公式的化学意义主要体现在以下两方面:① 通过公式所表现的平均值的标准偏差随测量次数(即样本容量n)的增加而降低的趋势,可以获取这样的信息:增加测量次数可以减少随机误差,提高精密度。所以,在实际分析中,总是要平行称取几个试样组成一个样本进行平行测量。② 由于在分析实践中无法知道总体的真实值,我们希望通过少量的测量数据或者说单组测量(m=1)的几个平行数据来估计包括总体平均值在内的可靠性范围,即置信区间:
(10)
在这里,我们要避免另外一个理解误区。仍以上述测定面粉中的镉实验为例:称量1份面粉试样,溶样、定容以后,用原子吸收平行测定3次,不少学生把这里的平行测定次数3当作了样本容量n。实际上,此时对于面粉试样的总体来说,不但样本数m=1,而且样本容量n=1(只称了一个样),因此,不能用这3次测定的平均值和偏差估算总体均值的置信区间。
本文在撰写过程中,作者曾与浙江大学陈恒武教授和吉林大学苏星光教授进行过多次有益的讨论,特此致谢。
参 考 文 献
[1] 武汉大学.分析化学(上册).第5版.北京:高等教育出版社,2006
[2] 郑用熙.分析化学中的数理统计方法.北京:科学出版社,1986
[3] 盛骤,谢式千,潘承毅.概率论与数理统计.第3版.北京:高等教育出版社,2001