用统计量 t 检验使用中标准物质的量值
2018-05-09上海市计量测试技术研究院
/ 上海市计量测试技术研究院
0 引言
标准物质能够在时间和空间上传递量值,从而建立了测量的量值溯源性,同时也保证了测量的量值可比性,因此在各行各业的理化实验室有着非常广泛的应用。根据管理要求[1][2],实验室应在技术条件允许的情况下,对使用中的标准物质进行核查。
标准物质的量值是其研制机构按照规定的要求[3],通过一系列的实验和统计,经评审后确定并发布的。关于标准物质的核查,有很多讨论,但有一点毋庸置疑:使用中标准物质的量值应在可能的条件下予以充分关注。
虽然核查使用中标准物质的量值需要非常高的技术要求,但实验室可以从标准物质的具体使用条件出发,利用已有的仪器进行测试,通过统计检验,判断使用中标准物质的量值与新购标准物质的量值是否存在显著性差异。因为是两个量值之间的比较,t检验法[4][5]是最适合的,其基本步骤是:计算统计量t的绝对值,查表得相应的临界值,如果计算值小于临界值,可认为两者没有显著性差异,反之则反。
本文以溶液标准物质和直读光谱仪标准物质为例,介绍应用统计量t检验使用中标准物质量值的方法,供广大标准物质使用者参考。
1 相同目标值的 t 检验法
多数仪器分析方法都需要将溶液标准物质稀释成系列浓度的标准溶液,并利用该系列标准溶液获得工作曲线后,再进行待测样品的测试,如原子吸收分光光度法、离子色谱法等。在测试的对象、方法和仪器不改变的前提下,系列标准溶液的浓度是固定的。以原子吸收分光光度法测铜元素所需的铜标准溶液为例,详细介绍相同目标值的t检验法。
将某编号的国家二级标准物质水中铜1 000 mg/L,按实验室制订的作业指导书规定的步骤稀释至2.00 mg/L铜标准溶液,正常使用一段时间后,再次采购该编号的国家二级标准物质,同样按作业指导书规定的步骤稀释至2.00 mg/L铜标准溶液,即前后两次稀释的目标值相同。
在原子吸收分光光度计正常工作条件下,分别重复测试使用中的和新稀释的2.00 mg/L铜标准溶液的吸光度各7次,分别求出两组数据的平均值、标准偏差和方差,数据汇总见表1。
使用中的铜标准溶液 新稀释的铜标准溶液测得值(x) 0.239,0.241,0.236,0.240,0.237,0.243,0.239 2 = 0.241 3标准偏差(s) s1 = 0.002 360 s2 = 0.002 138方差(s2) s12 = 5.571×10-6 s22 = 4.571×10-6 0.244,0.241,0.238,0.242,0.242,0.243,0.239平均值( )1 = 0.239 3
t检验应用的前提是两组数据的标准偏差没有显著性差异,即两组数据是等精度的。根据F检验的计算公式得
取95%置信概率,则α= 0.05;又两组数据的测量次数均为7次,即n1=n2= 7,则f1=f2= 7 - 1 =6。查表得Fα,f1,f2=F0.05,6,6= 4.28,则F<F0.05,6,6。据此,可以认为两组数据是等精度的。下一步是求两组数据的合并标准偏差,根据公式得,
因为仅检验两个平均值是否不同,不关心孰大孰小,故为双尾检验(也叫双侧检验)。取α= 0.05,查表得tα,n1+n2-2=t0.005,12= 2.18。因为 |t| <t0.05,12,在95%置信概率下可以认为:用原子吸收分光光度计检验使用中的和新稀释的2.00 mg/L铜标准溶液,两者的量值没有显著性差异。
通常情况下,凡是由高浓度溶液标准物质稀释至特定浓度标准溶液的,都可以用上述方法检验使用中标准物质的量值与新稀释标准物质的量值是否存在显著性差异。
2 不同目标值的t检验法
有些仪器分析方法所用的标准物质是固态的、直接使用的,不能像前文所述的溶液标准物质那样稀释至任意指定的目标浓度,如直读光谱仪标准物质、红外碳硫分析仪标准物质。与多数溶液标准物质不同,这些固态标准物质在制备过程中无法精准控制其特征量值,即使是同一标准物质编号,不同批次的量值也会在一定范围内波动。以直读光谱仪测试所用的低合金钢标准物质中的锰元素为例,详细介绍不同目标值的t检验法。
某低合金钢标准物质中锰元素质量分数的标准值为1.27%,按操作规范正常使用一段时间后,再次采购低合金钢标准物质(可以是不同的标准物质编号,但两者锰元素的质量分数应尽可能接近),其锰元素质量分数的标准值为1.65%。两者锰元素质量分数的标准值存在差异,是两个不同的目标值,可以用“对子分析”[4]的方法进行t检验。
在直读光谱仪正常工作条件下,分别重复测试使用中的和新采购的低合金钢标准物质中锰元素的质量分数各10次,分别求出两组数据的标准偏差和方差,数据汇总见表2。
对两组数据进行F检验,以判断是否等精度。根据F检验的计算公式得
取95%置信概率,α= 0.05。查表得F0.05,9,9= 3.18,F<F0.05,9,9,则可以认为两组数据是等精度的,符合t检验的前提。
表2 使用中的和新采购的低合金钢标准物质中锰元素的质量分数(单位:%)
下一步,分别计算两组测试值与其标准值的差值,可得到两组示值误差,构成十对“对子”;然后计算每对对子的差值,新得到一组十个数的数据;再计算该组差值的平均值和标准偏差。上述数据已列于表2。
最后根据公式计算统计量t,得,
同样仅检验两个平均值是否不同,故为双尾检验。查表得t0.05,9= 2.26。因为|t| <t0.05,9,在95%置信概率下可以认为:用直读光谱仪检验使用中的和新采购的低合金钢标准物质中锰元素的质量分数,两组数据没有显著性差异。
“对子分析”可用于比较在不同实验条件下的实验结果,是平均数比较的一个特例。用直读光谱仪测试低合金钢标准物质中锰元素的质量分数,其实也就是用低合金钢标准物质测试直读光谱仪锰元素的示值误差。当用两种锰元素含量接近的低合金钢标准物质测试同一台直读光谱仪的示值误差时,在仪器正常的情况下,只要测试次数足够多,所得的结果不应有显著性差异。因此,用“对子分析”的方法检验使用中直读光谱仪标准物质的方法是合理的。
通常情况下,基体标准物质在研制及复制时,能够对其准确定值,但不能精准地控制其量值。对于此类标准物质,可以用“对子分析”的方法获得统计量t,以检验两组数据是否存在显著性差异。
3 结语
本文所举的两个例子中,无论是F检验还是t检验,两组数据都不存在显著性差异。两组数据是由同一台仪器测得的,在仪器和标准物质都正常的情况下,只要测试次数足够多,理论上这两组数据必然是等精度的。如果在F检验时发现两组数据的方差存在显著性差异,在排除仪器异常的前提下,可适当增加测试次数。如果增加测试次数后,两组数据仍然不是等精度的,就需要对标准物质作进一步检查,尤其是使用中的标准物质。
同样,如果经t检验发现两组数据存在显著性差异,可适当增加测试次数。如果增加测试次数后,统计量t的计算值仍大于临界值,需要对标准物质作进一步检查,重点应关注使用中的标准物质。
需要说明的是,本文介绍的方法不是用来核查标准物质量值的,只是用统计检验的方法判断使用中的标准物质与新采购的标准物质所测得的数据是否存在显著性差异。绝大多数实验室不具备核查标准物质量值的技术条件,从本文论述中也可以发现,统计量t是基于标准物质的具体使用条件获得的。在第一个例子中,用原子吸收分光光度计测试,没有显著性差异,但如果改用准确度更高的库仑分析法测试,很可能就会有显著性差异了。本着“符合使用要求即可”的原则,可以认为这种检验方法是合理的、有效的。
最后,还需要强调的是,t检验不是万无一失的。在大多数情况下,统计量t是基于一个正常运行的分析系统的统计参数的估计值,并且是在一定置信概率下的估计值。更重要的是,统计量t无法识别单次测试结果是偶然发生的粗大误差还是分析系统的短期波动。尽管如此,用统计量t检验使用中标准物质的量值,对实验室内部质量控制是非常有帮助的。
[1]全国认证认可标准化技术委员会. 检测和校准实验室能力的通用要求:GB/T 27015—2008[S]. 北京:中国标准出版社,2008.
[2]中国国家认证认可监督管理委员会. 检验检测机构资质认定评审准则[EB/OL].(2016-05-31)[2016-06-02]. http://www.cnca.gov.cn/xxgk/gwxx/2016/201606/t20160602_51597.shtml
[3]全国标准物质计量技术委员会. 标准物质定值的通用原则及统计学原理 JJF1343—2012[S]. 北京:中国质检出版社,2012.
[4]郑用熙. 分析化学中的数理统计方法[M]. 北京:科学出版社,1986.
[5]邓勃. 数理统计方法在分析测试中的应用[M]. 北京:化学工业出版社,1984.