APP下载

用经验模型评估环境样品测量不确定度

2012-01-11李玉武狄一安孙海容曹实任立军周昊郭婧杨勇杰王斗文

中国无机分析化学 2012年1期
关键词:定值精密度经验

李玉武 狄一安 孙海容 曹实 任立军 周昊郭婧 杨勇杰 王斗文

(1国家环境分析测试中心,北京 100029;2中国合格评定国家认可中心,北京 100062;3辽宁出入境检验检疫局,辽宁大连 116001)

用经验模型评估环境样品测量不确定度

李玉武1狄一安1孙海容2曹实2任立军1周昊1郭婧1杨勇杰1王斗文3

(1国家环境分析测试中心,北京 100029;2中国合格评定国家认可中心,北京 100062;3辽宁出入境检验检疫局,辽宁大连 116001)

利用水样、土壤和沉积物标准样品定值数据,建立了评估环境样品测量结果不确定度的经验模型。讨论了判断模型质量的指标。用建立的经验模型估算了实际标样和能力验证数据不确定度,并与实测结果进行了比较。探讨了利用本模型计算的相对标准偏差允许限用于实验室内部质量管理与控制的可行性。经验模型能帮助客户判断送检样品检测结果在临界值时能否满足相关要求。

不确定度评估;经验模型;Horwitz函数;标样协作定值

1 引言

近年来,在中国合格评定国家认可委员会的大力推动下,测量结果不确定度评估越来越受到各级检测实验室的重视。认可委要求已获认可的检测实验室应有能力对每一项有数值要求的测量结果进行测量不确定度评定。如果客户有要求,检测报告必须提供测量结果的不确定度。实验室目前大多使用GUM法[1-2]。GUM法注重各种不确定度分量的识别与计算,评估过程繁琐,评估过程未考虑实验室内质控数据或实验室间精密度数据。考虑到人力物力等因素,实验室很难对不同测试项目、不同浓度的检测结果提供测量不确定度。

除了经典的GUM方法外,近年来还有一些方法在欧洲和美国实验室得到广泛应用。我国也有相关标准推出,如精密度法[3]、控制图法[4]、经验模型法[5]、线性拟合法[6]和蒙特卡洛法[7]。这些方法均是在满足特定条件下,对标准JJF1059.1的简化和延伸应用。其中基于Horwitz函数的经验模型法由于具有操作简便的特点,受到基层实验室关注。但文献中的应用示例均为钢铁、金属和矿产、食品卫生等行业检测数据,基于环境样品测试数据的经验模型研究未见报导。

利用我国环境保护和地质资源行业长期积累的水样、土壤和沉积物标准样品定值数据,建立了评估环境样品测量结果不确定度的经验模型。讨论了判断模型质量的指标。用建立的经验模型估算了实际标准样品和能力验证数据不确定度,并与实测结果进行了比较。探讨了利用本模型计算的相对偏差允许限用于实验室内部质量管理与控制的可行性。

2 经验模型法[5]

基于Horwitz函数式的经验模型法又称目标不确定度法。Horwitz函数描述了分析浓度c与分析精密度(复现性标准偏差Sr或相对标准偏差Srsd)之间的关系,由美国Dr.Horwitz[8]于二十世纪八十年代提出。此函数是经验拟合模型最为经典和简洁的数学式,它有三种表达式[9],S=0.02c0.85(其中S、c均为质量浓度);Srsd=2c-0.15和Srsd=21-0.5logc(Srsd单位为%)。20世纪20年代到90年代几万次数据的验证都证明了其正确性[10]。据作者发表的实验数据分析结果和结论来看,此函数表达式中分析结果精密度只与分析浓度有关而与样品类型、基体、检测项目、分析方法无关。虽然该函数描述的是实验室间精密度与分析浓度的关系,但也常用来监控实验室内精密度。

在确保测量系统受控前提下,通过长期大量能力验证实验数据积累建立的经验模型,已用于同领域样品测量结果不确定度评定[11-13]。

ISO TC17(钢铁化学分析)专业委员会和ASTME01(金属、矿产及相关材料化学分析)专业委员会根据多次能力验证的数据(钢铁、金属和矿产等相关领域)对经验模型法进行了验证[14-16]。TC17组织的实验室间比对采用了45个国家和国际标准,通过6种方法(重量法、分光光度法、原子吸收光谱法、滴定法、电位法、高频红外碳硫法),对钢铁中的21种元素进行了测定[17]。ASTME01利用2年多的时间实施了碳素钢、低合金钢和不锈钢等的实验室间比对,被测元素有碳、锰、磷、硫、硅、铜、镍、铬、钼、铝和锡等,涉及原子发射光谱法、原子吸收光谱法、X-射线荧光光谱法、电感耦合等离子体质谱法(ICP-MS)法。结合上述获得的数据,随后E01又组织了120多个实验室的碳素钢和低合金钢的比对、以及40多个实验室的不锈钢材料检测结果的比对。两个组织得到的经验模型见表1。

表1 根据能力验证活动数据建立的经验函数式*Table 1 The empirical models established based on experimental data from inter-laboratory proficiency tests

图1给出了ASTME01实验室间比对的稳健统计对数作图(图中实心矩形点为离群值)。根据文献[5]建议,实验室可参考Horwitz函数表达式给出自己的经验模型,并通过F检验,判定经验模型是否有效。

图1 经验模型法示意图[5](引自ASTME01实验室间比对测量数据)Figure 1.Schematic diagram of the empirical model based on experimental data from collaborative studies between laboratories.

3 实验数据

水质样品数据有2个系列。系列1取自环保部标准样品所标样协作定值网2006~2011年期间每年1次组织的标样协作定值结果通知单(167个数据)。系列2来自环境保护部标准样品研究所网站(http://www.ierm.com.cn/)提供的2009~2011年能力验证结果报告(88个数据)。

土壤标准物质有2个系列。系列1有8个样品(470个数据);系列2有4个样品(88个数据)。水系沉积物标准物质有2个系列。系列1有12个样品(650个数据),系列2有3个样品(159个数据)。除了土壤系列2取自中国环境监测总站标准物质证书(土壤成分分析标准物质,1986年定值,2003年修订),其他数据均取自中国地质科学研究院地球物理地球化学勘查研究所(河北廊坊)标准物质证书(土壤成分分析标准物质,1986年定值,2003年修订)。系列1用于建立模型,系列2用于检验模型。

上述标样各系列样品编号、测试项目名称及分析方法见表2。系列1用于建立模型,系列2用于检验模型。

实际环境样品数据中,土壤(矿石)数据来自中科院地质与地球物理研究所网站(http://www.igg.cas.cn/)微量元素分析室提供的国际比对实验数据。氨氮测试数据是作者所在实验室2010~2011年期间积累的各种工业废水(如化肥、造纸、煤化、城市污水、制药、化工、食品工业、焦化、石化等)中氨氮检测报告。测定方法采用纳氏试剂分光光度法。应客户要求,检测过程均采用两次平行测定。

表2 实验数据一览表Table 2 Summary of experimental data used in this paper

4 结果与讨论

4.1 问题的提出与分析

各种标准或指南中不确定度的评估方法大致可分为两类:“自下而上”和“自上而下”。GUM是基于计量学“自下而上”的计算方法:分析、计算分析步骤中每一操作涉及的不确定度分量,计算合成标准不确定度,然后乘以包含因子得到扩展不确定度(置信区间为95%)。GUM方法可完全覆盖物理测量,但没有对与化学和生物测量相关的特殊问题作出特定的规定。例如关于样品前处理步骤,虽然对分析程序中的单一步骤(称量、溶液移取等)、标准溶液浓度的计算、校准曲线拟合不确定度的评定,GUM也给予一般原则和指导,但GUM方法应用于较为复杂的化学测量时仍有一定局限性[18]。研究结果表明,化学分析中不确定度的主要分量大多为校准曲线和样品重复测定。但这种重复性测定一般均是当天或短时间内完成,未能反映实验室长期质控状态,也不涉及实验室间的分析精密度(如同一项目能力验证数据及标样协作定值)。

“自上而下”的方法使用从方法确认、实验室内质控和/或实验室间协作定值、能力验证等研究数据[3-6]。由于使用了长期积累的质控数据,评估过程全面反映不确定度的潜在来源的机率会更大。在评定化学测量结果的不确定度时,“自上而下”的方法比GUM法更为实用。但能力验证和协作定值数据的积累或获取不是件容易的事情,普通基层实验室很难做到。充分利用各种标准样品定值结果,建立适合自己实验室的经验模型将是评估测量结果不确定度的一条有效途径。

4.2 水样、土壤、沉积物经验模型的建立与检验

不确定度的一个重要应用体现在各种标准样品定值结果的表达。协作定值结果通知单或标样说明书上的定值结果一般表示为:标准值±不确定度。这里的不确定度是扩展不确定度。利用Excel电子表格数据趋势线或分析工具提供的计算功能,将分析含量(浓度)和扩展不确定度作图,用幂函数y=a×cb进行拟合(或将分析含量和扩展不确定度分别取对数后进行线性拟合,lgy=lga+blgc)。图2(a)~2(d)分别显示了基于水质、土壤和沉积物标样微量元素和常量元素保证值与不确定度的函数关系。模型拟合参数参见图2和表3。

图2 基于环境标准样品定值数据建立的经验模型Figure 2.The empirical model based on the certified values of the environmental standard.

表3 环境样品经验模型参数、拟合质量指标一览表Table 3 Summary of empirical model parameters and its fitting quality index based on environmental samples

从图2(a)~图2(d)可以看出,水质、土壤和沉积物标样协作定值及保证值数据中,浓度与不确定度之间关系基本符合Horwitz函数特征,浓度和不确定度取对数后,存在明显的线性关系,均通过了相关系数和F检验。但其参数与原函数y=0.0384c0.58(在图中用折线表示)的两个参数明显不同。土壤与沉积物模型参数比较接近,但两者与水样模型差别较大,这可能与分析物检测结果单位有关。土壤、沉积物分析物浓度是质量分数,而水标样浓度单位是mg/L。为便于比较,将Horwitz函数S=0.02c0.85(此处S和c单位为质量分数),进行转化,将S和c单位变为μg/g,S=(0.02 ×(c/1000000)0.8495)×1000000;经整理为:S=0.020× 100.903c0.850=0.160c0.850。将土壤和沉积物中微量元素经验模型(参见图2(b),2(c))系数a除以2,从扩展不确定度转为S的表达式,S=0.0670c0.863和S=0.0715c0.851。与S=0.160c0.850相比,土壤与沉积物中微量元素经验模型系数b与Horwitz函数比较接近,但系数α仍有明显区别。这表明,标准物质的协作定值SR明显低于基于能力验证数据的SR。

图2结果表明,Horwitz函数描述的分析物浓度与测量不确定度(或精密度)的关系在环境领域也存在,但在应用时,应根据本领域的实验数据进行拟合,确定模型参数。

表3列出了4个经验模型的拟合质量指标和拟合参数区间(95%上下限)。相关系数越接近1,标准误差越小,表明模型拟合质量越高。参数区间越窄,表明模型计算值不确定性越小。由拟合参数区间可知建立的经验模型用于预测时仍存在一定的不确定性。蒙特卡罗模拟法可以定量计算其不确定度。进一步的研究仍在进行中。

4.3 经验模型计算结果的检验与判断

经验模型计算结果检验可采用F方差和H比值检验法。其意义在于帮助判断计算值与实验值在数理统计上有无显著性差别。分别将扩展不确定度实验值和计算值分别除以2转化为复现性标准偏差,H=SR实验/SR计算;F=SR2实验/SR2计算。H比值越接近于1,表明实验值与计算值越接近,结果越理想。

用建立的经验模型预测了水常规项目、土壤和沉积物微量元素测量结果不确定度。系列1数据参与建立模型,系列2是未参与建立模型,专门用于检验模型的数据。图3显示了水、土壤和沉积物7个系列数据稳健标准偏差计算值与实验值F比值和H比值统计分类数据,数据按两种标准分类,一类是F比值<0.33、0.33~3.0、>3.0;另一类是基于H=0.5~2.0的判断标准(见4.4节),H比值<0.50、0.5~2.0、>2.0。

图3 经验模型计算结果F比值(a)和H比值(b)检验Figure 3.(a)Fratio and(b)Hratio test for measurement uncertainty estimated by the empirical model.

从图3(a)可以看出,7个系列数据中F比值为0.33~3.0的比例为69.2%~88.0%,平均值为82.5%。除了土壤系列2符合要求的比例偏低外,其他系列数据无明显差别。如果按照H比值要求0.5~ 2.0,其比例为86.4%~94.0%,平均值为91.6%,参见图3(b)。此结果表明,7个系列数据中大多数测试数据的扩展不确定度计算值与实验值在统计意义上没有显著性区别。

表4列出了3个沉积物样品测量不确定度的预测值与实验值及F值。从表中数据可以看出,大多数预测值与实验值基本符合。同时注意到,部分元素不确定度计算值与实验值仍有较大差别。这提示应用经验模型法时,应考虑客户对检测结果不确定度的误差要求。收集、积累更多的同一检测项目、同一分析方法、不同浓度水平样品检测能力验证数据用于建立经验模型,将会有效改善经验模型法计算精度。

表4 经验模型法评估沉积物样品测量不确定度示例Table 4 Application example for evaluation of measurement uncertainty of sediment samples by empirical model μg/g

续表4

4.4 经验模型用于考察能力验证数据和分析方法标准验证协作研究数据

Horwitz函数的另一个应用是用于考察、判断能力验证或协作研究数据和分析方法标准验证实验数据的合理性[9]。其方法是将参加能力验证测试或参加协作研究的各实验室上报数据的统计值稳健标准偏差(SR实验)与经验模型计算值(SR计算)的比值(H=SR实验/SR计算)来判断数据的合理性。研究结论表明[9],当H值小于0.5时,能力验证数据的复现性标准偏差SR过于乐观,其实验条件和统计结论需重新审查;如H值大于2.0,统计值SR值得怀疑,数据精度比预期要差。基于此观点和方法,考察了环境保护部标准样品研究所能力验证数据(参见图4)。

从图4可以看出,水质多项指标检测能力验证数据基本分布在经验模型计算值附近,大部分数据点落在H=0.5和H=2.0两条直线所包含的区间。其中有3个点H值大于2.0。其测试项目分别为CODCr(20.1mg/L),高锰酸盐指数(2.59和3.29mg/L),这可能与用滴定法测定低浓度COD,方法本身精密度较差有关。

如果将此系列数据进行拟合,其模型参数分别为0.0570和0.950,与(水质)经验模型参数0.0567和0.951基本一致。

4.5 经验模型用于实验室内部质控

经验模型除了用于评估样品测定结果不确定度外,更多的应用在于检测结果符合性判断和计算精密度限值(目标不确定度)。由于多家实验室、多水平样品检测结果协作研究需要花费大量人力、物力和财力,不易实现。各种分析方法验证实验及合格的精密度数据都是需要下大力气才能完成的工作。因此,利用经验模型计算实验室间精密度用于符合性判断监控实验室内精密度将具有广泛应用前景。

图4 经验模型用于考察能力验证数据Figure 4.Inspecting proficiency test data by the empirical model.

表5比较了经验模型法(土壤)用于能力验证结果的判断示例。表中Z值按下式计算:

一般认为,<2,为满意;2<<3,为可疑值,>3为离群值。从表5中可以看出,两种方法计算的Z值基本相符。经验模型的优点在于,如果没有同批次大量协作实验室数据,经验模型法也能用来判断考核样品是否满足要求。

图5显示的是各种工业废水中氨氮测定精密度数据内部监控图。基于平行测定数据按下式计算相对标准偏差(图中简称为实验数据):

表5 经验模型用于检测结果符合性判断示例Table 5 Application example of empirical model in compliance assessment of test result μg/g

图中有三条控制线:最大允许限(由水标样定值数据拟合的经验模型计算得到);内部控制限(由最大允许限除以);Horwitz函数。三条线均显示随着分析物浓度减小,检测结果的相对标准偏差增大。经典Horwitz函数(Srsd=2c-0.15)描述的趋势更明显。超出限值要求的数据应及时查找原因,重新测定。通过调整系数的方法可确定符合实验室内部控制要求的控制线,经验模型法提供了一条有效途径,同时也需要实验室长期的工作积累。

图5 工业废水中氨氮检测结果质量内部控制图Figure 5.The quality control chart for the test results of NH3-Nin industry waste water.

5 结论

经水样、土壤、沉积物标准样品定值数据和能力验证数据验证,描述分析物浓度与实验室间精密度之间函数关系的经验模型,可用于评估或核对环境样品测量结果不确定度。利用F方差和H比值可检验、判断模型计算结果的合理性。没有同批次大量协作实验室数据,经验模型法可以用来判断考核样品是否满足要求。通过调整系数的方法可确定符合实验室内部控制要求的控制线,经验模型法是一条有效途径。收集、积累更多的同一检测项目、同一分析方法、不同浓度水平的样品检测能力验证和协作定值数据,将会有效改善经验模型法计算精度。

[1]中国实验室国家认可委员会.化学分析中不确定度的评估指南[M].北京:中国计量出版社,2002.

[2]国家质量监督检验检疫总局计量司.JJF1059.1—1999测量不确定度评定与表示[S].北京:中国标准出版社,1999.

[3]辽宁出入境检验检疫局,中国标准化研究院,等.GB/Z 22553—2010利用重复性、再现性和正确度的估计值评估测量不确定度的指南[S].北京:中国标准出版社,2010.

[4]辽宁出入境检验检疫局,中国合格评定国家认可中心,等.GB/T 27407—2010实验室质量控制-利用统计质量保证和控制图技术评价分析测量系统的性能[S].北京:中国标准出版社,2010.

[5]辽宁出入境检验检疫局,中国合格评定国家认可中心,中国计量科学研究院.GB/T 27***—201*检测实验室中常用不确定度评定方法与表示[S].标准报批稿.

[6]辽宁出入境检验检疫局,中国合格评定国家认可中心,等.GB/T 22554—2010基于标准样品的线性校准[S].北京:中国标准出版社,2010.

[7]国家质量监督检验检疫总局计量司.JJF1059.2—2011用蒙特卡洛法评定测量不确定度[S].北京:中国标准出版社,2011.

[8]Horwitz W.Evaluation of analytical methods used for regulation of foods and drugs[J].Anal.Chem.,1982,54:67A-76A.

[9]DesiréLMassart,Johanna Smeyers-Verbeke,Yvan Vander Heyden.Benchmarking for Analytical Methods:The Horwitz Curve[J].LCGC EUROPE,2005,18(10):(http://chromatographyonline.findanalytichem.com/lcgc/author/authorInfo.jsp?id=21467)

[10]Boyer K W,Horwitz W,Albert R.Interlaboratory Variability in Trace Element Analysis[J].Anal.Chem.,1985,57:454-459.

[11]Horwitz W,Kamps LR,Boyer I W.Quality Assurance in the Analysis of Foods for Trace Constituents[J].J.Assoc.Off.Anal.Chem.,1980,63:1344-1354.

[12]Margosis M,Horwitz W,Albert R.Performance characteristics of methods of analysis used for regulatory purposes.I.Drug dosage forms.F.Gravimetric and titrimetric methods[J].J.Assoc.Off.Anal.Chem.,1988,71:619-635.

[13]Horwitz W,Britton P,Chitrel S J.A Simple Method for Evaluating Data from an Interlaboratory Study[J].J.Assoc.Off.Anal.Chem.,1998,81:1257-1265.

[14]ASTME2093:2005.Standard Guide for Optimizing,Controlling and Reporting Test Method Uncertainties from Multiple Workstations in the Same Laboratory Organization[S].ASTMInternational,United States.

[15]ASTMD6689:2006.Standard Guide for Optimizing,Controlling and Reporting Test Method Uncertainties from Multiple Workstations in the Same Laboratory Organization[S].ASTMInternational,United States.

[16]ASTME2437:2005.Standard Practice for Designing and Validating Performance-Based Test Method for the Analysis of Metals,Ores,and Related Materials[S].ASTMInternational,United States.

[17]Hobson,J D.ISO Document N938,A Survey of the Precision of Standard Methods for Analysis of Steel and Iron,based on ISO,ECISS/ENand BSI Statistics,revised 1992-06-01.

[18]National Association of Testing Authorities,Australia(NATA),Technical Note 33,December 2009,Guidelines for estimating and reporting measurement uncertainty of chemical test results.

Evaluation of Measurement Uncertainty for Environmental Sample by Empirical Model

LI Yuwu1,DI Yian1,SUNHairong2,CAO Shi2,RENLijun1,ZHOU Hao1,GUO Jing1,YANG Yongjie1,WANG Douwen3
(1.NationalResearchCenterforEnvironmentalAnalysisandMeasurements,Beijing,100029,China;2.ChinaNationalAccreditationServiceforConformityAssessment,Beijing,100062,China;3.LiaoningImport/ExportInspectionandQuarantineBureau,Dalian,Liaoning116001,China)

An empirical model for evaluating measurement uncertainty for environmental sample is established based on certified values of standard samples including water,soil and sediment.The criteria for evaluating the quality of the model is discussed.The empirical model was used to evaluate measurement uncertainty for the standard samples and for the proficiency test data.Furthermore,the results were compared with the experimental data.The feasibility of applications of permitted relative deviation limit calculated based on the empirical model in laboratory internal quality management and control is explored.The empirical model can be used to help client determine whether the analysis results obtained in the critical condition meet certain requirement.

evaluation of measurement uncertainty;empirical model;Horwitz function;interlaboratory study on standard sample

O242;X132

A

2095-1035(2012)01-0001-08

10.3969/j.issn.2095-1035.2012.01.0001

2011-10-31

2011-11-29

国家重大科学仪器设备开发专项(2011YQ14014708);中国合格评定认可委员会科技项目(2011CNAS11);国家自然科学基金青年科学基金项目(41105089)。

李玉武,男,研究员,主要研究方向是大气颗粒物化学组分分析表征、来源解析及测量结果不确定度评估。E-mial:liyuwu@cneac.com。

猜你喜欢

定值精密度经验
副波长对免疫比浊法检测尿微量清蛋白精密度的影响
圆锥曲线的一类定值应用
“大处着眼、小处着手”解决圆锥曲线中的定值问题
2021年第20期“最值得推广的经验”评选
Phosphatidylinositol-3,4,5-trisphosphate dependent Rac exchange factor 1 is a diagnostic and prognostic biomarker for hepatocellular carcinoma
经验
2018年第20期“最值得推广的经验”评选
10kV线路保护定值修改后存在安全隐患
10kV线路保护定值修改后存在安全隐患
关于重复测量不确定度评定方法的商榷