APP下载

用稳健统计法处理方法标准验证实验中方法检出限数据

2018-01-15殷惠民任立军王婧瑞李玉武

中国环境监测 2017年6期
关键词:离群标准偏差检出限

殷惠民,任立军,闫 岩,王婧瑞,李玉武

国家环境分析测试中心,北京 100029

为配合实施环境质量标准和污染源排放限值标准,环境保护部每年都有大批环境监测方法标准立项,也有大批监测方法标准颁布执行。《环境监测 分析方法标准制修订技术导则》(HJ 168—2010)[1](以下简称技术导则)对这些标准的制修订提出了明确的技术要求。例如,标准编制说明附件《方法验证报告》应列出验证实验方案、全部原始测量数据、方法检出限、测定下限、精密度和准确度等方法性能指标计算过程及结果。可以看出,方法检出限是方法验证数据汇总时需要确认的技术指标。它直接关系到标准颁布后,相关实验室检测能力符合性判断。

文献[2] 对计算检出限的国内外代表性方法标准进行了比较和解读。目前,标准编制单位大多采用参加方法验证的各家实验室方法检出限数据中的最大值,并未按技术导则要求对各家实验室检出限数据进行合格性判断。因此,最大值很有可能是离群值。这将直接导致部分项目方法检出限偏高,也可能与标准制定者担心部分实验室过不了检测能力符合性验证及检查有关。在文献中也有识别和删去离群值后再取最大值作为方法检出限的报道[3]。笔者查阅了近期有代表性的标准编制说明和文献,收集了其中4组数据,并结合笔者制定《环境空气 颗粒物中无机元素的测定 X射线荧光光谱法》标准时组织方法验证的2组数据,对方法检出限3种计算方法:①稳健统计法;②识别并删去离群值后合并计算;③在符合要求的数据中取最大值计算结果进行了比较。提出了实验室数据与标准中方法检出限比值是否小于曼德尔k检验临界值作为实验室某项目方法检出限符合性判据。

1 计算方法

1.1 科克伦方差检验法

科克伦方差检验法[4-5]应用于所有标准偏差都是在重复性条件下,且由相同数目(n)的测试结果计算得出的情形。在实际工作中,由于数据的缺失或剔除,使测试结果个数可能会不同。假定在正常组织的实验中,每个实验室的测试结果数目不同所造成的影响是有限且可以忽略的,在科克伦检验中所用的n可取多数实验室的测试结果数。

该统计方法是对标准偏差的最大值进行评定,属于单侧检验。统计过程:首先将各家实验室检测结果标准偏差从小到大排列,然后根据公式(1)计算科克伦检验的统计量。最后,查阅科克伦检验临界值表[5],通过比较相同显著水平下的临界值来判定该最大标准偏差是否为离群值。如果标准偏差的最大值是离群值,则将该值舍去后对剩余的标准偏差重新计算科克伦检验统计量。

式中:sj为第j个实验室的标准偏差,smax是sj中最大值,L为参与检验的系列标准偏差数据个数(即参与方差检验的协作实验室个数)。

可疑值和离群值按下列规则进行判断[4]:

1)当统计量小于等于α=0.05的临界值时,认为该值是正常值。

2)当统计量大于α=0.05的临界值且小于等于α=0.01的临界值时,该值为可疑值(用*标记)。

3)当统计量大于α=0.01临界值时,认为该值是统计离群值(用** 标记)。

当平行测定次数n=7,参与检验的实验室个数L分别等于6、5、4时,对应α=0.01的临界值分别为0.487、0.553、0.641;对应α=0.05临界值分别为0.418、0.478、0.560 。

1.2 稳健统计法

稳健统计法[6]可计算一组测定结果的平均值和标准偏差(算法A),也可用于计算标准偏差(或极差)的稳健合并值(算法S)。算法S计算步骤如下:

L个数据为w1,w2,……,wL(这些数据可以是极差或标准偏差)。

w*为稳健标准偏差合并值,与每个wi相关的自由度为ν(当wj为极差时,ν=1;当wj为n次测试结果的标准偏差时,ν=n-1)。当n=7时,可查得算法所需的ξ和η值分别等于1.024 和1.332。

计算w*的初始值:w*=med[wj](j=1, 2,……,L),med表示取中位数。

按以下步骤更新w*的值,计算中间参数ψ=η×w*;对于每个wj(j=1,2,……,L),如果wj大于ψ,有w*=ψ;如果小于或等于ψ,则有w*=wj;计算新的w*:

稳健估计值w*可由迭代算法得到,即不断更新w*直到过程收敛。当稳健估计值的第三位有效数字连续2次迭代后数值不再变化时,即可认为该过程是收敛的,迭代终止。

1.3 曼德尔k检验法

考虑到标准文本上的方法检出限是以多家协作实验室数据为基础,因此可采用曼德尔k检验法对各家实验室方法检出限实验的标准偏差进行一致性检验。计算公式如下:

式中:sj为某家实验室测试结果标准偏差,sr为各家协作实验室方法检出限实验重复性标准偏差:

k临界值可以查表[4],也可以按式(5)进行计算,两者完全一致:

式中:Fα,ν1,ν2为方差检验临界值。计算示例见表1。符合性判别规则与科克伦方差检验相同。

表1 不同条件下曼德尔k检验临界值计算示例

注:F(α,ν1,ν2)可利用Excel®函数FINV(α,ν1,ν2)计算得到。

2 实验部分

3组数据来源于环境保护部官方网站标准征求意见专栏公开发表的标准编制说明附件《方法验证报告》,分别为《水质 百菌清及拟除虫菊酯类农药的测定 气相色谱-质谱法》(HJ 753—2015)[7],《土壤和沉积物 11种元素的测定 碱熔-电感耦合等离子体原子发射光谱法》(征求意见稿)[8]和《环境空气 无机元素的测定 X射线荧光光谱法》(征求意见稿)[9]。1组数据来源于沉积物标准样品中无机元素协作定值[10];1组数据来源于海水中常规污染物方法检出限协作验证[3]。

3 结果与讨论

根据目前通常做法,标准编制组得到各实验室的方法检出限数据后,取其中最大值作为方法检出限确认值写入标准文本。如果这些数据中有离群值该怎么办?从数理统计学的角度看,首先应该判断各实验室上报的检出限数据是否存在离群值,如果有,则应该删去。常见的判别方法有科克伦方差检验法。对于存疑的数据,实验室应进行复核,同时应尽量找到对应的技术原因后重新做实验,得到新的结果后再上报。

科克伦方差检验法比较严格,是否需要删去有时还需要结合专业经验判断。例如,协作定值中,有些实验室数据方差离群,如果其相对标准偏差在允许范围内,数据仍可保留[10]。必要时应该请标准审查专家组确认。现行有效的统计方法标准中,处理各家实验室数据还有一种方法是稳健统计法[6],其优点是不需要识别可疑值和离群值。在计算过程中,可直接将离群数据对最终结果的影响降低到最小,不需要反复数轮进行检验,可以避免由于忘记进行方差检验,直接取最大值作为最终结果的错误。等同采用ISO 13528—2005的标准[6]规范性附录C推荐的稳健统计法。其中,算法A可以得到数据平均值和标准偏差的稳健值。算法S用于计算一组标准偏差的稳健合并值(或称稳健联合值)。

3.1 标准偏差数据存疑情况下不同计算方法结果比较

表2、表3为文献[10]中沉积物中无机元素协作定值2种方法处理结果比较。从表2、表3可以看出,不含离群值或仅含一个离群值,删去离群值后进行均方根处理合并标准偏差的经典方法和稳健统计处理结果基本相符。

表4为海水中常规污染物方法检出限3种计算方法的比较。第1列为原文计算结果:采取科克伦方差检验法识别离群值,取通过方差检验合格的标准偏差数据中最大值用于计算方法检出限;第2列为删去离群值后进行方差合并计算方法检出限;第3列为稳健统计结果。从表4可以看出,后2种方法结果更为接近。第1列结果和后2列结果基本相符(符合性判断详见3.2小节)。

表2 协作定值数据标准偏差2种方法处理结果比较(不含离群数据)

注:L=9~12,n=6;“*”表示数据单位为μg/kg,其余数据单位为mg/kg。

表3 协作定值数据标准偏差2种方法处理结果比较(含离群值数据)

注:L=9~12,n=6;“*”表示数据单位为g/kg,其余数据单位为mg/kg。

表4 海水常规污染物检出限3种计算结果比较

汇总方法检出限数据时,有时会发现上报数据中存在异常值。原则上应该通知数据存疑的实验室复核数据,查找原因并重新做实验。如果时间及人力安排均不允许,此时可以连续应用科克伦方差检验法识别离群值后,再对合格数据进行方差合并计算或取最大值。

表5~表7列出了标准编制说明附件《方法验证报告》中方法检出限汇总数据[7-8]及科克伦统计量。各项目方法检出限数据按数值大小排列。将表中各项目方法检出限最大值科克伦统计量C与临界值比较,可以将其分为合格、可疑(*)和离群(** )3类。相应数据的统计量C计算值同样分别用“*”或“** ”标记。如果该项目最大值为离群值,将继续下一轮方差检验,直至符合要求。3组数据均表明,已确认的方法检出限属于离群值是普遍存在的情况。参与统计的29组数据中,有8组方法检出限数据被判定为离群值,占比为27.6%。由此表明,如不按要求进行方差检验,直接取最大值作为方法检出限存在估值偏高的风险。

表5 农药-GC-MS(液液萃取)方法检出限数据及方差检验结果

注:①n=7,α=0.01:L=6,临界值=0.487,L=5,临界值=0.553,L=4,临界值=0.641;n=7,α=0.05:L=6,临界值=0.418,L=5,临界值=0.478,L=4,临界值=0.560;② 1#~6#数据单位为μg/L,统计量C无单位;③“**”表示离群值,“—”表示无该值。下同。

表6 农药-GC-MS(固相萃取)方法检出限数据及方差检验结果

注:“*”表示可疑值。下同。临界值参见表5注。

表7 元素-碱熔-ICP-OES测定方法检出限原始测定数据及方差检验结果

由第1轮方差检验可知,表5有4个项目存在离群值,表6有1个可疑值,表7有4个离群值和3个可疑值。针对出现离群值的项目继续进行方差检验,在第2轮检验中,删去离群值后,表4所有项目剩余数据均通过检验;表7 中MgO、Fe2O3仍存在离群值。2轮检验共发现10个离群值和4个可疑值。

对应表5~表7方法检出限汇总数据,表8~表10比较了4种方法计算结果。表8~表10中的第1行数据均是直接取最大值。即在各家实验室上报的数据中直接取最大值(原结果);第2行为稳健统计(算法S)计算结果;第3行为合格数据-合并,是指利用科克伦方差检验法识别并去掉离群值后,将剩下的数据按常规方法进行均方根合并处理;第4行合格数据-max表示经科克伦方差检验后,在合格数据中取最大值。从这些表中可以看出,取最大值方法的结果明显偏高,其他3种方法计算结果基本相近。

表8 农药-GC-MS(液液萃取)方法检出限计算结果比较

表9 农药-GC-MS(固相萃取)方法检出限计算结果比较

表10 元素-碱熔-ICP-OES测定方法检出限计算结果比较

大气颗粒物中无机元素测定XRF方法标准验证实验[6]中,有7家实验室提供了石英滤膜和聚丙烯滤膜样品的波长色散X荧光光谱法(WD-XRF)测试数据。经过几轮科克伦方差检验发现,大多数元素方法检出限数据中都有1~2个离群值。利用稳健统计法、合格数据的合并处理、合格数据中取最大值3种方法来处理这2组数据,处理结果见图1、图2。

图1 石英滤膜样品WD-XRF方法检出限3种方法计算结果比较Fig.1 Comparison of three methods to calculate detection limit on elements determination in quartz filter samples by WD-XRF

图2 聚丙烯滤膜样品WD-XRF方法检出限3种方法计算结果比较Fig.2 Comparison of three methods to calculate detection limit on elements determination in polypropylene filter samples by WD-XRF

从图1、图2可以看出,大多数元素在3种方法(合格数据的合并处理、稳健统计和合格数据中取最大值)中,稳健统计法结果更接近于合格数据的合并处理后结果。合格数据中取最大值一般均大于前2种方法结果。3种方法之间没有显著性区别。对于需要数轮方差检验才能进行方差合并计算或取最大值的方法,稳健统计法具有操作简单,无需人工干预的特点。

3.2 方法检出限的不确定性及符合性判断

上述几组实测数据均证实,如果不进行方差检验,直接从上报结果中采用取最大值作为方法检出限,其结果存在偏高的风险。稳健统计与删去离群值后合并计算标准偏差的方法结果基本相符。在上报数据中取最大值作为方法检出限,可能与实验室计量认证(CMA)或合格实验室认可(CNAS)要求所有实验室均要达到标准文本上的方法检出限要求有关,也与管理部门充分考虑到全国实验室水平差异,特别是针对当前国内不同地区实验条件相差较大有关。如标准规定的方法检出限较低,会使一些实验室抱怨。实际工作中,在标准偏差基础上得到的方法检出限本身就具有不确定性。同一实验室、同一操作人员在不同时间得到的标准偏差数据有一定波动性。

如何判断实验室的结果与标准文本上的方法检出限有无显著性差别?方法检出限来源于特定样品系列测试数据的标准偏差。F方差检验是判断2个独立实验结果方差是否存在显著性差别的有效工具。基于F方差检验的曼德尔k检验可以用于方法检出限符合性判断。如果某实验室根据自己的实验数据计算得到的方法检出限与标准上的值相比较,其比值小于等于临界值(表1),则认为其结果是合理的,即不存在显著性差别。如果采用此比值判据,就无需在制定方法标准时有意放宽方法检出限。曼德尔k检验比值判别法相较科克伦方差检验方法的优点是可以一次性识别一组数据中的离群值,无需进行多轮检验。

3.3 用曼德尔k检验法识别离群值

以原始结果均方根为基准,用曼德尔k检验法(比值法)核查表2~表4所列出的检出限数据是否存在离群值,并与经典的科克伦方差检验法进行了比较。结果见表11~表13。

表11 用比值法检验农药-GC-MS(液液萃取法)方法检出限数据

注:科克伦检验临界值参见表5注;曼德尔k检验离群值和可疑值临界值分别为1.568、1.399 。

表12 用比值法检验农药-GC-MS方法(固相萃取法)检出限数据

注:参见表11注。

从表11~表13中可见,共有13个数据大于临界值1.568 (α=0.01,参见表1),被判为离群值。表明,这些数据与基准值之间有显著性差别,即这些实验室操作程序可能存在问题,需要仔细查找原因。方差检验中发现的10个离群值同样被比值法识别。比值法结论与科克伦方差检验结论基本相符。比值法识别的其他3个离群值均在科克伦方差检验判定的6个可疑值之列。这些可疑值的科克伦统计量与离群值的临界值(α=0.01)非常接近。

如果以稳健统计结果为基准,用曼德尔k检验法判断表2~表4数据也可以得到相似结果。

WD-XRF数据按数值大小排列后,分别用科克伦方差检验法和比值法处理。将表中各元素方法检出限最大值科克伦统计量C与临界值比较后,将离群值用“**”表示。如该项目最大值为离群值,将继续进行下一轮方差检验,直至符合要求。比值法先分别求出方法检出限均方根值或稳健统计结果后再分别计算与各实验室上报数据的比值。由于平行测定次数为6,故大于1.553~1.634 (取决于参与检验的数据个数)的数据用“**”标记。石英滤膜和聚丙烯滤膜样品测量数据计算结果(以均方根为基准)分别见表14、表15。3种方法结果比较见表16。

表13 用比值法检验碱熔-ICP-OES测定方法检出限数据

注:参见表11注。

表14 科克伦方差检验及曼德尔k检验结果比较(WD-XRF石英滤膜数据)

注:①科克伦方差检验:α=0.01,n=6:L=7、6、5、4,临界值分别为0.466、0.520、0.588、0.676;α=0.05,n=6:L=7、6、5、4,临界值分别为0.397、0.445、0.506、0.589;②曼德尔k检验:α=0.01,n=6:L=7、6、5、4,临界值分别为1.634、1.616、1.591、1.553;α=0.05,n=6:L=7、6、5、4,临界值分别为1.442、1.433、1.421、1.402。

表15 科克伦方差检验与曼德尔k检验结果比较(WD-XRF聚丙烯滤膜数据)

注:临界值见表14注。

表16 科克伦方差检验及曼德尔k检验结果汇总

从表16可以看出,如果仅以离群值识别个数为标准进行统计,科克伦方差检验和稳健统计比值法显得更严格一些,这可能与科克伦方差检验连续进行多轮检验有关。据文献[4]介绍,当分布为近似正态的假定没有充分满足时,科克伦检验有可能导致过度的拒绝,因其不是为同时检验多个离群值而设计的,故下结论时要格外小心。

稳健统计由于已降低了离群值的影响,直接降低了基准值,从而影响了比值结果。如果只考虑科克伦检验的第1轮检验结果,以均方根为基准的比值法与科克伦方差检验法结果基本相符。比值法判定为离群值的大部分实例中,科克伦检验法也判定其为离群值。有些被比值法判定为离群值的数据中,科克伦检验法则判定其为合格(表14中Ni),这与比值法中的稳健统计结果或均方根偏低有关。如果数据分布出现2个峰值,此时采用稳健统计法可能不合适。当出现类似现象时,应增加技术原因分析环节并结合专业经验确认最终结果。

上述验证结果表明,科克伦方差检验、稳健统计或均方根比值法均可有效识别离群值。2种方法得到的结果可相互验证,保证结果不出现计算失误。

4 结论

1)目前环境保护系统监测方法标准制定过程中,将参加方法验证的各家实验室方法检出限数据汇总后,不经方差检验,直接取最大值作为标准文本的方法检出限的做法不妥。其结果存在数值偏高的风险。

2)利用科克伦方差检验法识别并去除离群值后,将剩余数据进行均方根合并处理或取最大值得到方法检出限。也可以直接采用稳健统计(算法S)对数据进行处理,该方法更简便,无需人工干预。

3)以方法检出限上报数据均方根数值为基准,利用比值法判据,同样可识别各家实验室上报数据中的离群值。其结果与科克伦方差检验法结论基本相符。

4)基于实验室数据与标准文本上的方法检出限进行符合性比较时,可采用比值法进行判断。如果两者比值小于或等于曼德尔k检验临界值,则表明两者无显著性差别。

[1] 环境保护部科技标准司.环境监测 分析方法标准制修订技术导则:HJ 168—2010[S].北京:中国环境科学出版社,2012.

[2] 李玉武,任立军,王婧瑞,等.方法检出限三个评估方法标准解读与比较[J].中国无机分析化学,2015,5(3):24-33.

LI Yuwu,REN Lijun,WANG Jingrui,et al,Interpretation and comparison of three procedures for the determination of method detection limit[J].Chinese Journal Inorganic Analytical Chemistry,2015,5(3):24-33.

[3] 谭爱民,蒋海威.从实验室质量保证探讨海水新国标分析方法检出限的应用[J].海岸工程,2003,22(4):55-60.

TAN Aimin,JIANG Haiwei.Study on application of detection limit of new national standards for seawater analysis[J].Journal of Coastal Engineering,2003,22(4):55-60.

[4] 全国统计方法应用标准化技术委员会.测量方法与结果的准确度(正确度与精密度)第2部分:确定标准测量方法重复性与再现性的基本方法:GB/T 6379.2—2004[S].北京:中国标准出版社,2009.

[5] 全国统计方法应用标准化技术委员会.数据的统计处理和解释-测试结果的多重比较:GB/T 10092—2009[S].北京:中国标准出版社,2009.

[6] 全国统计方法应用标准化技术委员会.利用实验室间比对进行能力验证的统计方法:GB/T 28043—2011[S].北京:中国标准出版社,2011.

[7] 国家环境分析测试中心.水质 百菌清及拟除虫菊酯类农药的测定 气相色谱-质谱法:HJ 753—2015.标准编制说明[EB/OL].(2015-04-02)[2016-04-07].http://www.mep.gov.cn/gkml/hbb/bgth/201504/W020150414523636829552.pdf.

[8] 吉林省环境监测中心.土壤和沉积物 11种元素的测定 碱熔-电感耦合等离子体原子发射光谱法(征求意见稿)编制说明[EB/OL].(2016-01-22)[2016-04-07].http://www.mep.gov.cn/gkml/hbb/bgth/201601/W020160129549434188472.pdf.

[9] 国家环境分析测试中心.环境空气 无机元素的测定 X射线荧光光谱法(征求意见稿)编制说明[EB/OL].(2016-03-16)[2016-07-15].http://www.zhb.gov.cn/gkml/hbb/bgth/201603/W0201603 22374754 088793.pdf.

[10] 吴忠祥.水系沉积物和及标准样品研制与定值技术[M].北京:中国环境科学出版社,2012.

猜你喜欢

离群标准偏差检出限
环境监测结果低于最低检出限数据统计处理方法
一种基于邻域粒度熵的离群点检测算法
定量NMR中多种检出限评估方法的比较
倾斜改正在连续重力数据预处理中的应用
基于地质分析测试行业对检出限的理解和应用
分析化学中检出限与测定下限分析
一种相似度剪枝的离群点检测算法
从数学的角度初步看离群点检测算法
平滑与褶皱表面目标的散射光谱的研究
候鸟