六西格玛度量在实验室性能评价和质量控制设计中的应用*
2015-09-05王治国
张 路,王治国
(1.北京协和医学院研究生院,北京100730;2.北京医院卫生部临床检验中心,北京100730)
实验室在寻求对分析方法和仪器性能进行客观评价及比对。但是很少有方法可以在一个公平的条件下比较系统性能从而作出公平合理的比较。当前的评估方法是随意的,其依赖于不清晰的“当前技术水平”评估,或者更关注容易有形的效率指标,如速度、成本或易用性。在购买仪器的决策过程中常常忽视试验交付质量的分析目标和要求。而在这些方面,西格玛度量是一个很好的工具。
西格玛度量评价性能的过程可以比喻成一个带箭的靶。六西格玛度量确定靶的形状,质量要求确定靶的大小,方法性能数据确定箭击中靶的位置。
西格玛度量分析不仅提供对分析方法及仪器的客观评估,还提供实施操作需要的关键设计信息。西格玛度量分析过程的质量控制设计方案使用定量的和图形工具来确定方法和仪器常规监测所需的质量控制程序。
1 采用六西格玛作为实验室检测的全球标准
六西格玛是一种广泛接受的质量管理体系,最著名的是通用电气和摩托罗拉的创新产品管理[1]。制造业和服务业以及医疗机构从医院到实验室已采用了六西格玛。
六西格玛是一种以每百万机会的缺陷数(DPM 或DPMO)来量化过程性能的度量。六西格玛的目标就是消除或降低过程中所有变异。过程中的变异会导致由于重新检测及权变措施而浪费精力及资源。六西格玛的定量目标是创建一个将变异最小化到6倍标准差在容差极限之内的过程(见图1)。在六西格玛性能水平上(世界级质量性能)大约每百万机会有3个缺陷。
图1 不精密度(CV)、偏倚(Bias)及允许总误差(TEa)在预测缺陷中的关系
六西格玛尺度一般从0到6,但是如果过程变异性足够低而降低缺陷率,也可超过六西格玛。在医疗以外的行业中,3可被认为是过程的最低可接受的性能。当性能低于3,认为该过程本质上是不稳定的和不可接受的。与其他行业不同,医疗和临床实验室似乎是在2 到3 环境中运行。
六西格玛的部分功效是在于其能够提供一个通用基准测试的能力。西格玛度量允许不同过程间的比较,甚至是不同机构和不同行业间过程的比较。
在医疗领域,常规过程的西格玛性能还鲜为人知。美国医学研究院发布了具有里程碑意义的报告:人非圣贤孰能无过[2]。它极好地揭示了美国医院每年有48 000到90 000例死亡可以避免。这表明医疗领域只实施3.8 水平。如果医疗达到六西格玛水平,病死者将只有每年16~34例。
Nevalainen等[3]在临床实验室西格玛评估中的开创性工作分析了常规检测过程的性能,并发现很多都是严重的不足,详见表1。
表1 常规检验过程的西格玛度量
再次探讨箭和靶的模型,六西格玛提供了靶的形状。形状将六西格玛性能目标定义为靶心,以及将四和五西格玛定义为内圈。在三西格玛圈之外的性能认为是未中靶,这个过程不认为是“适合用途”。
2 规定质量要求
知道靶子的形状还不够。还必须描述其大小。在六西格玛术语中,必须定义容差极限。在检验中,容差极限的最好的表达形式就是允许总误差(TEa)规范。
TEa是医疗检验领域广泛接受的概念,此模型结合方法的不精密度(变异系数,CV)和偏倚(Bias)来计算对试验结果的总影响[4]。TEa表示基于患者结果解释没有损害患者医疗的情况下,试验结果中可允许多少结合的不精密度和Bias。
实验室规定质量规范有一定的难度。大多数实验室不知道甚至认为不需要知道他们的试验所要求的分析质量。数十年前,只有很少的质量规范来源。幸运的是,现在可利用并易于获得的质量要求和目标有很多[5]。首先最重要的是美国实验室实施的临床实验室改进修正法案(CLIA)能力验证指南。CLIA 为大约80个检验项目提供了特定的质量要求。由能力验证计划、室间质量保证计划或同行组比对计划提供其他的分析基准。在美国以外,澳大利亚皇家病理学家学会(RCPA)及德国医学协会(RiliBak)指南提供一些质量规范来源。
临床基准也可以用于制定质量要求。Carmen Ricos教授及其同事自2000年提供了一个持续更新的生物学变异数据库[6]。他们将超过300 个不同检验项目的不精密度、Bias及TEa 的适当规范制成表格[7]。ISO15189是新的国际实验室质量认可标准,它也为分析检测提供指南。最终,越来越多的循证检验医学(EBLM)研究可用于建立临床决定区间。这些区间又可以用于确定特定试验的质量要求。至少,实验室可以咨询使用其结果的临床医生,通过记录试验结果如何解释来确定他们试验过程要求的质量。
再次回到箭和靶的模型,建立质量要求就是确定靶的大小。既然不同试验的用途及性能不同,那么箭/过程必须击中的靶子的大小也不同。六西格玛和质量要求提供靶子的形状和大小。那么最后就是要确定箭是否击中或击中靶的什么位置。为此,需要有关过程实际性能的数据。
3 测量实验室六西格玛性能
通常通过统计缺陷数,然后将计数转化为DPM 或DPMO来评价西格玛性能[8]。一旦知道了DPM,可以参考标准课本中的六西格玛表来获得六西格玛度量。
在实验室,计缺陷数也是通常的六西格玛度量技术。例如实验室可计算一段时间内的周转时间(turn-around time,TAT)缺陷试验结果数量,然后将其转化为西格玛性能。
然而,对于实验室试验结果,确定和检出缺陷是比较困难的。当产生一个试验结果时,不可能知道该试验结果的真值应该是多少。因此,并不知道结果是否落在容差极限或质量要求内,也就没办法计算试验过程产生多少的缺陷数。
但实验室可以通过使用质控品测量变异的方法来确定过程的西格玛度量。质控品是一个已知值,所以可以测量观察试验结果的变异。有了多个质控结果,就可以收集有关试验过程标准差的信息,并能计算不精密度。通过比较试验方法和参考方法间的结果,或通过分析能力验证、同行比较或一些其他形式的室间保证计划中试验方法结果可以易于获得分析检测过程偏倚的信息。
性能数据应该是方法性能在特定时间点和特定浓度水平(最好是临界水平即医学决定水平)下的一个准确的反映。这样西格玛度量结果才最好地反映了实际的试验性能。例如,如果临界水平在动态范围的低限,也应该在相同的浓度范围内估计偏倚,或者来自方法对比研究的回归方程可以用于在临界水平上估计偏倚。对于有多个临界水平的试验,应该在每个水平上都估计西格玛度量。
不精密度及偏倚与西格玛度量的关系可以用图示说明(图1)。如果实验结果是正态分布,且已知标准差(不精密度)和偏倚,就可计算可接受性能范围,相反地也可确定结果不可接受的浓度范围(即定义TEa 的容差极限以上及以下的浓度范围)。
不精密度和偏倚(Bias)与西格玛度量之间的关系可总结为以下数学公式:
σ=(TEa-Bias)/CV
再次回到箭和靶的模型,西格玛方法给了一个靶,质量要求给了靶的大小,方法的性能数据给了箭,箭应该使工作人员尽可能地击中靶心(六西格玛)。
即使当方法偏倚数据丢失,也可以计算出修正的西格玛度量。度量结果记录了方法在理想条件下没有偏倚出现时达到世界级性能的能力。此种评估的好处是实验室可以评估除了不精密度外还剩下多少“误差的空间”。对于一些仪器,甚至西格玛能力度量就可允许一个实验室作出关于方法适用性的判断。
西格玛度量能力=TEa/CV
可以使用方法评估决定图(MEDx,见图2)及其图上的六西格玛度量线来图示说明方法的性能[9]。方法决定图y轴表示Bias,x轴表示不精密度。每个特定的质量要求都画一种特定的图(即10%的质量要求会使用一个针对10%的方法决定图),但是有不同质量要求的多种方法可以展示在一种标准化操作规范(OPSpecs)图上。在一种标准化方法决定图中,每个轴都设置为100%,且通过计算质量要求的百分率来确定试验的x和y值,见图3。
图2 允许总误差为10%的方法决定图
图3 标准化方法决定图
例如,如果试验的质量要求为10%,CV 为1%,Bias 为2%,则标准化方法决定图的坐标为(10,20),见图4。
尽管带有六西格玛限的标准化方法决定图将很多复杂的特征及计算合并成单独的显示,但图的结果仍然符合箭和靶的模型。图可以看做是靶的右上象限。图上原点(0,0)周围(及所有线以下)的区域是靶心。标绘的试验的x及y轴坐标代表了试验的性能及箭击中的点。
图4 具有样品数据点的标准化方法决定图
4 西格玛评价在方法验证中的应用
有了西格玛度量公式的简单参数,实验室就可以易于确定其所有方法的当前的性能。新仪器的标准方法验证方案中获得数据也可以用来确定性能度量。此外,要对所有的新方法实施正式的方法验证研究,此研究在学术会议中常以壁报的形式呈现,或以专业杂志中发布的学术报告形式,或只是以制造商经要求提供的数据的形式。实验室可以用这些数据计算西格玛度量,将其与竞争仪器的西格玛度量进行比较,将此工具作为其决策过程的一部分。这种应用对于购买新仪器之前客观评估并比较仪器性能很有价值。它使实验室有能力预测按照他们的临床需要将实施某种方法而不实施某种方法。
5 从西格玛度量评价到质量控制设计
西格玛度量分析不限于评估及方法验证。西格玛度量也可以用于完善和简化方法的操作程序。将西格玛度量结合在质量控制设计工具,如操作规范图(OPSpecs)上,允许实验室能定制和优化实验室实施的质量控制程序。合理的质量控制设计可以消除很多不经济的2s质量控制实践,用适当的控制界限和控制测定值个数来替代它。
图5 TEa为10%的OPSpecs图
OPSpecs图提供对于规定的质量要求取得适当的分析质量保证水平质量控制程序所需的控制规则和控制测定值个数以及允许不精密度和偏倚的图形描述[10]。此图中的斜线代表实际的质量控制程序(控制规则和控制测定值个数)的误差检出性能。这些线从上到下的排列是根据他们的误差检出能力;最高的线提供最高的误差检出(因此,此线以下有更多的“空间”供方法击中)。有关质量控制的其他细节,如假失控率(Pfr)、控制测定值个数(N)及批的数量(R)见图右侧的区域。x轴和y轴坐标分别代表方法的不精密度和Bias。如果该“操作点”低于OPSpecs图的其中一条线,那么说明那条线代表的质量控制程序将提供适当的性能(见图5)。
最后再次讨论箭和靶的模型,可以以西格玛度量分析及方法决定图相同的方式来观察OPSpecs图。OPSpecs图就像靶的右上象限,原点是靶心。方法性能(箭)应该尽可能地接近靶心。然而,这次靶上不同的圈代表实验室使用的不同的质量控制程序。越接近于靶心,则有更多的质量控制程序可用于质量管理。
OPSpecs图和方法决定图都是针对特定的质量要求制作而成。也可以将OPSpecs图标准化以便于将有不同质量要求的多个试验显示在同一图中(见图6)。
图6 标准化OPSpecs图样板
6 结 论
西格玛度量分析、方法决定图及OPSpecs图为实验室确定他们当前方法性能及质量控制设计,以及比较市场上具有竞争的仪器提供方便的工具。用这种方法可以进行定量计算及目测评估。这些技术为实验室选择正确方法并为这种方法选择正确的质量控制提供了一种实用的方法。其产生的结果就是满足适当试验解释所要求质量优化的检测过程。
[1]Wectgard JO.Six sigma OC design and control[M].2nd Edition.Madison WI:Westgard QC,2006.
[2]Institute of Medicine.To err is human:building a safer health system[M].Washington DC:National Academy Press,2001.
[3]Nevalainen D,Berte L,kraft C,et al.Evaluating laboratory performance on quality indicators with the six sigma scale[J].Arch Pathol Lab Med,2000,124(4):516-519.
[4]Westgard JO.Basic planning for quality[M].Madison WI:Westgard QC,2000.
[5]王治国.临床检验质量控制技术[M].3版.北京:人民卫生出版社,2014.
[6]王治国.生物学变异与参考区间[M].北京:人民卫生出版社,2012.
[7]Ricos C,Alvarez V,Cava F,et al.Desirable specifications for total error imprecision and bias derived from biologic variation[EB/OL].2008-12-20.[2014-10-15].http://www.westgard.com/biodatabase1.htm.
[8]王治国.临床检验6σ质量设计与控制[M].北京:人民卫生出版社,2012.
[9]Westgard JO.A method evaluation decision chart(MEDx chart)for judging method performance[J].Clin Lab Sci,1996,8(5):277-283.
[10]Westgard JO.Charts of operational process specifications("OPSpecs charts")for assessing the precision,accuracy,and quality control needed to satisfy proficiency testing performance criteria[J].Clin Chem,1992,38(7):1226-1233.