医学实验室目标测量不确定度的选择
2023-11-09丁海峰周剑涛
丁海峰,姚 尧,张 琪,周剑涛
1. 武汉千麦医学检验实验室(武汉 430010)
2. 黄冈职业技术学院医药学院医学检验教研室(湖北黄冈 438002)
检验医学旨在为正确的临床决策提供有用的信息,从而为医疗服务质量做出贡献[1]。测量不确定度(measurement uncertainties, MU)是评价医学实验室测量活动的重要质量指标[2]。为使医学实验室测量结果可用于临床诊疗与卫生保健,并确保测量变异性不会掩盖测量结果所提供的临床信息,医学实验室在正式提供检验服务前,应对测量不确定度进行充分评估,并判断测量结果的测量不确定度是否符合目标测量不确定度(target measurement uncertainty, TMU)(简称“目标不确定度”)的要求,如果不符合,说明该医学实验室的检验结果未达到预期的质量水平[3-4]。
1 目标不确定度与可选择的目标不确定度
目标不确定度是根据测量结果的预期用途,规定作为上限的测量不确定度,通常也被称为“最大允许不确定度”或“测量不确定度的允许限值”[5]。根据测量应用要求,基于生物变异、国内外专家组的建议、管理准则或当地医学界的判断,对不同水平的测量结果可以确定一个或多个目标不确定度[4]。
自2017 年开始,本实验室依据室内质控(internal quality control, IQC)与室间质量评价/能力验证(external quality assurance/proficiency testing,EQA/PT)数据,采用“由上至下”法(top-down approach)对定量检测项目程序化计算测量不确定度[6]。根据《临床生物化学检验常规项目分析质量指标》(WS/T 403-2012)[7],选定国家卫生健康委临床检验中心(National Center for Clinical Laboratories, NCCL)室间质量评价标准作为目标不确定度,当项目相对扩展不确定度小于目标不确定度时认为符合临床测量要求[8]。
本实验室评定测量不确定度的结果表明,申报项目的测量不确定度均小于NCCL 室间质量评价标准,符合中国合格评定国家认可委员会(China National Accreditation Service for Conformity Assessment, CNAS)认可要求[4]。然而,以此目标不确定度评价的测量项目,其检验性能是适合临床诊疗要求还是测量技术水平要求仍值得探讨。
2 根据米兰模型定义测量不确定度的性能规范
《医学实验室:测量不确定度评估实用指南》(ISO/TS 20914:2019)强调测量不确定度的大小应适用于医疗决策的结果[5]。测量不确定度原则上应在医学相关性的范围内,使测量结果在临床决策和患者管理中可被临床接受并可靠[9]。因此,定义目标不确定度对于客观评价医学实验室测量结果的临床可靠性至关重要。2014 年,欧洲临床化学和检验医学联合会(European Federation of Clinical Chemistry and Laboratory Medicine, EFLM)在意大利米兰会议提出了分析性能规范(analytical performance specifications, APS)三种模型,称为米兰模型(Milan models)[10-12]。
模型Ⅰ,基于测量结果对临床结果的影响。适用于测量结果在特定疾病或临床情况的决策中具有核心作用的测量方法,其中为诊断、筛查或监测建立起临界水平/临床决策限[11]。模型Ⅰ可进一步分为Ⅰa 型与Ⅰb 型,Ⅰa 型是测量结果直接影响临床结果,Ⅰb 型是测量结果影响临床分类或临床决策,从而对患者结果概率产生影响[13]。如总胆固醇、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、葡萄糖、糖化血红蛋白、血清白蛋白和心肌肌钙蛋白是适合模型Ⅰ的实际测量示例[14]。这些测量项目对于疾病的诊断和治疗监测有明确的决策界限。模型Ⅰ的主要缺点是其仅适用于临床决策和临床结果之间的联系直接和显著的检查。此外,APS 通常会受当前测量质量的影响,结果可能会因为所使用的实际测试方法、调查人群和医疗保健环境而变化[10]。
模型Ⅱ,基于被测量物的生物变异(biological variation, BV)。受试者内部和受试者之间的BV对于设置测量方法的APS 很重要,获取BV 数据的方法应具有科学性和合理性[15]。模型Ⅱ应用于被测量物处于稳定状态、测量结果对特定疾病或临床情况不起核心作用的测量,适用于血浆电解质和矿物质(钠、钾、氯化物、碳酸氢盐、钙、镁和无机磷酸盐等),以及血浆肌酐、胱氨酸抑素C、尿酸和总蛋白项目的测量[12,14]。这些指标被测量物的体内水平受激素(如调节钠、钾的醛固酮和加压素,调节钙、无机磷酸盐的甲状旁腺激素等)和其他机制(如肾功能)的严格控制[11]。模型Ⅱ的局限性是需要仔细评估BV 数据的相关性和有效性。例如,BV 数据研究之间的差异(如甘油三酯的差异为2.3%~31.9%)很大,数据通常来自相对年轻和健康的受试者,依赖于研究的时间跨度(从小时到年),以及测量浓度可能产生的影响[16]。目前,BV 数据质量有了很大的改善,可用的BV 数据可从EFLM BV 数据库(EFLM Biological Variation Database)上查阅[17]。使用模型Ⅱ测量不确定度的APS 可以保持在±0.25 CVI(coefficient of variation index)、±0.50 CVI 或±0.75 CVI 水平,它们分别表示最佳、理想或最低的质量水平,如何确定则取决于人们预期要达到的质量水平[18]。
模型Ⅲ,基于最先进的测量技术,定义为测量技术上可实现的最高水平的分析性能,也可以定义为一定百分比的实验室所能达到的分析性能[12]。如果最好的实验室只能达到某一质量水平,若要达到更高的质量水平(根据模型Ⅰ或模型Ⅱ),则需要在技术上进行改进。如果大多数实验室可以达到一定的质量水平,那么不符合这一水平的实验室就可能需要改进自身提高质量。模型Ⅲ的优点是随时可用最先进的性能数据,缺点是技术上可实现的目标与临床结果所需的目标之间可能没有关系,因此模型Ⅲ是最不可取的方法[10]。模型Ⅲ适用于不能应用于模型Ⅰ或模型Ⅱ中的所有测量。它可以暂时用于那些仍在等待定义基于临床结果(模型Ⅰ)的APS 测量,或同时等待BV数据(模型Ⅱ)的测量,或这两种模型均不适用的测量,如尿液中钠、钾、氯、钙、镁、无机磷酸盐、肌酐、尿素、尿酸等[11]。
3 室间质量评价方案的分析性能规范
EQA/PT 旨在反复验证实验室测量结果是否符合患者医疗所需的预期质量。为了评估EQA 结果是否可接受,EQA 方案(EQA scheme, EQAS)组织者必须围绕目标建立可接受限,即APS。出于监管、统计或临床的目的,不同的EQAS 组织者定义的APS 有较大差异[19]。
一般来说,如果基于监管目的,APS 会制订得比较宽松;如果基于质量改进目的,则会制订得比较严格。大多数EQAS 组织者基于监管目的将APS 设置为低标准水平,即监管限,其目的是识别筛出性能不佳而不能继续执业的实验室,例如美国临床实验室改进修正案(clinical laboratory improvement amendments, CLIA)[20]。统计限基于这样一个假设:如果使用相同程序获得的结果与其他方法一致,则测量性能是可接受的,例如,EQA 参加者的测量结果分布于±2~3 个标准差,那么测量程序适合临床使用。临床限则基于可能影响临床决策或生物变异的差异,这是检验医学追求的目标,但目前仍难以普遍实施[21]。
目前,我国《临床生物化学检验常规项目分析质量指标》(WS/T 403-2012)将质量水平定义为80%以上三级医院所能达到的质量水平[7],国家NCCL 的EQAS 也是按此标准执行[8]。值得注意的是,以此质量水平作为测量项目的目标不确定度与临床诊断应用无直接关联。EQAS 参加实验室的测量结果满足这些标准,并不意味着测量性能是最佳的,也不意味着测量性能能够满足临床医疗需要。
4 采用多元化标准选择目标不确定度,促进检验质量水平不断提高
综上所述,选用NCCL 的评价标准作为定量项目的目标不确定度,尽管评价为合格不确定度的项目能通过CNAS 认可,但并不意味认可项目的测量性能达到了临床应用要求。以本实验室2022 年11 项血液生化检测的测量不确定度为例说明。
将本实验室2022 年11 项血液生化检测的测量不确定度与3 种拟定目标不确定度进行比较,得出的评价结果不尽相同。由表1 可知,TMU ②与TMU ③标准相对一致,但TMU ①与TMU ②和TMU ③ 标准差异较大,TMU ①标准更加严格。因此,葡萄糖、糖化血红蛋白、25-羟维生素D3、钠、钾、氯、肌酐、丙氨酸氨基转移酶、C-反应蛋白的测量不确定度符合TMU ②/TMU ③标准,但大于TMU ①标准。尿素与总胆红素既符合TMU ②/TMU ③标准,又符合TMU ①标准。
表1 本实验室11项生化测量的测量不确定度与不同目标不确定度的比较(%)Table 1. Comparison of measurement uncertainty of 11 biochemical measurements in our laboratory with uncertainty of different targets (%)
11 项测量项目测量不确定度明显小于TMU ② / TMU ③标准,长期以TMU ②/TMU ③标准作为实验室测量项目的目标不确定度,将不利于实验室持续改进并提高测量质量水平。虽然本实验室钠、钾、氯和丙氨酸氨基转移酶的测量不确定度大于TMU ①标准,但尿素与总胆红素小于TMU ①标准,说明实验室有潜力,可以根据测量项目的实际测量水平,依据临床结果或生物变异参数确定目标不确定度,既能达到CNAS认可要求,又能促进实验室测量质量不断提高。而葡萄糖、糖化血红蛋白和25 羟维生素D3 的测量不确定度虽然符合CNAS 认可要求,但大于TMU ①标准,不能满足临床诊断的要求,需继续改进。TMU ② / TMU ③的标准值普遍大于TMU ①标准,尤其是基于技术先进水平标准的项目C-反应蛋白(TMU ③ 25.0 vs. TMU ① 3.76),主要原因可能是制订标准的目的不同。作为国家质量标准或国家级EQAS 的质量性能规范,除了发挥监管功能,还应该引导全国检验质量持续不断地改进提高,标准要与测量实际水平与时俱进、适时修订,长期不变的低标准不利于提高我国整体检验水平。
5 结语
EQA 对于确保医学实验室可接受的分析质量至关重要。EQAS 的一个关键要素是为每个测量建立了APS,实验室可以使用其APS 评估所获得的测量结果与目标值的偏差程度。医学实验室测量项目有多种性能指标可供选择,米兰模型可以应用于EQAS 的APS 设置。基于不同的目的(监管、统计或临床),不同的EQAS 所采用的标准和APS 会存在较大差异。检验医学的最终目标是实现高质量的医疗决策,因此需要了解实验室数据的质量对其在患者医疗中使用方式的影响。鉴于EQAS 无法为每种测量预期目标提供APS,因此,当实验室的测量不确定度预期目标与特定EQAS 一般测量预期目标不一致时,应该根据实验室测量预期目标寻求与此相应的APS 作为评价测量不确定度的目标不确定度。