间接法建立生物参考区间

2015-01-02沈隽霏宋斌斌综述潘柏申审校

检验医学 2015年4期

沈隽霏，宋斌斌综述，潘柏申审校

(上海复旦大学医学院附属中山医院检验科，上海200032)

生物参考区间通常指参考值分布的95%中心区间[1]，是解释检验结果、分析检验信息的一个基本尺度和依据。医学实验室为临床提供可靠的生物参考区间才能正确指导临床对患者或健康体检者的诊断和治疗[2]。美国临床实验室标准化协会(Clinical and Laboratory Standards Institute，CLSI)和国际临床化学联合会(International Federation of Clinical Chemistry and Laboratory Medicine，IFCC)在2010年共同修订的推荐指南《临床实验室如何确定和建立生物参考区间;批准指南——第3版》(EP28-A3c指南)中指出，通过建立排除标准，选取合适参考个体以获得参考值的方法(直接法)是建立生物参考区间的标准方法[3]。然而，参考个体的选择是直接法面临的最困惑的问题。筛选标准的制定、疾病亚临床状态的存在都将直接影响到生物参考区间的取值。由于直接法操作过程复杂，耗时长，且费用昂贵，大部分实验室均直接引用试剂厂商推荐的生物参考区间[4]。但由于人群、地域、生活习惯、疾病的流行病学表现等多方面的差异，直接引用的生物参考区间可能不适合本地区的人群。随着计算机信息技术的发展，有学者提出利用实验室储存的大量数据，建立以数学统计为基础的生物参考区间(间接法)。近年来，许多学者也纷纷采用类似的途径报道了众多的研究成果[5-10]。我们就近年来报道的文献中出现的多种间接法进行简单阐述，并比较各个方法的特点，希望对国内医学实验室建立生物参考区间有所帮助。

间接法建立生物参考区间是指利用医院数据库中已有的数据建立生物参考区间的方法[4]。间接法的优势主要有两点:(1)有充足、可靠的数据来源;(2)间接法的操作较直接法而言比较简便，耗时短，成本低，有利于参考区间的建立和定期评审[3]。然而由于医院数据有存在错误值的可能性，因此必须运用合适的统计学方法对医院数据库中可能存在的错误值加以剔除。根据近年的文献报道，间接法建立生物参考区间大致可以归纳为以下4个步骤:(1)在医院数据库中完成足够数量符合要求的数据采集;(2)利用合适的方法对偏态分布的数据进行数据变换;(3)剔除医院数据中的离群值或错误值;(4)选取合适的方法建立生物参考区间。

一、数据采集

作为一种后验的方法，间接法建立参考区间需要采集医院数据库中已有的数据。EP28-A3c指南指出使用间接法建立参考区间必须采取必要的筛选措施以防医院数据库中大量非健康个体被纳入[4]。GROSSI等[8]认为设置合适的筛选标准可以大幅提高数据的可靠性，如选择排除过去3年内对同一项目进行过重复测试的个体数据、综合观察研究对象的相关性指标等。以γ-谷氨酰基转移酶(gamma-glutamyltransferase，GGT)为例，由于GGT与结合胆红素、丙氨酸氨基转移酶和天门冬氨酸氨基转移酶存在相关性，排除3项指标中任意一项超过现行参考区间的个体有助于降低选中非健康个体的概率[8]。然而许多研究并未提及数据筛选标准的具体设置，迄今为止这种做法的必要性仍不明确。

在间接法建立参考区间的过程中，为了尽可能降低年龄和性别等因素对结果的影响，ARZIDEH等[5]还推荐使用者根据性别和年龄的差异对样本进行分层筛选。

由于间接法建立生物参考区间需要使用相对较长时间范围内的数据，因此分析变异、分析前因素等都有可能对结果造成影响，导致建立的生物参考区间受到影响。EP28-A3c指南认为坚持合格的质量控制程序可以将分析变异对结果造成的影响降至最低[3]。然而，受试者的状态及是否空腹等一些分析前因素都会影响分析结果。这类因素所引起的变异很难被客观评估，也很难被实际控制[4]，这在某种程度上也影响到间接法的可靠性。

一般来讲，在间接法建立参考区间的过程中，足量的数据可以优化所建立的参考区间，其重要性甚至要高于统计方法的选择。当然选择正确的统计方法也能够提高新建参考区间的准确度，尤其是在无法收集到足量数据的情况下[3]。

二、数据变换

由于间接法所使用的医院数据中存在错误值的可能性较大，此类错误值(离群值)的存在会对最终获取的生物参考区间造成影响，故应当予以剔除。然而许多离群值剔除方法是基于样本数据呈正态分布的假设下建立的，当此类方法应用于偏态数据时，其可靠性将会下降。样本数据呈正态分布是离群值剔除的基础。HORN等[11]认为偏态数据会导致正常值被错误剔除或产生多个离群值的掩盖效应，进而影响最终获得的参考区间。因此，对于偏态分布的数据需要选用合适的方法预先对样本数据进行变换，以使其达到正态或近似正态分布。

检验样本数据是否呈正态分布的方法有很多，包括 Anderson-darling检验、Kolmogorov-Smirnov检验、Jarque-Bera检验以及 Skewness-Kurtosis检验(偏度-峰度检验)等。其中偏度-峰度检验应用较为简便。标准正态分布数据的偏度和峰度值均为0，一般认为偏度或峰度的绝对值大于样本标准差(s)的1.96倍，可以认为其分布与正态分布存在明显差异[9]。GRECU 等[12]曾使用偏度-峰度检验来判定数据的正态性。上述几种检验方法的共同特点是理论上适用于所有分布的拟合优度检验，并不针对某一特定的分布类型。然而在研究中还经常用到一些仅仅是针对一维正态分布数据而言的检验方法，其中常用的有比较直观的Q-Q图法，以Shapiro-Wilk检验为代表的回归型检验和矩检验法等。

如果数据需要做正态性转化，应当根据数据形态确定相应的转换公式，其中最常见的情况为正偏态和陡峰态。然而并非所有形态的数据都可以通过此类转换变为正态分布，如呈“双峰”或“多峰”分布的数据，没有任何公式可以将此类数据变换为单峰的正态分布。以下是两类常见的数据变换方法。

1.指数及对数转换转换公式见公式1～3。公式1多用于中度偏态数据，即偏度或峰度为s的2～3倍。公式2多用于高度偏态数据，即偏度或峰度为s的3倍以上。公式3纠偏力度最强，但有时会矫枉过正，容易将正偏态数据转换成负偏态分布。公式中的x均代表待转换变量。这3个公式的纠偏力度是递增的。然而某些偏态分布的数据经平方根变换或对数变换后仍然呈偏态分布，尤其是负偏态数据经平方根变换或对数变换后反而会增加其偏性[13]。因而可能有必要寻找一种更全面的数据转换方式。

2.Box-Cox转换 Box-Cox转换是基于统计分析中常用的一般线性模型假定:Y(λ)=Xβ+e，e～ N(0，σ2I);式中 Y(λ)为反应变量的向量，λ 为变换参数，X为设计矩阵或观测矩阵，β为未知参数向量，e为误差项，需要服从正态分布[14]。然而e通常不服从正态分布，不能直接用于数据分析。因此需要对变量Y进行Box-Cox变换，从而使e服从正态分布。Box-Cox变换自从1964年由Box和Cox提出后已成为一种常用的变换方法[15]。INAL等[9]在使用间接法建立促甲状腺激素和游离甲状腺素参考区间时使用了Box-Cox变换。ARAL等[16]在使用间接法建立凝血酶原时间和活化部分凝血活酶时间参考区间时也使用了Box-Cox变换。Box-Cox变换是针对变量Y进行变换。Y(Y＞0)的变换可以用公式4表示。公式4中的λ为待定变换参数。Box-Cox变换能对不同的λ做出不同的变换，所以它是一种涵盖多种数据变换方式的模型，包括了对数变换、平方根变换和倒数变换等常用变换[14]。在变换过程中，通常采用极大似然法[17]来估计参数λ的值，而λ的值又是由所有样本数据决定的。在实际应用中，经常通过Box-Cox变换来将偏态分布的数据变换为近似正态分布。然而并非任何分布类型的数据都可以通过Box-Cox变换达到正态分布[7]。Box-Cox变换过程中参数λ常取-5～5之间的值。若在此范围中难以找到合适的λ值，一般不考虑使用Box-Cox变换。

三、离群值或错误值的剔除

由于间接法所使用的医院数据中存在错误值的可能性较大，此类错误值(离群值)的存在会对最终获取的生物参考区间造成影响，故应当予以剔除。

所谓离群值是指在数据中与其他数值相比差异较大的值。医学实验中经常出现存在离群值的情况，通常情况下很难准确判断此类数据出现的具体原因。如果将正常值当做离群值剔除，那么必然导致最终获取的参考区间反常缩小;反之，如果大量离群值存在于分析数据中，而相应的离群值剔除手段又没有奏效，必然会引起参考区间的反常扩大[3]。在使用间接法建立生物参考区间的过程中，必须尽力避免这2种情况的出现。由于离群值剔除的方法较多，难以一一详述。近年来的文献主要介绍了以下几种常用的离群值剔除方法。

1.箱式图与茎叶图法箱式图与茎叶图法是基于四分位间距(inter-quartile range，IQR)的一种剔除离群值的方法。该法主要从数据两侧剔除3倍以上的IQR数据。箱式图与茎叶图法可以借助SPSS统计软件轻松实现。软件会计算IQR并自动从两侧剔除3倍以上的IQR数据。这套程序将重复执行直到所有离群值被剔除。如果数据事先经过正态性变换，则需要将数据变换回原先的形式[9]。箱式图的优势在于数据平均水平和变异程度可直观分析比较。然而当离群点较多时，通过箱式图判定离群值会变得困难，而茎叶图则是更好的选择。

2.狄克逊(Dixon)检验法狄克逊检验法最早由Dixon在1953年提出。AITKENHEAD等[18]在使用间接法建立与儿童年龄相关的参考区间的相关研究中采用狄克逊检验法作为离群值的剔除方法。在 EP28-A3c指南中，狄克逊检验法被CLSI推荐作为离群值的剔除方法。狄克逊检验法的具体方法如下:定义R为极差(当前所有值中最大值和最小值之差)，D为可疑值与下一个最值之间差值的绝对值。如果D/R＞1/3，那该值便作为离群值被剔除。但EP28-A3c指南同时指出如果数据同侧同时存在几个相近的异常值时，狄克逊检验法便会因为其互相掩盖而失去效果。当这种情况发生时，实验者需要对离差最小的异常值使用狄克逊检验法进行计算，以保证所有异常值都能被剔除[3]。然而，在 EP28-A3c指南中并未说明使用狄克逊检验法时离差最小的异常值的确定方法[11]。

3.杜奇(Tukey)法杜奇法是 TUKEY[19]在1977年Exploratory Data Analysis一书中首次提出的一种方法。它仅仅使用样本数据中心50%的部分，以此来降低或限制单侧多个相似离群值同时存在而产生的掩盖效应。这种方法需要计算出数据分布的25%和75%百分位点的值(P25，P75)以及IQR，然后计算出上、下2个离群值决定水平:决定上限=P75+1.5×IQR;决定下限=P25-1.5×IQR。任何超出该范围的数据均应被视为离群值。当已发现的离群值被剔除后，应当继续并循环使用本方法直到剔除所有离群值为止[3]。和很多方法一样，杜奇法的使用条件也是样本数据呈正态分布。因此，在数据不呈正态分布的情况下必须对数据进行转化。

4.格拉布斯检验法和肖维纳准则(Grubbs method＆Chauvenet criteria) 在一组测量数据中，如果个别数据偏离平均值很远，那么这些数据可以被称作“可疑值”。我们可以使用格拉布斯检验法来判断此类可疑值是否存在。若将“可疑值”从此组数据中剔除而不参与平均值的运算，那么该“可疑值”就被称作“异常值”(粗大误差)。格拉布斯检验法认为若某测量值(x)对应的残差的绝对值(V)大于均值与s的乘积时应将该数据舍去，见公式 5[20]。KATAYEV 等[21]在使用间接法建立红细胞平均体积、血红蛋白浓度、肌酐、钙、促甲状腺激素的生物参考区间的研究中使用了肖维纳准则剔除离群值。肖维纳准则认为在n个测量值中任一数据与平均值的偏差大到这样程度:凡等于或大于此偏差出现的概率均小于1/2n时(n为样本例数且n≥4)，此数据应舍弃。简而言之，即从概率意义上讲，对于那些误差的可能出现次数小于半次的相应测量值应予以剔除，据此可以得到可舍弃测量值的误差标准，见公式6[20]。格拉布斯检验法是被理论和实验所证明的一种较好的方法。1982年徐中秀在《异常值的处理方法分析及其应用》中曾使用大量模拟数据进行测试，认为相对于肖维纳准则而言，格拉布斯检验法剔除效能更佳[22]。然而，格拉布斯检验法更适用于小样本量的情况;肖维纳准则用于n≥10的测量中较为合理、可靠，所以通常用于样本量较大的情况下。肖维纳准则的最大缺点在于其检验系数缺乏明确的意义[23]。格拉布斯检验法和肖维纳准则的使用都需要分析数据呈正态分布。

式中u为积分变量，可通过查表得知;σ为样本数据的s。

四、生物参考区间的建立方法

1.参数法(parametric method) 参数法估计生物参考区间是指将样本数据与标准误结合起来，确定一个具有较大置信度的包含总体参数的可信区间(confidence interval，CI)。CI由上、下2个可信限(confidence limit，CL)构成。在医学研究中，最常用的置信度为95%[24]。参数法作为估计生物参考区间的经典方法被广泛使用，其具体步骤无需赘述。值得注意的是参数法的使用前提为数据呈正态分布。如果样本数据呈非正态分布，需要选择一种合适的方法对数据进行处理[3]。

2.非参数法(nonparametric method)EP28-A3c指南明确指出非参数法是建立生物参考区间的推荐方法之一。由于参数法的计量水准明显高于非参数法，因此非参数法对样本数量的要求相对较高。根据REED等的建议，使用非参数法进行参考区间研究，最小的可靠观测量为120例。在某些群体中，在某些组别的参考个体(如新生儿、儿童、老年人)不易获得的情况下，收集120例或许会有困难。如果可能的话，允许研究年龄相仿的足够的参考个体。无论获得多大量的参考值，数据仍然应该根据非参数方法分析并根据适当的百分位数报告[3]。对大部分分析物而言，应该选取数据分布的2.5%和97.5%百分位值作为上、下参考限的取值[3]。然而对部分特殊分析物则应当区别对待。以心肌肌钙蛋白(cardiac troponin，cTn)为例，2000年和2007年的对急性心肌梗死重新定义的文件指出cTn临床判断值应取表面健康人群参考区间上限的99%百分位值[25-26]。因此使用非参数法建立cTn应选取数据分布的99%百分位值作为参考限。有学者指出使用非参数法对已剔除离群值的数据建立生物参考区间时或许应当对用于计算上、下参考限的2个百分位点作适当调整。以杜奇法为例:从理论的角度来看，标准正态分布的上、下四分位数分别为 ±0.674 5，因此 IQR 为1.349。而杜奇法的上、下决定限分别为 -0.674 5-1.5×1.349 和0.674 5+1.5×1.349，即 ±2.698。因此，理论上来说只有＞2.698s的数据才能被认为是离群值。换言之，标准正态分布的数据中将有0.7%的数据被认为是离群值而被剔除。因此参考区间必须被增宽。例如如果要计算90%CI的参考区间，那么90%应被调整为90.634%;对于95%CI的参考区间，应当使用 95.67%[11]。

3.罗伯斯特(Robust)法 1998年，HORN等在“A robustapproach to reference interval estimation and evaluation”一文中对罗伯斯特法进行了详尽的阐述。罗伯斯特法是一种介于参数法与非参数法之间的方法[26]，具有类似参数估计的过程并且对样本量没有太高的要求。因为离群值或错误值对该方法的影响较其他方法小，所以该法对于数据形态的要求不如其他的方法严格。正是由于这种特性使罗伯斯特法在非正态分布的数据中同样表现出色[3]。从严格意义上来说，罗伯斯特法是一种小样本估计参考区间的方法，被广泛应用于样本量少于120例的情况中。曾有学者对多种小样本估计参考区间的方法进行比较，最终结果显示罗伯斯特法在95%CI下对参考上限的估计远优于其他方法[27]。虽然罗伯斯特法对于偏态数据同样适用，但是它却对数据的对称性异常敏感，因此使用前必须仔细检查数据的形态，确保样本数据呈对称分布。

4.其他方法近几年来出现了很多将计算机技术整合到间接法建立生物参考区间的尝试。“Reference Value Advisor”是为了方便使用计算机建立生物参考区间，基于Microsoft Excel软件设计的一组免费宏命令插件。Reference Value Advisor是根据EP28-A3c指南中所推荐的方法而设计的一款软件，目前暂时只支持Microsoft Excel 2003及以上的版本。Reference Value Advisor V2.0目前可以在“http://www.biostat.envt.fr/”免费下载[7]。

五、总结

1.现状如今参考区间的使用现状不容乐观。很多医学实验室更倾向于沿用文献或试剂厂商提供的参考区间，并未考虑到这些参考区间的可转化性或这些参考区间本身就是错误的。由于间接法建立生物参考区间具备独特优势，在未来的临床工作中也可能具备较好的应用前景[8]。然而使用间接法建立生物参考区间目前仍然存在争议[9]，其最主要的原因是间接法所使用的数据包含错误值的可能性较大。EP28-A3c指南认为间接法只能对参考区间作出粗略的估计，在条件允许的情况下，仍然首先推荐使用直接法建立生物参考区间[3]。可以这么说，虽然使用间接法建立的生物参考区间和直接法所得到的结果相比可能存在一定偏差，但这比直接采纳厂商提供的参考区间要好得多。另外在利用直接法建立参考区间的过程中，有时会面对部分特殊人群，如新生儿、儿童和老人等，一般很难从此类人群中收集合格且足量的参考个体。样本量的不足将导致参考限的扩大，然而间接法无疑为此类较难研究的人群建立参考区间提供了一种新的机制[10]。

2.展望利用医院数据使用间接法建立生物参考区间并应用于临床至少在理论上是可行的，但首先必须要确保数据来源的可靠性;其次需根据不同方法的具体要求以及数据分布，运用适当的方法对数据加以处理;第三则是使用恰当的方法剔除数据中存在的错误值或是直接将所需值分离。这一步恰恰是间接法的难点所在。如何根据不同项目和不同数据类型选择最合适的方法及最合适的数据量尚无定论。目前很难单独评判每种方法的优劣，只能根据数据量及数据分布并结合每种方法的特点选择一种或多种较为合适的方法来使用。第四是利用预处理的数据选择合适的方法建立参考区间。未来的挑战是如何基于EP28-A3c指南继续完善间接法建立参考区间的相关理论，并将间接法建立生物参考区间更多地运用到日常的临床工作中。

[1]CNAS-CL02.医学实验室质量和能力认可准则[S].

[2]魏有仁.参考值的几个基本问题[J].中国实验诊断学，1997，1(1):44-46.

[3]Clinical and Laboratory Standards Institute.Defining，establishing，and verifying reference intervals in the clinical laboratory;approved guideline-third edition[S].EP28-A3c，CLSI，2010.

[4]GEFFIÉ A，FRIEDRICHS K，HARR K，et al.Reference values:a review[J].Vet Clin Pathol，2009，38(3):288-298.

[5]ARZIDEH F，WOSNIOK W，HAECKEL R.Indirect reference intervals of plasma and serum thyrotropin(TSH)concentrations from intra-laboratory data bases from severalGerman and Italian medical centres[J].Clin Chem Lab Med，2011，49(4):659-664.

[6]CONCORDET D，GEFFRÉ A，BRAUN JP，et al.A new approach for the determination of reference intervals from hospital-based data[J].Clin Chim Acta，2009，405(1-2):43-48.

[7]GEFFRÉ A，CONCORDET D，BRAUN JP，et al.Reference value advisor:a new freewaresetof macroinstructions to calculate reference intervals with Microsoft Excel[J].Vet Clin Pathol，2011，40(1):107-112.

[8]GROSSI E，COLOMBO R，CAVUTO S，et al.The REALAB project:a new method for the formulation of reference intervals based on current data[J].Clin Chem，2005，51(7):1232-1240.

[9]INAL TC，SERTESER M，COSKUN A，et al.Indirect reference intervals estimated from hospitalized population for thyrotropin and free thyroxine[J].Croat Med J，2010，51(2):124-130.

[10]GIAVARINA D，DORIZZI RM，FORTUNATO A.Indirect estimation of pediatric Health Related Limits for serum thyrotropin using the ADVIA Centaur analyzer[J].Clin Biochem，2007，40(15):1143-1149.

[11]HORN PS，FENG L，LI Y，et al.Effect of outliers and nonhealthy individuals on reference interval estimation[J].Clin Chem，2001，47(12):2137-2145.

[12]GRECU DS，PAULESCU E.Quality in post-analytical phase:indirect reference intervals for erythrocyte parameters of neonates[J].Clin Biochem，2013，46(7-8):617-621.

[13]田俊.数据正态性简易判断方法及偏态数据幂变换法[J].中国公共卫生，2003，19(12):1536-1538.

[14]李运明，封宗超，李小凯，等.Box-Cox变换及其在SPSS软件中的实现[J].数理医药学杂志，2009，22(5):569-571.

[15]Li P.Box-Cox transformations:an overview [EB/OL].(2005-04-11)[2013-05-10].http://faculty.mu.edu.sa/public/uploads/1338395987.4587geos-6.pdf.

[16]ARAL H，USTA M，CILINGIRTURK AM，et al.Verifying reference intervals for coagulation tests by using stored data [J].Scand J Clin Lab Invest，2011，71(8):647-652.

[17]茆诗松，周纪芗.概率论与数理统计[M].2版.北京:中国统计出版社，2007:232-239.

[18]AITKENHEAD H，HEALES SJ.Establishment of paediatric age-related reference intervals for serum prolactin to aid in the diagnosis of neurometabolic conditions affecting dopamine metabolism[J].Ann Clin Biochem，2013，50(Pt 2):156-158.

[19]TUKEY JW. Exploratory data analysis. Reading[M].New York:Addision-Wesley，1977:506-506.

[20]杨旭武.实验误差原理与控制[M].北京:科学出版社，2009:62-64.

[21]KATAYEVA，BALCIZA C，SECCOMBEDW.Establishing reference intervals for clinical laboratory test results:is there a better way[J].Am J Clin Pathol，2010，133(2):180-186.

[22]徐中秀.异常值的处理方法分析及其应用[J].系统工程理论与实践，1982，2(1):36-44.

[23]邓勃.关于异常值的检验与处理[J].大学化学，1995，10(4):5-9.

[24]方积乾.医学统计学[M].6版.北京:人民卫生出版社，2009:91-93.

[25]ALPERT JS，THYGESEN K，ANTMAN E，et al.Myocardial infarction redefined-a consensus document of the Joint European Society of Cardiology/American College of Cardiology Committee for the redefinition of myocardial infarction [J].J Am Coll Cardiol，2000，36(3):959-969.

[26]THYGESEN K，ALPERT JS，WHITE HD，et al.Universal definition of myocardial infarction[J].J Am Coll Cardiol，2007，50(22):2173-2195.

[27]HORN PS，PESCE AJ，COPELAND BE.A robust approach to reference interval estimation and evaluation[J].Clin Chem，1998，44(3):622-631.