APP下载

临床生化检验反应面法中的统计学介绍*

2015-01-27刘春龙孙慧颖韩玉霞陈宝荣

中国卫生统计 2015年5期
关键词:生化检验因子

刘春龙 陈 龙 孙慧颖 胡 滨 韩玉霞 陈宝荣△

临床生化检验反应面法中的统计学介绍*

刘春龙1陈 龙2孙慧颖1胡 滨1韩玉霞1陈宝荣1△

临床生化检验各项目的测量结果受到很多因素的影响,尤其在酶学测量领域,如波长、温度、湿度、pH、孵育时间、延迟时间、测量时间等都会对最终检验结果有不同程度的影响。这些影响因素的一个或多个发生变化时,都会影响到最终检验结果的准确性,因此,在方法学性能研究时,一般需进行实验条件的摸索,研究各种因素对检验结果的影响,并使各影响因素处于最佳状态是方法学研究的主要目的。检验界常常习惯于采用固定其他条件,变化一种影响因素来判断变化因素的最佳测量条件,即单因素分析法。然而单因素分析法的前提条件是各影响因素之间不存在交互作用。然而,几乎每一个测定程序都存在各因素间的交互作用。临床生化检验反应面法(RSM)能够很好地反应各影响因素的交互影响,是一种经典的多因素分析方法,可作为传统的单因素分析法的补充。在IFCC公布的参考测量程序中,几乎每个测量程序均有RSM分析的结果和等高线图,RSM的重要意义可见一斑。本文从RSM及相关术语的介绍、RSM的建模原理、RSM模型的拟合及预测性能评价、RSM模型的优化四个方面进行阐述并对RSM中的统计学进行介绍。

RSM及相关术语的介绍

RSM是通过实验数据的识别分析,建立合适的反应面模型的多因素分析方法,其需要统计学实验设计的基础、回归模型的技术和因素优化的方法[1]。RSM由数学和统计学技术结合实验数据,通过建立一阶或者多阶函数,直至反应条件得到优化[2]。RSM常与响应、影响因子、因子水平、最速上升路径法等紧密相关。在临床生化检验中,响应是指检验结果,检验结果是对各个测量条件的响应;影响因子即影响因素,是对检验结果的最终判定产生作用的测量条件,如某个测量程序中的波长、温度、pH、缓冲体系等;因子水平是指影响因子的取值,取值一般应成一定的比例。影响因子的数量和因子水平数直接关系到RSM设计方式的选择,进而影响最终建立模型的预测性能。最速上升路径法又称爬坡实验,由于反应曲面拟合方程只有在考察的临近区域里才能充分近似真实情况,所以应先找到其最佳区域,即通过各影响因子不同水平的取值,在最短的路径下到达响应值附近。

RSM的建模原理

假设某临床生化检验项目的测量结果为y,对y起决定作用的重要影响因子有n个,分别为x1、x2、x3、…、xn。影响因子的确定可以根据经验,若不能确定各因子的影响大小,可采用单因素分析法进行实验后判定其是否为该项目的重要影响因子[3]。确定了影响因子后,即可进行实验设计。假设进行了m次实验。实验数据表示为:

第1次试验:y1⟺x11,x21,…,xn1

第i次试验:yi⟺x1i,x2i,…,xni

第m次试验:ym⟺x1m,x2m,…,xmm

根据实验结果,建立RSM模型,即建立测量结果与影响因子之间的关系。任何函数都能用多项式拟合来近似,并且只要多项式的次数适当,近似的准确度就能达到最佳,因此测量结果与影响因子之间的关系必然可以采用多项式来进行模拟。

欲找出反应和独立变量之间适当的近似函数,通常利用独立变量在一些范围里的低阶多项式近似,即为一阶模型(first-order model),如果系统中有曲率,则必须利用较高阶的多项式,如二阶模型(second-order model)。当二阶模型仍不具有较好的拟合度时,可采用三阶以上模型进行拟合。在临床生化检验中,一般采用二阶模型即可。其函数式分别表示为:

得到回归方程后,通过对x1、x2、x3、…、xn的合理取值求得y最佳值,即达到RSM分析的目的。建立了各种影响测量的因素(x1、x2、x3、…、xn)如pH、温度、波长等与测量结果的函数关系。RSM不仅考虑了各影响因子对曲线线性的影响,也考虑了不同影响因子间的交互作用和曲率影响。这种多项式拟合法有一个缺陷,即当因素较多时,如果所选多项式次数较高,会导致计算量很大、需要的实验数据很多。常用的RSM设计方式有3k因子设计,Box-Behnken实验或中央合成设计实验(central composite design,CCD)[4]。

RSM模型的预测及拟合性能评价

对于RSM模型的性能评价,一般可以分为两方面,一方面是模型中参与拟合的所有实验点的拟合度;另一方面为对未进行实验的实验结果的预测准确度。

关于RSM模型的拟合度一般通过决定系数R2来进行判断,R2越靠近1则表示拟合效果越好。目前在建立模型时,一般采用SAS、Minitab等软件,检验水准α一般设置为0.01或0.05等,拟合时应注意观察分析结果中的失拟项的P值,失拟项的P值应大于等于0.05,否则应增加实验,进行二次因子设计。建立RSM模型的目的是为了预测其他实验条件组合下的测量结果,为评价模型的准确度,必须通过验证实验进行判断,即按一定规律选取若干条件,使用RSM模型进行理论值预测,同时进行实际值的测量(至少包含高、中、低三水平),再将两者进行比较。一般认为,若相关系数R2和失拟项的P值满足条件,且验证实验符合实验室要求,则认为成功建立了该项目的RSM模型。特别说明的是,符合上述标准,仍然是比较粗的预测,若要进一步细化,还需要进行假设检验。但由于生化反应本身的复杂性,如基质效应的存在等,在生化检验项目的条件摸索中,笔者认为通过比较模型的决定系数R2,失拟项的P值及验证实验是否成功即可判断模型的优劣。

RSM模型的优化

在临床生化检验方法学开发研究中,RSM模型成功建立后,最重要的是依据该模型对实验条件进行优化,以达到最佳的响应。假设检验结果y越小越好,选择一个中心点,并在其附近取多个实验点进行实验,得到相应的测量结果,建立回归方程,通过求导的方式得到一个向量(方向),实验点沿该方向变化时(沿该方向再取很多实验点),响应值变小的最快;当响应值开始变大时,取前一个实验点为第二个设计点,再重复上面过程,最终得到使y最小的实验点(因素的水平组合)。这是二次因子设计的基础,重复该过程,直到优化后的条件满足实验室的预期测量要求。在SAS、Minitab等软件中均有设计好的优化器,通过在优化器中设置相应的参数,即可得到优化后的预测结果,但值得注意的是,此时确定影响结果的条件后,应再次进行验证实验,以确定预测误差在实验室可接受范围内。

结 语

RSM作为经典的多因素分析法,已在国外临床生化检验领域发挥举足轻重的作用,但在我国检验领域,其应用仍不多见。在新方法、新技术的研发中,RSM可以节约大量的人力、物力、财力。本文对RSM进行了全面的介绍,尤其对RSM中的统计学进行了介绍,旨在帮助读者合理采用RSM进行方法学性能研究,特别是实验条件的摸索,建立适合自己实验室各检验项目测量程序的RSM模型。

[1]Raymond H,Douglas C,Christine M,et al.Response surface Methods OLOGY.America:A John Wiley & Sons inc,2009:1-6.

[2]Bezerra MA,Santelli RE,Oliveria EP,et al.Response surface Methods ology(RSM)as a tool for optimization in analytical chemistry.Talanta,2008,76(5):965-977.

[3]Bota A,Gella FJ,Canalias F.Optimization of adenosine deaminase assay by response surface Methods ology.Clin Chim Acta,2000,290(2):145-157.

[4]刘春龙,金仁玲,孙慧颖,等.临床生化检验反应面法(RSM)及其常用设计方式浅析.临床检验杂志,2014,32(4):317-318.

(责任编辑:郭海强)

*国家高技术研究发展863计划(2011AA02A111);国家质检总局公益项目(201210066)

1.北京航天总医院检验科(100076)

2.北京航天科技集团有限公司

△通信作者:陈宝荣,E-mail:jyk711@sina.com

猜你喜欢

生化检验因子
序贯Lq似然比型检验
因子von Neumann代数上的非线性ξ-Jordan*-三重可导映射
一些关于无穷多个素因子的问题
2021年《理化检验-化学分册》征订启事
影响因子
影响因子
从废纸篓里生化出的一节美术课
对起重机“制动下滑量”相关检验要求的探讨
谁是半生化人
《生化结合治理白蚁》