APP下载

血细胞特性曲线拟合方法的研究

2014-06-07孙少杰

计算机工程 2014年10期
关键词:曲线拟合血细胞分析仪

孙少杰,龙 伟,仝 建,李 蒙

(南昌大学信息工程学院,南昌330031)

血细胞特性曲线拟合方法的研究

孙少杰,龙 伟,仝 建,李 蒙

(南昌大学信息工程学院,南昌330031)

针对血液分析仪对血细胞各个参数检测线性偏差较大的问题,提出一种血细胞特性曲线分段拟合算法。根据血液分析仪检测值与理论值的对应关系,针对不同段的数据,进行分段线性拟合,再根据2条线性曲线段衔接处的3个数据点,采用最小二乘法多项式拟合算法进行过度曲线拟合,实现不同线性段间的平滑过渡,从而避免不同曲线交叉点的跳跃现象。实验结果表明,该方法简单、实用,拟合后的血细胞线性偏差优于血液分析仪行业标准的要求,满足临床应用的需要。

血细胞检测;分段曲线拟合;最小二乘法;血液分析仪;线性偏差;数据采集

1 概述

血液分析仪是通过对血液标本的检测,对血液中有形成分进行定性、定量分析,并提供相关信息的仪器[1]。目前的血液分析仪大多采用电阻抗法原理对单位体积血液中所含白细胞、红细胞、血小板个数进行计数[2-3]。理论上单位体积血液中所含细胞个数与浓度呈线性关系。然而,受试剂、数据采集、样本浓度、采样负压等综合因素影响,测试结果与临床应用结果不符[4],难以满足行业标准对线性偏差的要求。因此,需要对血细胞曲线进行线性拟合,对测试的实际值进行校正,从而切实反映符合临床应用的结果。

目前,常用的曲线拟合方法有:最小二乘法(Least Square Method,LSM)曲线拟合,NURBS曲线拟合,BP神经网络拟合算法,RBF神经网络拟合算法,遗传算法拟合算法等[5]。总体上曲线拟合方法可分为2类:(1)由与数据的背景资料规律相适应的解析表达式约束的曲线拟合(主要是最小二乘法拟合);(2)由几何算法或神经网络的拓扑结构确定数据关系的曲线拟合(主要是神经网络拟合)。前者适用于处理具有严谨数学基础的线性问题,工程应用较多、拟合后的算法简洁,较适用于需对数据进行实时处理的情况;后者多用于处理复杂的非线性问题,但由于没有理论曲线模型的限制,从而不能直接用于对理论模型有严格要求的曲线拟合问题,并且网络结构的选择和处理结果具有一定的主观性[6-7]。另外,神经网络曲线拟合算法复杂,运算处理时间长,难以应用于需对大量数据进行在线实时处理的系统中,多应用于实验室理论研究。

目前各血液分析仪生产厂家对血细胞特性曲线的拟合没有公开统一的方法,部分厂家采用分段直线拟合,问题是分段拟合线段的直线斜率不一样,当一个标本值在2条线段的交点附近时,存在明显跳动,即2次测试的结果分别落在2个线段范围内时,结果差异比较大。

针对上述方法的缺陷,本文根据单位体积血液中所含细胞个数与浓度呈线性关系这一特点,采用最小二乘法对血细胞特性曲线进行分段线性拟合,并对不同段的拟合曲线交叉点进行平滑处理,避免了交叉点附近的数据跳跃现象。

2 LSM分段拟合原理

2.1 LSM多项式拟合原理

最小二乘法多项式拟合是按偏差平方和最小的原则选取拟合曲线的方法[8-10]。对给定的数据(xi, yi)(i=0,1,…,m),求一个n(n≤m)次广义多项式:

其中,pn(x)为n次广义多项式;ak为多项式xk的系数;k为0,1,…,n,且n≤m。

使误差ri=pn(xi)-yi(i=0,1,…,m)的平方和最小,即:

其中,I为误差平方和;ri为xi点的理论值与真实值的误差;pn(xi)为xi点的理论值;yi为xi点对应的真实值;min为最小。

满足式(2)的pn(x)称为最小二乘法拟合多项式。特别的,当n=1时,称为最小二乘法直线拟合或线性拟合。式(2)是关于参数a0,a1,…,an的多元函数,可转变成为求I=I(a0,a1…,an)的极值问题。由多元函数求极值的必要条件,得:

式(4)是关于a0,a1,…,an的线性方程组,用矩阵表示为:

式(5)称为正规方程组或法方程组。

方程组式(5)的系数矩阵是一个对称正定矩阵[11],故存在唯一解。从式(5)中解出 ak(k=0, 1,…,n),从而可以求得多项式式(1)的解。

在实际应用中,n<m或n≤m;当n=m时所得的拟合多项式就是拉格朗日或牛顿插值多项式。

2.2 分段点选取方法

分段点选取对分段曲线拟合至关重要,且分段数据段的长短直接影响拟合后的计算数据与理论数据之间的相关性。数据段越短、分段越多,则计算后的数据与理论数据之间的相关性越高,但此时数据段点之间的分段点增加,运算过程中判断条件复杂,不利于血液分析仪实时性要求。本文根据实际测试数据曲线的特点,将其分成2段进行拟合。然后用分段点及其前后2个点进行过度曲线拟合。

3 血细胞LSM线性曲线分段的拟合方法

3.1 血液分析仪线性偏差的检测方法

临床检验中对血液分析仪线性偏差的检验,通常采用将高值质控或标本稀释5个浓度,依次将稀释后的5个浓度在仪器上各测试3次,用各浓度3次测试的平均值通过回归方程计算其线性偏差的方法,来评估仪器对各参数检测的线性程度[1]。本文以血小板为例进行血小板线性曲线分段拟合,白细胞、红细胞的线性曲线分段拟合方法与血小板方法相同。

3.2 基础实验数据的获取

为了更准确地反映血小板测试值与理论值的对应关系,将高值质控品样本稀释12个浓度,将稀释后的样品标本,从高浓度到低浓度依次在待拟合曲线的血液分析仪样机上进行测试,每个浓度标本测试3次,记录仪器所采集的血小板细胞个数。根据高值质控品的靶值,分别计算12个浓度样本的理论值。血小板测试值与理论值如表1所示,血小板单位为109个/L。

表1 各浓度样品理论值与测试值数值

3.3 血小板线性曲线分段拟合

3.3.1 分段数据点的选取

根据表1血小板理论值与测试平均值,画出以测试平均值为自变量x,以理论值为因变量y的曲线图,如图1所示。

图1 血小板测试平均值与理论值对应散点

根据图1曲线图趋势,可在第9个数据点将整条曲线分成2段,根据2段数据分别拟合为不同的多项式曲线。经数据分析后可知,拟合多项式的次数越高越能反映血小板的实际曲线,但根据实际计算后发现,3次以上的曲线比3次曲线改善不大,而低于3次多项式的曲线拟合后的线性偏差较大,因此,对2段数据曲线的拟合均采用3次多项式,故拟合多项式的次数n=3。

3.3.2 第1段数据段拟合

设第1段数据段多项式为:y1=a0+a1x+a2x2+a3x3,根据式(5)可得正规方程组为:

求解式(6)可得:a0=-0.623,a1=1.033,a2= -6.9E-4,a3=3.83E-6。因此,拟合后的多项式应为:

根据血小板测试结果为整数值的特征,最终拟合后的第1段曲线为:

3.3.3 第2段数据段拟合

设第2段数据段多项式为:y2=b0+b1x+b2x2+b3x3,根据式(5)可得正规方程组为:

求解式(9)可得:b0=0.000 1,b1=-2.777,b2=0.025,b3=-3.955E-5。因此,拟合后的第2段曲线多项式应为:

3.3.4 分段点过渡曲线的拟合

为了保证2段曲线交叉点附近的数据点在2段曲线上平滑地过渡,利用第60%,70%,80%这3个点拟合一条3次多项式过渡曲线。设过去曲线多项式方程为:

根据式(5)可得正规方程组为:

求解式(11)可得:c0=-6.48E-14,c1= 5.086,c2=-0.033 68,c3=7.068 7E-5。因此,拟合后的第2段曲线多项式应为:

3.3.5 曲线交点的求解

根据式(8)、式(10)、式(12)可求得式(8)与式(10)的交点为x1=232,式(10)与式(12)的交点为x2=258。即:

(1)当x≤232时,y1=1.033x-0.000 69x2+ 0.000 003 836x3;

(2)当 232<x<258时,y2= -2.777x+ 0.025x2-0.000 039 55x3;

(3)当x≥258时y3=5.086x-0.033 68x2+ 0.000 070 687x3。

血小板测试平均值经过拟合后的曲线计算结果如表1中拟合后的测试平均值所示,血小板线性曲线拟合前后测试值对比曲线如图2所示。

图2 血小板线性曲线拟合前后测试值对比曲线

由图2可知,稀释后的高值质控样本,每个浓度对应的理论值应该为一条直线,而实际的测试结果在40%的浓度点开始逐渐低于理论值,达不到临床测试要求。拟合后的测试平均值曲线,基本与理论值直线重合,且其相关系数R=0.994,接近于1,所以拟合程度较好[12],满足了临床测试要求。

4 血细胞线性曲线线性误差及临床应用验证

在拟合好血小板线性曲线后,用拟合后的曲线分别在4台仪器上进行线性偏差的验证。按《YY/ T0653-2008血液分析仪》线性测试方法,用高值质控品稀释5个浓度,分别是100%,75%,50%,25%, 10%。然后按浓度从高到底的顺序依次在准备好的4台试验仪器上进行测试,每个浓度测试3次,用回归方程计算其线性偏差,线性偏差结果如表2所示。行业标准对仪器的要求为:测试值范围PLT>100时,偏差要求<10%,测试范围PLT<100%时,偏差要求<10。

由表2可知,血液分析仪行业标准对血小板线性偏差的要求为:当血小板个数大于100×109个/L时,偏差要求不超过±10%;当血小板个数小于100× 109个/L时,偏差要求不超过±10×109个/L。4台样机的血小板测试值,经过拟合的3次多项式计算后,线性偏差最大值为-3.44×109个/L,线性偏差结果优于血液分析仪行业标准要求,满足了仪器对血小板线性的要求。

为验证拟合曲线后的临床测试效果,分别用医院的样本在拟线后的4台仪器上进行了测试,并计算了其可比性,测试数据如表3所示。

表2 线性曲线验证结果及行业标准线性偏差要求

表3 拟合后的血小板线性曲线临床标本验证对比

由表3结果可知,血小板的测试值随着血小板靶值的不同而变化,可明确区分出血小板值小于100×109个/L及血小板值大于300×109个/L的非正常标本[13]。根据血液分析仪行业标准要求,血小板在100×109个/L~300×109个/L之间的可比性不超过±8%,由表3中4台仪器可比性可知,其中可比性最大值为3.60%,可比性优于血液分析仪行业标准要求,满足了临床测试要求。

5 结束语

随着血液分析仪的普及,临床应用对仪器的各方面性能要求越来越高。血液分析仪对各个参数检测的线性与否直接影响医生对患者的病情判断,因此,提高仪器的线性有很大的现实意义和临床意义。本文根据血液分析仪检测值与理论值的对应关系,针对不同段的数据,进行分段线性拟合,再根据2条线性曲线段衔接处的3个数据点,采用最小二乘法多项式拟合算法进行过度曲线拟合,实现不同线性段间的平滑过渡,从而避免不同曲线交叉点的跳跃现象,很好地解决了血液分析仪血细胞检测线性偏差大的问题。通过实践证明,拟合后的曲线有效地提高了血液分析仪对各个血细胞参数检测的线性偏差,优于血液分析仪行业标准《YY/T 0653-2008血液分析仪》要求,且满足了临床测试要求,同时,拟合后的算法简洁,适用于不同的仪器。

[1] 国家食品药品监督管理局.中华人民共和国医药行业标准YY/T 0653-2008:血液分析仪[S].2008.

[2] Davies R,Karuhn R,Graf J.Studies on the Coulter Counter Part II:Investigations into the Effect of Flow Direction and Angle of Entry of a Particle on Both Particle Volume and Pulse Shape[J].Powder Technology,1975,12(2):157-166.

[3] 乐家新,周建山,兰亚婷.血细胞分析仪检测原理[J].中华检验医学杂志,2004,27(3):205-208.

[4] 张春光,黄民双.血细胞计数分析仪的信号处理[J].自动化与仪器仪表,2000,(3):27-29.

[5] 平书伟.关于曲线拟合的方法探讨[J].机电信息, 2011,(12):112-113.

[6] 乔立山,王玉兰,曾锦光.实验数据处理中曲线拟合方法探讨[J].成都理工大学学报:自然科学版,2004,31 (1):91-95.

[7] 贾丹丹,李 宏.基于神经网络和小波分析的血细胞识别算法[J].计算机应用与软件,2009,26(8):29-31.

[8] 吕 游,刘吉臻,赵文杰,等.基于分段曲线拟合的稳态检测方法[J].仪器仪表学报,2012,33(1):194-200.

[9] Waterhouse W C.Gauss’s First Argument for Least Squares[J].Archive for History of Exact Sciences, 1990,41(1):41-52.

[10] 田 垅,刘宗田.最小二乘法分段直线拟合[J].计算机科学,2012,39(6):482-484.

[11] 王 刚,杨洪耕.基于最小二乘法的正交多项式级数在谐波估计中的应用[J].继电器,2006,34(12): 25-29.

[12] 谢印忠,庄松林,张保洲.基于线阵CCD的光谱仪定标研究[J].仪器仪表学报,2011,32(3):546-550.

[13] 叶应抚,王毓三,申子瑜.全国临床操作检验规程[M].3版.南京:东南大学出版社,2006.

编辑 顾逸斐

Research on Blood Cells Characteristic Curve Fitting Method

SUN Shao-jie,LONG Wei,TONG Jian,LI Meng
(School of Information Engineering,Nanchang University,Nanchang 330031,China)

According to the linear deviation problem of blood cells parameters detection for the hematology analyzer,a piecewise curve fitting method of blood cells is put forward in the paper.Based on the one-to-one relationship between the original value for all kinds of blood cells which are detected by the hematology analyzer and the theoretical value,for piecewise linear fitting according to the data of different period.In order to avoid the jump phenomena of different curve intersection,using three data points of the two linear curve segment intersection to fitting polynomial by Least Square Method(LSM),to realize the smooth transition between different linear segment.Experimental results show that the algorithm is simple,practical and the fitting curve linear deviation is better than the requirements of hematology analyzer industry standard.In addition,it can fully meet the needs of the clinical application.

blood corpuscle examination;piecewise curve fitting;Least Square Method(LSM);hematology analyzer; linear deviation;data acquisition

1000-3428(2014)10-0287-05

A

TP273

10.3969/j.issn.1000-3428.2014.10.053

国家自然科学基金资助项目(61261011)。

孙少杰(1987-),男,硕士,主研方向:计算机控制,嵌入式智能仪表技术;龙 伟,教授;仝 建、李 蒙,硕士。

2013-08-28

2013-11-12E-mail:bluesnowssj@163.com

中文引用格式:孙少杰,龙 伟,仝 建,等.血细胞特性曲线拟合方法的研究[J].计算机工程,2014,40(10):287-291.

英文引用格式:Sun Shaojie,Long Wei,Tong Jian,et al.Research on Blood Cells Characteristic Curve Fitting Method[J]. Computer Engineering,2014,40(10):287-291.

猜你喜欢

曲线拟合血细胞分析仪
Sievers分析仪(苏伊士)
一种用于深空探测的Chirp变换频谱分析仪设计与实现
施氏魮(Barbonymus schwanenfeldii)外周血液及造血器官血细胞发生的观察
血细胞分析中危急值的应用评价
沙塘鳢的血细胞分析
曲线拟合的方法
基于曲线拟合的投弃式剖面仪电感量算法
Matlab曲线拟合工具箱在地基沉降预测模型中的应用
Matlab曲线拟合法在地基沉降预测中的应用
全血细胞分析仪配套操作台使用体会