小波变换-偏最小二乘法用于多组分混合物光度法同时测定
2010-09-04王丽平司圣柱董雄辎
王丽平, 司圣柱, 董雄辎
(合肥师范学院化学化工系,安徽合肥230061)
小波变换-偏最小二乘法用于多组分混合物光度法同时测定
王丽平, 司圣柱, 董雄辎
(合肥师范学院化学化工系,安徽合肥230061)
在波长范围380-600nm测定了藏红、荧光桃红、曙红三种色素混合物溶液的吸光度数据,用小波变换对光谱数据进行处理,然后将小波变换系数用偏最小二乘 (PLS)法进行回归分析。用Daubechies4小波对原始吸光度数据进行一次分解,以低频系数作校正集并用交叉验证法选择主成分数进行PLS建模,获得了令人满意的预测结果。
小波变换;偏最小二乘;色素;分光光度;同时测定
小波变换(WT)是在傅里叶变换(FT)基础上发展起来的数学方法。与 Fourier变换相比,小波变换在时域和频域同时具有良好的局部化特征,能有效地从信号中提取更多的信息。通过伸缩和平移等操作能对信号进行多尺度分析,解决了 Fourier分析不能解决的许多问题,因而被誉为“数学显微镜”。小波分析在化学领域已有很多应用[1]。由于小波分析具有多分辨率分析的能力,因此可以对信号在不同尺度上进行分解,得到原始信号在小波域的不同频率的离散逼近和离散细节。利用吸光度信号的离散逼近代替原始吸光度数据进行多元校正建模,可以压缩数据并降低噪声对校正结果的影响[2-4]。
藏红、荧光桃红、曙红三种色素的可见光谱严重重叠,借助多元校正结合可见光度法可实现对其混合组分进行同时测定[5]。本文将离散小波变换和偏最小二乘回归方法结合对藏红、荧光桃红、曙红混合物的可见光谱数据进行处理,实现了三种组分的同时测定,并取得令人满意预测结果。
1 方法原理
根据离散小波变换(DWT)原理和Mallat算法[6],原始信号C0经 j尺度分解后可表示为:
其中
算子 H和G分别为低通和高通滤波器,Cj和Dj分别为 C0在2j分辨率下的离散逼近(低频系数)和离散细节(高频系数),C0在 j尺度下分解所得到Cj和Dj数据量各为原始数据的1/2j。
由于小波变换是一种线性变换,Cj和Dj是C0在小波空间的线性映射,因此我们可以用较少的小波系数(Cj或Dj)代替原始数据C0进行分析。
偏最小二乘回归的主要目的是要建立一个线性模型:
其中,T和U分别为X和Y的得分,P和Q分别为X和Y的载荷,E和F分别为用偏最小二乘模型拟合 X和Y所引进的误差。偏最小二乘法在同时分解 X和Y时,考虑了U和 T之间的内在线性关系,即在分解矩阵Y时考虑X的因素,而在分解矩阵X时考虑Y的因素。
对于未知样品,由其响应矩阵,利用式(3)关系及校正过程中的 P求出未知样的T,再由U和T间的线性关系求得未知样的U,然后利用校正过程中的Q,由式(4)计算出未知样品的浓度。
由图3可见,定向耦合器1端口的频率为fc的信号由三部分构成:(1)发射机的互调发射信号vt1(t);(2)信号源的互调发射信号vjj(t)经发射机端口反射后的信号,简称为信号源一次反射互调信号vt2(t);(3)发射机的互调发射信号vtt(t)经信号源端口的反射,再经发射机端口反射后的信号,简称为发射机的二次反射互调信号vt3(t).
本文将响应矩阵 X用小波系数替换进行最小二乘建模和预测,使用均方根误差(Root Mean Square Difference,简称 RMSD)和相对预测误差(Relative Error of Prediction,简称REP)评价模型的预测能力。其中,
RMSD、REP越小,模型的预测能力越强。
2 实验部分
2.1 实验仪器
SHIMADZU(苏州岛津)
UV-2550紫外可见分光光度计;
PC-PentiumII个人计算机。
2.2 试剂
藏红、荧光桃红、曙红储备液500ug/ml(二次蒸馏水配制)。
采用正交设计配制3组分染色剂混合溶液,将定量的单一成分溶液分别移入25ml容量瓶中,用二次蒸馏水稀释至刻度,摇匀备用。在波长380-600nm范围内,每隔0.1nm分别测定混合样品的吸光度值(以二次蒸馏水为参比),实验数据用自编Matlab程序处理。
3 结果与讨论
3.1 吸收光谱
由藏红、荧光桃红、曙红的吸收光谱图可知,三种色素的吸收光谱重叠严重,用经典的光度分析方法进行定量分析干扰严重,借助化学计量学方法与光度分析相结合可在不经分离的情况下对各组分进行同时准确定量。
3.2 小波函数的选择
对在波长380-600nm范围内,每隔0.1nm测得的混合样品的吸光度数据进行小波变换处理。试验了Daubechies1~Daubechies10、bior1.1、bior1.3、bior1.5、bior2.2、sym2、sym3、sym4及coif等函数对校正结果的影响,研究发现小波函数对本文所研究的三组分混合物体系的预测结果准确度无明显差异。
图1 三种染色剂的吸收光谱
3.3 主成分数的选择
在用PLS方法建立校正模型时,如何确定建立模型所使用的主成分数是至关重要的。本文采用Cross-validation留一法计算了校正模型的最佳主成分数,对于由12个样品组成校正集(波长范围380-600nm,波长间隔0.1nm)体系的吸收光谱,用Daubechies(db4)进行小波分解所得到的小波系数建模,3种色素的主成分数在5时预测误差平方和(PERSS)达最小,本文选择5因子建立校正模型。
3.4 不同尺度的小波系数对预测结果的影响
为了考察不同尺度的小波系数对预测结果的影响,我们用12个样品作校正集,12个样品作预测集,用C1~C4及D1~D4构成数据矩阵进行PLS回归分析,选用5因子建模时对12个样品预测的RMSD和REP值列于表1中。
表1 不同尺度下WT-PLS法对12个样品中3种组分预测的RMSD和REP值
由表1可以看出,基于C1~C4预测的误差都比较小,而在基于D1~D4的预测误差中,D3和D4较小,D1的预测误差很大,这正说明在小波分析中,小尺度的离散细节中包含更多的随机噪声(频率高),而大尺度的高频系数主要反映信号的频率特征。在本文研究的三组分色素可见分光度同时测定中,选用原始吸光度数据的小波低频系数C1构造分析矩阵进行PLS回归分析。
3.5 合成样品分析
选用原始吸收光谱在1尺度下的小波低频系数(C1)构成分析数据,使用校正样品数为12、主成分数为5进行 PLS建模对藏红、荧光桃红、曙红三种色素的合成样品进行预测,结果列于表2。
表2 WT-PLS法对合成样品的测定结果(主成分数取为5)
由表2可见,藏红的回收率在95.1~109.4之间,荧光桃红的回收率在94.4.00~108.78之间,曙红的回收率在96~103.9之间,而12个样品中3组分的预测相对误差REP分别为4.3%、3.29%、2.35%,结果令人满意。另外,使用小波系数进行PLS建模,不仅可以消除原始信号中的部分噪音而提高预测准确度,而且数据量也得到较大的压缩使计算效率得以提高。由此可见,用WT-PLS法结合可见分光光度分析可为混合食用色素不分离同时测定提供一种新的简便、可靠的方法。
[1] 司圣柱.小波变换方法及其在化学中的应用[J].安徽教育学院学报,2004,113(3):73.
[2] 金继红,陈家玮,张永文.小波变换用于钨和钼的同时光度测定[J].理化检验-化学分册,2001,37(10):443.
[3] 王国庆,王 芳,陈 达,等.近红外光谱技术用于复杂植物样品中无机离子测定的新方法[J].光谱学与光谱分析,2004,24 (12):1540.
[4] 司圣柱,司 娲.小波变换-偏最小二乘法用于三组分食用色素的光度法同时测定[J].分析仪器,2007,No.2,48.
[5] 王丽平,司圣柱.丁爱民,校正变换矩阵法用于多组分染色剂的同时测定研究[J].安徽教育学院学报,2008,No.6,69.
[6] 徐佩霞,孙功宪.小波分析与应用实例[M].合肥:中国科技大学出版社,1996.
Application of Wavelet Transform-Partial Least Square Method to Simultaneous Determination of Multi-components Using Spectrophotometry
WANG Li-ping, SI Sheng-zhu, DONG Xiong-zi
(Department of Chemistry and Chemical Engineering,Hef ei Normal University,Hef ei230061,China)
The absorbance data is determined for ternary mixture solution of safranine,phloxine B and eosin Y within wavelength ranging 380~600 nm,wavelet transform(WT)is then employed to process the obtained data of absorbance spectrum,and finally the partial least square(PLS)regression procedure is performed on the wavelet coefficients.Therefore,the original absorbance spectrum is decomposed with Daubechies4 wavelet transform,and cross-validated with low frequency coefficient as a calibration set to select the optimal number of components modeled on PLS,and the desirable prediction results is obtained.
wavelet transform;partial least square;pigment;spectrophotometry;simultaneous determination
O65
A
1674-2273(2010)06-0083-03
2010-05-10
安徽省高等学校教学研究项目(2008jyxm467),安徽省高校青年教师资助计划项目(2008jqw1125)
王丽平(1963-),女,山东济南人,合肥师范学院化学化工系副教授,研究方向:分析化学,化学计量学的教学及研究。