荧光寿命衰减曲线结合支持向量机的油种识别
2022-04-20景敏陈曼龙丁敏张琦杨帆马祯元
景敏,陈曼龙,丁敏,张琦,杨帆,马祯元
(陕西理工大学机械工程学院,陕西 汉中,723001)
0 引 言
处于稳定的基态或低激发态的原子吸收一定能量的光子后跃迁至不稳定的高激发态,很快会跃迁回低能级,并释放能量,这些能量以光子形式射出,被称为荧光。激光诱导荧光技术是利用激光激发物质产生的荧光信号进行判别的一种监测技术,具有灵敏度高、选择性好的优点。近年来,该技术已在海洋污染监测[1-3]、工业环境监测[4]、食品卫生检测[5]和大气环境监测[6,7]领域推广应用。
石油污染物是环境监测领域海面污染常见的污染源,针对海面石油污染物的传统荧光检测法有荧光强度检测法、荧光光谱分析法和荧光寿命分析法。由于荧光强度易受激发光强、荧光散射角度及环境光等因素的干扰,单纯强度检验法在应用中受到限制,常采用荧光比值法、特征波长强度比值法和双比值联用分类法用以提高分类准确率[8]。光谱分析法常用于多组分体系物质检测中,利用三维荧光光谱分析技术解决测量过程中荧光光谱重叠的问题,目前研究主要集中在利用神经网络技术、主成分分析法、平行因子分析法[9]、小波分析法等[10,11]各类算法实现油种的判别。然而,利用三维荧光光谱法探测难以解决光谱差异较小或“异类同谱”问题。荧光寿命是荧光团在被激发后处于电子激发态的平均时间[12]。它是荧光辐射的倒数,表征着量子产额等于1时的荧光衰减特性,由于不受测量过程中外界因素(如散射角度、环境光强弱等)的影响,利用荧光寿命作为参数进行测量具有良好的稳定性及测量精度。肖雪等[13]针对环境中的多环芳烃污染物采用355 nm激光进行激发,研究污染物的时间分辨光谱特性,成功地利用多环芳烃荧光寿命特性实现了污染物的识别;韩晓爽等[14]提出了基于时间分辨荧光技术与支持向量机模型相结合的原油样品鉴别方法;刘德汉等[15]利用荧光寿命显微成像技术研究了原油密度与平均荧光寿命的相关性,利用荧光寿命参数成功地推算了塔中隆起地区多种类型石油包裹体对应于地面原油的密度。荧光寿命显微成像技术受成像系统硬件性能及光路质量影响较大。近年来,随着更低系统噪声及更高采集效率的超快激光器及高灵敏度探测器的迅猛发展,荧光寿命显微成像系统的采集效率、图像信噪比及测量精度得以迅速提高。但这种提高方法效果有限且成本较高,因此通过改进软件算法来提高探测精度是目前研究趋势。Gao等[16]提出了在基于时域分析的荧光寿命成像技术中采用扩展卡曼滤波算法估计荧光寿命和仪器响应函数的方法;Shao等[17]提出采用神经网络学习建立荧光寿命预测模型,并进行了验证;刘丙新等[18]采用反射光谱数据结合聚类分析的方法针对不同溢油油种进行了判别研究及比较。目前,荧光寿命法用于油种识别检测主要集中在通过研究不同的算法解决低光子数下荧光寿命测量精度问题。
机油对发动机具有润滑作用,它是石油产品的衍生物,主要是由苯、菲、萘、蒽、苯并芘等多环芳烃和卟啉化合物等组成的复杂化合物,这类化合物均具有π电子的不饱和结构及刚性平面结构[19],是良好的荧光发射物质。机油品类繁多,属于多组分化合物,其各组分荧光团荧光光谱彼此重叠,仅用荧光光谱形状难以区分识别。本文结合荧光光谱形状及荧光寿命衰减曲线,提取荧光平均寿命作为特征参数,提出利用荧光寿命衰减曲线结合支持向量机(SVM)进行油种识别的方法,解决在事故判定、内陆水域污染溯源研究等方面机油快速分类识别的问题。
1 荧光寿命衰减曲线测量原理
荧光寿命是分子在能级之间的渡越时间,通常在ns至ms量级,常采用频域法和时域法两种测量方法。频域法也称之为相移法,激发光源采用的是强度按照正弦规律调制的光源,通过比较荧光信号与激发光源的相位差与调制系数来计算被测样品的荧光寿命[20]。用频域法对多组分物质的荧光寿命进行高精度测量时,不仅需要用到已知荧光寿命的样品对系统进行精确标定,还需要对荧光样品中的各组分分别测量,成像速度会受到限制,且操作过程也较复杂。时域法也称作脉冲法,被测样品受到高重复频率超短脉冲激发时会产生荧光强度的衰减,衰减曲线经拟合分析计算得到荧光寿命信息。主要方法有门控探测法、时间相关单光子计数法和条纹相机法等。门控探测法是通过短脉冲激发样品后,观测荧光强度随时间的衰减规律,利用荧光衰减曲线计算荧光寿命。通常在荧光寿命衰减周期内设置两个相同宽度的时间门来实现,时间门开启时间分别设置为t1和t2,通过记录这两个时间门的荧光强度信息I1和I2计算荧光寿命值τ,计算公式为
在实际应用中,双门控采集时经常受探测器存储时间延迟等的影响出现无法采集的现象,常采用多门控探测的方法以解决这一问题[21]。即每一次当样品受脉冲激发后,开启CCD等探测器记录采样窗口时间门内的荧光信息,时间门都在前一次的基础上经过一个延时,这样经过多个采样窗口及多次延时采集,便可以获得真实的荧光寿命衰减曲线。
2 实验方法
由于荧光强度较弱且荧光寿命通常在ns量级,需要利用既具有高增益又具有良好时间控制能力的采集器件。增强型电荷耦合器件(ICCD)利用在普通电荷耦合器件的前端耦合一个图像增强器以实现图像增强的功能,不仅可以提高信号增益,还可以增大ICCD采集的动态范围[22]。考虑到其精准的时间控制能力,这里也选择ICCD作为多门控探测法的主要图像探测器件。
按照图1搭建门控探测法测量润滑油样品荧光寿命参数实验系统。系统激发光源采用波长为1064 nm的ND:YAG脉冲激光器,频率设置为10 Hz。通过倍频技术可以得到355 nm波长的激发光,利用355 nm高反分光镜M1、M2和M3不仅可以调节光的出射方向,还可以通过多次反射滤掉其它波长的光,凹透镜起到扩束的作用,使得355 nm诱导光源均匀地照射样品。系统中,润滑油被激光诱导而产生的荧光被ICCD接收。实验所用ICCD为美国普林斯顿公司生产的PI-MAX3型科研级相机,其具有优良时间控制能力,被广泛应用于微光及遥感探测领域。实验中在ICCD前加装400~500 nm选通滤光片。用一个光电二极管控制触发ICCD同步工作,而光路L1、L2和L3是为了保证激光脉冲与ICCD同步工作设置的光路补偿。利用控制软件设置ICCD门控延时0.2 ns,采样时间200 ns,采样次数1001次。
图1 门控探测法测量荧光寿命系统图Fig.1 System diagram of fluorescence lifetime based on time-gated detection
选取市面所购的昆仑GL-5 85W-90、长城15W-40SFMA200和长城15W-40SGMA300三种摩托车润滑油,为方便描述分别用a、b和c表示。将三种润滑油分别涂抹在不发射荧光的石英比色皿上,得到不同种类的油膜,如图2所示。激光诱导荧光信号通过使用高频率连续脉冲激光不断激发样品油产生,同时利用光电二极管同步触发图像采集器件工作。考虑到图像采集器是一个由若干像素点构成的二维采集阵列,采集的荧光图像中的每一个像素点都可以看作是一个用以记录每一组离散的激光诱导荧光信号的时间通道[23]。完整的激光诱导荧光信号数据由按照时间段采集到的强度信息拼接组成,通过拟合得到随时间变化的激光诱导荧光衰减曲线,根据荧光寿命衰减特点再按照多指数函数拟合。选取不同润滑油按照图1所示系统进行测量,选取荧光图像中相同大小(50 pixel×50 pixel)激发区域荧光强度平均值进行比较,经平滑处理后计算与仪器响应函数的卷积,归一化后处理得到不同润滑油的荧光衰减曲线。研究荧光寿命特点,分别按照不同指数衰减函数对荧光衰减曲线拟合并分析比较,并确定最佳拟合函数。针对不同润滑油样品荧光寿命衰减图像进行研究,分析图像上每一个像素点的强度变化规律。将荧光图像激发区域中每一像素点的荧光强度衰减曲线均按照其对应的最佳多指数衰减函数进行拟合,再考虑到多组分物质总荧光强度应为各组分荧光强度的贡献和[24],通过对不同的衰减曲线进行指数拟合得到相应的指数衰减函数,再计算平均荧光寿命τ,其计算公式为
图2 三种润滑油油膜原图。(a)油a;(b)油b;(c)油cFig.2 Original images of three oil films.(a)Oil a;(b)Oil b;(c)Oil c
式中,假定复杂荧光体系由m个荧光组分组成,Ai是各荧光组分的相对浓度拟合值,τi为各荧光组分的荧光寿命拟合值。
实验所考察三种不同润滑油,按照上述方法确定计算每个点的平均荧光寿命,最后求激发区域的平均荧光寿命的平均值及其标准差,统计激发区域每个点平均荧光寿命值落在95%置信区间内的比例,具体计算参数如表1所示。
表1 三种润滑油平均荧光寿命参数表Table 1 Average fluorescence lifetime parameters of three oils
荧光寿命成像技术还可以用于描述不同润滑油二维空间分布。实验研究的a、b、c三种润滑油,分别按照单指数、单指数、双指数衰减函数拟合的方法得到其荧光寿命分布图谱,利用伪彩色图表示如图3所示。
图3 三种润滑油的荧光寿命图。(a)油a;(b)油b;(c)油cFig.3 Fluorescence lifetime maps of three oil films.(a)Oil a;(b)Oil b;(c)Oil c
结合表1和图3可以看出,三种润滑油a、b、c的平均荧光寿命均不同,不同的荧光寿命值代表不同的润滑油种类,利用平均荧光寿命参数作为特征参数可以区分油种类。选取95%的置信概率,统计三种润滑油激发区域内荧光寿命值分别落入各自置信限内的概率,结果显示分别为68%、86%和87%。实验结果表明,利用荧光寿命衰减曲线按照多指数衰减函数进行拟合分析从而计算平均荧光寿命的方法可行且有效[25]。利用荧光寿命参数绘制的荧光寿命图谱同时也可以显示荧光物质的二维空间分布。
3 利用SVM进行油种识别
SVM是一种新型机器学习方法,它以统计学习理论为基础,其基本思想就是寻找一个分类超平面,既能分离两类样本又使两类分隔距离最大。SVM核心思想是采用特征映射的方法,将低维特征向量空间集映射到高维特征向量空间以解决分类划分问题,但计算复杂度会随着维数的增加而迅速增大,因此关键是核函数的选择[26,27]。
核函数可以解决线性分类到非线性分类问题,是SVM算法中解决维数灾难问题的核心。目前常采用的核函数种类有[28]:线性核函数K(x,y)=xty,此时SVM得到的是样本空间中的超平面;径向基(RBF)核函数K(x,y)=exp(-γ‖x-y‖2),式中γ为表征核函数宽度的参数;多项式核函数K(x,y)=(αxty+1)d,此时得到的是d阶多项式分类器;Sigmoid核函数K(x,y)=tanh(αxty+β)。选择核函数的依据是增加分类超平面与支持向量之间的距离,既要增大高维空间的可分性又需要尽量避免计算量增大。
在研究的三种润滑油荧光寿命序列图像中,图像上的每一个像素点都代表一个独立样本,记录该点随时间变化的荧光强度信息。选取图片上相同大小(100 pixel×100 pixel)的范围作为研究区域,并选取平均荧光寿命作为特征矢量进行SVM的识别。实验中,训练集选取每种润滑油样本的前50个数据,其余的特征量作为测试集,分别用四种不同核函数对选取的相同样本集和测试集进行对比识别实验。
首先,基于荧光平均寿命特征向量验证选取不同核函数的SVM识别实验,实验结果见表2。所有核函数中,松弛变量取0.001,惩罚因子取10。由表2可以看出,线性核函数、RBF核函数、多项式核函数和Sigmoid核函数4种核函数均有较高的识别正确率,均在67%以上。而通过运行速度比较发现,采用Sigmoid核函数识别速度最快。综合考虑识别正确率与速度,结果发现采用RBF核函数具有最高的分类识别正确率且识别速度较快。
表2 基于荧光平均寿命不同核函数比较识别结果Table 2 Comparison of recognition results of different kernel function based on fluorescence mean lifetime
其次,分析基于径向基核函数的支持向量机不同样本数比较。选取采集的三种油样品的荧光寿命序列图像研究,在每种样品受激区域内任选4组结果作为训练样本,训练样本数分别取50、100、500和1000,测试样本为任意选取每种油样中的100个像素点的数据。采用径向基核函数的支持向量机分类方法对以上4组不同样本数的数据进行分类比较分析,惩罚因子及核函数宽度都取为256,结果如表3所示。
表3 基于RBF核函数的支持向量机不同样本个数比较Table 3 Comparative result of different sample sizes based SVM method with RBF kernel function
可以发现,可以利用支持向量机的方法对不同润滑油分类识别,且采用RBF核函数时有较好的识别率;通过采用不同样本数识别对比发现,该方法适用于分类时训练样本数较少的情况。
4 结 论
以摩托车润滑油为例,分析了多组分化合物的荧光特性,探讨了利用门控探测法获取荧光寿命衰减曲线的方法。结合非线性最小二乘回归的思想,提出利用多指数函数衰减拟合荧光寿命曲线,计算平均荧光寿命并绘制荧光寿命图谱;提出利用荧光平均寿命作为特征向量结合支持向量机进行油种识别的方法,并对不同核函数及样本数进行了实验验证。实验结果表明,荧光寿命参数不仅可以作为物质识别的特征向量,而且利用荧光寿命参数绘制的荧光寿命图谱还可以显示荧光物质的二维空间分布;利用支持向量机结合荧光平均寿命作为特征向量的油种识别方法可行,RBF核函数在样本数较少的情况下也具有较好的识别率。提出的利用荧光衰减曲线拟合荧光平均寿命参数的方法不仅适用于润滑油荧光特性的研究,也适用于多组分化合物荧光特性分析,提出了利用荧光平均寿命作为特征向量结合支持向量机的油种识别方法,为利用主动诱导荧光检测进行油类污染物痕量识别及溯源研究奠定了基础。