用于光谱分类的光谱峰谷沿匹配算法*
2010-09-20贾丽萍张太宁王湘晖常胜江南开大学现代光学研究所天津30007石家庄经济学院石家庄05003
陈 扬 贾丽萍 张太宁 郭 澎 王湘晖 常胜江(南开大学现代光学研究所,天津 30007(石家庄经济学院,石家庄 05003
用于光谱分类的光谱峰谷沿匹配算法*
陈 扬1)†贾丽萍2)张太宁1)郭 澎1)王湘晖1)常胜江1)
1)(南开大学现代光学研究所,天津 300071)
2)(石家庄经济学院,石家庄 050031)
(2009年3月9日收到;2009年4月29日收到修改稿)
针对超短脉冲激光与气体相互作用产生的非线性荧光光谱的特点,提出了一种新的光谱去噪、特征提取、特征匹配的有效方法.通过对三种气体不同浓度的荧光光谱进行小波压缩去噪,得到5层664个小波系数,重构后获得除噪效果满意而特征信息保持不变的光谱.对重构后的光谱进行光谱峰/谷沿相似度的分析,构造了三种气体的特征谱.在此基础上,经对三种气体光谱进行特征峰/谷沿的匹配分析,提出一种利用同种物质不同浓度下的光谱总体相似度来构造标准特征谱新方法,通过与标准特征谱的匹配分析得到分类结果.实验结果表明,该算法的分类结果受浓度变化影响小,对低至0.05%浓度条件下的全部27条光谱均获得100%的分类识别结果.
非线性荧光光谱,特征匹配,光谱峰谷沿
PACC:4230S,3350D
1.引言
随着工业的发展,大气污染问题已经成为人们关注的焦点,为更好地检测和治理污染,有必要对大气状况进行实时监测.传统的湿式化学技术以及后续发展起来的气相色谱法[1]、质谱和色谱联合技术[2]等是以吸气取样后的实验分析为基础,不具备实时和连续监测能力.近些年,基于差分光学吸收光谱技术、傅里叶变换红外光谱技术以及差分吸收激光雷达技术[3,4]等光学和光谱学方法以其大范围、高灵敏度、多组分的在线检测能力而成为大气环境监测的主要技术手段.但由于这些技术需要瞄准光源安装探测系统或使用角反射器,因此只能在固定的场合使用.
近几年,超短脉冲激光与大气相互作用产生荧光光谱[5—7]现象引起了人们的重视.由于自聚焦效应,超短脉冲激光在空气中传输时会形成等离子体通道,即成“丝”现象出现,丝状脉冲光场内的高密度能量使生化污染物分子发生非线性电离和解离,产生具有分子光谱特性的荧光光谱[8—10],这些光谱可以作为分子指纹模式加以识别,从而得到大气中污染气体的成分和浓度.同已有的光学或光谱学环境监测方法相比,超短脉冲激光技术具有三个明显的优势:1)“丝”状光场是一个稳定的脉冲光场,污染气体分子释放的荧光光谱具有很好的稳定性和可重复性;2)超连续谱分布(加上展宽的三次谐波光谱后光谱范围为250 nm至几个微米)的“丝”状脉冲光场可同时满足所有污染气体激发荧光的需要,因此使用单个激光器就可满足多种气体监测要求;3)可以把激光光源与遥感探测系统集成为一体形成车载、船载或机载系统,可实现对任意地点的大气环境进行实时监测,因此它的机动性很强,潜在的应用领域更广.目前,该方法在环境监测中应用的主要困难是缺乏光谱分析的有效方法,由于非线性荧光光谱的产生涉及的非线性效应较多,且同时测量多种污染气体,这些污染成分的荧光光谱相互影响,产生交叠,出现光谱强度与气体浓度之间复杂的非线性关系,采用传统的光谱分析方法分析上述光谱存在很大难度,解决这一问题的有效方法是研究和探索新型的光谱分析技术.
传统光谱分类方法,依据光谱形态可以有导数光谱分析、波峰/波谷总数、波峰/波谷宽度、波峰/波谷斜率等各种分析方法[11,12].由于受噪声干扰,飞秒脉冲激光与大气相互作用产生的荧光光谱存在一些不可忽略的尖峰噪声,导致一些原本较平坦的区域由于噪声干扰出现随机波动的伪特征;同时,随着浓度的变化,各个峰变化趋势不尽相同,其叠加谱的变化规律更为复杂.传统的光谱分析方法对以上因素较为敏感,例如对偶然出现的尖峰噪声,导数光谱分析、波峰/波谷总数分析、波峰/波谷斜率分析等都将给出错误的信息,采用传统的光谱分析方法分析上述荧光光谱难度较大.
本课题组对复杂非线性荧光光谱数据已进行了较为深入的研究[10,13—17].针对超短脉冲激光与大气相互作用产生的荧光光谱的具体特点,本文提出了一种新的光谱去噪、特征提取、特征匹配的有效方法.我们以空气中混杂的各种浓度的乙烯、N-丁烷和1-丁烯气体为分类对象,通过对三种气体不同浓度的荧光光谱进行小波压缩去噪,得到5层664个小波系数,重构后可以获得除噪效果满意而特征信息保持不变的光谱.在此基础上,经对三种气体光谱进行特征峰/谷沿的匹配分析,我们提出一种利用同种物质不同浓度下的光谱总体相似度来构造标准特征谱的新方法,通过与标准特征谱的匹配分析得到分类结果.计算机模拟结果表明,该算法的分类结果受浓度变化影响小,在低至0.05%浓度条件的所有光谱均获得100%的分类识别结果.
2.特征峰匹配的特征提取与分类算法
2.1.小波压缩去噪
小波压缩去噪的理论基础是小波变换的多分辨率分析.含有噪声的信号经过小波变换的多分辨率逐级分解,得到其小波变换后的离散细节和离散逼近.Mallat等证明,噪声的离散细节信号的幅度随着小波变换尺度的增长而不断减小,但信号的小波变换系数与尺度的关系则不同.利用光谱噪声和小波变换的特点,选择一门限对小波变换后各尺度离散细节进行门限处理,绝对值较小的点取为零,对非零值重新索引后数据点数即可大大压缩.将离散逼近信号和处理后离散细节经小波逆变换重构信号,即可以达到去噪的目的[18—20].
2.2.光谱峰谷沿匹配的特征提取算法
图1 光谱匹配图示例
在荧光光谱特征提取方面,考虑到飞秒脉冲激光与大气相互作用产生的荧光光谱的特点后,我们提出一种基于特征峰/谷匹配算法的特征提取算法. 2.2.1.光谱峰谷沿的确定
采样光谱是离散的,我们用其一阶差分来确定光谱的极大值点和极小值点.某一点处的差分由负值变为正值,则该点为极小值点;同理可确定极大值点.极小值到极大值之间的一段为上升沿,标注为“+”;极大值到极小值之间的一段为下降沿,标注为“-”.忽略光谱上升下降的具体数值,将其抽象为峰谷变化的趋势,有利于克服各个峰谷绝对强度随浓度变化不同带来的分析问题.
2.2.2.光谱的匹配图
将待比较的两条光谱进行如上处理之后,分别投影到直角坐标系中的x-y平面内,根据已标注的两条谱线的“+”“-”区域,我们可以将坐标平面分割成许多矩形块,这些矩形块依据两个边乘积的正负被赋予正负号.矩形块为“+”表示其对应的两段光谱同为上升沿或同为下降沿,如图1所示的阴影部分.为“-”表示一段为上升沿另一段为下降沿.其中投影于x轴的光谱简称为x谱,也称为标准谱.投影于y轴的光谱简称为y谱,也称为待匹配谱.在匹配图中,我们只关心y=x这条线附近的情况,因为这条线上的点对应两条谱线相同的波长位置.
2.2.3.峰谷沿的相似度
我们定义峰谷沿的相似度
其中x1,x2,y1,y2为图1中矩形块的四个顶点坐标.当我们以x谱为标准谱,分析y谱与x谱的相似度时将上式左边简写为sy(x1,x2).(1)式表示了x谱(x1,x2)段与y谱(y1,y2)段的相似度,从图1中直观的看,就是矩形块(x1,x2,y1,y2)所夹y=x线段长度与矩形块对角线长度之比.只有当两段光谱同为上升沿或下降沿时才有正值,否则相似度为0.
2.2.4.对尖峰噪声的优化
通常光谱中不可避免地包含着噪声,导致光谱中存在不可忽略的较窄的噪声尖峰,采用峰谷沿匹配算法能很好地解决噪声对分类的影响.考虑图1 (b)所示情形,y谱为x谱叠加尖峰后的光谱.在光谱的匹配图上出现了x谱(x1,x2)段对应y谱(y1, y2),(y3,y4)两段的情况.我们通过定义一个整体相似度将这两段谱的相似度合并,整体相似度定义为
此时(x1,x2)段的相似度会有一定程度的下降,但仍保持较大正值,不同于完全失配下相似度为0的情况.(2)式满足加法结合律,如果出现一段x谱对应多段y谱的情况,利用(2)式同样能得到整体相似度.
2.2.5.平移系数与拉伸系数
由于光谱的采样是离散的,采样点的细微偏差可能引起采样点幅度值较大的变化,在极值点附近还可能引起极值点定位的偏差.另外受仪器精度的影响,采样所得的光谱可能会有整体细微的漂移或拉伸.为了把光谱本身的差别和仪器采样误差区分开,需要对光谱匹配情况进行更细致地描述,我们定义
峰谷沿平移系数为峰谷沿平移系数表示两段相似度大于0的谱沿相对的位移,取值范围为[-1,1],当谱沿没有相对位移时平移系数为0;当相对位移达到最大时平移系数为1或-1.平移系数为正值表示y谱相对x谱有向右的位移,负值表示有向左的位移.从匹配图上直观地看,平移系数表示矩形块中心到y=x的距离与矩形块对角线半长度的比值.
峰谷沿的拉伸系数定义为
峰谷沿的拉伸系数表示相似度大于0的两段谱沿在坐标轴投影的长度之比.当拉伸系数大于1时y谱相对于x谱是拉伸的,当系数小于1时y谱相对于x谱是压缩的.从匹配图上直观地看,拉伸系数表示矩形块y轴长度与x轴长度之比.
2.2.6.修正的峰谷沿相似度
当峰谷沿相似度不为1时,匹配的两段谱有相对位移或拉伸.通常采样过程会引起细微的漂移与拉伸,与有较大漂移与拉伸的不匹配有本质的区别.为区分这种差别,我们修正峰谷沿的相似度公式使其与漂移、拉伸量的平方相关.
其中tran,deform为(4),(5)式中x1x2所对应矩形块的平移系数与拉伸系数,该矩形块为完成(2)式所做尖峰噪声优化后的大矩形块.通过(5)式的修正,当平移、拉伸较小时,相似度被修正的量很小,几乎可以忽略;当平移、拉伸较为严重时,原本未修正时谱线的相似度就比较小,而修正后相似度被进一步减小,使我们更加容易区分出不匹配的情况.当待匹配光谱段仅出现尖峰噪声时,由于合并后整体峰谷沿的位置还是匹配的,大矩形块对应的平移系数和拉伸系数都与完全匹配时相近,修正后的相似度几乎没有改变而保持较大值.为了便于分析,我们将按峰谷沿分组表示的相似度改写成按光谱点逐点表示的相似度,即
一个光谱点落在某段峰谷沿范围内,则赋予该点相似度为对应峰谷沿的相似度;如果一个光谱点为标准谱的极大值点或极小值点,则该点同时落在前后两段光谱沿范围内,我们赋予该点相似度为前后两段峰谷沿相似度的平均值.将(6)式求得的各个谱点的相似度值顺序排列组成相似度矢量simsxy,矢量维数为光谱点的数量.
2.2.7.光谱特征峰的提取与标准特征峰谱的自适应构造法
为了有效提取光谱的特征,我们将同一物质不同浓度的光谱进行两两间的匹配分析,方法如下:不同浓度的谱z1,z2,…,zn,依次将各浓度下的光谱za作为标准谱,其余浓度作为待匹配谱分别与标准谱进行(1)至(6)式的计算得到相似度矢量simszaz1…simszaza-1,simszaza+1…simszazn,将上述矢量取平均后得到平均相似度矢量
它表示了以za作为标准谱时与其他浓度谱的总体匹配情况,对平均相似度矢量sims′za进行阈值处理
得到za作为标准谱与其他浓度谱的总体相似度矢量simsza.对于非特征峰的光谱部分,由于噪声的随机性,不同浓度光谱作为标准谱与其他谱进行匹配时相似度都有大有小,但平均值较小,通过阈值作用将被置为0.对于特征峰的光谱部分,由于总体相似度值大于阈值,相似度被保留下来.
基于以上分析,我们提出一种利用同种物质不同浓度下的光谱总体相似度来构造标准特征谱新方法.具体方法如下.
每个特征峰/谷在simsz1…simszn中对应一段相似度不为0光谱段,以不同谱z1,z2,…,zn为标准谱时这个峰谷沿的总体相似度不同,我们选取总体相似度最大的光谱段代表特征峰谷沿,特征峰谷沿的端点为该光谱段对应沿的端点,峰沿的上升(下降)趋势标注与谱线对应沿一致.当相邻的特征峰谷沿对应不同光谱段时,边界点可能会发生重叠或空白.我们处理的原则是:重叠部分划归为相似度高的峰谷沿,空白部分划归为相似度低的峰谷沿.
以三条谱线为例,图2模拟了两种不同情况下构造的特征谱st.图2(a)中光谱段2作为标准谱时,其上升沿所对应的总体相似度sims2(1)(sims2(1)代表谱2上升沿各个点的总体相似度,它们都是相等的,因此放在一起简化表示)较其他两条光谱作为标准谱时在该处的总体相似度sims1(1),sims3(1)大,因此我们将谱线2的上升沿作为标准谱的上升沿.同理我们将谱线1下降沿作为标准谱的下降沿.谱线2的上升沿与谱线1的下降沿有坐标重合的部分,在这些重合点处sims2(1)>sims1(2),因此我们将这些点划归为上升沿部分.图2(b)为构造标准谱的另外一种情况,上升沿取为与光谱2相同,下降沿取为与光谱3相同,空白部分划归为下降沿.这样的处理保证了标准谱中既能完整地包含高相似度的峰谷沿,也能对低相似度的峰谷沿进行调整.实际操作中我们处理是相似度矢量,因此在构造标准谱时,除了标记上升沿和下降沿外,我们在相似度矢量为0的点处将标准谱标记为0,表示在这些点特征峰不明显或无法肯定是否存在.经过这些步骤后,我们可以得到维数为光谱点数的标准特征峰谱st,其各点值标记为0,“+”或“-”.
图2 构造标准谱示例
2.3.基于构造标准特征谱的分类算法
当对未知光谱z进行分类时,如何提取标准谱的特征点是很关键的.以两种气体为例:首先对两种光谱按照2.2.7节的方法构造标准谱stx和sty,将这两种光谱的标准特征谱进行一次相似度分析,此过程只需将(6)式的变量x,y用stx和sty代替,并将(1)式的结果代入即可得到相似度矢量simsstxsty.标准谱的特殊之处在于有许多点的值为“0”,处理时按照“-”来处理,因为它们同为不匹配的情况.
对于多种气体的光谱的情况,依次考虑各个谱的特征.以sts1为例,我们将sts1分别与剩下的n-1种气体标准谱进行相似度分析得到相似度simssts1sts2…simssts1stsn.sts1谱与stsn谱的相似度分析在特征点处有几种情况:sts1有明显的特征而stsn没有明显特征,即stsn谱在这些点为0,此时求得这些点的相似度为0;sts1与stsn都有明显特征但特征相反,此时相似度很小;sts1与stsn都有明显特征且特征相近,此时相似度较大.我们赋予不同特征点不同的权值,第一种情况0.5,第二种情况1,第三种情况0,用以区分它们对分类贡献的大小.同样方法,我们可以得到sts1与余下n-1种气体谱的所有n-1组权值,将得到的权值相加作为特征点的权重.我们依次对sts1,…,stsn进行这样的运算,得到n个气体谱的特征点权重.
以三种气体为例,表1和图3显示了各个光谱的标准谱示例和计算出的特征点权重.表格中的“-”表示该点不是该标准谱的特征点,因为其特征谱在该点处为0.通过图和表我们看到,大的权重对谱的分类是非常重要的,如st1谱中的1和2处,如果待分类谱在1处匹配该上升沿,2处匹配该下降沿,则为我们的分类提供相当大的帮助,因为待分类谱与st2谱和st3谱中这两处是不匹配的,我们相信该谱为st1类的可能性很大;而1,2两处对于st2和st3的分类作用则没有那么大,因为如果匹配了st2, st3的特征,我们仅能得出不是st1的结论,并不能判断是st2或st3中的哪一类.
表1 标准谱示例中计算得到的分类特征点权值
图3 三种气体的标准谱示例
求得特征点权重后,我们将待分类谱z与各特征谱sts1,…,stsn分别进行加权的相似度分析
式中d为光谱维数,wni表示标准谱stsn第i点的权重,如果该点不是特征点则权重为0.simsstnz(i)表示z谱与stsn谱的相似度.在理想情况下,当z谱与stsn在特征点处加权相似全匹配时为1,不匹配时较小.在分类过程中,考虑到特征点众多,可以对权重取阈值操作,仅保留特征明显对分类很有帮助的点.权重小的点处与其他谱特征相似,代表性不强且容易受到干扰,可弃之不用.
基于构造标准特征谱的分类方法,不但给出了分类结果,还给出了与各标准谱匹配的相似度,得出更加明确的结论.在与已知谱相似度都较低时,该方法有助于发现新物质和确定新物质的特征.
3.实验及其结果分析
3.1.非线性荧光光谱的获得
获取气体荧光光谱的实验装置参考我们前期的工作[7—12],飞秒激光脉冲入射到气体中时由于自聚焦效应,在空气中形成等离子体通道,即成“丝”现象出现,丝状脉冲光场内的高密度能量使生化污染物分子发生非线性电离和解离,产生具有分子光谱特性的荧光光谱.经透镜会聚后被分光光度计(Acton Spect rapro2150)和CCD探测,得到混合气体的非线性荧光光谱.实验中一个输入脉冲激光能量为10 mJ、脉宽为50 fs,重复频率为10 Hz.我们特别选取三种光谱十分接近的掺杂气体,分别为乙烯(Ethylene),1-丁烯(1-Butene),N-丁烷(N-Butane).这三种气体分别与空气混合的体积比:乙烯为25%, 12.5%,6.25%,3.13%,1.56%,0.78%,0.39%, 0.20%,0.10%,0.049%(10个数据);1-丁烯为25%,12.5%,6.25%,3.13%,1.56%,0.78%, 0.39%,0.20%,0.10%,0.05%(10个数据);N-丁烷为12.5%,1.56%,0.78%,0.39%,0.20%,0.098%, 0.049%(7个数据),总共27条光谱数据.
图4 同种气体的相似度与不同气体的相似度 (a)0.78%乙烯光谱;(b)0.39%乙烯光谱;(c)0.78%与0.39%乙烯光谱相似度矢量;(d)0.78%乙烯光谱;(e)0.39%1-丁烯光谱;(f)0.78%乙烯光谱与0.39%1-丁烯光谱相似度矢量
3.2.光谱的小波压缩去噪
原始光谱中含有大量噪声,有必要进行去噪处理.我们采用小波去噪的方法,将信号作五层分解,采用硬阈值函数对各层系数进行处理,细节中绝对值较小的点置为零.我们前期的工作已经验证了对于该类复杂荧光光谱,采用双正交的bior3.9小波的滤波及重构光谱均方误差最小,且特征峰保留完好.本文依然采用bior3.9小波进行压缩去噪.最终光谱数据由3979个点压缩为664个系数,重构后光谱的噪声大大降低,信号特征更为明显.
3.3.相似度矢量
我们以乙烯气体浓度为0.39%和0.78%的两条谱为例分析一下它们的相似度.我们将0.78%乙烯光谱作为标准谱,0.39%乙烯光谱作为待匹配光谱进行(1)至(6)式的运算.图4(a),(b),(c)显示了采用小波去噪处理后两气体光谱和它们的相似度矢量.从图中我们可以看出两种浓度的气体光谱在光谱强大的地方相似度很高,而在强度小的地方相似度则有高有低.
我们再以1-丁烯浓度为0.39%和乙烯浓度0.78%的两条谱为例分析相似度.我们仍然将0.78%乙烯光谱作为标准谱,将0.39%的1-丁烯光谱作为待匹配谱.图4(d),(e),(f)显示了两气体光谱和它们的相似度矢量.从图中我们可以看出这两种不同气体的光谱在强度较大处特征峰处相似度依然很高,不论直接观察或与图4(a),(b),(c)的相似度进行比较我们都难以明显区分1-丁烯和乙烯两种气体谱的差别.因为乙烯与1-丁烯两种有机气体的电离能很接近,主要化学键也接近,两种气体的主要官能团也都为双键,因此它们的谱很相似;且在很低浓度情况下,光谱中还包含大量空气中各主要气体成分的光谱,因此区分这两种谱是有一定困难的.
3.4.构造标准特征谱
根据2.2.7节的方法,我们利用同种物质不同浓度的光谱构造标准特征谱,平均相似度阈值ξ取0.5.图5显示了N-丁烷与1-丁烯气体谱与构造的标准特征谱.左图为N-丁烷,我们只选取N-丁烷7条光谱中的2条为例.图5(a),(b)光谱浓度为0.78%,0.05%.对应的(c)图为构造的标准谱,忽略了幅度信息,构造标准谱的“+”,“-”,“0”用斜率1,-1,0的线段来表示.(d),(e),(f)为1-丁烯各浓度光谱与构造标准谱,其中的光谱选取3.13%, 0.05%为代表.
图5 光谱与其构造标准谱 (a)0.78%N-丁烷光谱;(b)0.05%N-丁烷光谱;(c)N-丁烷构造标准谱;(d)3.13%1-丁烯光谱;(e)0.05%1-丁烯光谱;(f)1-丁烯构造标准光谱
3.5.基于构造标准特征谱的分类算法
采用2.3节的方法计算三种气体谱的分类特征点权重,图6(a),(b),(c)显示了三种气体谱的分类特征点权重.我们以乙烯光谱权重为2的点3638—3653为例,直观分析一下对应光谱的特点.图6(d), (e),(f)显示了浓度分别为1.56%与0.10%的N-丁烷、1-丁烯、乙烯气体谱在点3638—3653附近的光谱.
图6 气体谱的分类特征点权重与三种谱在乙烯特征点3638—3653附近的光谱 (a)N-丁烷特征点权重;(b)1-丁烯特征点权重;(c)乙烯特征点权重;(d)N-丁烷示例光谱;(e)1-丁烯示例光谱;(f)乙烯示例光谱
从图6中可以看出,在乙烯特征点权重为2的地方,乙烯谱与N-丁烷、1-丁烯谱有着明显不同的特征,N-丁烷、1-丁烯谱在这些点处为明显的峰而乙烯为明显的谷,为我们区分乙烯与其他两种谱提供了很大的帮助.从左图中可以看出,乙烯有20多处特征权重为2的谱段,N-丁烷与1-丁烯也有10多处;特征权重1.5的地方更多.这些谱段都对应明显的特征峰,有助于我们鉴别污染气体.
我们轮流用三种气体27条光谱中的1条作为测试光谱,其余26条用来进行2.2.7节与2.3节中标准谱的构造与特征权重值的求解,用这条测试光谱与构造的三种气体标准谱进行带权重的匹配.权重只取2和1.5的部分,其余部分置为0.表2列出了27条光谱的相似程度.
表中编号1—7为N-丁烷浓度12.5%—0.05%,8—17为1-丁烯浓度25%—0.05%,18—27为乙烯浓度25%—0.05%.bta表示N-丁烷,bte表示1-丁烯,eth表示乙烯.加权相似度未进行归一化.
从表中我们可以看出,对27条光谱取相似度度最大匹配谱为分类结果,正确率为100%.这三种有机物光谱十分相似,特别是N-丁烷与1-丁烯这两种物质,它们在化学结构差别仅为一碳双键与一个碳—碳键,在浓度很低的情况下,它们混合空气谱的相似度更加接近.而本方法能很好地区分这两种差别细微的物质,而且能计算物质与物质之间谱相似度的差异.在气体浓度很低的时候,光谱淹没在很大的噪声中,而本实验中7,17,27号谱所对应浓度分别为0.05%的N-丁烷、1-丁烯、乙烯谱,与其他浓度的谱相比,基于相似度分析的分类结果没有显著地变差,提示我们本方法有分析识别更低浓度气体的能力.
表2 光谱的相似度分析
4.结论
本文提出了一种新的光谱去噪、体征提取及分类的有效方法.研究了在空气中混杂的各种浓度的乙烯、N-丁烷和1-丁烯气体的分类算法,通过对三种气体不同浓度的荧光光谱进行小波压缩去噪,得到5层664个小波系数,重构后可以获得除噪效果满意而特征信息保持不变的光谱.在此基础上,经对三种气体光谱进行特征峰/谷沿的匹配分析,我们提出一种利用同种物质不同浓度下的光谱总体相似度来构造标准特征谱新方法,通过与标准特征谱的匹配分析得到分类结果,该算法可用于解决其他类型复杂光谱的分类问题,特别对低浓度气体的分类有很好的鲁棒性.
[1]Shao GR,Jiao D M1996Zhejing Chemical27 37(in Chinese)[邵光荣、焦东苗1996浙江化工27 37]
[2]Zhao Z,Wang R Z,Sun T H1999Chin.Space Sci.and Tech.4 46 (in Chinese)[赵 忠、王荣宗、孙天辉1999中国空间科学技术4 46]
[3]Edner H,Fredriksson K,Sunesson A 1987Appl.Opt.26 4330
[4]Zhang GX,Zhao YF,Zhang YC,Zhao P T2008Acta Phys.Sin. 57 7390(in Chinese)[张改霞、赵曰峰、张寅超、赵培涛2008物理学报57 7390]
[5]Hu X Y,Zhong F C,Deng J 2001Acta Opt.Sin.21 641(in Chinese)[胡雪原、钟方川、邓 建2001光学学报21 641]
[6]Zhu S T,Zhang J L,Shen W D 1994Chinese Journal of Lasers21 678(in Chinese)[朱莳通、章介伦、沈文达等1994中国激光21 678]
[7]Feng Z H,Fu XQ,ZhangL F,Xu H W,Wen S C2008Acta Phys. Sin.57 2253(in Chinese)[冯则胡、傅喜泉等2008物理学报57 2253]
[8]Cao S Y,Zhang Z G,Chai L,Wang Q Y,YangJ J,Zhu X N 2007 Acta Phys.Sin.56 2765(in Chinese)[曹士英、张志刚、柴路、王清月、杨建军、朱晓农2007物理学报56 2765]
[9]Yang S Z,Chen D Y2008Chin.Phys.B 17 817
[10]ShenJ Y,Han Y Z,Chang S J 2004Acta Opt.Sin.24 1000(in Chinese)[申金媛、韩应哲、常胜江2004光学学报24 1000]
[11]Liu Y,Song C Y,Luo X S,Lu J,Ni X W 2007Chin.Phys.16 1300
[12]Su HJ,Du P J,Sheng Y H 2008Application Research of Computer 25 390(in Chinese)[苏红军、杜培军、盛业华2008计算机应用研究25 390]
[13]Han Y Z,Li S M,Zhang Y X 2005J.Optoelectronics Laser16 710 (in Chinese)[韩应哲、李素梅、张延2005光电子激光16 710]
[14]Han Y Z,Zhang Y X,Chang S J 2005J.Optoelectronics Laser16 718(in Chinese)[韩应哲、张延、常胜江2005光电子激光16 718]
[15]Li S M,Han Y Z,Zhang Y X 2006Acta Opt.Sin.26 147(in Chinese)[李素梅、韩应哲、张延2006光学学报26 147]
[16]Wang K,Zhang H,Chang S J,Shen J Y 2007Acta Phys.Sin.56 3613(in Chinese)[王 凯、张 会、常胜江、申金媛2007物理学报56 3613]
[17]WangJ H,Zheng Z,Zhang Y X 2007J.Optoelectronics Laser18 741(in Chinese)[王建华、郑 震、张延2007光电子激光18 741]
[18]Yuan L 2008Chin.Phys.B 17 170
[19]Ding G,Zhong S S,Li Y2008Chin.Phys.B 17 1998
[20]Sun Y K 2005Wavelet Analysis and Application(Beijing:China Machine Press)p17(in Chinese)[孙延奎2005小波分析及其应用(北京:机械工业出版社)第17页](Received 9 March 2009;revised manuscript received 29 April 2009)
PACC:4230S,3350D
A classification method for nonlinear fluorescent spectra based on edges matching*
Chen Yang1)†Jia Li-Ping2)Zhang Tai-Ning1)Guo Peng1)Wang Xiang-Hui1)Chang Sheng-Jiang1)
1)(Institute Of Modern Optics,Key laboratory of Opto-electronic Information Science and Technology of Ministry of Education,Nankai University,Tianjin 300071,China)
2)(Shijiazhuang University of Economics,Shijiazhuang 050031,China)
A pre-process of feature extraction and classification approach based on spectrum edges matching is proposed to analyze the complicated nonlinear fluorescence spectra emitted by the interaction between femto-second(fs)laser and the impurities in air. The spectra data is denoised and compressedfrom3979 points to 664 points usingwavelet(WT)transform.By similarity analysis we create the characteristic spectra of 3 kinds of gases and the weights for classification.A new method of classification is proposed based on the edges matching and the comparison with characteristic spectra.Compared with existing methods,our method can not only get 100%classification accuracy,but also gives the characteristic position and the matching degree.The analysis of the matching degree shows that our method works well at low concentrations and has a potential application of identifying gases of lower concentration.
nonlinear fluorescence spectrum,feature matching,edges of spectrum
*国家重点基础研究发展计划(973计划)(批准号:2007CB310403);天津市自然科学基金重点项目(批准号:07JCZDJC05500);国家自然科学基金(批准号:60772105,10704043);河北省科技厅科技支撑项目(批准号:08213517D)资助的课题.
†通讯联系人.E-mail:ych@mail.nankai.edu.cn
*Project supported by the National Basic Research Program of China(Grant No.2007CB310403),the Key Program of the Natural Science Foundation of Tianjin,China(Grant No.07JCZDJC05500),the National Natural Science Foundation of China(Grant Nos.60772105,10704043)and the Support Program of Science and Technology Department of Hebei Province(Grant No.08213517D).
†Corresponding author.E-mail:ych@mail.nankai.edu.cn