基于集合经验模态分解的拉曼光谱信号特征研究
2020-01-08崔飞鹏
李 明,赵 迎,崔飞鹏,刘 佳
1. 钢铁研究总院,北京 100081 2. 钢研纳克检测技术股份有限公司,北京 100094
引 言
拉曼光谱中的噪声主要有来自电子元器件随机热运动而造成的电子噪声,在谱图中表现为高频频段; 外部杂散光以及样品在入射光的作用下产生的荧光或其他杂散光,在谱图中表现为低频频段。赵肖宇等应用经验模态分解(EMD)和集合平均经验模态分解(ensemble empirical mode decomposition, EEMD)方法处理了含噪光谱信号,获得了不错的效果,但仅应用于信号的去噪处理。EEMD方法最大的优势就是根据时频特性将信号本身的特征成分自适应的分解为具有物理意义的特征分量,本文利用EEMD方法对拉曼信号进行自适应时频特征分解,得到有物理意义的高频噪声段,拉曼有效信号段和荧光背景段,通过增强有效信号并重构拉曼信号获得了更好的特征谱图[1],该方法应用于食用油的分析,取得了较好的效果,为拉曼光谱信号处理提供了一种新的方法。
1 理论部分
Huang等[2]于1998年提出一种信号时频分析方法—EMD,该方法能自适应的将信号分解成有限个具有物理意义的分量—固有模态函数(intrinsic mode function,IMF)。EMD方法的一个重要缺陷就是模态混叠,为了克服这个问题,Wu和Huang在对白噪声进行EMD分解深入研究的基础上,提出了EEMD方法,其基本思路[3]为: 将高斯白噪声加入被分析信号,使信号和噪声成为一个“集合”,在EMD的分解过程中,当被分析信号加在这些一致分布的白色背景上时,不同尺度的信号,会自适应的映射到合适的频率范围上; 同时,由于白噪声的零均值特性,加入多次白噪声分解,将这些多次分解的结果取“平均”后,噪声最终被相互抵消而消除,即集合平均的分解结果被当做是被分析信号的EMD分解结果。
EEMD方法的基本步骤[4]为:
步骤1: 给被分析信号x(t)加入一组白噪声w(t)来获得一个总体X(t)
X(t)=x(t)+w(t)
(1)
步骤2: 对X(t)进行EMD分解,得到相应的各阶IMF
(2)
步骤3: 给被分析信号x(t)加入一组不同的白噪声wj(t)来获得另一个总体Xj(t),对Xj(t)进行EMD分解后,得到相应的各阶IMF
(3)
步骤4: 求得各个IMF的均值作为最终信号的IMF
(4)
式中,N为加入白噪声的次数,即总体的个数,ε是加入白噪声的幅度,εn是原始信号和由最终的IMF之和所得信号的误差。
(5)
EEMD方法较之EMD方法,有效的克服了模态混叠现象,能更加清晰的将信号中不同频率的成分划分开来,因此更加适合频率成分丰富的拉曼信号的特征分析和处理。
2 实验部分
2.1 食用油样本
本研究用的食用油采购市场常见的品牌,其中大豆油5种,花生油5种,玉米油5种,葵花籽油5种,如图1所示,所有食用油样品置于不含荧光背景的5 mL样品瓶中。
2.2 仪器与参数
实验仪器为美国Bayspec公司的AgilityTM拉曼光谱仪,如图2所示,参数设置: 激发波长785 nm,激光器功率450 mW,积分时间1 000 ms,扫描波数范围: 100~2 700 cm-1。
2.3 方法
实验室环境温度25 ℃,每种样品分装在2个样品瓶中,直接测量,一共获得的40张拉曼光谱原始谱图,如图3所示,图示曲线从上到下,1—10为大豆油拉曼谱图; 11—20为花生油拉曼谱图; 21—30为玉米油拉曼谱图; 31—40为葵花籽油拉曼谱图。
3 结果与讨论
3.1 拉曼信号的EEMD方法处理
选取原始拉曼谱图作为信号处理对象,经EEMD分解,自适应的得到了10个IMF,如图4所示,其特征频率从高到低排布,其中IMF1频率最高,IMF10[即信号的趋势r(t)]最低。根据信号的能量分布以及幅值特性,IMF1和IMF2表征为信号中的噪声部分; IMF3—IMF7表征为拉曼特征信号部分; 最后一阶IMF10表征为荧光背景成分,IMF8和IMF9为其他物理意义的频率成分。由此可见,EEMD方法可以完整的将拉曼信号中各个有物理意义的特征频率成分分解出来。
图1 食用油样品
图2 拉曼光谱仪
图3 食用油原始拉曼谱图
图4 原始拉曼信号的EEMD分解
3.2 拉曼信号的特征重构及增强处理
上述处理结果,IMF1和IMF2为信号中的噪声部分,IMF10为荧光频率段,通过增强IMF3—IMF7段可有效增加信噪比,而拉曼信号的噪声及荧光背景不变,获得特征增强后的拉曼信号Y(t),其中k定义为增强因子。
(6)
如图5所示,为特征增强后的拉曼信号和原始拉曼信号,图中可见,信号的高频噪声和荧光背景与原始谱图一致,在k=3的有效信号特征增强下获得了信噪比2~5倍的提升。
图5 原始拉曼信号和增强后的拉曼信号对比
如图6所示,结合基于连续小波变换的惩罚最小二乘法[5](continuous wavelet transform-penalized least squares, CWT-PLS)进行进一步处理,可见有效特征峰均得到不同程度的增强,其中,食用油中难以探测的酯键羰基伸缩振动位于1 745 cm-1的谱峰得到了显著的增强。
图6 原始拉曼信号和增强后的拉曼信号二次处理后对比
3.3 食用油类型PCA分析
将试验的拉曼谱图均按上述方法进行信号特征增强后,获得了4种食用油各10张增强后的拉曼谱图,如图7所示。
上述数据仅从拉曼谱图上无法鉴别食用油样本类型,本文结合PCA(主成分分析)方法后进一步进行判别,选取信噪比较高拉曼位移为300~1 800 cm-1的谱段作为PCA分析的主要分析数据,图8显示为原始信号以及使用EEND方法的特征增强后的信号经过CWT-PLS方法处理后的PCA分析结果对比。结果显示: 原始信号直接经过CWT-PLS方法处理后获得的结果比较分散,不同类样本也有重叠,不存在明显的类间距,很难完整的区分4种类型的食用油; 基于EEMD特征增强后经过CWT-PLS方法处理的数据样本各自聚集,每种食用油样本都可以相互鉴别。
图7 食用油增强拉曼谱图
图8 PCA结果对比
4 结 论
将集合经验模态分解应用于食用油样本的拉曼光谱信号的特征提取,增强后并重构拉曼光谱信号,可得如下结论:
(1)集合经验模态分解方法可自适应的将食用油拉曼光谱信号分解成10阶IMF,其IMF1和IMF2表征为信号中的噪声部分; IMF3—IMF7表征为拉曼特征信号的部分; 最后一阶IMF10表征为荧光背景部分。
(2)基于EEMD的拉曼特征增强方法具有自适应的特点,不需要预先设置其他参数,通过应用于食用油拉曼特征增强,获得了拉曼特征更强的信号,可以清晰的鉴别4种类别的食用油,为拉曼光谱的数据处理提供了新的方式。