近红外光谱的小波域分析方法研究
2015-05-30李渌洁刘航王英鸿
李渌洁 刘航 王英鸿
摘 要:材料的红外光谱包含大量信息,属于高维度数据。从复杂的近红外光谱样本中消除无用信息、提取关键特征是近红外光谱建模领域中不易攻克的关键技术。依据获取的透射近红外光谱信息建立小麦含水量模型,采用小波分析手段,选取最佳小波系数,优化了模型结构,提高了模型对含水量的预测精度。
关键词:小波分析;近红外光谱;小波系数;特征提取
1 概述
物质的光谱样本蕴含了大量信息。近红外光谱与物质的物理性质、化学成分相关,同时还会受到共线性、散射、照明光强等因素的影响。因此,在包含大量信息的近红外光谱信号中发掘出有用的特征信息是光谱分析方法的重要技术难点。傅里叶分析在处理高维度近红外光谱数据时,出现了运算量大、误差大的问题。传统的傅里叶分析方法无法满足近红外光谱建模的需求。相较于傅里叶变换,小波分析具有明显的优势,能根据实际需求快速、准确地提取信号中的特征信息。我们将小波分析引入到近红外建模领域,开展了理论分析与实际应用。
光谱特征信息提取是在复杂的多维光谱数据中获得有用的分类信息。光谱特征提取要实现两个目标:一减小内类差异,二增大类间差异[1]。这两个指标是评价一种光谱特征提取方法优劣的主要依据。光谱特征信息提取的目的是将材料光谱信号与环境噪声相分离,获取有用的光谱信号,进而分析出材料的化学特性。光谱分析技术中,对光谱特征信息提取是首要环节,提取出的信息被用于物质分类识别,并能得出物质的量化数值。因此,光谱特征提取是光谱分析的先决因素。
从工程的角度分析,小波变换,与傅里叶变换一样,都是集合时域、频域等多种概念的信号特征提取方法[2]。小波理论是在多学科、多领域技术交叉融合的基础上建立起来的[3]。
2 实验与数据
实验平台:分光器、探测器、漫反射信号收集器和近红外光源构成了光谱探测核心装置,再配合光学耦合器件、计算机等辅助设备继而能开展近红外光谱建模实验。借助此套装置,通过光谱信号采集、数据预处理、光谱模型建立等步骤实现对小麦样品水分的定量分析。
小麦样品放置于冰柜内,冷藏至4℃。光谱数据采样之前,避免环境温度对近红外光谱的影响,环境温度严格控制在20℃。仪器提前开机1小时,确保采样时仪器处于稳定的工作状态。光谱采样前,测量标准白板光谱,修正光谱仪测量误差。MCS611NIR光纤光谱仪对每个样品进行3次测试,取平均值。
图2为小波变换光谱特征提取流程示意图,光谱提取分为两步:
小麦近红外光谱建波及特称提取过程:针对近红外光谱采用PLS建模,求解出校正集和对应验证集的R2与RMSE的数值,选取coif、db、sym三种基本函数对近红外光谱进行小波变换。根据计算结果,决定选择的小波函数为db5,分解尺度为5。
整个小波系数19-55,58-72,96-114三个区间构成一个大区间,内部蕴含了大量特征信息,分析大区间的光谱数据能获得小麦水分含量的精准数据数值。重新组合各类系数,对光谱信号进行重构,重构光谱如图3所示。再使用PLS方法校正模型,则校正集为R2=0.9812,RMSE=0.2523,对应的驗证集为R2=0.9758,RMSE=0.2910。根据此结果可以看出,选取19-55,58-72,96-114三个区间为小波系数时,相对应的校正集与验证集为最优组合,所构造的模型精准度最高,对小麦水分的预测准确度最高。
3 结束语
文章采用小波分析法对小麦透射光谱进行光谱特征信息提取,预测小麦的含水量。选取小波系数(19-55,58-72,96-114),优化模型,使校正集结果(R2=0.9812,RMSE=0.2523)和验证集结果(R2=0.9758,RMSE=0.2910)达到最佳状态。以此对红外光谱进行重构,提高了对小麦含水量的预测精度。
参考文献
[1]熊智新.基于小波变换的化学谱图数据处理[D].浙江:浙江大学,2004.
[2]葛哲学,沙威.小波分析理论与MATLABR2007实现[M].电子工业出版社,2007,1.
[3]田高友,袁洪福,刘慧颖,等.小波变换在近红外光谱分析中的应用进展[J].光谱学与光谱分析,2003,23(6):1111-1114.
作者简介:李渌洁(1987-),女,吉林长春人,职称:研究实习员,学历:硕士,主要研究方向:光子学与光电子技术。