基于PCR和PLS的沙棘汁品种近红外光谱研究
2010-06-18张海红张淑娟介邓飞赵华民
张海红,张淑娟,介邓飞,赵华民
(山西农业大学工程技术学院,山西太谷 030801)
基于PCR和PLS的沙棘汁品种近红外光谱研究
张海红,张淑娟,介邓飞,赵华民
(山西农业大学工程技术学院,山西太谷 030801)
建立可见-近红外漫反射光谱与沙棘汁品种之间的数学模型,以评价可见-近红外漫反射光谱技术快速检测沙棘汁品种。采用美国ASD公司的FieldSpec3光谱仪对三种不同品种的沙棘汁进行光谱分析,各获取30个样本的光谱数据,对原始光谱进行一阶微分和二阶微分预处理,并利用偏最小二乘法(PLS)数学校正方法对三种不同预处理的光谱数据建模。结果表明,采用二阶微分预处理数据,应用PLS方法建模较好,其校正模型相关系数为0.9992,均方根误差为0. 0317;采用主成分回归(PCR)和偏最小二乘法(PLS),对沙棘汁的二阶微分数据进行分析比较,结果也表明,基于二阶微分数据,应用PLS方法建模较为理想,其预测集的相关系数为0.9988,所测预测样本的均方根误差为0.0392。近红外光谱可作为一种快速、有效的无损检测方法来识别沙棘汁的品种。
可见-近红外漫反射光谱;快速检测;沙棘汁品种;PCR;PLS
沙棘,又称醋柳,酸刺,是生长在我国华北和东北地区的一种野生落叶灌木,果实为椭圆形橙黄色,它能调节血脂、血压、改善心肌缺血,抗疲劳,增强记忆力。沙棘汁作为一种绿色饮料,其口感、糖分含量、酸度和维生素含量等内部品质都得到了人们广泛的重视。从目前市场看,沙棘汁的品种繁多,不同品种间的显著差异直接影响其口感及品质。因此,研究一种简单、快速、无损的沙棘汁品种鉴别技术是非常必要的。
近红外光谱技术是一种快速测定物质化学组分含量的现代光谱技术,具有速度快、无污染、适于在线分析等优点,已引起越来越多国内外学者的重视[1~10]。有学者研究用近红外光谱技术区别酸奶品种[2]、酱油品牌[3]、可乐品牌[4]等,本文旨在利用近红外漫反射分析技术,基于主成分分析(PCR)和偏最小二乘法(PLS)对沙棘汁品种进行研究,初步建立沙棘汁品种的预测模型。
1 试验材料及方法
本试验设备由微机、光谱仪、卤光灯、校正白板等组成。光谱仪使用美国ASD(Analytical Spectral Device)公司的FieldSpec 3光谱仪,光谱采样间隔为1 nm,采样范围为350~2500 nm,扫描次数30次,分辨率 3.5 nm,探头视场角为 25°,采用漫反射方式进行样品光谱采样;光源采用与光谱仪配套的14.5 V卤素灯。光谱数据以ASCII码形式导出进行预处理,分析软件为 ASD ViewSpec Pro V5.0,Unscramble V9.7。
本试验材料分别为同一批次的夏普赛尔、维仕杰和汇源三种沙棘汁。各采集40个样本,合计120个样本,随机分为建模集90个样本和预测集30个样本。试验时,将沙棘汁装入高1.4 cm,直径6.5 cm的培养皿内,液面高度10 mm。将光谱仪置于沙棘汁样本的上方,距沙棘汁表面50 mm,光源距盛样容器中心350 mm,成45°角照射。
2 光谱数据预处理
为了去除来自高频随机噪音、基线漂移、样本不均匀、光散射等影响[10],采用Move average平滑法进行光谱预处理,选用平滑点数为9,此时能很好滤除各种因素产生的高频噪音,再进行MSC(Multiplicative Scatter Correction)处理[3],三种不同品种沙棘汁的典型的可见-近红外光谱漫反射曲线见图1。
图1 三种不同品种沙棘汁可见-近红外漫反射光谱曲线Fig.1 Visible-Near infrared diffuse reflectance spectroscopy of three different varieties of persimmon
图1中的横坐标为波长,范围是 350~2500 nm,纵坐标为光谱反射率。从图1中可以看出,不同品种沙棘汁的光谱图不同,具有一定的特征性和指纹性。
3 沙棘汁品种的优化建模
为了优化建模,在对光谱数据进行前面的预处理的基础上,本试验采用一阶微分(平滑点数:9)和二阶微分(平滑点数:9)与原始光谱数据进行比较,应用主成分回归(PCR)和偏最小二乘法(PLS)分别对沙棘汁品种进行建模。建模样本的均方根误差(RMSEC)和预测样本的均方根误差(RMSEP)用于评价与对比所建模型的精确性。
3.1 光谱不同处理方法的比较与确定
为了比较不同光谱处理方法对模型建立的影响,针对原始光谱、一阶微分光谱和二阶微分光谱,应用PLS校正方法对品种分别建模。表1显示了三种光谱处理方法应用PLS校正方法建模的结果接近。比较而言,二阶微分光谱的PLS效果最好,其校正模型相关系数较高,均方根误差较低。图2表明了PLS校正建模算法对沙棘汁二阶微分光谱的校正结果,其校正模型相关系数为0.9992,校正均方根误差为0.0317.
表1 不同光谱处理方法应用PLS校正方法建模结果Table 1 Results of PLS model with different spectrum
图2 二阶微分光谱PLS样本集实测值与预测值的散点Fig.2 Second derivative spectra of the original sample set PLS predicted value of the measured value and the scatter
3.2 不同定标模型的比较与确定
为了比较不同校正方法对沙棘汁品牌模型建立的影响,应用PCR和PLS两种校正方法对沙棘汁品种分别建模。
从表2可以看出,采用原始光谱处理时,两种不同校正方法对沙棘汁品种建模的结果。从分析结果看,两种方法的校正结果接近。
表2 不同光谱建模方法的结果Table 2 Results for calibration models of PCR and PLS regression methods for the firmness of Persimmon
3.3 校正模型的精度评价
为了检验校正模型的可靠性和适应性,对二阶微分光谱比较PCR和PLS两种校正方法,在相同条件下应用于预测样本集,结果见表3。由预测结果可知,PLS方法要优于PCR方法。如图3所示,应用所建PLS校正模型对预测集样本进行的预测,其相关系数较高为0.9988,预测样本均方根误差为0.0392。
表3 同光谱建模方法的结果Table 3 Results for prediction models of PCR and PLS regression methods for the firmness of Persimmon
图3 二阶微分光谱PLS预测集实测值与预测值的散点Fig.3 Second derivative spectra of the original PLS prediction set and the predicted value of measured value of the scatter
4 结论与讨论
研究结果表明,近红外漫反射光谱可以作为一种快速检测沙棘汁品种的方法。通过比较分析不同预处理方法的校正建模结果可知,二阶微分光谱的PLS效果最好,其校正模型的相关系数较高,均方根误差较低;通过比较主成分回归PCR和偏最小二乘PLS两种不同校正方法对沙棘汁原始光谱建模结果,可以看出两种方法的校正结果接近,PLS建模结果稍好;由预测样本集的预测结果可知,PLS方法要优于PCR方法,其相关系数较高为0.9988,预测样本均方根误差为0.0392。
所建模型的准确性受多种因素的影响,需要深入了解各种影响因素以及制订详细的预防措施和解决方法,本实验中选择同一批次的样本来建立模型,采用同一规格的比色皿盛放样本等措施来尽量排除外界因素对实验结果的影响。
[1]刘燕德,罗吉,欧阳爱国.可见光光谱检测赣南脐橙糖度的研究[J].光谱学与光谱分析,2007,27(3):569-572.
[2]何勇,冯水娟,李晓丽,等.应用近红外光谱快速鉴别酸奶品种的研究[J].光谱学与光谱分析,2006,26(11):2021-2023.
[3]童晓星,鲍一丹,何勇.应用近红外光谱技术快速检测酱油品牌的研究[J].光谱学与光谱分析,2008,28(3):597-601.
[4]裘正军,陆江锋,毛静渊,等.基于可见-近红外光谱的可乐品牌鉴别方法研究[J].光谱学与光谱分析,2007,27(8):1543-1546.
[5]李桂峰,赵国建,王向东,等.苹果质地品质近红外无损检测和指纹分析[J].农业工程学报,2008,24(6):169-173.
[6]王莉,刘飞儿,何勇.应用可见-近红外光谱技术进行白醋品牌和pH值的快速检测[J].光谱学与光谱分析,2008,28(4):813-816.
[7]曾一凡,刘春生,孙旭东,等.可见-近红外光谱技术无损检测果实坚实度的研究[J].农业工程学报,2008,24(5):250-252.
[8]祝诗平,王刚,尹雄,等.DOSC在花椒挥发油含量近红外光谱分析中的应用[J].农业机械学报,2008,39(4):104-107.
[9]张淑娟,王凤花,张海红,等.鲜枣品种和可溶性固形物的近红外光谱无损检测[J].农业机械学报,2009,40(4):151-154.
[10]田海清,应义斌,徐惠荣,等.西瓜可溶性固形物含量近红外透射检测技术[J].农业机械学报,2007,38(5):111-113.
Research on Varieties of Sea Buckthorn Juice by Near-Infrared Diffuse Reflectance Spectroscopy Based on the PCR and PLS
ZHANG Hai-hong,ZHANGShu-juan,JIE Deng-fei,ZHAO Hua-min
(College of Engineering and Technology,Shanxi Agricultural University,TaiguShanxi 030801,China)
The objectives of this study are to establish mathematical relationship between visible and near-infrared(Vis-NIR)diffuse reflectance spectroscopy and sea buckthorn juice varieties,and to evaluate the applicability of Vis-NIR spectroscopy technique for fast measurement of the sea buckthorn juice varieties.A Fieldspec3 spectroradio meter was used for collecting 30 samples spectra data of the three kinds of sea buckthorn juices,Then the first and second derivatives were calculated using Vis-NIR diffuse reflectance spectroscopy,and principal component regression(PCR)and partial least square(PLS)regression were used to establish mathematical models to analyze the spectral data with three pretreatments The best prediction results were obtained,which was based on second derivative with PLS model,and its correlation coefficients of calibration set was 0.9992,and root mean standard error of correction(RM SEC)was 0.0317.Based on the second derivative with PLS model,and its correlation coefficient of prediction set is 0.9988,and root mean standard error of correction(RMSEC)is 0.0392.Vis-NIR spectroscopy is a fast and available method for non-destructive detection of Sea buckthorn Juice Varieties.
Near-infrared diffuse reflectance spectroscopy;Fast measurement;Seabuckthorn juice varieties;PCR;PLS
O433.4
A
1671-8151(2010)01-0046-03
2009-11-20
2009-12-28
张海红(1983-),女(汉),山西汾阳人,硕士,主要从事数字农业技术与装备的研究。
张淑娟,教授,博士生导师。Tel:0354- 6288091;E-mail:zsujuan@263.net
山西省科技攻关项目(2007031109-2)
(编辑:武英耀)