可见/近红外半透射结合CARS方法在线检测脐橙SSC
2013-08-22林金龙许文丽饶洪辉刘木华
孙 通,林金龙,许文丽,饶洪辉,刘木华
(江西农业大学生物光电技术及应用重点实验室,江西 南昌 330045)
赣南脐橙是全国优势农产品之一,为国家地理标志保护产品,享有“中华名果”荣誉称号,其果肉脆嫩、风味浓甜芳香、品质优良,深受消费者的喜爱.但由于国内果品产后加工和检测技术落后,难以按外观和内部品质(如可溶性固形物)对赣南脐橙进行分级,导致其国际市场竞争力不强,上不了高档货架.因此,非常有必要对赣南脐橙的可溶性固形物进行在线检测研究,从而推动国内果品品质检测与分级技术的发展,提高赣南脐橙的国际市场竞争力.
可见/近红外光谱分析技术是近几十年来发展起来的绿色、无损、快速的现代分析技术.该技术已用于各种水果的内部品质检测,如苹果[1-2]、柑橘[3]、梨[4]、猕猴桃[5-6]、芒果[7]、瓜类[8-9]等.目前,国内外学者利用可见/近红外光谱分析技术对脐橙内部品质检测也作了一些研究.Liu Y等[10]利用可见/近红外漫反射光谱 (350~1800 nm)对脐橙可溶性固形物(SSC)含量进行检测,采用微分及多元散射校正(MSC)等方法进行光谱预处理,并应用偏最小二乘 (PLS)回归和误差反向传播神经网络(BPNN)建立预测模型,研究结果表明:BPNN结合MSC预处理光谱所建立的预测模型最优,其相关系数和预测均方根误差 (RMSEP)分别为0.90和0.68%.孙旭东等[11]在700~933 nm波段范围内采用基于基准波长点的反射比法对每个脐橙样品光谱进行实时处理,应用PLS和最小二乘支持向量回归法(LSSVR)建立脐橙SSC预测模型,并与吸收光谱所建立的预测模型进行比较,结果表明:LSSVR结合一阶微分处理后的反射比光谱所建立的预测模型最优,其相关系数和 RMSEP分别为0.85和0.41%.胡润文等[12]采用斜率截距 (Slope/Bias)校正法和直接校正(DS)算法对脐橙总糖模型进行模型传递研究,研究结果表明:直接校正算法优于斜率截距校正法,经直接校正算法进行模型传递后,从仪器的RMSEP由3.675%下降为0.448%.蔡丽君等[13]采用小波压缩结合遗传算法对脐橙的反射比光谱(700~933 nm)进行变量优选,并采用PLS建立脐橙SSC预测模型,预测模型的相关系数rc和RMSEP分别为0.759和0.468%.Liu Y 等[14]以由620,850,880及940 nm组成的发光二极管 (LED)为光源,采集脐橙的漫反射光谱,利用LSSVR结合小波变换建立脐橙SSC预测模型.此外,还有其他学者也应用可见/近红外光谱对脐橙内部品质进行检测研究[15-18].总结上述研究文献可以发现,脐橙内部品质检测基本上均采用漫反射方式,对于漫反射检测方式,其获取的光谱信息仅包含果皮及靠近果皮的部分果肉的品质信息.脐橙是属于中厚型果皮,漫反射检测方式仅能获取其果皮及果皮附近的浅层果肉的品质信息,难以获取深层果肉的品质信息.当脐橙浅层果肉SSC与深层果肉SSC存在差异时,漫反射检测方式的检测精度较低,而半透射检测方式的检测精度不受影响.另外,文献中的脐橙内部品质检测大多为静态检测,在线检测研究相对较少.
本研究利用可见/近红外半透射光谱对脐橙SSC进行在线检测研究.采用CARS(competitive adaptive reweighted sampling)变量选择方法对脐橙光谱变量进行优选,并应用PLS方法建立脐橙SSC在线预测模型,选用独立的预测集样本对在线预测模型进行验证,并对预测集样本的预测误差进行分析.
1 材料与方法
1.1 脐橙样本
试验所用的脐橙样本均购买于水果批发市场,样本分为2个批次购买.第1批次脐橙样本为170个,第2批次脐橙样本为95个,于第1批次脐橙试验完成后2周购买.第1批次的脐橙样本作为校正集,用于建立脐橙SSC在线预测模型;第2批次的脐橙样本作为独立的预测集,用于对脐橙SSC在线预测模型进行验证.购买的脐橙样本均需进行表皮清理,依次编号.在光谱采集前,将样本置于室温下24 h左右,使样本温度与室温基本一致.
1.2 可见/近红外光谱采集
本试验中,脐橙样本光谱在可见/近红外半透射在线检测系统中采集.可见/近红外半透射在线检测系统由微型光纤光谱仪、光源、光纤、输送系统、电脑等组成(见图1).微型光纤光谱仪为具有3648像素CCD的USB4000光谱仪 (Oceanoptics公司,美国),光谱采集波段范围为470~1150 nm.光源为2盏卤钨灯 (15 V,150 W),总功率为300 W,对称分布在水果两侧,光源中心位置基本对准水果赤道部位,光源与光纤之间的角度为 90°.光纤芯径为100 μm,光纤一端接收透过水果的光,另一端连接USB4000光谱仪.输送系统速度为0.3 m·s-1.
试验中的光谱参比为直径80 mm的聚四氟乙烯球.在采集脐橙样本光谱前,先采集参比光谱和暗场光谱.对于脐橙样本,在0.3 m·s-1的输送速度下采集其光谱,每个脐橙样本采集一次光谱.参比、暗场及脐橙样本光谱的积分时间均为60 ms,平均次数均为1,平滑点数均为6.光谱采集和参数设置采用自编光谱采集软件完成,该软件根据Oceanoptics公司二次软件开发包编写而成.脐橙样本光谱以log(1/T)表示,T为样本光谱透射率,其计算公式为
式中:Sλ为波长λ下样品光谱的强度;Rλ为波长λ下参比光谱的强度;Dλ为波长λ下暗场光谱的强度.
1.3 可溶性固形物测量
脐橙样本的可溶性固形物按照国标GB12295—90方法进行测定.在完成光谱采集后,将脐橙样本去皮,并对果肉部分进行榨汁,然后采用滤纸对脐橙果汁进行过滤.过滤后的果汁采用PR-101α型数字折射仪(Atago公司,日本)进行可溶性固形物含量测定.
1.4 数据处理与分析
本研究中采用微分、MSC及标准正态变量变换(SNV)方法对脐橙光谱进行预处理,根据建模结果确定较优的预处理方法.光谱预处理在Unscrambler X 10.1软件里运行完成.
CARS方法是模仿达尔文进化理论“适者生存”原则提出的一种新变量选择方法.该算法的主要原理是通过自适应重加权采样技术,每次均保留PLS回归系数大的变量而剔除回归系数小的变量,从而获得一系列的波长变量子集.再采用交叉验证方法对波长变量子集进行建模,根据模型交互验证均方根误差(RMSECV)值最小原则选择最优的波长变量子集.CARS算法的具体原理参见文献[19].本研究中,采用CARS方法对脐橙光谱进行变量优选,其最大因子数由蒙特卡罗 (MC)交叉验证决定,MC采样次数为50次.采用5折PLS交叉验证对所选择的波长变量子集进行建模,并根据RMSECV值最小原则确定最优的波长变量子集.经CARS方法进行波长变量选择后,采用PLS建立脐橙SSC在线预测模型.CARS变量选择及PLS方法在Matlab 7.6.0里运行完成.
2 结果与讨论
2.1 脐橙样本SSC统计结果
对脐橙校正集和预测集样本的SSC值进行统计分析.表1为脐橙校正集和预测集样本的SSC平均值、范围及标准偏差.
表1 脐橙可溶性固形物平均值、范围及标准偏差
从表1可以看出,校正集和预测集样本的SSC平均值、范围及标准偏差均较为接近.图2为脐橙校正集和预测集样本的SSC直方图.从图2可以看出,不管对于校正集还是预测集样本,SSC在10% ~11%以及11% ~12%范围内的样本相对较多,而SSC分布在两端的样本则相对较少.
图2 脐橙校正集和预测集样本的SSC直方图
2.2 光谱预处理分析
图3为脐橙校正集和预测集样本的可见/近红外半透射光谱.从图3可以看出,光谱两端光谱噪声较大,中间部分光谱曲线较为平滑,存在一些光谱波峰和波谷.脐橙光谱在705 nm及820 nm左右处存在较为明显的波谷,而在750 nm及980 nm左右处存在较为明显的波峰.因此,光谱在705~980 nm波段范围内可能包含脐橙SSC的有用信息.考虑到980 nm处的波峰接近于光谱末端,光谱可能存在一定的噪声.此外,脐橙光谱在600~705 nm波段范围内曲线较为平滑,可能包含有脐橙SSC的有用信息.为了不引入光谱噪声,同时不丢失有用信息,经过多次建模分析,选择620~950 nm为建模波段范围用于后续的分析.
图3 脐橙校正集和预测集样本的可见/近红外半透射光谱
采用PLS方法在620~950 nm波段范围内对脐橙SSC进行建模.表2为不同预处理下脐橙校正集样本的SSC的PLS建模结果.从表2可以看出,经MSC和SNV预处理后,SSC模型性能比原始光谱所建立的SSC模型性能略差;而经一阶微分和二阶微分预处理后,SSC模型性能急剧下降,远远差于原始光谱所建立的SSC模型性能.由此可见,上述预处理方法未能有效提高SSC模型的预测性能,原始光谱所建立的模型性能最优,其校正集的交互验证相关系数rcv和RMSECV分别为0.871和0.560%.
表2 不同预处理下脐橙校正集样本SSC的PLS建模结果
2.3 CARS变量选择
由于原始光谱所建立的脐橙SSC的PLS模型性能最优,因此CARS变量选择在脐橙原始光谱上进行.图4为脐橙校正集样本的SSC的CARS变量选择结果.
图4 脐橙校正集样本的SSC的CARS变量选择结果
图4a为CARS变量选择过程中被选择的波长变量数的变化趋势.从图4a可以看出,随着采样次数的增加,被选择的波长变量数逐渐下降,其下降趋势由快变慢,体现了CARS变量选择的粗选和精选两个过程.图4b为CARS变量选择过程中RMSECV曲线的变化.从图4b可以看出,RMSECV曲线随着采样次数的增加先缓慢下降而后逐渐上升,表明变量选择过程中先剔除与脐橙SSC无关的波长变量使得RMSECV值下降,而后开始剔除与脐橙SSC相关的波长变量,丢失有用信息导致RMSECV值上升.图4c为CARS变量选择过程中各波长变量相关系数的变化趋势.“*”所对应的位置为22次采样,为50次采样中的最佳变量选择结果即RMSECV值最小.由图4a可知,22次采样时被选择的波长变量为95个.图5为脐橙SSC被选择的波长变量的分布情况.
图5 脐橙SSC的被选择波长变量的分布情况
采用PLS方法利用被选择的波长变量对脐橙校正集样本进行交叉验证建模,建立脐橙SSC的在线预测模型.脐橙SSC的校正集相关系数和校正均方根误差 (RMSEC)为0.951和0.354%,交互验证相关系数和RMSECV为0.934和0.412%.与全光谱PLS模型相比,CARS-PLS所建立的预测模型性能得到有效提高,交互验证相关系数由0.871上升为0.934,RMSECV由0.560%下降为0.412%.此外,所用波长变量数由1733个下降为95个,有效地简化预测模型,提高模型的稳定性.
2.4 模型预测及误差分析
2.4.1 模型预测
利用CARS-PLS所建立的脐橙SSC在线预测模型对完全独立的预测集样本进行预测.图6为预测集样本的SSC预测结果,RMSEP为0.649%,实线为预测值与测量值的回归线,虚线为目标线(1∶1).图6中回归线与目标线之间比较接近但存在微小平移,表明该脐橙SSC在线预测模型可以较好地预测未知脐橙样本的SSC值.此外,脐橙SSC在线预测模型若是能消除回归线与目标线之间的微小平移,模型预测精度将得到进一步提高.
图6 脐橙预测集样本的SSC预测结果
2.4.2 预测误差分析
图7为脐橙预测集样本的SSC预测残差,两实线为残差±0.5%的界限,两虚线为残差±1.0%的界限.
图7 脐橙预测集样本的SSC预测残差
由图7可知,SSC预测残差落在±0.5%界限以内的脐橙样本为53个,占总预测样本数的55.8%,落在±0.5% ~1.0%界限以内的脐橙样本为29个,占总预测样本数的30.5%,落在±1.0%界限以外的脐橙样本为13个,占总预测样本数的13.7%.因此,SSC预测残差落在±1.0%界限以内的样本占总预测样本数的86.3%,该预测精度基本上可以满足脐橙SSC在线检测分级的需要(按SSC值分成高、中、低3个等级).
3 结论
可见/近红外半透射光谱结合CARS变量选择可以对脐橙SSC进行在线检测,CARS-PLS交互验证相关系数和RMSECV分别为0.934和0.412%.CARS变量选择方法能有效筛选有用波长变量,提高SSC在线预测模型的预测精度.CARS-PLS模型优于全光谱PLS模型,交互验证相关系数由0.871上升为0.934,RMSECV由0.560%下降为0.412%.独立预测集样本SSC的RMSEP为0.649%,SSC预测残差落在±1.0%界限以内的样本占总预测样本数的86.3%,基本可以满足脐橙SSC在线检测分级的需要.
References)
[1]McGlone V A,Martinsen P J.Transmission measurements on intact apples moving at high speed[J].Journal of Near Infrared Spectroscopy,2004,12(1):37 -43.
[2]Bobelyn E,Serban A S,Nicu M,et al.Postharvest quality of apple predicted by NIR-spectroscopy:study of the effect of biological variability on spectra and model performance[J].Postharvest Biology and Technology,2010,55(3):133-143.
[3]Cayuela J A,Weiland C.Intact orange quality prediction with two portable NIR spectrometers[J].Postharvest Biology and Technology,2010,58(2):113-120.
[4]Sun T,Lin H,Xu H,et al.Effect of fruit moving speed on predicting soluble solids content of‘Cuiguan’pears(Pomaceae pyrifolia Nakai cv.Cuiguan)using PLS and LS-SVM regression[J].Postharvest Biology and Technology,2009,51(1):86-90.
[5]McGlone V A,Clark C J,Jordan R B.Comparing density and VNIR methods for predicting quality parameters of yellow-fleshed kiwifruit(Actinidia chinensis)[J].Postharvest Biology and Technology,2007,46(1):1-9.
[6]Moghimi A,Aghkhani M H,Sazgarnia A,et al.Vis/NIR spectroscopy and chemometrics for the prediction of soluble solids content and acidity(pH)of kiwifruit[J].Biosystems Engineering,2010,106(3):295-302.
[7]Delwiche S R,Mekwatanakarn W,Wang C Y.Soluble solids and simple sugars measurement in intact mango using near infrared spectroscopy[J].Horttechnology,2008,18(3):410-416.
[8]Long R L,Walsh K B.Limitations to the measurement of intact melon total soluble solids using near infrared spectroscopy[J].Australian Journal of Agricultural Research,2006,57(4):403-410.
[9]Flores K,Sanchez M T,Perez-Marin D C,et al.Prediction of total soluble solid content in intact and cut melons and watermelons using near infrared spectroscopy[J].Journal of Near Infrared Spectroscopy,2008,16(2):91-98.
[10]Liu Y,Sun X,Ouyang A.Nondestructive measurement of soluble solid content of navel orange fruit by visible-NIR spectrometric technique with PLSR and PCA-BPNN[J].LWT-Food Science and Technology,2010,43(4):602-607.
[11]孙旭东,郝 勇,高荣杰,等.脐橙糖度近红外光谱在线检测数学模型优化研究[J].光谱学与光谱分析,2011,31(5):1230-1235.Sun Xudong,Hao Yong,Gao Rongjie,et al.Research on optimization of model for detecting sugar content of navel orange by online near infrared spectroscopy[J].Spectroscopy and Spectral Analysis,2011,31(5):1230-1235.(in Chinese)
[12]胡润文,夏俊芳.脐橙总糖近红外光谱模型传递研究[J].食品科学,2012,33(3):28-32.Hu Runwen,Xia Junfang.Transfer of NIRS calibration model for determining total sugar content in navel orange[J].Food Science,2012,33(3):28 -32.(in Chinese)
[13]蔡丽君,刘燕德,万常斓.脐橙糖度近红外光谱在线检测的建模变量优选[J].西北农林科技大学学报:自然科学版,2012,40(1):215-220.Cai Lijun,Liu Yande,Wan Changlan.Selection of NIR variables for online detecting sugar content of navel orange[J].Journal of Northwest A&F University:Natural Science Edition,2012,40(1):215-220.(in Chinese)
[14]Liu Y,Gao R,Hao Y,et al.Improvement of near-infrared spectral calibration models for Brix prediction in‘Gannan’navel oranges by a portable near-infrared device[J].Food Bioprocess Technol,2012,5(3):1106-1112.
[15]夏俊芳,李培武,李小昱,等.不同预处理对近红外光谱检测脐橙VC含量的影响[J].农业机械学报,2007,38(6):107-111.Xia Junfang,Li Peiwu,Li Xiaoyu,et al.Effect of different pretreatment method of nondestructive measure vitamin c content of umbilical orange with near-infrared spectroscopy[J].Transactions of the Chinese Society for Agricultural Machinery,2007,38(6):107-111.(in Chinese)
[16]Lu H,Jiang H,Fu X,et al.Non-invasive measurements of the internal quality of intact‘Gannan’navel orange by VIS/NIR spectroscopy[J].Transactions of the ASABE,2008,51(3):1009-1014.
[17]黎 静,薛 龙,刘木华,等.基于光谱技术识别不同农药污染脐橙的研究[J].江西农业大学学报,2010,32(4):723-728.Li Jing,Xue Long,Liu Muhua,et al.Recognition of different pesticide contamination in navel oranges based on spectra technology[J].Acta Agriculturae Universitatis Jiangxiensis,2010,32(4):723 -728.(in Chinese)
[18]赵 珂,熊 艳,赵 敏.基于近红外光谱技术的脐橙快速无损检测[J].激光与红外,2011,41(6):649-652.Zhao Ke,Xiong Yan,Zhao Min.Rapid non-destructive testing of navel orange based on near infrared spectroscopy[J].Laser & Infrared,2011,41(6):649 - 652.(in Chinese)
[19]Li H D,Liang Y Z,Xu Q S,et al.Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J].Analytica Chimica Acta,2009,648(1):77-84.