APP下载

小波变换和连续投影算法在火龙果总酸无损检测中的应用

2016-07-12洪添胜吴伟斌梅慧兰

光谱学与光谱分析 2016年5期
关键词:总酸火龙果小波

罗 霞,洪添胜,罗 阔,代 芬,吴伟斌,梅慧兰,林 凛

1.华南农业大学电子工程学院,广东 广州 510642 2.华南农业大学南方农业机械与装备关键技术教育部重点实验室, 广东 广州 510642 3.国家柑橘产业技术体系机械研究室,广东 广州 510642 4.华南农业大学工程学院,广东 广州 510642

小波变换和连续投影算法在火龙果总酸无损检测中的应用

罗 霞1, 2, 3,洪添胜2, 3, 4*,罗 阔2, 3, 4,代 芬1, 2, 3,吴伟斌2, 3, 4,梅慧兰2, 3, 4,林 凛4

1.华南农业大学电子工程学院,广东 广州 510642 2.华南农业大学南方农业机械与装备关键技术教育部重点实验室, 广东 广州 510642 3.国家柑橘产业技术体系机械研究室,广东 广州 510642 4.华南农业大学工程学院,广东 广州 510642

应用可见/近红外光谱技术、小波变换(WT)和连续投影算法(SPA),对火龙果总酸含量(TA)进行精确、快速的无损检测,为火龙果内部品质无损检测提供科学依据。利用Maya2000光纤光谱仪采集380~1 099 nm范围的火龙果漫反射光谱数据,通过WT消噪、SPA优选波长和偏最小二乘回归(PLSR)分析方法,建立了火龙果总酸的定量预测模型。试验结果表明:经过WT消噪联合SPA优选波长压缩光谱变量后建立的WT-SPA-PLSR模型,预测精度都高于全谱PLSR模型。由全部样本的原始光谱变量作为输入变量建立PLSR模型的预测相关系数(Rp)为0.851 394, 预测均方根误差(RMSEP)为0.086 848; 全部样本的原始光谱数据使用dbN(N=2,3,…,10)小波进行分解消噪,其中消噪效果最优的是db4小波2层分解(db4-2),WT-PLSR模型的Rp为0.915 635,RMSEP为0.066 752,小波变换消噪后的光谱预测模型精度明显提高; 原始光谱经过db10-3小波消噪联合SPA算法,从570个光谱变量中优选出530,545,604,626,648,676,685,695,730,897,972,1 016 nm共12个变量作为输入变量,建立WT-SPA-PLSR预测模型,模型的RP为0.882 83, RMSEP为0.077 39。SPA算法适合火龙果TA模型的光谱变量选择,能够有效提取与总酸相关度高的波长变量,增加了预测模型的精度和稳定性。研究结果表明小波变换技术联合连续投影算法的漫反射近红外光谱无损检测火龙果总酸含量具有可行性。

可见/近红外光谱技术; 无损检测; 小波变换(WT); 连续投影算法(SPA); 火龙果; 总酸(TA)

引 言

水果品质无损检测一直是农业工程领域重要的研究课题[1]。随着生活水平提高,越来越多的人们在选购水果时,不仅注重水果的形状、外观等直观品质,更加重视水果内部品质如口感、甜酸度等。火龙果是热带特色水果之一,果肉细腻,其总酸含量是衡量火龙果品质的主要指标之一。传统检测水果总酸含量一般采用化学方法,不仅操作复杂,检测时间长,而且是一种有损检测。因此寻求快速、无损检测方法是非常必要的。

可见/光谱分析作为一种新型分析技术,具有绿色无污染、快速、便捷等特点,在水果品质无损检测中得到广泛应用。Shyam等[2]对七个不同品种芒果的可溶性固形物和pH值进行了检测; Cayuela等[3]应用可见-近红外光谱仪结合偏最小二乘法(PLS)建模,对油桃的可溶性固形物 (SSC)、硬度、水果重量和果皮颜色等相关指标进行了定量分析; 国内学者欧阳爱国等为简化近红外光谱模型,提高对苹果可溶性固形物含量的预测精度,将移动窗口偏最小二乘法(MWPLS)与遗传算法、连续投影算法相结合优选特征变量,建立偏最小二乘回归校正模型; 洪涯等[4]应用连续投影算法(SPA)对砂糖橘总酸近红外光谱无损检测模型进行优化,模型预测相关系数Rp分别为0.829 470,0.837 095和0.857 299。目前很多学者对荔枝、脐橙、西瓜、苹果、梨、猕猴桃等水果进行了评价研究[5-8],检测方式主要以漫反射、透射和漫透射光谱检测为主,但是对火龙果总酸进行无损检测鲜有报道。

利用可见/近红外光谱分析技术,采集漫反射光谱,通过小波变换(wavelet transform,WT)消除光谱噪声,运用连续投影算法(successive projections algorithm,SPA)优选波长,建立了小波变换消噪-偏最小二乘回归(wavelet transform-partial least square regression,WT-PLSR)和小波消噪联合连续投影算法-偏最小二乘回归(wavelet transform-successive projections algorithm-partial least square regression,WT-SPA-PLSR)预测模型,为实现火龙果无损检测提供科学依据。

1 实验部分

1.1 材料与试剂

试验所用的火龙果均为产于广东省湛江市的白肉火龙果,将其洗净擦干后,剔除有损的样本,最后得到试验样本157个。试验中测量火龙果样本总酸所用试剂为:蒸馏水、酚酞指示剂、分析纯氢氧化钠、邻苯二甲酸氢钾、乙醇等。

1.2 仪器

试验所用的主要设备为Maya2000pro光纤光谱仪(测量范围在380~1 099 nm; 数据输出间隔为1 nm),直径为200 μm的光纤,积分球,计算机,分析天平,打浆机等。

1.3 方法

1.3.1 光谱数据采集

光谱数据采集于华南农业大学工程学院北302实验室,室内温度控制在(25±1)℃,光谱采集如图1所示,试验所用设备主要包括Maya2000pro光纤光谱仪、光源、光纤、积分球、全封闭实验箱、USB数据线和计算机等。

光谱采集前,先采用漫反射标准白黑板进行标定。采集时,将火龙果样本直接放在积分球上方,采集火龙果的漫反射光谱。经过优化调整,光谱采集软件参数设置为:积分时间为10 ms,平滑宽度为5 nm。为了最大可能降低由于样本果形大小不等、光源强度不均匀和仪器设备等因素的影响,光谱采集位置如图2所示,在每个火龙果赤道位置取间隔90°的4点、果梗和果蒂位置取间隔120°的各3点进行测量,每一个样本采集10个点,每个点扫描5次,取5次均值作为该点的光谱数据,再取10个采集点光谱均值作为一个火龙果样本的漫反射光谱,采集的157个样品的漫反射光谱如图3所示。

研究中用到的数据分析软件有科思凯光谱分析软件,Unscrambler 9.8,Excel 2007,Matlab 2009a(Mathsworks,USA)。

1.3.2 总酸化学测定方法

样本光谱数据采集后,尽快采用化学方法测定其总酸含量。总酸的测量方法参照国标GB/T12293—90《水果、蔬菜制品可滴定酸的测量》。按照(sample set partitioning based on joint X-Y,SPXY)样本划分方法[9]选取120个试验样本作为校正集,37个试验样本作为预测集。所有样本总酸分布如表1所示。

图1 火龙果漫反射检测方式示意图

图2 火龙果光谱采集位置示意图

图3 157个火龙果样本漫反射光谱

表1 火龙果样本总酸含量统计表

1.3.3 连续投影算法

连续投影算法是一种新型变量选择方法,通过向量的投影分析,从光谱矩阵提取有效信息,并使光谱变量共线性最小[10]。具体算法步骤见参考文献[4]。

1.3.4 建模方法和模型评价标准

多元线性回归(multivariate linear regression, MLR)是数理统计学中常用的回归分析方法,建立因变量与多个自变量的最优组合的回归方程。偏最小二乘法回归(partial least square regression,PLSR)是一种多元数据统计分析方法,该方法是集主成分分析、普通多元线性回归和典型相关分析于一体的回归分析方法,解决了自变量多重共线性的问题[11],在光谱分析中得到了广泛应用。为了有效评价模型精度,实验选取了交叉验证相关系数(correlation coefficient of cross validation,RCV)、交叉验证均方根误差(root mean square error of cross validation,RMSECV)、预测相关系数(rorrelation coefficient of prediction,Rp)和预测均方根误差(root mean square error of prediction,RMSEP)作为评价标准,RCV和Rp值越大,RMSECV和RMSEP值越小,模型的预测效果越好。

2 结果与讨论

2.1 光谱数据分析

实验采集的光谱范围为380~1 099 nm,如图3所示,由于光谱在380~529 nm波段范围内光谱噪声较大,故实验中选择的光谱范围为530~1 099 nm,共计570个光谱变量作为后续处理的数据。

2.2 基于小波消噪的光谱预处理

小波分析是近年来国际上广为关注的一种信号分析方法,具有多分辨率分析的特点,小波变换是时间和频率的局部变换,能有效区分信号的突变部分和噪声,从而实现信号的降噪。常用的小波基函数有Haar,Daubechies,Biorthogonal,Coiflets,Symlets等,不同小波基函数分解层数各有不同。试验采用具有正交性和离散小波变换功能的Daubechies(dbN)小波基对光谱数据进行消噪。Daubechies(dbN)小波基是一个小波族,从db1-db10有10个小波基,一般记为dbN,N为小波的序号,N值取2, 3, …, 10。

将全部样本的原始光谱数据使用dbN(N=2,3,…,10)进行分解消噪。数据波长范围为530~1 099 nm。对光谱数据分别选择小波基函数db2-db10,进行2,3,4共3层分解和消噪,消噪时选用wpbmpen函数获取阈值,采用wpdencmp函数进行小波包消噪。将消噪后的光谱数据建立PLSR模型,比较不同分解尺度下的不同小波基函数消噪对火龙果TA模型的影响,探索最佳分解尺度和小波基函数。PLSR建模效果如表2所示。

由表2可以看到,不同的dbN小波基采用的不同的分解尺度所建立的模型精度存在差异。原始光谱数据建立的PLSR模型的RCV为0.852 522,RMSECV为0.101 011。3个分解尺度的比较,以3层分解尺度为例,按照模型评价标准,消噪效果最好的是db6小波3层分解(db6-3), 其模型的RCV为0.861 733,RMSECV为0.097 730,消噪效果最差的是db2-3,RCV为0.847 063,RMSECV为0.102 646,其校正模型预测效果略低于原始光谱模型。

同一种小波基函数,分解尺度不同消噪效果也不同。对于db6小波消噪,分解尺度分别为2,3,4层,结合表2,可以得出,db6-4消噪效果最好,db6-2消噪效果较差。

经过db3-2后,RCV由原来的0.852 522提高到0.860 511,RMSECV由原来的0.101 011降到0.098 280; 经过db4-3,RCV由原来的0.852 522提高到0.860 844,RMSECV由原来的0.101 011降到0.098 022; 经过db6-4,RCV由原来的0.852 522提高到0.862 025,RMSECV由原来的0.101 011降到0.097 689,模型的精确度和稳定性得到提高。可见db3-2,db4-3,db6-4较适合火龙果TA模型的光谱预处理。

表2 基于dbN小波消噪的光谱PLSR建模结果比较

Note:dbN-nmeans noise reduction which were decomposed in levelnusing wavelet function dbN

2.3 小波消噪预测模型验证

对比图a和图b可知,加入纳米粒子后,增塑剂分子的热逸散峰值温度由139.07 ℃升高至142.28 ℃、淀粉分子的裂解峰值温度从 393.40 ℃升高至394.50 ℃,即纳米粒子的加入促进了两种分子峰值温度的升高。有研究表明,纳米粒子层状结构在材料基体中可充当热屏障作用,阻碍材料基体中增塑剂分子和多糖分子链的运动[16,28];另一方面,加入纳米粒子后,材料表面形成C-Si形成了“桥联”[29],从而纳米粒子与酯化淀粉分子相互作用形成的聚集态结构,对增塑剂的热逸散和淀粉分子的热裂解行为都存在一定的限制作用。

用校正集120个样本经过小波消噪后,建立PLSR模型,采用留一全交叉验证来确定最佳主成分数(PCs),并对37个样本进行预测,统计结果如表3所示。

由表3可知,经过不同的小波消噪后建立的PLSR模型的预测精度都高于未消噪的PLSR模型,其中消噪效果最好的是db4-2,如图4(a)所示,PLSR模型的Rp=0.915 635,RMSEP=0.066 752,其次是db8-3,如图4(b)所示,PLSR模型的Rp=0.871 622,RMSEP=0.081 138,说明小波消噪适合于火龙果总酸含量的可见/近红外光谱预处理,小波消噪后的光谱预测模型精度明显提高。

2.4 基于SPA优选波长

采用校正集120个样本的光谱变量570个建立的PLSR全谱模型,在建模过程中,光谱数据量很大,同时还会引入干扰变量,反而会降低模型的预测精度[5]。在全谱范围内使用SPA,进行光谱变量压缩。对表3中的九种模型,进行SPA运算,得到九种优选波长,优选出来的光谱变量见表4。

表3 八种不同小波消噪后的PLSR预测模型结果比较

Note:dbN-nmeans noise reduction which were decomposed in levelnusing wavelet function dbN

图4 不同小波消噪预处理后的预测模型回归图

表4 SPA优选波长

Note:dbN-nmeans noise reduction which were decomposed in levelnusing wavelet function dbN

2.5 建模结果分析

对校正集120个样本,使用全谱和经过SPA压缩后的优选波长分别建立PLSR模型、MLR模型,并对预测集37个样本进行预测,统计结果如表5所示。

由表5可知,模型1是全谱570个变量建立的PLSR模型,经过SPA进行数据压缩后提取出11个优选波长建立的PLSR模型2,模型变量仅为模型1变量的2%,得到的模型的Rp=0.870 06, RMSEP=0.080 82,如图5(a)所示,其预测精度优于全谱模型1,说明SPA适合火龙果TA模型的光谱变量选择,能够有效提取与总酸相关度高的波长变量,增加了预测模型的精度和稳定性。

经过小波去噪和SPA优选波长压缩光谱变量后建立的PLSR模型,预测效果都高于全谱模型的预测精度,其中原始光谱经过db10-3小波去噪和SPA算法后建立的模型18,最终提取出530,545,604,626,648,676,685,695,730,897,972,1 016 nm共12个变量,取得了相关系数为Rp=0.882 83, RMSEP=0.077 39,如图5(b)所示,精度高于全谱PLSR模型1和经SPA压缩后的模型2,说明小波消噪能够有效去除光谱噪声,提高模型的预测精度。

对于PLS模型和MLR模型,基于同种消噪方法和同种输入变量的比较,PLSR模型和MLR模型预测精度相差不大。

表5 PLSR和MLR模型预测结果

Note:dbN-nmeans noise reduction which were decomposed in levelnusing wavelet function dbN

图5 不同预处理和SPA后预测模型回归图

3 结 论

研究工作表明利用可见/近红外光谱技术、小波消噪和连续投影算法的新方法无损检测火龙果总酸含量是可行的。从试验中得到如下结论。

(1)采用Daubechies(dbN)小波基对光谱数据进行消噪,将消噪后的光谱采用PLSR建立模型,不同的dbN小波采用的不同的分解尺度所建立的模型精度存在差异,以3层分解尺度为例,按照模型评价标准,消噪效果最好的是db6-3, 其模型的RCV为0.861 733,RMSECV为0.097 730,消噪效果最差的是db2-3,RCV为0.847 063,RMSECV为0.102 646,其校正模型预测效果略低于原始光谱模型。

(2)经过不同的小波消噪后建立的WT-PLSR模型的预测精度都高于未消噪的PLSR模型,其中消噪效果最好的是Db4-2,WT-PLSR模型的Rp=0.915 635,RMSEP=0.066 752,说明小波消噪适合火龙果总酸含量的可见/近红外光谱预处理,小波消噪后的光谱预测模型精度明显提高。

(3)经过小波变换消噪联合连续投影算法优选波长压缩光谱变量后建立的WT-SPA-PLSR模型,预测效果都高于全谱模型的预测精度,原始光谱经过db10-3小波去噪和SPA算法后建立的预测模型,最终提取出530,545,604,626,648,676,685,695,730,897,972,1 016 nm共12个变量,取得了Rp=0.882 83, RMSEP=0.077 39,说明SPA适合火龙果TA模型的光谱变量选择,能够有效提取与总酸相关度高的波长变量,提高了预测模型的精度和稳定性。

[1] HONG Tian-sheng, LI Zhen, WU Chun-yin, et al(洪添胜, 李 震, 吴春胤, 等).Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2007, 23(11) : 280.

[2] Shyam N J, Pranita J, Narsaiah K, et al.Scientia Horticulturae, 2012, 138: 171.

[3] Cayuela J A.International Journal of Postharvest Technology and Innovation, 2011, 2(2): 131.

[4] HONG Ya, HONG Tian-sheng, DAI Fen, et al(洪 涯, 洪添胜, 代 芬, 等).Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2010, 26(Supp.2): 380.

[5] DAI Fen, CAI Bo-kun, HONG Tian-sheng, et al(代 芬, 蔡博昆, 洪添胜, 等).Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2012, 28(15): 287.

[6] LIU Yan-de, SHI Yu, CAI Li-jun, et al(刘燕德, 施 宇, 蔡丽君, 等).Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2013, 44(9): 138.

[7] JIE Deng-fei, XIE Li-juan, RAO Xiu-qin, et al(介邓飞, 谢丽娟, 饶秀勤, 等).Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2013, 29(12): 264.

[8] GUO Wen-chuan, WANG Ming-hai, YUE Rong(郭文川, 王铭海, 岳 绒).Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2013, 44(2): 142.

[9] Galvao R K H, Araujo M C U, Jose G E, et al.Talanta, 2005, 67: 736.

[10] CHEN Bin, MENG Xiang-long, WANG Hao(陈 斌,孟祥龙,王 豪).Journal of Instrumental Analysis(分析测试学报), 2007, 26(1): 66.

[11] QIN Hao, LIN Zhi-juan, CHEN Jing-wu(秦 浩,林志娟,陈景武).Journal of Mathematical Medicine(数理医药学杂志),2007,20(4): 450.

(Received Jan.6, 2015; accepted Apr.26, 2015)

*Corresponding author

Application of Wavelet Transform and Successive Projections Algorithm in the Non-Destructive Measurement of Total Acid Content of Pitaya

LUO Xia1, 2, 3, HONG Tian-sheng2, 3, 4*, LUO Kuo2, 3, 4, DAI Fen1, 2, 3, WU Wei-bin2, 3, 4, MEI Hui-lan2, 3, 4, LIN Lin4

1.College of Electronic Engineering, South China Agricultural University, Guangzhou 510642, 2.Key Laboratory of Key Technology on Agricultural Machine and Equipment, Ministry of Education, South China Agricultural University, Guangzhou 510642, 3.Division of Citrus Machinery, China Agriculture Research System,Guangzhou 510642, 4.College of Engineering, South China Agricultural University, Guangzhou 510642, China

The objective of present study was to find out an accurate, rapid and nondestructive method to detect total acid content (TA) of pitaya with visible/near-infrared spectrometry, wavelet transform (WT) and successive projections algorithm (SPA), which will provide scientific basis for non-destructive measurement of pitaya.Maya2000 fiber-optic spectrumeter was used to collect spectral data of pitaya on the wavelength in the range of 380~1 099 nm; and then with the methods of WT denosing pretreatment, SPA and partial least squares regression (PLSR) quantitative forecasting model of TA of pitaya was established.The result showed that the precision of WT-SPA-PLSR model, which combine the WT with SPA, was better than that of PLSR model based on the whole wave variables.The relation coefficient of the PLSR model (Rp) that predicted TA based on the original spectrum of all samples as the input variables was 0.851 394 and RMSEP was 0.086 848.The original spectrum variable of the all samples were processed by using wavelet function dbN(N=2, 3, …, 10) for wavelet decomposition and de-noising.The optimal results of noise reduction were decomposed in level 2 using wavelet function db4 (db4-2).TheRpof WT-PLSR model was 0.915 635 and RMSEP was 0.066 752.The prediction of model using wavelet transform de-noising was improved significantly.After the original spectrum processed by db10-3 and SPA, 12 preferred variables were selected from 570 spectrum variables, such as 530, 545, 604, 626, 648, 676, 685, 695, 730, 897, 972, 1 016 nm spectrum variables.The WT-SPA-PLSR model based on these 12 variables as input variables was established.Rpof the WT-SPA-PLSR prediction model was 0.882 83 and RMSEP was 0.077 39.SPA algorithm was suitable for the selection of spectrum variables which could effectively obtain the spectrum variables which were strong correlation with TA and increase the accuracy and stability of the prediction model.The results indicated that the nondestructive detection for TA of pitaya based on the diffuse reflectance visible/near-infrared spectrometry, WT and SPA was feasible.

Visible/near-infrared spectrometry; Nondestructive examination; Wavelet transform (WT); Successive projections algorithm (SPA); Pitaya; Total acid content (TA)

2015-01-06,

2015-04-26

国家现代农业产业技术体系建设专项项目(CARS-27)和教育部高等学校博士学科点专项科研基金项目(20124404120006)资助

罗 霞,女,1973年生,华南农业大学电子工程学院实验师 e-mail: btxlx@scau.edu.cn *通讯联系人 e-mail: tshong@scau.edu.cn

S123

A

10.3964/j.issn.1000-0593(2016)05-1345-07

猜你喜欢

总酸火龙果小波
基于多小波变换和奇异值分解的声发射信号降噪方法
红心火龙果不神奇
构造Daubechies小波的一些注记
邱婕 火龙果带火创业路
基于MATLAB的小波降噪研究
初探影响液态法米酒总酸总酯的因素
食品中总酸的测定方法确认报告
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
百色当地产圣女果主要营养成分的测定
滴定法测定食醋中总酸含量及其不确定度评定