基于高光谱成像技术的草莓硬度预测
2018-03-26卢娜韩平王纪华
卢娜 韩平 王纪华
摘要:为对草莓硬度进行预测研究,利用高光谱成像系统获取草莓的高光谱数据,光谱数据波长为400~1 000nm,采用标准正态变换(SNV)、多元散射校正(MSC)、卷积平滑方法(SavitzkyGolay )以及几种方法相结合对光谱数据进行预处理,选择最优的预处理方法,进一步结合化学计量学方法建立PLS预测模型,比较不同的光谱预处理方法对预测模型的效果,以选择最优预测模型。结果表明,经标准正态变换(SVN)处理后建立的偏最小二乘(PLS)模型效果最好,校正集和预测集的相关系数及均方根误差分别为0.989,0.882和0.021,0.073。因此,可采用高光谱成像技术对草莓硬度进行预测。
关键词:高光谱成像技术;草莓;硬度;无损检测
DOIDOI:10.11907/rjdk.172845
中图分类号:TP319
文献标识码:A文章编号文章编号:16727800(2018)003018003
英文摘要Abstract:To predict the firmness of strawberry, hyperspectral data of strawberry were obtained by hyperspectral imaging system. The spectral data were wavelengths of 400~1 000nm.There were used to acquire the best pretreatment method in the spectral region that is standard normal transform (SNV), multiple scattering correction (MSC), convolution smoothing method (SavitzkyGolay) and combined several methods. We will establish the partial least squares forecasting model with chemometrics and then compare the effect of different spectral preprocessing methods on the prediction model to select the optimal prediction model. The results show that the partial least squares (PLS) model established by standard normal transform (SVN) is best. The correlation coefficients and root mean square errors of the calibration set and the prediction set are 0.989, 0.882 and 0.021, 0.073, respectively. Therefore, hyperspectral imaging techniques can be used to predict the firmness of strawberry.
英文关键词Key Words:hyperspectral imaging technique; strawberry; firmness; nondestructive detection
0引言
草莓又叫红莓、洋莓、地莓等,原产于南美,在中国各地及欧洲等地广为栽培。草莓营养价值丰富,有“水果皇后”的美誉,含丰富维生素C,有帮助消化的功效。与此同时,草莓还有巩固齿龈、清新口气、润泽喉部、保护视力等保健功效。因此,草莓成为深受广大消费者喜爱的水果之一,人们在选择时也就会更加关注草莓的内部品质。硬度是评价草莓内部品质的主要指标之一,由于草莓保存时间较短,很容易变质,检测草莓的硬度不仅有助于指导消费者,而且对于草莓的采后贮藏和加工具有重要意义。目前主要采用探头压入的方法检测草莓硬度,这种方法不仅耗时、费力,而且是一种有损检测方法,不利于水果的大规模检测[15]。因此,寻找一种快速无损检测水果品质的方法很有必要。
高光谱成像技术因其优越性,不仅在遥感领域大量应用,在水果品质无损检测领域也应用广泛。它集合了成像技术和光谱技术两者的优点,具有“图谱合一”的特点,其中提取图像信息检测水果外部品质,提取光谱信息则用于检测水果内部品质,同时可将图像信息和光谱信息进行特征融合,以此更好地检测水果的内外部品质[6,7]。近年来,国内外研究学者已将高光谱成像技术应用到水果品质的检测中。Janos[8]、GómezSanchis[9]、李江波等[10]利用高光谱成像技术对苹果早期淤伤、柑橘表面腐烂、桃的皮肤缺陷进行检测研究;Sun[11]、Polder[12]、洪添胜等[13]采用高光谱成像技术对水果的内部品质进行检测研究,都取得了良好的效果。因此,高光谱成像技术在水果品质检测上具有很大的发展潜力。本文以采后新鲜草莓为试验材料,利用高光譜成像技术并结合化学计量学对其进行建模分析,以达到检测草莓硬度的目的,并为利用高光谱成像技术对草莓品质进行检测与分级提供技术依据。
1材料与方法
1.1实验样品
采集新鲜、大小均匀的草莓样品120个,品种为甘露。采摘后放置于4℃条件下冷藏,隔天取出样品放置6h,使其处于室温下并编号。对其采集高光谱图像和硬度测量。
1.2高光谱采集
高光谱成像系统(见图1),是由EMCCD相机(Andor Luca EMCCD DL604M,Andor Technology plc.,Ireland)、高光谱成像仪(ImSpector V10E,Spectral Imaging Ltd.,Oulu,Finland)、两个500W石英卤素灯光源(天安国际有限公司,中国台湾)、可编程的电动定位样品台(EZHR17EN,AllMotion,Inc.,America)以及一台计算机组成。波长范围为325~1 100nm,光谱分辨率为2.8nm。
高光譜图像采集应置于暗室条件下,采集前需要将仪器预热半小时左右,为了减少基线漂移对数据造成的影响,相机设置在连续模式下,具有22ms的曝光时间。收集的光谱图像被存储为立方体数据块,这种立方体块不是传统意义上的黑、白或者R/G/B,区别在于它在光谱维度上有多个通道,以达到图谱合一的目的。
由于光源强度不均匀,在CCD相机中存在很多暗电流,因此会产生很大的噪声,需要进行黑白校正才能消除部分噪声以获得更有效的原始光谱数据。如式(1)所示:
R=R0-DW-D×100%(1)
式(1)中:R0是样本原始的漫反射光谱图像,W是白板的漫反射图像,D是暗图像,R是校正后的漫反射光谱图像。
1.3硬度测定
水果硬度计是测量水果硬度的专用仪器,它的用途非常广泛,在种子培育、产后贮藏、产后运输和加工等方面,都需要对水果的硬度进行检测。实验采用型号为JC05FT02的水果硬度计测量草莓的硬度。首先将硬度计归零,将硬度计插入果肉中,插入长度不得超过刻度线,分别在赤道部位向阳区和背阳区各测定1次硬度值,记录并取其平均值。测量范围为0~1kg;探头直径为6mm。草莓硬度计算如式(2)所示:
P=mg/s(2)
P为硬度值,单位为N;m为硬度计读数,单位为kg,g取9.8N/kg;s为果实受力面积,单位为m2。
1.4数据处理及模型验证
由于高光谱数据量大,冗余度较高,既存在有用信息,也有很多无用信息和各种噪声,因此在建模之前对数据进行预处理很有必要。光谱数据预处理的方法有很多,本次研究选用标准正态变换(SNV)、多元散射校正(MSC)、卷积平滑方法(SavitzkyGolay)以及几种方法相结合对光谱数据进行优化。标准正态变换(SNV)主要是消除采集光谱时散射光所产生的误差,对光谱数据进行标准正态化处理。多元散射校正(MSC)也是用来消除散射影响的,但是与标准正态化处理不同的是,它消除由于颗粒尺寸及其分布不均匀带来的影响,进而提高对有用信息的提取,以获得较为理想的光谱。卷积平滑方法(SavitzkyGolay)是一种比较常用的数据预处理方法,用来消除高光谱成像系统收集光谱信息时产生的随机误差,以减少噪声。
模型的评价指标为相关系数R和均方根误差,校正集和验证集的相关系数越接近1,均方根误差越接近0,且校正集和验证集的均方根误差越接近,说明模型效果较好。
2结果与讨论
2.1样本集划分
随机选择90个作为校正集,30个作为预测集,样本集划分见表1。
2.2光谱数据获取
将草莓置于高光谱成像系统的移动操作台上,采取线扫描方式获取光谱数据,该方式是在空间域进行扫描,特别适合于传送带上方物体的动态检测,是果蔬品质检测时最为常用的图像获取方式。由于草莓体积较小,检测过程中以10个草莓为一组构成一幅图像(见图2)。
采用ENVI4.7软件对采集的光谱图像进行光谱信息提取,为了使光谱数据更准确,提取整个样本的平均光谱作为原始光谱,如图3,由于小于400nm和大于100nm的光谱数据噪声较大,因此,选取400~1 000nm波长的数据。
2.3模型建立与评价
本次研究利用Unscrambler软件采用不同的方法对原始光谱进行预处理,并使用该数据进行建模,分析不同的预处理方法对预测模型的作用。应用偏最小二乘回归(PLSR)建立草莓硬度预测模型,并对模型的预测能力进行验证和精度评价。采用不同预处理方法的偏最小二乘(PLS)模型效果如表2所示。
由表2可知,原始光谱数据经过标准正态变换处理后建立的预测模型,校正集和验证集的相关系数分别为0.989和0.882,相较于其他模型更为稳定,预测效果最好,而且RMSEC和RMSEP较低且比较接近。一个好的模型不只是要求较高的RC,还要看RP,在使用不同的数据预处理方法后,结合SVN处理的预测模型RC和RP都较高,且RMSEC和RMSEP的值较大、相差较少。因此,经过标准正态变换处理后建立的模型最为合适。经过标准正态变换处理后建立的PLS验证模型见图4。
3结语
利用高光谱成像技术对草莓硬度预测进行研究,运用多种预处理方法,消除采集光谱数据过程中所产生的噪声,并建立了PLS定量预测分析模型。结果表明,不同预处理方法都有一定效果,采用经过标准正态变换(SVN)预处理后的光谱建立PLS预测模型,校正集和验证集的相关系数RC和RP分别为0.989和0.882,RMSEC和RMSEP分别为0.021和0.073。研究结果表明,利用高光谱成像技术对草莓硬度的预测方法是可行的。在以后对草莓的研究过程中可以增加草莓的种类,研究贮藏过程中草莓内部品质的变化,以延长草莓的贮藏期。建立预测效果更佳且更为稳定的模型,促进高光谱成像技术在果蔬品质检测中有更广泛应用。
参考文献参考文献:
[1]PETER R.S. Improving the protein content and composition of cereal grain[J]. Journal of Cereal Science,2007,11(3):239250.
[2]毕京翠,张文伟,肖应辉,等.应用近红外光谱技术分析稻米蛋白质含量[J].作物学报,2006(5):709715.
[3]陆艳婷,金庆生,叶胜海,等.应用近红外光谱技术快速测定粳稻品种的直链淀粉含量[J].中国粮油学报,2007(3):149153.
[4]刘建学,吴守一,方如明.大米直链淀粉含量的近红外光谱分析[J].农业工程学报,2000(3):9496.
[5]陈季旺,刘英,刘刚,等.大米淀粉纯化工艺及其性质的研究[J].农业工程学报,2007(9):225228.
[6]饶秀勤.基于机器视觉的水果品质实时检测与分级生产线的关键技术研究[D].杭州:浙江大学,2007.
[7]徐广通,袁洪福,陆婉珍.现代近红外光谱技术及应用进展[J].光谱学与光谱分析,2000(2):134142.
[8]JANOS C. K, MOHAMMAD G. Realtime pixel based early apple bruise detection using short wave infrared hyperspectral imaging in combination with calibration and glare correction techniques[J]. Food Control,2016,66:215226.
[9]GMEZSANCHIS J, MARTINGUERRERO J D, SORIAOLIVAS E, et al. Detecting rottenness caused by penicillium genus fungi in citrus fruits using machine learning techniques[J]. Expert Systems with Applications,2009,39(1):780785.
[10]LI J B, CHEN L P, HUANG W Q, et al. Multispectral detection of skin defects of bicolored peaches based on visNIR hyperspectral imaging[J]. Postharvest Biology and Technology,2016:112121,133.
[11]SUN M J, ZHANG D, LIU L, et al. How to predict the sugariness and hardness of melons: a nearinfrared hyperspectral imaging method[J]. Food Chemistry,2016,218: 413421.
[12]POLDER G, YOUNG I T. Spectral image analysis for measuring ripeness of tomatoes[J] . Trans of ASAE,2002,45(4):11551161.
[13]洪添胜,乔军,赵祚喜,等.基于高光谱图像技术的雪花梨品质无损检测[J].农业工程学报,2007(2):151155.
责任编辑(责任编辑:何麗)