苹果霉心病光谱在线检测的摆放姿态及建模方法优化研究
2021-11-11张剑一傅霞萍
秦 楷,陈 刚,张剑一, ,傅霞萍*
1.浙江理工大学机械与自动控制学院,浙江 杭州 310018 2.德菲洛(杭州)科技有限公司,浙江 杭州 310014
引 言
苹果富含矿物质、维生素、多酚及黄酮类等营养物质,营养价值高,口味酸甜,是很受消费者喜爱的一种水果。苹果种植过程中会出现很多病症,霉心病(又称心腐病)就是其中一种,该病由多种病原菌引起,病菌主要通过花萼传播危害果实健康,在发病初期会在苹果心室附近出现褐色斑点,恶化后会变成白色或粉色霉状物,较为严重的会导致心室腐烂并逐步向外扩散[1]。感染霉心病的苹果一般是不能食用的,因此在销售苹果前需要剔除病果。传统的霉心病判别方法往往结合经验进行破坏性抽样,费时费力且准确率低不适合当前水果生产销售的实际。寻找一种水果内部病变的无损检测方法以及建立水果内部品质快速、准确的智能分选线符合目前市场需求,近年来行业内越来越多的企业已经陆续开始做多品类、大规模、针对内在品质的水果分级。
可见近红外光谱分析技术是一项高效、低成本、无污染的无损检测技术,已经广泛应用于农业、食品业、医药业及矿业等各行各业。近年来,国内外不少学者也利用可见近红外光谱分析技术开展水果病害的快速无损检测研究,其中涉及内部病变检测的如:Khatiwada等[2]利用该技术对在大气中储藏的苹果内部褐变病症进行了预测,采用LDA,PLS-DA,SVM和逻辑回归4种判别方法,结果显示PLS-DA效果最佳;Shenderey等[3]在现有的微型光谱分析仪的基础上,研制了一套适合于在线近红外光谱测量的仪器,采用偏最小二乘回归(PLSR)方法在线检测苹果霉心病;Sun等[4]利用可见近红外光谱在600~904 nm范围内,通过相关分析选取两个特征波段用于判别褐心梨;Mogollonca等[5]采用偏最小二乘和支持向量机方法建立了定性和定量模型,预测“Cripps Pink”苹果内部是否褐变及褐变面积;Zhou等[6]提出了一种基于透光光谱的苹果霉变快速无损检测方法, 采用人工神经网络(ANN)和SVM两种分类算法建立模型,利用遗传算法(GA)对模型参数进行优化,判定苹果核是否霉变;采用透射光谱区分霉心病健康果和病果时果径会对预测结果产生影响,为解决这一问题,Tian等[7]提出了一种基于果实大小的光谱校正方法,通过计算透射光在苹果内部的消光系数对透射谱进行了修正,从而得到更好的判别效果。Hu等[8]通过连续投影算法(SPA)选择出区分健康苹果和霉心病苹果的最佳波长,将提取的波长作为反向传播人工神经网络(BP-ANN)的输入建立判别模型。
在上述研究基础上,本研究针对苹果在线检测中不同摆放姿态对光谱采集的影响,开展了果实姿态对霉心病检测的影响分析,通过采用不同算法建立多种判别模型进行对比分析,实现苹果霉心病光谱在线检测的摆放姿态及建模方法优化。
1 实验部分
1.1 样品
样品是产自中国陕西省洛川县的红富士苹果,在洛川当地选购后快递运往实验室。剔除有明显外部损伤的果实后,最终选出96个苹果样品用于本次检测。测量所有样品外观参数后用标签标注,放置在实验室内等待第二天的检测。
1.2 光谱采集
采用带暗箱的传送装置,将苹果样本置于托盘上方,由传送带输送至检测位置,卤素光源(12 V,100 W)布置在传送带两侧,透射光由下方的检测探头收集,与之连接的光纤将信号传输至微型可见近红外光谱仪(QE65Pro,Ocean Insight,FL,USA),整个检测单元置于暗箱中以避免环境光影响,暗箱两侧留有样品进出口。光谱仪通过USB数据线连接电脑,使用SpectraSuite软件(Ocean Insight,FL,USA)查看和存储光谱。为考察苹果样品摆放姿态对检测结果的影响,每个样品采集4次光谱,分别对应4种摆放姿态:竖放柄朝上、竖放柄朝下、横放柄朝输送方向和横放柄垂直输送方向。96个样品对应4种摆放姿态共获得384条光谱。
1.3 数据分析
光谱采集完成后,将苹果沿果柄蒂轴对半切开观察心室是否霉变(如图1所示),将健康果归于1类、霉心病果归于2类。基于获取的光谱及有损检测获得的霉心病果判据,开展苹果霉心病的判别分析,取2/3样本作为校正集、1/3样本作为预测集。采用线性判别分析[9]、马氏距离判别[10]、偏最小二乘判别[11-12]、K近邻法[13]、极限学习机[14]和支持向量机[15]对4种摆放姿态分别建立判别模型并对比判别效果(以判别准确率为指标)。数据分析主要采用MATLAB(R2016a,The MathWorks,Natick,MA,USA)软件开展。
图1 健康果(左)和霉心病果(右)心室对比示意图
2 结果与讨论
2.1 果实外观参数及透射光谱
经统计,96个样品中包含78个健康果和18个霉心病果。样品外部参数指标如表1所示。
表1 健康果和霉心病果的外观参数统计
基于所采集的全部样品4种摆放姿态的透射光谱,分别计算健康果和霉心病果4种摆放姿态的平均透射光谱,结果如图2所示,可以发现在400~600 nm 间存在较高的噪声,而900 nm之后样品的透射率几乎为零,因此选取600~900 nm的透射光谱进行分析。4种摆放姿态的健康果的平均透射光谱在600~900 nm波段内整体都高于病果的平均透射光谱,尤其是在710 nm附近健康果的透射光谱峰值明显高于病果,可能是因为病果果实内部霉变组织的吸收较大所致。
图2 健康果和病果4种摆放姿态下的平均透射光谱
2.2 霉心病果判别结果
基于600~900 nm的透射光谱信息,结合主成分分析提取的主成分(PCs)建立的LDA,MD和KNN三种判别模型,其中KNN算法中k=7,表示对于一个需要预测的输入向量x,我们只需要在训练数据集中寻找7个与x最近的向量的集合,然后把x的类别预测为这7个样本中类别数最多的那一类。表2显示三种判别模型提取的主成分数以及训练集和预测集的判别效果,4种摆放姿态的LDA判别模型预测集的判别准确率最高的是竖放柄朝上摆放为90.63%,有3个健康果被误判为病果,整体来看LDA模型竖放柄朝上摆放和竖放柄朝下摆放的判别效果明显优于横放柄朝输送方向和横放柄垂直输送方向摆放时的效果;MD模型4种摆放姿态的判别效果差别不大,预测集判别准确率都达到87.50%,虽然MD模型对健康果没有产生误判但其对病果的识别效果较差;KNN模型中预测集的判别准确率最高的是竖放柄朝下的90.63%,相对判别效果较差的横放柄朝输送方向摆放和横放柄垂直输送方向摆放的预测集判别准确率也可达到80%以上。
表2 基于4种摆放姿态透射光谱(600~900 nm)提取主成分后的线性判别分析(LDA)、马氏距离(MD)和K近邻法(KNN)三种判别模型结果的比较
通过对LDA,MD和KNN三种判别模型的比较,从表2中各项数据可以看出LDA模型和KNN模型竖放柄朝上摆放和竖放柄朝下摆放的判别效果相比其他两种摆放姿态都更好,在三种判别模型中效果最佳的是LDA模型的竖放柄朝上摆放。
对600~900 nm的透射光谱进行中心化预处理后建立的PLS-DA模型结果如表3所示,当苹果竖放柄朝上摆放和竖放柄朝下摆放检测时预测集的判别准确率最高为93.75%,苹果横放柄垂直输送方向进行检测所建立的判别模型效果相对其他三种摆放姿态较差。
表3 基于4种摆放姿态透射光谱(600~900 nm)的偏最小二乘判别分析(PLS-DA)结果
600~900 nm的透射光谱经归一化处理后,使用ELM和SVM两种机器学习算法建立的判别模型结果如表4所示,对于ELM模型选用sigmoid函数为极限学习机的激活函数并设置隐含层神经元个数为20,当苹果竖放柄朝上、横放柄朝输送方向和横放柄垂直输送方向的预测集判别准确率都为90.63%,有2个病果和1个健康果被错判,其余三种摆放姿态的预测集的判别准确率也都高于85%;建立SVM模型时利用交叉验证的方法获得最优的惩罚参数c和核函数的参数g,通过表4可知,果柄朝上摆放时预测集判别准确率最高为96.88%,预测集只有1个病果被错判。
表4 基于4种摆放姿态透射光谱(600~900 nm)的极限学习机(ELM)和支持向量机(SVM)两种判别模型的比较
通过对上述6种判别模型预测集判别效果的汇总结果如图3所示,LDA和SVM模型的4种摆放姿态的预测集判别率最佳的是竖放柄朝上摆放,MD和ELM模型的4种摆放姿态的判别效果接近,KNN模型除了横放柄朝输送方向摆放时判别效果较差其余3种摆放姿态的预测集判别率都超过87%,PLS-DA模型的最佳摆放姿态为竖放柄朝上摆放和竖放柄朝下摆放,整体来看竖放柄朝上摆放在不同的判别模型中都有不错的判别效果,这可能与在线检测装置中光源和检测探头的位置布置有关。
图3 预测集的6种判别模型效果(a)及病果错判为健康果个数(b)对比图
从建模方法来看PLS-DA的判别效果优于其他方法,其中PLS-DA模型的竖放柄朝上和竖放柄朝下的判别准确率都为93.75%,通过6种判别模型预测集病果错判为健康果个数结果对比,PLS-DA判别模型的竖放柄朝上的摆放姿态没有误判果,可以很好的识别出预测集中所有的病果。
苹果霉心病PLS-DA判别模型的变量投影重要性指标(VIP)得分值分布如图4所示,在710 nm附近得分值达到峰值,因此进一步选择690~720 nm作为特征波段建立PLS-DA判别模型,由表5所示结果可知,竖放柄朝上和竖放柄朝下时预测集的判别准确率为93.75%。4种摆放姿态在690~720 nm波段范围的预测集判别准确率均大于80%,这为采用LED灯代替卤素灯检测苹果霉心病的可行性提供了依据。
图4 PLS-DA判别模型不同波长的VIP得分值分布
表5 基于4种摆放姿态透射光谱(690~720 nm)的偏最小二乘判别分析(PLS-DA)结果
3 结 论
基于600~900 nm波段4种摆放姿态的透射光谱提取主成分后建立的LDA,MD和KNN判别模型都有着不错的判别效果,其中LDA模型对应竖放柄朝上摆放姿态的预测集判别准确率最佳为90.63%,LDA和KNN模型竖放柄朝上和竖放柄朝下的判别效果都优于横放柄朝输送方向和横放柄垂直输送方向。基于600~900 nm建立的PLS-DA判别模型4种摆放姿态的预测集判别准确率都大于80%,并且竖放柄朝上和竖放柄朝下的判别准确率都是大于其余两种摆放姿态。还建立了ELM和SVM两种机器学习算法判别模型,从预测集判别准确率和病果错判个数观察效果最佳都是竖放柄朝上的姿态。
综合以上建立的6种判别模型来看,竖放柄朝上摆放在不同的判别模型中都有不错的判别效果,这可能与在线检测装置中光源和检测探头的位置有关。从建模方法来看,4种摆放姿态整体判别效果最好的PLS-DA模型,再通过其VIP得分值提取特征波段690~720 nm后重新建立PLS-DA判别模型,竖放柄朝上和竖放柄朝下的预测集判别准确率都达到93.75%,其中竖放柄朝上摆放检测到的光谱建立的模型筛选病果的能力达到最佳,全部病果都能被判别出,因此竖放柄朝上摆放检测是一种合理有效的苹果霉心病在线检测姿态。