APP下载

基于近红外透射光谱与机器视觉的蜜柚汁胞粒化分级检测

2021-02-02孙潇鹏刘灿灿陆华忠

食品科学技术学报 2021年1期
关键词:粒化蜜柚光谱

孙潇鹏,刘灿灿,陆华忠,3,徐 赛

(1.华南农业大学 工程学院,广东 广州 510642;2.广西大学 轻工与食品工程学院,广西 南宁 530004;3.广东省农业科学院,广东 广州 510642;4.广东省农业科学院 农产品公共监测中心,广东 广州 510642)

蜜柚(CitrusmaximaL.)为芸香科柑橘属乔木,果圆球形或梨形,风味极佳,营养价值高。柑橘类水果经常遭受各种生理性疾病的困扰,如汁胞粒化(又称为硬粒化)等,对蜜柚的品质和口感产生极大的影响[1]。1934年,Bartholomew等[2]首次报道了汁胞粒化后,又有来自不同国家的研究人员进行了相关报道。汁胞粒化是柑橘类水果中汁液囊的一种生理失调,其汁液囊变硬、干燥膨大,呈灰色,几乎没有可提取的汁液[3]。随着汁胞粒化程度的增加,水果从果汁囊泡中损失了更多的水分,伴随着内部品质的迅速降低,使其缺乏食用价值。柑橘类水果的汁胞粒化通常与汁液囊泡中的次生壁形成和细胞壁增厚有关[4]。收获时间也对果实内部品质有重要影响,收获时间较晚可能会加重蜜柚的汁胞粒化程度[5]。由于造成汁胞粒化的原因很复杂,所以目前对汁胞粒化的相关研究非常有限。

近红外透射光谱是一种无损检测技术,现已广泛应用于水果的内部品质检测,如可溶性固形物含量(SSC)[6]、水果成熟度[7]或柑橘黄龙病[8]等检测。然而,有限的穿透深度限制了其对水果内部品质检测的潜力,尤其是可能会影响厚皮水果(如西瓜和蜜柚)内部品质检测的准确性[9]。由于样本的特殊性和汁胞粒化的复杂性,很难准确地分类不同粒化等级的蜜柚。近年来,机器视觉技术已广泛用于农业和食品行业,尤其是对水果特征的提取和计算(如果形提取、体积估算等)[10]。研究发现:体积的差异可用于水果品质检测,如柑橘类水果的汁胞粒化分级[11]。因此,本研究将近红外透射光谱与机器视觉技术相结合,对蜜柚的粒化等级进行分级检测和评估。

1 材料与方法

1.1 材料与试剂

蜜柚采摘自梅州市蜜柚果园,采摘后立即运至实验室,剔除外部破损和畸形的蜜柚,擦拭蜜柚外部污渍,自然晾干,在室温(19~21 ℃)下静置24 h后,进行实验。根据蜜柚生长期,每周采集20个样本进行实验,实验样本共计600个。

NaOH溶液、酚酞指示剂,广州和为医药科技有限公司。

1.2 仪器与设备

PAL-Grape Must型数字折光仪,ATAGO(爱拓)中国分公司;游标卡尺(测量范围0~300 mm),上海申韩量具有限公司;DHG-9030A型电热鼓风干燥箱,上海一恒科学仪器有限公司;酸碱中和滴定常用仪器(酸式滴定管、碱式滴定管、滴定管夹、铁架台、锥形瓶、玻璃棒等),江苏博雅教学设备有限公司。

近红外透射光谱检测系统:计算机、NIR-QUEST型光谱仪(测量波长900~1 700 nm,光谱分辨率0.25 nm,信噪比15 000∶1,积分时间1 ms~10 s,美国海洋光学公司)、实验箱体、光纤、积分球和实验托盘等[12-13]。光谱采集软件,广州标旗光电科技发展有限公司。

1.3 实验方法

1.3.1近红外透射光谱采集及预处理

启动近红外透射光检测系统,预热15 min使设备达到稳定的工作状态。在光谱采集软件中,积分时间设置2 000 ms,平均次数设置为1。将托盘置于光谱平台内,分别采用标准白板和标准黑板贴住积分球校正光谱仪后,进行样本光谱采集。将柚果放置在托盘上,每旋转90°采集1次,并存储光谱数据,取4次光谱的平均值作为该样本的光谱数据。在近红外透射光谱中,将样本的相对透射率作为光谱信息的研究参数,计算见式(1)。光谱数据中除有效光谱信息外,也含有大量无关或冗杂信息,且存在背景噪声。光谱预处理可削弱或剔除干扰及无效信息,保留有效信息,降低模型的复杂度。研究采用Savitzky-Golay多项式平滑对原始光谱进行预处理[14]。

(1)

式(1)中,T,样本的相对透射率,%;Is,样本的透射光强度,cd;Iw,标准白板的透射光强度,cd;Ib,标准黑板的透射光强度,cd。

1.3.2光谱特征提取

连续投影算法(successive projections algorithm,SPA)是一种无监督的变量选择算法,可用于近红外透射光谱的特征变量提取。SPA从光谱数据中提取有效信息,依据均方根误差相对较低的值,提取符合要求的特征变量[15]。该算法能够有效剔除变量之间的共线性,最大程度避免信息的重复,使得变量之间的信息冗余度最低。经SPA预处理后,光谱数据以少数波长点来概括样品中大部分光谱信息,从而能够提升模型数据处理的速率[16]。

1.3.3样本特征的获取与估算

基于机器视觉技术,自搭建图像获取系统,如图1。图像获取系统配套图片捕获软件(IC capture)和图像处理软件(Matlab R2018a)共同使用。

1.实验箱体;2.GigE相机(DFK 33GP006型);3.相机镜头(M0814-MP2, F1.4, f8 mm 2/3);4.条形光源(24 V,580 mA);5.环形光源(24 V,580 mA);6.蜜柚样本;7.蜜柚托盘;8.计算机。

基于机器视觉技术,通过图像信息获取系统,可快速获取并估算样本的特征数据。该系统采用IC capture软件获取样本图像信息,110 mm×110 mm标定板和 Matlab 软件工具箱(computer vision system toolbox 8.1)进行相机标定。Matlab软件工具箱(image processing toolbox 10.2)可快速获取横径和纵径的像素值,通过像素-尺度转换[17],得到横径和纵径的估算值。

估算体积时,可将蜜柚默认为椭球体。椭球体的长、宽、高分别用L、W和H表示。将椭球体划分为多个圆台,切面默认为标准圆,即W≈H,圆台的上顶面和下底面分别由Htj和Hbj表示,椭球体的H和L可分别代表横径和纵径,如图2。因此,样本的体积可认为是多个圆台体积的累加,圆台体积(Vj)和样本的估算体积(V),可由式(2)和式(3)计算得到。

图2 椭球体的划分和体积估算

(2)

(3)

1.3.4样本理化指标测定

分别采用游标卡尺测定样本的横径和纵径(mm),电子天平称量样本的质量(g),排水法测定样本的体积(cm3)。提取光谱采集区域内果肉少许,通过挤压和纱布过滤提取果汁,数字折光仪测量可溶性固形物含量,酸碱中和滴定法测定样本的可滴定酸度(titratable acidity, TA),每个样本重复3次后记录平均值。采用赵晓玲[18]方法测定样本的汁胞含水率(moisture content, MC),计算见式(4)[19]。

(4)

式(4)中,m1,鲜汁胞的质量,g;m2,干汁胞的质量,g。

1.4 粒化蜜柚评价分级

邀请10位感官评价人员对不同生长期样本的不同粒化程度进行打分。分级标准参考陈昆松等[19]的方法进行,将蜜柚沿着果蒂纵切八瓣,进行粒化评级。根据蜜柚汁胞粒化程度,将蜜柚分为5级,1级为未发生汁胞粒化,2级为汁胞粒化程度小于25%,3级为汁胞粒化程度在26%~50%,4级为汁胞粒化程度在51%~75%,5级为汁胞粒化程度大于75%[20]。

1.5 模型建立与评价指标确定

1.5.1模糊C均值聚类

模糊C均值(fuzzy c-means, FCM)聚类是模糊聚类中常用的划分聚类方法,属于软化分算法。FCM算法由MacQueen提出,其原理是首先定义一个准则函数,并随机选取c个初始聚类中心,然后根据样本与聚类中心的隶属度来确定聚类关系,再重新计算每类的聚类中心,此过程不断重复,直到准则函数最小。准则函数为样本和聚类中心的平方误差的总和[21]。

模糊C均值聚类的准则,设xi(i=1, 2, …,n)是n个样本组成的样本集合,c为预定的类别数目,μj(xi)是第i个样本对于第j类的隶属度函数。用隶属度函数定义的聚类损失函数计算见式(5)。

(5)

其中,b>1,是一个可以控制聚类结果模糊程度的常数。在不同的隶属度定义方法下最小化聚类损失函数,就得到不同的模糊聚类方法。其中最有代表性的是模糊C均值聚类,它要求每个样本对于各个聚类的隶属度之和为1,如式(6)。

(6)

1.5.2K-近邻法聚类

K-近邻法(K-nearest neighbor, KNN)聚类是一种高效且具备较高分类精度的方法[22]。KNN聚类算法的核心思想是在多维空间Rn中找到与未知样本最近邻的k个点,并根据这k个点的类别来判断预测样本的类属。该算法假设所有样本对应于n维空间中的点,每个样本的最近邻是根据欧式距离定义,设x的特征向量为[a1(x),a2(x), …,an(x)]。其中,ar(x)表示样本x的第r个属性值。2个样本xi和xj间的距离定义为d(xi,xj),计算见式(7)。

(7)

以xi为预测样本的特征向量,Y定义样本的类别,yi∈Y{c1,c2,…,ck}为预测样本的类别,I为指示函数,NK(x)为n维空间内选取与x最邻近的k个点的领域,并以x预测y类别[23],如式(8)。

(i=1,2,3,…,N;j=1,2,3,…,K)

(8)

1.5.3样本分级的评价指标确定

通过kennard-stone法[24]将600个实验样本按照2∶1的比例,分为训练集和预测集。运用模糊C均值聚类、K-近邻法聚类对样本进行分级,运用混淆矩阵评估二进制分类模型的性能[25]。假设将1级样本定义为目标样本,2、3、4、5级样本定义为非目标样本。TP为目标样本正确分类为1级样本的数量;TN为非目标样本正确分类在2、3、4、5级样本中的数量;FP为非目标样本分类为1级样本的数量;FN为目标样本分类为2、3、4、5级样本的数量,即本属于1级的样本被分类为2级、3级、4级或5级的样本数量和。当其他级别样本定义为目标样本,皆可根据以上方法进行假设。再根据式(9)~式(11),分别从聚类模型的准确性、敏感性和特异性进行分级评价。

(9)

(10)

(11)

2 结果与分析

2.1 近红外透射光谱分析

600个样本的近红外透射原始光谱见图3(a)。在近红外光谱区域内,典型的重叠吸收峰对应水果中水分和碳水化合物的C—H、O—H和N—H化学键。在短波近红外光谱区域(900~1 100 nm),重叠吸收峰出现在大约948 nm处,950 nm附近的吸收峰为水分的吸收带[26]。汁胞粒化的过程伴随着样本枯水的过程,其果汁囊泡中损失了更多的水分。在长波近红外光谱区域(1 100~1 700 nm),最大的吸收峰出现在1 283 nm处,这是C—H键第二官能团振动带[27]。而1 410 nm处吸收峰是木质素相关的吸收带,它是亚甲基C—H键与R(CH2)nR的C—H键的组合官能团。柑橘类水果发生汁胞粒化与果汁囊泡的细胞壁结构变化有关,是木质素、纤维素和果胶等细胞壁成分的增加造成的[3]。5种粒化等级的平均光谱见图3(b)。随着样本的汁胞粒化程度加重,948 nm处吸收峰呈依次递减趋势;而1 410 nm处吸收峰呈依次递增趋势。

图3 样本的近红外透射光谱

样本的近红外透射光谱经预处理后,采用SPA进行光谱特征提取,如图4。SPA共选取17个特征变量,代表样本在900~1 700 nm波段的光谱信息,快速高效地完成了数据降维,解决了变量间的共线性问题。且特征变量多集中在950、1 283、1 410 nm吸收峰附近,与蜜柚汁胞粒化的过程密切相关。

图4 连续投影法的光谱特征提取

2.2 样本理化指标与汁胞粒化的关系分析

根据蜜柚的生长期,研究1~5级汁胞粒化样本的特征变化,如图5。实验采集的样本随着汁胞粒化等级的增加,外部形态逐渐减小。根据粒化样本评级方法,样本随着汁胞粒化等级的增加,内部出现汁液囊变硬、干燥、膨大等特征,颜色呈灰色,几乎没有可提取的汁液(见图6)。随储藏时间的增加,果汁囊泡中损失了更多的水分,存储过程中疾病的严重性增加。

图5 1~5级汁胞粒化样本的外部特征变化

图6 1~5级汁胞粒化样本的内部品质变化

各级粒化样本的理化指标见表1。结果表明:随着汁胞粒化等级由1级升至5级,样本的横径和纵径逐渐减小,伴随着体积也逐渐减小;与此同时,样本的MC、SSC和TA也逐渐降低。样本的外部特征及内部品质均会受到汁胞粒化的影响。

表1 各级粒化样本的理化指标

2.3 样本特征估算与数据分析

为验证体积估算值的可靠性,将排水法测定的体积测量值(Vacc)与图像信息获取系统计算的体积估算值(V)进行比较。对Vacc与V进行线性拟合分析,如图7(a)。由回归方程可知,V与Vacc之间存在线性规律,决定系数R2等于0.987 9,证明蜜柚体积的估算模型中,估算值相较于真实值,准确率达到98.79%。对Vacc与V进行差异性分析,来确定样品的测量值和估算值之间的差异[28],见图7(b)。Vacc与V的95%一致性极限均位于d-1.96至d+1.96。Vacc与V平均差异百分比为7.2%,95%一致性极限区间为[4.4, 9.9],证明V比Vacc小约4.4%~9.9%。进一步佐证体积估算值可代替测量值,将其融合光谱数据可用于汁胞粒化的模型分级检测与研究。

图7 体积测量值和估算值的数据分析

2.4 预测模型的分级评价

研究采用SPA-FCM和SPA-KNN 2种分级模型,对各级粒化样本进行分级检测。根据kennard-stone法[24],从600个实验样本数据中,随机选取400个训练集样本数据,进行模型建立和训练;剩余200个预测集样本数据进行模型预测。模型输入变量为经预处理和特征提取的近红外透射光谱数据与图像特征提取的样本体积估算值,模型输出变量为汁胞粒化等级。

分级模型的混淆矩阵,如表2。SPA-FCM与SPA-KNN的混淆矩阵中,预测集的误判样本均少于训练集。模型训练集与模型预测集中,1级和2级互为误判样本的机率较高,证明从无汁胞粒化至小于25%汁胞粒化,样本的内部品质变化较小;因此分级模型完成1级和2级准确分级难度较大。与此同时,4级和5级互为误判样本的机率较高,证明从50%~75%汁胞粒化至大于75%汁胞粒化,样本内部均已严重粒化,伴随着汁胞含水率的降低,出现严重的枯水现象,无可提取果汁,SSC和TA的急剧降低,内部果肉基本不可食,且口感极差;因此,分级模型完成4级和5级准确分级难度较大。然而,SPA-FCM与SPA-KNN均能完成对3级样本的准确分类。

表2 分级模型的混淆矩阵

根据分级评价指标,结合模型的混淆矩阵,对预测集样本进行分级预测,见表3。SPA-FCM预测结果的准确性、敏感性和特异性分别达到0.925 9、0.733 3和0.935 3以上;SPA-KNN预测结果的准确性、敏感性和特异性分别达到0.970 0、0.923 1和0.987 4以上。而且,SPA-FCM与SPA-KNN对3级样本完全准确预测,其准确性、敏感性和精确性均达到1。结果表明:SPA-KNN相较于SPA-FCM,对各级粒化样本的分级预测能力更好,即能更好地完成对样本汁胞粒化的分级检测。

表3 分级模型对样本预测集的预测能力

3 结 论

采用近红外透射光谱和机器视觉技术的分级预测模型,可用于蜜柚汁胞粒化的分级检测。近红外透射光谱可以捕获由汁胞粒化引起的内部品质的化学变化。机器视觉技术可快速估算样本的外观特征,探究由汁胞粒化引起的外部特征的物理变化。此方法对粒化样本的预测能力好,分级准确率高,分级检测过程中,对样本无破坏,适用于实时在线检测。因此,基于近红外透射光谱和机器视觉技术对蜜柚汁胞粒化的分级检测具有较高的可行性,以期为厚皮水果或柑橘类水果的内部品质检测提供了一定的研究基础和参考。

猜你喜欢

粒化蜜柚光谱
基于三维Saab变换的高光谱图像压缩方法
水稻丸粒化种子直播方法研究
我国中药材种子丸粒化研究进展△
高光谱遥感成像技术的发展与展望
高丹草种子丸粒化配方的筛选
“柚”一年老家的味道
琯溪蜜柚汁胞粒化影响因素及防控技术综述
平和蜜柚经济林产业现状及可持续发展对策
第一次包蜜柚
基于GPU的高光谱遥感图像PPI并行优化