APP下载

基于太赫兹衰减全反射技术的花生霉变程度判别

2019-04-29刘翠玲吴静珠邢瑞芯王少敏

农业机械学报 2019年4期
关键词:赫兹光谱花生

刘翠玲 胡 莹 吴静珠 邢瑞芯 王少敏

(1.北京工商大学计算机与信息工程学院, 北京 100048;2.北京工商大学食品安全大数据技术北京市重点实验室, 北京 100048)

0 引言

花生富含大量的蛋白质、脂肪、糖类以及钙、磷、铁矿物元素等,可直接食用或者进行烘培等后续加工后食用,已成为人们喜爱的休闲食品;同时花生也是食用油的重要原材料之一,丰厚的营养价值使花生成为人们生活中的必需品[1]。但收获后的花生在储藏期间易受到温、湿度的影响而引起花生霉变[2]。霉变花生极有可能含强致癌物质——黄曲霉素,快速识别并分离霉变花生可从源头上阻止其进入食物链,降低人类摄入黄曲霉素的风险[3]。因此,对花生的霉变检测尤为重要。目前,绝大多数花生生产企业,主要依靠人工观测判断花生是否发生霉变,该检测方法易受主观心理、视觉疲劳等因素影响[4]。在农业行业标准NY/T 1068—2006和国标GB/T 5494—2008中,规定了对于花生中霉素的检验,采用同位素稀释液相色谱-串联质谱法、酶联免疫吸附法等检测方法。这些传统检测方法具有前处理复杂、费时费力,且易对样品造成破坏、产生二次污染等问题[5-6]。因此,亟需寻找一种可靠、快速、便捷的方法来检测花生仁的霉变程度。

光谱检测技术具有绿色环保、耗时短、成本低、可靠性高的特点,弥补了传统理化检测方法的不足[7-9],近年来在食品检测领域发展较快。HIRANO等[10]通过分析花生油脂短波近红外(700~1 100 nm)的透射比对表面良好、内部霉变的花生进行了检测,但该方法对样本具有破坏性,且油脂提取程序相对繁琐。LEE等[11]采用了拉曼光谱、近红外光谱技术(Near infrared,NIR)与中红外光谱技术(Mid infrared,MIR)3种光谱技术对玉米受黄曲霉毒素污染进行了对比分析,结果显示,拉曼光谱与MIR对玉米中黄曲霉毒素的预测精度优于NIR光谱技术。这些研究均表明,光谱技术在农产品的霉变检测领域取得了较好的研究进展[12-14]。新兴的太赫兹光谱技术与其他光谱技术相比,具有承载更多信息、能量低、不会对被检物质造成光电离破坏、并具有一定的穿透性等特点[15-17],在农产品检测领域具有巨大的潜力[18-19]。因此,本文采用太赫兹光谱技术中的衰减全反射方式进行光谱扫描,通过光谱预处理与变量优化后分别结合BP(误差反向传播)神经网络算法与支持向量机(Support vector machine,SVM)算法,建立不同霉变程度花生的定性分析模型。

1 实验及方法

1.1 材料与仪器

材料:不同品种的带壳花生1 000 g(购于某种子公司)。

主仪器:英国Tera View公司生产的TeraPulse 4000型太赫兹脉冲光谱仪,如图1a所示,可发射频率从60 GHz到4 THz(2~133 cm-1)的太赫兹波,信噪比最高达到70 dB。光谱采集部分选择入射角为35°的单晶硅衰减全发射(ATR)模块,工作范围为10~120 cm-1(0.3~3.6 THz)。

辅助仪器:SPX-80型智能生化培养箱,购自杭州硕联仪器有限公司,温度波动±0.5℃,如图1b所示。

图1 实验仪器Fig.1 Experimental apparatus

1.2 实验方法

实验选取的花生品种为花育36号;为排除不同品种给实验带来的偶然性,选取鲁花9号花生品种作为参考样本进行培育。两种花生品种样本共计80枚,大小、颜色均匀一致,吹扫干净。预留20枚视为正常花生样本,其余60枚作为发霉培育对象。花生在高温、高湿、封闭环境下最易发生霉变[20],因此实验时,按照水分与花生样本质量比0.2左右在花生壳表面均匀喷洒去离子水,并置于28℃的生化培养箱里培养。同时利用温湿度检测仪确保花生所处环境温度在28℃左右、相对湿度80%~90%。实验方案如表1所示。

表1 样本培养方案Tab.1 Sample culture program

将得到的轻度、中度、严重霉变花生样本作为实验待测样本,取出并放置于干燥、常温环境下1~2 d。得到的花生样本外壳表面有明显皱缩、发黑,有斑点的现象;去壳后霉变样本如图2所示。

图2 不同状态下的花生Fig.2 Peanuts in different states

3类霉变花生样本表面皆有4 mm左右淡绿毛、白色块状斑点产生,颜色晦暗发黄,质地变软,肉眼较难区分。随机选取包括正常、轻度、中度、严重霉变花生仁各20粒,制作成厚度约1 mm、尺寸约1 cm×1 cm的花生仁切片,样本共计80个。为防止花生仁发生氧化等反应,该操作应尽可能快速准确。实验环境温度始终保持在22℃。

1.3 光谱采集

图3 部分霉变样本的时域光谱Fig.3 Time-domain spectra of some mildew samples

实验采集80个花生样本切片的ATR光谱。确保ATR晶体未放置样品并干净无污染,采集得到参考信号(Reference signal)后进行样本的数据采集。为确保样本和ATR晶体之间光学接触良好,需拧紧压力螺钉,最大限度地提高吸光度[21]。ATR采集参数设置为:分辨率0.94 cm-1,每次快速扫描的平均次数为450。

部分样本的原始太赫兹时域光谱如图3所示。从图中可以看出,由于空气中的水分干扰,样本信号的波形均存在较小抖动。此外,4种花生仁样本的脉冲波形相似,差异细微,说明了系统的稳定性;但不易直接通过太赫兹时域光谱进行不同程度霉变花生的有效鉴别,需要将采集得到的时域信号进一步处理,提取出更有效的光学常数并结合模式识别算法建立定性分析模型。

2 结果与分析

2.1 光谱预处理

2.1.1光学常数提取

光学常数是表征物质宏观光学性质的重要物理量,同样也是太赫兹光谱分析中建模数据的来源[22]。通常情况下更多选用的光学常数是物质的吸光度与吸收系数。提取光学常数前,需要利用快速傅里叶变换(FFT)将参考信号和样本的时域光谱进行转换。在获得信号频域谱的过程中,为避免信号数据开头和结尾不连续造成信号频谱显示的失真,需对信号进行加窗处理,减少时域信号截断所带来的误差[23]。窗函数的种类多样,比如Boxcar用于高分辨率,Blackman Harris用于高信噪比,本文选择最常用的Happ Genzel,因为其兼顾了信噪比和分辨率。

将得到样本信号与参考信号的对应频域信息作比后,利用所得比值函数的幅值ρ(ω)和相位φ(ω)信息计算得到所需的光学常数。样本的光学常数吸光度A(ϑ)与吸收系数α(ω)计算公式为

(1)

(2)

(3)

式中E0(ϑ)——入射的太赫兹波强度

E1(ϑ)——透过物质的太赫兹波强度

d——样本的厚度

ω——角频率

ρ(ω)——比值函数的幅值

φ(ω)——比值函数的相位

n(ω)——样本的折射率

c——太赫兹波在空气中的传播速度

其中吸光度与吸收系数谱图如图4所示。

图4 吸光度谱图和吸收系数谱图Fig.4 Absorption and absorbance spectra

图5 平均吸收系数Fig.5 Average absorption coefficient

2.1.2光谱范围选取

在10~120 cm-1频域内,观察图4a实验数据发现,随着频率的增加,样品吸光度整体呈现先上升后下降趋势,但无明显特征峰存在;而图4b中所有样本的吸收系数光谱特征峰明显,所以本实验选择吸收系数作为建模数据。但吸收系数谱线整体呈差异较小、重叠度较高、难以分辨的特点。

为了解决这个问题,进一步对每个类别的所有样本取平均处理。处理后可以发现在一定波段内正常样本与霉变样本的差异十分显著。图5a为正常、严重霉变花育36号各自类别在5~44 cm-1的平均吸收系数,可以看到两条曲线相离甚远,并且随着频率增加,吸收系数越来越高。图5b为正常、严重霉变鲁花9号各自类别在0~50 cm-1的平均吸收系数,同样两条曲线差异也是十分显著,为后期模型建立提供了可能性。

2.2 建模及定性分析

BP神经网络算法是当前工业领域应用较多的一种前馈式学习算法与反向传播算法的神经网络,可对样本进行有效分类,故采用BP神经网络进行不同霉变程度样本的分类处理;同时,为了探究处理此类数据更优的算法,尝试采用同样经典的SVM方法进行霉变样本分类的定性分析。支持向量机库Lib-SVM,能够解决小样本情况下的机器学习问题,提高泛化能力,解决高维问题、非线性问题,适于处理光谱数据[24-25],故同时采用Lib-SVM进行花生霉变程度鉴别模型的建立。

2.2.1基于BP神经网络的定性分析

表2 BP网络输出节点编码Tab.2 BP network output node coding

图6 BP算法分类结果Fig.6 BP algorithm classification results

2.2.2基于Lib-SVM的定性分析

首先建立正常与霉变花生的二分类模型。采用基于网格搜索及交叉验证方法进行参数寻优的支持向量机多分类算法,建立两类品种样本霉变的二分类模型。按3∶1的比例随机划分建模集和测试集,即得到20个样本作为测试集,其余60个样本作为建模集。对经过归一化预处理后的样本建立基于特征波段-吸收系数的正常、霉变样本二分类模型。模型结果如图7所示,蓝色标识代表样本的实际类别,红色标识代表样本的预测类别,可以看出,两类测试样本都准确地被划分到自身所属类别当中,模型预测正确率为100%。

图7 霉变程度二分类模型预测结果Fig.7 Prediction result of mildew degree two-class model

为进一步探索太赫兹光谱技术在花生霉变情况检测研究中的可行性,对轻度、中度、严重霉变样本建立基于特征波段-吸收系数谱的霉变程度三分类模型。

在建立三分类模型时,同样选择采用基于网格搜索法及交叉验证方法进行参数寻优的SVM多分类算法,按3∶1的比例随机划分建模集和测试集,即得到15个样本作为测试集,其余45个样本作为建模集。对经过归一化预处理后的所有样本建立SVM模型,并分别建立花育36号、鲁花9号霉变样本的三分类模型,结果如图8所示。可以看出,3类测试样本都准确地被划分到自身所属类别当中,模型预测正确率为100%,可靠性较高。所有模型参数及预测结果如表3所示。

图8 霉变程度三分类模型预测结果Fig.8 Prediction result of mildew degree three-class model

分类模型光谱范围/cm-1总预测正确率/%惩罚参数Gamma参数花育二分类模型5~44100-2.5-5鲁花二分类模型0~50100-4.0-4.5花育三分类模型5~44100-1.5-6鲁花三分类模型0~501000-7

3 结束语

应用太赫兹衰减全反射技术对不同霉变程度的花生样本进行了定性分析研究。通过对比发现,不同霉变程度的花生样本在太赫兹波段的时域谱、吸光度谱以及吸收系数谱均存在一定的差异。进一步使用归一化对数据进行处理,并分别结合BP神经网络算法与SVM算法,建立了花生霉变程度鉴别的定性分析模型。其中,基于BP神经网络算法的模型对花育36号霉变样本的识别正确率为88.57%,对鲁花9号样本的识别正确率为91.40%;基于SVM算法的二分类、三分类模型对花育36号、鲁花9号霉变样本的识别正确率均达到100%。结果表明,相比于BP神经网络算法,SVM算法能够解决小样本情况下的机器学习问题,可提高泛化能力,更适合处理光谱数据,并进行建模分析;作为一种便捷、可靠的方式,采用太赫兹衰减全反射光谱技术对贮藏期间的花生进行检测,在判断花生霉变程度方面具有一定的可行性。

猜你喜欢

赫兹光谱花生
掏花生
基于三维Saab变换的高光谱图像压缩方法
基于3D-CNN的高光谱遥感图像分类算法
高光谱遥感成像技术的发展与展望
基于双频联合处理的太赫兹InISAR成像方法
太赫兹低频段随机粗糙金属板散射特性研究
太赫兹信息超材料与超表面
到底埋在哪棵树下
花生去哪儿了
苦味酸与牛血清蛋白相互作用的光谱研究