基于卷积神经网络和近红外光谱的太平猴魁茶产地鉴别分析

2021-09-14潘天红李鱼强

光谱学与光谱分析 2021年9期

陈琦，潘天红，李鱼强，林鸿

1. 合肥工业大学食品与生物工程学院，安徽合肥 230601 2. 安徽大学电气工程与自动化学院，安徽合肥 230601 3. 黄山海关茶叶质量安全研究中心，安徽黄山 245000 4. 江苏大学电气信息工程学院，江苏镇江 212013

引言

太平猴魁茶属于绿茶尖茶，主要产于安徽省黄山市黄山区三合村猴坑、猴岗和严家三个村落[1]。太平猴魁茶成品具有“两叶一芽、扁平挺直、魁伟重实、色泽苍绿、兰香高爽、滋味甘醇”等特点，深受广大消费者喜爱[1-2]。随着市场的不断扩大，茶叶掺假现象的不断发生损害了太平猴魁茶的市场形象，实现精准产地鉴别分析对促进太平猴魁茶发展具有重要意义。

传统感官分析方法主要通过外观、汤色、滋味及香气等感官指标实现产地鉴别分析，但手工工艺制备的茶叶成品外观差异较小，导致基于人工经验的感官评审方法无法实现快速、精准的产地鉴别分析[3]。目前主要通过化学分析方法实现茶叶高精度产地鉴别，然而化学分析检测繁琐、成本高，并且目前没有统一的化学检测标准可用于太平猴魁茶产地鉴别分析。

近红外光谱(near infrared spectroscopy,NIR)作为一种无损分析方法，具有快速、非破坏性、无污染等特点，已在茶叶生产过程得到广泛应用[4-5]。然而不同产地茶叶内含成分种类及其含量基本相同，不同产地样本光谱特征峰分布基本相同，导致常规分析方法无法有效选择光谱特征。卷积神经网络(convolutional neural networks,CNN)作为典型的深度学习网络模型之一，具有很强的特征提取和模型表达能力，已被广泛应用于NIR特征提取分析[6-9]。

本研究以不同产地光谱特征以及CNN模型，以太平猴魁茶为研究对象，利用1-D CNN模型提取NIR特征，建立基于1-D CNN和NIR的太平猴魁茶产地鉴别模型，并采用蒙特卡罗方法进行产地鉴别模型稳定性分析，为太平猴魁茶产地鉴别及溯源分析提供新方法。

1 实验部分

1.1 材料与仪器

材料：选取太平猴魁茶地理保护范围黄山市黄山区的猴坑、猴岗、颜家、三合、石河坑、汪王岭共6个不同产地样本，每个产地各20个样品。按照采摘时间从指定地点采集样品，委托黄山市猴坑茶业有限公司按照太平猴魁茶传统工艺进行制备，样本信息如表1所示。

表1 样品信息Table 1 Sample information

试验仪器： IRTracer-100NIR仪(日本岛津)、 KN 295 Knifetec样品磨(瑞典FOSS)、石英样品杯(日本岛津)。

1.2 方法

1.2.1 样品制备

将茶叶用粉碎机粉碎50 s，将粉碎的试样过0.154 mm的筛，密封放于4 ℃冰箱中备用。

1.2.2 仪器条件

光阑：自动，延迟10 s；增益： 1；模式：能量扫描；零填充： 4倍；动镜速度： 2.8 mm·s-1；测定模式：吸光度；扫描波数范围： 10 000～4 000 cm-1；扫描次数： 45次；光束：内部；检测器： MCT；光源：钨灯光源；变迹函数： SqrTriangle；分辨率： 4 cm-1。

1.2.3 光谱采集

取适量样品于石英样品杯中，高度约为5 mm，保证样品杯底部样品均匀无缝隙、厚度均匀，放在漫反射扫描装置的放样口处，盖好样品室盖板，扫描光谱。

1.3 光谱数据预处理

因背景噪声、杂散光和人工操作等因素影响，导致所采集数据包含噪声信号[10]。在分析之前对所采集的原始光谱数据进行预处理。选取标准正态变换(standard normal variants,SNV)作为预处理方法[11]。

1.4 卷积神经网络

卷积神经网络是一种多层非全连接的高性能非线性深度学习方法，其基本结构由卷积层、池化层和全连接层组成，在正向传播过程中利用卷积层和池化层相互交替学习实现原始数据特征提取；在反向传播过程中则利用梯度下降法最小化误差函数实现参数调整，以此完成权值更新[12]。

对于图像等二维形式的数据，一般采用大小的卷积核和池化核进行特征提取，但本试验采集的NIR是一维数据，因此采用1-D CNN进行特征分析，其一维卷积和池化分析过程如图1所示。

图1 1-D CNN提取特征过程Fig.1 Feature selection process of 1-D CNN

1.5 模型评价方法

为确定最佳网络结构和系统参数，选择预测准确率(correct identification rate， CIR)和运行时间作为模型性能评估指标，其中CIR定义为

式中， N表示全部样本,NC表示对应分析数据集中预测准确样本数。

2 结果与讨论

2.1 近红外光谱及预处理

选取黄山区太平猴魁茶共120个样本(表1)进行光谱采集，原始光谱如图2(a)所示。经SNV预处理后的光谱图如图2(b)所示，相比于图2(a)，预处理光谱特征峰更加明显。

图2 太平猴魁茶光谱数据(a)：原始光谱； (b)：预处理光谱Fig.2 Spectra of Taiping Houkui tea(a)： Original data； (b)： Preprocessed data

2.2 采样间隔对模型的影响

太平猴魁茶原始光谱波长点(12 446)较多，容易导致网络训练时间过长。为降低模型计算成本，需要对原始数据通过间隔采样实现降维处理。为选择最佳采样间隔，将样本随机划分为训练集(84，占70%)和测试集(36，占30%)，分析对比不同采样间隔数据预测精度和计算时间(表2)。

表2 不同采样间隔预测结果Table 2 Prediction results with different sampling intervals

分析结果表明，基于原始光谱数据的1-DCNN模型计算时间过长且模型预测准确率较低，当采样间隔为6时，CNN模型测试集预测精度达到最大(96.67%)，当采样间隔继续增大时， 1-DCNN模型计算时间减少，但预测性能快速下降，综合考虑模型预测精度和计算时间，选择6作为最佳采样间隔。

2.3 网络结构设置

为确定最佳网络结构，分别计算2—5层网络结果模型损失函数(图3)。分析结果表明， 3层网络结构模型目标函数可在最短(约85步，如图3红色实线所示)，迭代步长内实现收敛，因此选择具有3层网络的1-D CNN模型。

图3 不同1-D CNN结构训练集损失函数Fig.3 Loss function values of training set fordifferent 1-D CNN structure

2.4 卷积核大小及数目

对于NIR数据，重叠特征峰和独立特征峰的存在导致模型结果对于卷积核大小及数目更加敏感，卷积核过小导致模型计算过程复杂；卷积核过大则容易造成特征丢失。为确定最佳卷积核大小，分别讨论7—39不同大小卷积核分析结果(图4)。

图4 不同大小卷积核CIR Fig.4 CIR of different convolution kernel sizes

对于卷积核数目，按照2n进行设置，并分别测试了卷积核数目为n=3,4,5,6,7的分析结果。考虑到池化操作会减少卷积特征维度，以2为梯度递减相邻层卷积核数目，具体分析结果如表3所示。

表3 不同数目卷积核CIRTable 3 CIR of different convolution kernel number

由图4可知，当卷积核大小为41时， CIR达到最大值，由表3可知，当卷积核数目大于32时，运行时间显著增大。结合图4和表3，确定最佳卷积核大小和数目分别为41和32。

2.5 Dropout的影响

为防止因数据集参数过大而引起过拟合现象，采用Dropout方法进行网络结构优化。对比网络结构优化前后模型的预测结果发现，在引入Dropout后模型性能有明显提升，其预测集准确率从91.67%提高到100%。

2.6 激活函数的比较

为确定最佳激活函数，分别对比含有4种不同激活函数(ReLU， Sigmoid， PReLU和ELU)网络模型预测结果。其中， Sigmoid激活函数预测准确率最低(75%)， PReLU(95.83%)和ReLU(93.33%)次之， ELU激活函数预测准确率最高(98.33%)。因此，选择ELU作为1-D CNN模型激活函数。

2.7 产地鉴别结果

根据图5模型结构和系统参数所建1-D CNN模型如图5所示，图中所示结构含有3个卷积层(C1， C3， C5)，其卷积核大小分别为41， 39和37，由MSRA初始化卷积核权重。 3个池化层(S2， S4， S6)按照设定步长和窗口大小降低数据维度。在分析过程中，为防止梯度消失，在每一次卷积后进行批处理化(batch normalization,BN)。通过Softmax分类器实现对特定分析对象的分类预测。

图5 1-D CNN模型结构Fig.5 Model structure of 1-D CNN model

根据图5模型结构所建1-D CNN模型的预测结果如图6所示，图中横纵轴数值表示不同产地属性，对角线变量大小表示正确预测数，可知基于CNN和NIR的太平猴魁茶产地鉴别模型预测准确率为100%。

图6 1-D CNN模型预测结果Fig.6 Prediction results of 1-D CNN model

2.8 结果分析

为验证1-D CNN模型筛选NIR特征变量的有效性，分别选取不同产地样本，对比原始数据和不同卷积层筛选数据的分布情况[见图7(a)—(d)]。由图7(a)可知，原始光谱数据主要分布在8 700～5 600和5 300～4 000 cm-1两个区间，经第一层卷积网络获得特征峰主要分布在7 800～6 700， 6 400～5 200和5 200～4 200 cm-1，第二层筛选的特征峰主要分布在10 000～7 100， 6 300～5 400和5 400～4 200 cm-1，第三层筛选特征峰主要分布在10 000～7 300， 6 300～5 800和5 500～4 400 cm-1。结合太平猴魁茶主要品质成分官能团的分布，可以发现1-D CNN能够有效提取太平猴魁茶内含成分粗纤维(7 502～5 446 cm-1)、茶多酚(6 101～4 246 cm-1)、咖啡碱(7 502～5 446和4 424～4 246 cm-1)和游离氨基酸(7 502～5 800和5 450～4 246 cm-1)的NIR特征[13]。对比分析图7(a)和(d)可知， 1-D CNN模型在有效选择光谱特征的同时能够实现不同产地特征变量差异化表示，有助于提高太平猴魁茶产地鉴别模型分析能力。

图7 光谱特征分布(a)：原始光谱； (b)：第一卷积层； (c)：第二卷积层； (d)：第三卷积层Fig.7 Spectral feature distribution(a)： Original spectrum; (b)： First convolutional layer; (c)： Second convolutional layer; (d)： Third convolutional layer

2.9 模型对比

为验证1-D CNN模型有效性，采用相同的训练集和测试集样本，对主成分分析(principal component analysis,PCA)和1-D CNN模型分别进行100次蒙特卡罗试验，不同方法所建模型的训练集和测试集分析结果如表5所示。分析结果表明，相比于原始数据(41.29%， 40.57%)，基于PCA特征筛选的产地鉴别模型准确率有所下降(30.96%， 31.93%)，其主要原因是不同产地光谱变量分布相似， PCA无法有效选择特征光谱； 1-D CNN模型能够显著提高太平猴魁茶产地鉴别精度(98.48%～97.73%)，可实现太平猴魁茶高精度产地鉴别分析。此外，测试结果标准差表明基于1-D CNN的产地鉴别模型稳定性更高。

表5 蒙特卡罗试验结果对比Table 5 Comparison of Monte Carlo experimental results

3 结论

基于太平猴魁茶不同产地NIR信息，结合CNN特征表示方法，提出基于1-D CNN的太平猴魁茶产地鉴别模型。试验结果表明CNN能够有效筛选不同产地样本NIR特征，实现太平猴魁茶高精度产地鉴别分析(100%)； 100次蒙特卡罗试验表明，相比于原始数据(40.57%， 7.06)和PCA模型(31.93%， 6/96)，基于1-D CNN的产地鉴别模型具有更高的预测精度(97.73%)和更小的标准差(3.47)，该方法为太平猴魁茶等名贵茶叶产地鉴别及溯源分析提供新思路。