基于嗅觉可视化技术的花生黄曲霉毒素B1定量检测
2022-02-08刘良源陈全胜
江 辉 刘良源 陈全胜
(1.江苏大学电气信息工程学院, 镇江 212013; 2.江苏大学食品与生物工程学院, 镇江 212013)
0 引言
收获后花生在流通和储藏过程中,容易受到霉菌的污染而发生霉变。其中,黄曲霉毒素在霉变花生中常被检出[1]。而黄曲霉毒素B1(Aflatoxin B1, AFB1)毒性最大,是目前已知霉菌中毒性最强的。长期少量摄入该物质会引起慢性中毒,进而促使肝脏发生慢性损伤[2]。因此,AFB1被国际癌症研究机构划定为Ⅰ类致癌物,我国对花生及其制品中的AFB1限量指标为20 μg/kg。花生受到AFB1污染后不仅会降低花生的营养和商业价值,更重要的是影响花生及其制品的可食性和安全性[3]。因此,实现对花生AFB1的准确检测具有现实意义。
粮食中AFB1的传统检测方法主要有薄层色谱法、高效液相色谱法、免疫学方法等[4]。目前,高效液相色谱法已经成为检测粮食中AFB1的主要方法[5]。尽管该方法检测精度高,但是其样品检测的前处理较为复杂且检测时间长。此外,上述其他传统检测方法均属于实验室理化分析法,耗时费力、检测成本高,难以满足现代粮食中AFB1现场分析检测的需求。因此,开发一种高效、绿色的检测方法实现对花生AFB1的定量检测十分必要。
嗅觉可视化技术是近年来发展迅速的无损检测技术之一,它是一种新型嗅觉传感器检测方法[6]。该方法通过分析特定化学染料和待测物散发出的挥发性气体反应前后的颜色差值来实现待测物的属性分析[7]。近年来,该技术已经成功应用于食品和农产品品质分析领域[8-17]。在谷物霉变程度的定性识别方面也有成功应用[18-20]。但关于谷物真菌毒素的定量检测方面相关报道甚少。此外,嗅觉可视化技术的核心是特异性强的色敏传感器阵列的制备。但在传感器的制备上,目前还没有统一的理论来指导材料选型和制作流程。现有大多研究都是根据经验或者通过尝试来选择化学染料制备色敏传感器阵列。
鉴于此,本文首先利用顶空固相微萃取气相色谱-质谱联用技术(HS-SPEM-GC-MS)对不同霉变程度的花生样本进行分析,然后根据分析结果选择合适的化学染料来制备特异性色敏传感器阵列。利用化学计量学方法挖掘传感器图像数据特征,构建非线性检测模型以实现花生AFB1含量的嗅觉可视化技术定量检测。
1 材料与方法
1.1 样本准备
实验所用花生样本从当地大型市场购买,共10 kg。将所有花生均匀放置在两个金属托盘上并放入温度28℃、相对湿度80%恒温恒湿箱(天津宏诺仪器有限公司)中,每天取适量样本进行理化实验测定AFB1含量。结果发现,第5天取样的花生样本中检出了AFB1,于是,此后每间隔一天从两个托盘的不同位置取花生样本20个,每个样本10 g。第8天以后,花生样本的霉变情况已肉眼可见,终止取样。共采集了不同霉变程度的花生样本100个。
1.2 黄曲霉毒素B1含量测定
对采集的花生样本,按照GB 5009.22—2016中规定的第2种方法(高效液相色谱-柱前衍生法)对花生样本中的AFB1含量进行检测。
1.3 色敏传感器阵列制备
根据不同霉变程度花生样本的HS-SPEM-GC-MS分析结果发现,花生在霉变过程中,醛类物质占比比较高且变化明显,其中以己醛和壬醛为主;此外,2-正戊呋喃在花生霉变过程有增加的趋势。因此,将己醛、壬醛和2-正戊呋喃作为花生霉变过程中产生的主要指示性特征挥发物。前期研究表明,大米、小麦等谷物劣变或霉变过程产生的挥发性物质中同样也是醛类和呋喃类物质发生明显变化[16,18-20],这与花生霉变过程中所产生的主要挥发性物质类似。因此,基于课题组前期研究基础,选用同样的化学染料(以卟啉类为主)来制备特异性强的色敏传感器阵列,用于获取不同霉变程度花生样本的气味信息。最终,色敏传感器阵列制备所选用的化学染料分别为5,10,15,20-四苯基卟啉、四对甲氧苯基卟啉铁、四苯基卟啉铁、5,10,15,20-四苯基-21H,23H-卟吩铜(Ⅱ)、卟啉钴、四苯基卟啉锌、四苯基卟啉、2,3,7,8,12,13,17,18-八乙基-21H,23H-卟吩铜(Ⅱ)、八乙基卟吩、四苯基卟吩氧化钒、5,10,15,20-四苯基-21H,23H-卟吩羰基钌(Ⅱ)和2,3,7,8,12,13,17,18-辛乙基-21H,23H-卟吩钌(Ⅱ)羰基。
以聚偏二氟乙烯膜(Polyvinylidene fluoride, PVDF)(密理博公司,美国)作为基底来制备比色传感器阵列,具体制备流程如下:① 将PVDF裁剪成4 cm×3 cm的长方形基底材料备用。② 将12种色敏材料各称取8 mg分别溶于4 mL的二氯甲烷中,超声10 min后即可得到2 mg/mL的溶液置于阴凉黑暗处备用。③ 用100 mm×0.3 mm的毛细管吸取1 μL溶液并利用阵列模板辅助点样于疏水的PVDF上。静置后即可得到色敏传感器阵列。
1.4 嗅觉可视化数据采集与预处理
利用平板扫描仪获取色敏传感器原始图像数据。然后,取8 g经多功能粉碎机(德清拜杰电器有限公司)粉碎的花生样本粉末置于直径60 mm的培养皿中,色敏传感器利用双面胶固定在保鲜膜上(正面朝上),并用该保鲜膜将培养皿密封后静置反应16 min后取出。最后,利用平板扫描仪获取色敏传感器反应后的图像数据。
利用Matlab软件对得到的色敏传感器阵列的原始图像和反应后的图像分别进行中值滤波、阈值分割,再分别提取各色敏点周围12个像素半径内的R、G、B分量的灰度均值,并标准化到0~255之间。然后,利用反应后传感器阵列上各色敏点的颜色数值减去原始传感器阵列上各对应色敏点的颜色数值,这样,就可获取各对应色敏点的3个颜色差值分量ΔR、ΔG、ΔB。最后,对获得的ΔR、ΔG、ΔB进行归一化,叠加灰度图像生成色敏传感器特征图像。在本文中,每个色敏传感器阵列有12个色敏点,每个色敏点可以得到3个颜色特征分量。因此,每个花生样本的色敏传感器特征值有36个颜色分量。
1.5 数据分析方法
反向传播神经网络(Back-propagation neural networks, BPNN)是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一[21]。BPNN网络的主要特点是信号前向传递,误差反向传播,通过迭代优化网络的权值,使BPNN预测输出与期望输出尽可能一致。BPNN的学习过程是一个权值不断修正的过程,过程不断重复直到达到设定的学习次数或者输出误差达到预设值。本文BPNN作为回归器被用于遗传算法(Genetic algorithm, GA)优化色敏传感器阵列特征颜色分量。BPNN的参数设置如下:隐含层神经元节点数设为10,学习率为0.1,动量因子为0.95,初始权值为0.3,最小均方根误差为0.001,最大训练次数为100。
GA是一类借鉴生物界的进化规律演化形成的随机化搜索方法[22-23]。本文利用GA对色敏传感器阵列特征颜色分量组合进行优化。考虑到GA的随机性,将GA独立运行50次,并对50次独立运行结果进行统计分析,以消除随机性对优化结果的影响。GA参数设置如下:种群大小设置为20,交叉概率和变异概率分别设置为0.7和0.1,最大迭代次数设为100。
将GA嵌入到BPNN中用于优化传感器的最佳特征颜色分量组合。在此过程中,每次GA迭代后得到的颜色分量组合分别作为BPNN的输入,花生AFB1含量作为BPNN的输出。100次迭代结束后,根据各GA-BPNN模型对花生AFB1含量(质量比)的预测值与参考值之间的平均误差加权和最小原则来确定最佳颜色分量组合。GA的目标函数Y定义为
(1)
式中Nt——训练集样本数目
ei——训练集中第i个样本的AFB1含量与BPNN模型中预测值之间的差值
Np——预测集样本数目
ej——预测集中第j个样本的AFB1含量与BPNN模型中预测值之间的差值
支持向量回归(Support vector regression, SVR)是属于支持向量机(Support vector machine, SVM)的一种推广,专门用于处理回归分析问题[24]。SVR的主要思想是引入核函数将样本空间中非线性回归映射为高维空间中的线性回归问题,即寻找一个最优分类超平面,使得所有训练样本离该最优超平面的误差最小。回归的目的是得到一个能够尽量拟合训练集样本的模型,通常用的方法是构建一个样本标签与模型预测值的损失函数,使损失函数最小化,从而确定模型[25]。本文将径向基函数(Radial basis function, RBF)作为核函数。
网格搜索(Grid search, GS)是最简单、应用最广泛的超参数搜索算法,它是指定参数值的一种穷举搜索方法,该方法是将估计函数参数通过交叉验证的方法进行优化以达到最优的学习算法[26]。麻雀搜索算法(Sparrow search algorithm, SSA)是2020年提出的一种新型群智能优化算法,SSA主要是受麻雀的觅食行为和反捕食行为的启发[27],具有寻优能力强、收敛速度快、稳定性好、鲁棒性强等特点[28]。利用GS和SSA优化的SVR的惩罚参数C和核参数g以获取最佳性能的SVR模型,并对模型结果进行比较。在利用GS优化SVR参数C和g时,它们的取值范围为[2-10, 2-9.5, …, 29.5, 210]。在利用SSA优化SVR参数C和g时,C的取值范围设置为0.001~100,g取值范围设置为 0.001~1 000,种群数量为20,最大迭代次数为100。
2 结果与讨论
2.1 样本集划分
将训练集和预测集的样本划分成两部分。第1部分用于色敏传感器特征组合的优化。为了消除各种随机结果对优化结果的影响,对GA-BPNN算法独立运行了50次。在优化过程中,采用随机抽样,将训练集和预测集样本按照3∶1的比例进行划分。这样,训练集有75个样本,预测集有25个样本。第2部分用于SVR检测模型的构建。为了使模型获得更好的泛化性能,将所有样本根据AFB1含量从小到大排列,然后依次将每4个样本中间的任意一个放入预测集,另外3个放入训练集。这就可以保证训练集的样本特征包含预测集的样本特征。同样,训练集中有75个样本,预测集中有25个样本。表1为SVR构建时的样本划分情况。从表1可以看出,训练集和预测集中花生样本的AFB1含量平均值和标准差没有明显差异。
表1 训练集和预测集中AFB1含量统计结果Tab.1 Statistical distribution of AFB1 values in training set and prediction set μg/kg
2.2 色敏传感器阵列响应结果
图1为预处理后的不同AFB1含量花生样本的色敏传感器阵列特征图像。从图1可以看出,不同AFB1含量花生样本的传感器特征图像是有明显差异的。因此可以推断出,花生在霉变过程中产生的挥发性物质成分发生了显著变化,指示性挥发性物质的含量也在不同阶段发生了特定变化,而这些变化可以被色敏传感器阵列捕获,并以不同的颜色灰度呈现出来。从图1中还可以观察到,有些颜色变化较大的色敏点肉眼就能清晰可辨,这说明所制备的色敏传感器阵列能够有效地反映不同霉变花生样本气味信息的变化情况。但是,也有一些色敏点颜色饱和度之间的差异较小,这可能是邻近霉变阶段挥发性物质变化较小导致了颜色反应没那么明显。这也间接地表明了不同色敏点之间的特征数据存在一定的信息冗余。因此,在SVR检测模型构建前,有必要对色敏传感器的特征颜色分量组合进行优化。
图1 不同霉变程度花生样本的差值图像Fig.1 Difference images of peanut colorimetric sensor with different mildew degrees
2.3 基于GA-BPNN的特征优化结果
图2 50次独立运行GA-BPNN算法后每个颜色分量 被选择的累积频次Fig.2 Cumulative frequency of each color component selected after GA-BPNN algorithm ran independently for 50 times
图2为GA-BPNN独立运行50次后各个颜色分量被选中的累积频次。从图2可以看出,所有颜色分量都有被选中,且被选中最低频次的颜色分量都达到了10次。这间接说明了GA-BPNN在每一次的变量优选过程中保留了比较多的变量,这可能与GA优化准则有一定的关系。从图2还可以看出,有多个颜色分量被选中的频次比较高,尤其是第12、23、28个这3个颜色分量,它们的累积次数均超过了40次,这说明了在每次变量优化过程中,这3个颜色分量几乎都被选到,这表明这3个颜色分量可能有效反映了霉变花生中AFB1含量的变化。而有些颜色分量所选次数较低,比如第6个和第26个等,这表明这些颜色分量与霉变花生AFB1含量之间的相关性较小。从图2进一步分析可以发现,有13个颜色分量被选的次数超过30次,有7个颜色分量所选频次超过35次,依次为第3、12、19、23、25、28、32个颜色分量。在7个颜色分量中,有3个分量累积频次超过40次,依次为第12、23、28个颜色分量。因此,基于上述分析结果,将基于13、7、3个颜色分量的3种组合分别作为输入特征来构建SVR模型,并比较不同SVR模型的预测性能。
2.4 基于不同颜色分量组合的SVR模型结果
表2为基于不同颜色分量组合分别建立的SVR模型结果。从表2可以看出,在GS-SVR模型中,模式2模型获得了最佳的预测性能。尽管模式3下选用的颜色分量个数最少,但是建立的GS-SVR模型性能低于模式1和模式2两种模式下得到的GS-SVR模型性能。这说明建模选用的特征变量过少在一定程度上不能很好地保留原始数据的内在特征,从而影响模型的预测性能。
从表2进一步分析可以看出,相较于GS-SVR模型,SSA-SVR模型整体上获得了更好的预测效果。这可能是因为网格搜索法一般会先使用较广的搜索范围和较大的步长,然后会逐渐缩小搜索范围和步长,来寻找更精确的最优值。这种操作方案可以降低所需的时间和计算量,但由于目标函数一般是非凸的,所以很可能会错过全局最优值。而SSA具有高性能的搜索能力,使得其能够很好地搜索全局最优的潜在区域,并且可以有效地避免陷入局部最优的问题。因此,该模型整体性能优于GS-SVR模型。
表2 基于不同颜色分量组合建立的SVR模型结果Tab.2 Results of different SVR models based on different combinations of color components
对于SSA-SVR模型,从表2可以看出,同样是模式2下得到的SSA-SVR模型性能最佳,模式3下建立的SSA-SVR模型性能低于模式1和模式2两种模式下建立的SSA-SVR模型性能,这与不同模式下GS-SVR模型的性能结果一致。由此可见,尽管利用更少的特征变量来建模可简化模型结构,但所得到SVR模型的预测性能在一定程度上有所削弱。综合考虑模型的性能和复杂度,认为模式2下得到的最佳SSA-SVR模型为最优模型。图3 为最佳SSA-SVR模型在训练集和预测集中的预测值和实测值之间的散点图,其RP为0.914 2、预测均方根误差为5.683 2 μg/kg、剩余预测偏差为2.392 6。
图3 SSA-SVR模型预测值与测量值的关系Fig.3 Interrelationship between measured and predicted values in SSA-SVR model
3 结束语
针对花生霉变过程中指示性特征挥发性物质制备了特异性强的色敏传感器阵列,实现了霉变花生AFB1的定量检测。通过引入GA-BPNN算法对色敏传感器的颜色分量进行优化,建立了基于不同优化特征组合的SVR模型,并比较了GS和SSA两种优化算法对SVR参数优化的效果。结果发现,SSA-SVR模型性能整体上优于GS-SVR模型性能,且基于7个特征颜色分量组合的SSA-SVR模型得到了最佳预测结果,其RP为0.914 2,预测均方根误差为5.683 2 μg/kg,剩余预测偏差达到2.392 6。结果表明,利用嗅觉可视化技术结合适当的化学计量学方法实现花生中AFB1含量的定量检测是可行的,研究结果可为储藏期花生等谷物中真菌毒素的定量、现场检测提供一种新的技术方法参考。