基于嗅觉和光谱技术融合的面粉脂肪酸值定量检测
2021-03-20陈全胜
江 辉 刘 通 陈全胜
(1.江苏大学电气信息工程学院, 镇江 212013; 2.江苏大学食品与生物工程学院, 镇江 212013)
0 引言
面粉品质直接影响人类的身体健康[1]。随着我国国民经济的快速发展和人民生活水平的不断提高,人们对面粉品质的要求也越来越高。面粉由小麦加工而来,失去了外壳的保护,颗粒变小且裸露在外,其品质极易受到外界环境的影响[2]。因此,实现储藏期面粉品质的快速监测对保护消费者权益和饮食健康具有重要意义。
新生产的面粉中含有少量的脂质,其颗粒与氧气接触后,脂质被氧化分解而产生游离脂肪酸,脂肪酸进一步氧化产生的醛酮类化合物是导致储藏期面粉产生哈喇味的主要原因[3]。因此,面粉在储藏过程中,其脂质的变化直接影响面粉的口感和营养价值。面粉脂肪酸值可以反映脂质水解产生的游离脂肪酸的含量,可作为衡量面粉储藏品质的重要指标之一[4]。一般情况下,面粉脂肪酸值会随着储藏时间的延长而逐渐升高,脂肪酸值越高,面粉的品质越差,且脂肪酸值增加得越快,面粉越容易发生霉变[5]。目前,脂肪酸值的检测主要根据GB/T 15684—2015《谷物碾磨制品 脂肪酸值的测定》。尽管该方法准确可靠,但对检测人员要求较高,而且需要配备专用的化学试剂,其操作过程繁琐,不适合应用于现场快速检测。因此,高效、快速检测储藏期面粉脂肪酸值关系到面粉储藏安全与利用,具有显著的经济价值和社会价值。
近红外光谱的吸收带是有机物质中能量较高的化学键(主要是C—H、O—H、N—H)在中红外光谱区基频吸收的倍频、合频和差频吸收带叠加而成的[6]。近年来,该技术在食品和农产品质量分析方面取得了成功的应用[7-14],在粮食储藏品质检测方面也有所涉及[15]。比色传感器技术是近年来迅速发展的一种无损检测技术,其核心是传感器阵列的设计和制备。该技术可高效捕获有机物质所挥发的简单或复杂的气味信息,并以图像的形式呈现,在食品和农产品质量检测上也得以成功应用[16-23],在粮食储藏品质分析方面也有所应用[24]。然而,目前研究均采用单一的无损检测技术,而单一的传感器检测手段往往不能全面反映其过程中的变化信息,会影响检测结果的可靠性。鉴于此,本文融合比色传感器数据和近红外光谱特征,以期实现储藏期面粉脂肪酸值的高精度检测。
1 材料与方法
1.1 样本准备
实验使用的面粉是从江苏省镇江市超市购买的益海嘉里香满园面粉,共5袋,规格为5 kg/袋,放置于25℃的环境中储藏。以月为单位,从每袋的不同位置随机取4个20 g(精确到0.01 g)的面粉样本。每个月可以获得20个面粉样本。进行8个月储藏实验后,共得到160个面粉样本。
1.2 脂肪酸值检测
面粉样本的脂肪酸值测定依据GB/T 15684—2015《谷物碾磨制品 脂肪酸值的测定》来进行,基本原理如下:首先,用95%乙醇溶解面粉,提取面粉中的脂肪酸,进行离心分离并提取上层清液;然后加入酚酞试剂,用0.01 mol/L的KOH标准溶液滴定,根据滴定消耗的KOH溶液用量推导计算出脂肪酸值(该值为中和100 g面粉试样中游离脂肪酸所需KOH的质量)。
1.3 研究思路
图1为基于嗅觉和光谱技术融合的储藏期面粉脂肪酸值定量检测的主要思路。首先,制作比色传感器阵列和搭建便携式近红外光谱测量系统,并分别采集不同储藏期面粉样本的比色传感器数据和近红外光谱;然后,对获得的比色传感器数据和近红外光谱分别进行预处理,并对预处理后的比色传感器数据和近红外光谱分别利用主成分分析进行特征降维,在反向传播神经网络(Back propagation neural network, BPNN)模型校正过程中利用五折交互验证优化并确定最佳主成分(Principal components, PCs)数量;最后,在特征层融合优化后的最佳PCs建立BPNN模型以实现储藏期面粉脂肪酸值的定量检测。
1.4 数据采集
1.4.1比色传感器制作和数据采集
比色传感器的具体制作过程如下:① 根据前期预实验结果,筛选出15种化学染料,包括14种卟啉(美国西格玛奥德里奇公司)和1种疏水性pH指示剂(国药集团化学试剂有限公司)。② 称取各化学染料8 mg放入5 mL的容量瓶中,卟啉类染料用4 mL二氯甲烷溶解,pH指示剂用4 mL无水乙醇溶解。再对它们分别进行超声处理30 min即可得到质量浓度为2 mg/mL的溶液。③ 以C2反向硅胶板作为传感器阵列的基底,用毛细管(0.3 mm×100 mm)提取1 μL的上述溶液进行点样,制成5×3的比色传感器阵列。
比色传感器数据采集时,首先利用平板扫描仪扫描获取比色传感器反应前的图像数据;然后将20 g面粉样品置于50 mL烧杯内,将比色传感器阵列的底部用双面胶固定在烧杯盖上,再用塑料薄膜对烧杯进行密封。待传感器阵列与面粉产生的挥发性气体反应30 min后,取出。最后,利用平板扫描仪扫描获取比色传感器反应后的图像数据。
首先对得到的反应前、后的比色传感器阵列的图像分别进行中值滤波、阈值分割,再分别提取各色敏点周围15个像素半径内的平均R、G、B值,标准化为0~255之间。然后用反应后色敏点的颜色数值减去反应前的颜色数值,获取对应色敏点的3个颜色差值分量ΔR、ΔG、ΔB。最后,对ΔR、ΔG、ΔB进行归一化,叠加灰度图像,从而生成特征图像。在本研究中,每个比色传感器阵列有15个色敏点,每个色敏点可以得到3个颜色特征分量。因此,每个面粉样本的比色传感器数据为45个颜色特征分量。
1.4.2近红外光谱采集和预处理
所用便携式近红外光谱测量系统主要包括NIRQuest512型光谱仪和ISP-R型反射用积分球。扫描前,仪器参数设置如下:扫描波长范围为900~1 700 nm,积分时间为5 s,平均次数为3次,平滑度为3。这样,每条光谱包含512个数据点。光谱采集时,先将20 g面粉样本倒入石英比色皿中,再用光谱仪系统的积分球盖住样品,并进行近红外光谱的采集。为了使采集到的光谱数据更加准确,研究对每个样本分别进行3次测量,然后取3次测量的平均光谱作为该样本的原始光谱。光谱采集过程中,实验室温度保持在25℃左右。为了消除噪声、基线漂移和光散射等因素的干扰,对原始近红外光谱分别进行了SG(Savizkg-Golag)平滑和标准正态变换预处理。
1.5 数据分析方法
主成分分析(Principal component analysis, PCA)是一种分析、简化数据集的技术,是多元分析方法中的一种常用方法[25]。PCA是对于原先提取的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量尽可能保持原有的信息。其基本原理就是根据初选的特征量间可能存在的相关性,找到一种空间变换的方式,通过对原变量进行线性组合,形成若干个新的特征矢量,要求它们相互正交,并且能够最大限度地保留原样本所含的原始信息,同时根据实际需要从中取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法。在本研究中,利用PCA对预处理后的比色传感器数据和便携式近红外光谱进行数据降维和特征挖掘。
BPNN模型是一种多层前馈神经网络,该网络的主要特点是信号前向传递,误差反向传播,通过迭代优化网络的权值,使BPNN模型预测输出与期望输出尽可能一致。BPNN模型是一个非常强大的学习系统,可以处理许多复杂的非线性系统[26]。它包括3部分:输入层、隐含层和输出层。在前向传递过程中,信号从输入层经隐含层逐层处理,直至输出层,经过非线性变换,产生输出信号。将输出结果与期望结果相比较得到预测误差,转入反向传播阶段。在信号的前向传递期间,网络结构的权值保持不变,每一层的神经元状态只影响下一层的神经元状态。在反向传播阶段,误差通过隐含层向输入层逐层反传,并将误差分摊给各层所有节点,以调整各节点的权值。经过反复学习,确定与最小误差相对应的权值和阈值,使BPNN模型预测输出不断逼近期望输出。在本研究中,BPNN模型的隐含层设置为3层,每个隐含层的节点数都设置为5,迭代次数设置为100次,学习率设置为0.1,最小均方根误差设置为0.000 04。为了减少BPNN模型在初始化时随机因素对模型结果的影响,对BPNN模型进行了50次独立运行,并对50次独立运行后的结果进行统计分析。
2 结果与讨论
2.1 样本集划分
数据分析前,将获得的160个面粉样本划分成训练集和预测集。对每个月采集的20个面粉样本中随机选取15个面粉样本作为训练集,其余5个面粉样本作为预测集。这样,训练集中有120个面粉样本,预测集中有40个面粉样本。表1为训练集和预测集中面粉样本脂肪酸值的分布情况。
表1 训练集和预测集中脂肪酸值的分布统计Tab.1 Distribution statistics of fatty acid values in training set and prediction set
2.2 BPNN模型结果
2.2.1基于比色传感器数据特征的BPNN模型结果
图2为基于比色传感器数据特征的BPNN模型在训练集和预测集中的结果。图2a为在不同PCs下,50次独立运行BPNN模型后得到的模型在训练集中的检测结果。从图2a可以看出,当PCs数量为3时,交互验证均方根误差(Root mean square error of cross-validation, RMSECV)达到最小,为2.138 2 mg/(100 g),其对应的校正相关系数(Correlation coefficient of calibration,RC)为0.896 7。因此,认为基于比色传感器数据特征的BPNN模型的最佳PCs数量为3。图2b为建立在3个PCs上的BPNN模型50次独立运行后在预测集中的检测结果。从图2b可以看出,预测相关系数(Correlation coefficient of prediction,RP)的均值为0.867 3,标准差为0.017 3;预测均方根误差(Root mean square error of prediction, RMSEP)的均值为2.602 4 mg/(100 g),标准差为0.130 7 mg/(100 g)。
2.2.2基于近红外光谱特征的BPNN模型结果
图3为基于近红外光谱特征的BPNN模型在训练集和预测集中的结果。图3a为在不同的PCs下,50次独立运行BPNN模型后得到的模型在训练集中的检测结果。从图3a可以看出,当PCs数量为4时,RMSECV最小,为1.814 4 mg/(100 g),其对应的RC为0.925 9。因此,认为基于近红外光谱特征的BPNN模型的最佳PCs数量为4。图3b为建立在4个PCs上的BPNN模型50次独立运行后在预测集中的检测结果。从图3b可以看出,预测相关系数均值为0.923 5,标准差为0.024 1;预测均方根误差均值为1.977 2 mg/(100 g),标准差为0.223 9 mg/(100 g)。
2.2.3基于融合特征的BPNN模型结果
根据上文的分析,基于比色传感器数据特征的BPNN模型的最佳PCs数量为3,基于近红外光谱特征的最佳PCs数量为4。鉴于此,将通过五折交互验证优化得到的基于单技术(比色传感器技术和近红外光谱技术)数据特征的BPNN模型的最佳PCs在特征层进行融合,并建立基于融合特征的BPNN模型。图4为建立在融合特征上50次独立运行BPNN模型后得到的模型在训练集和预测集中的统计结果。从图4a可以看出,RC的均值为0.928 9,标准差为0.014 2;校正均方根误差(Root mean squareerror of calibration,RMSEC)均值为1.798 8 mg/(100 g),标准差为0.133 0 mg/(100 g)。从图4可以看出,RP的均值为0.927 6,标准差为0.015 8;RMSEP的均值为1.934 5 mg/(100 g),标准差为0.167 0 mg/(100 g)。
2.3 不同BPNN模型结果的比较
表2为基于不同特征建立的最佳BPNN模型在训练集和预测集中的检测结果。从表2可以看出,在训练集中,基于不同数据特征的BPNN模型的相关系数均在0.93以上,在预测集中的相关系数在0.89以上。这说明利用比色传感器或近红外光谱技术结合化学计量学方法实现储藏期面粉脂肪酸值的定量检测是可行的。另外,基于比色传感器数据和近红外光谱融合特征建立的BPNN模型,无论是在预测精度还是泛化性能方面,较单技术数据特征建立的BPNN模型性能而言均有所提升。这说明基于融合特征建立的BPNN模型能更全面地反映储藏过程中面粉样本的内外特征。因此,根据其特征建立的BPNN模型的预测精度和泛化性能最佳。
表2 基于不同特征建立的最佳BPNN模型在训练集和预测集中的检测结果Tab.2 Detection results of optimal BPNN model based on different characteristics in training set and prediction set
3 结束语
储藏期面粉理化指标变化是由内外因素共同作用而产生的。比色传感器可以快速获取储藏期面粉样本的气味变化信息,近红外光谱可以快速获取储藏期面粉样本内含物质的微变化。通过融合比色传感器数据和近红外光谱特征,构建了基于比色传感器技术与近红外光谱技术融合的储藏期面粉脂肪酸值的定量检测模型,最佳BPNN融合模型在预测集中的相关系数和预测均方根误差分别为0.951 0和1.625 2 mg/(100 g)。研究表明,相较于单技术检测模型,融合比色传感器数据和近红外光谱特征建立的化学计量学模型可有效提高模型预测精度和泛化性能。本研究为储藏期粮食品质的在线监测提供了一种新的技术方法,对保障粮食储藏品质具有重要的现实意义。