基于近红外光谱的果蔬脆片品质评价方法研究
2017-10-17杜广全
刘 静, 杜广全, 管 骁
(1.上海海事大学信息工程学院,上海 201306;2.上海理工大学医疗器械与食品学院,上海 200093)
果蔬脆片在保持原有风味的基础上尽可能保持果蔬的营养成分,同时又具备口感酥脆、绿色天然,便于贮存等特点,满足了消费者对果蔬脆片营养方便、天然低脂、高膳食纤维等需求[1]。随着人们对健康问题越来越多的重视,低脂低热量食品在市场上尤为受到关注。因此,一系列非油炸果蔬脆片干燥加工技术应运而生,主要有变温压差膨化干燥技术、真空冷冻干燥技术、微波真空干燥技术等[2 - 4]。自上世纪80年代以来,美国农业部东部研究中心、中国农业科学院农产品加工研究所、山东农业大学等研究团队对苹果脆片的加工进行了较多的研究,这些研究基本侧重于工艺参数的优化和不同干燥方式对产品某种特性的影响,不同的研究者对苹果脆片的品质情况定位也不同,进而选择不同的测定指标来反映产品的最终品质状况[5 - 6]。同时传统检测方法制样繁琐、检测费时费工,且需专业人士操作,难以实现快速无损监控加工过程中苹果脆片品质变化情况。目前,近红外光谱技术凭借其快速简便、无损绿色和易实时在线检测等优点被广泛应用于果品品质检测研究[7]。因此,本文将基于果蔬脆片的近红外光谱信息,运用智能机器学习方法建立苹果脆片的智能客观的品质预测模型,从而实现快速无损评判。
基于当前的果蔬脆片品质评价研究现状,本文中选取水分、总酸、总糖、可溶性固形物、硬度五个属性作为品质评价指标。根据果蔬脆片水分含量应小于5%的国家标准,选取苹果脆片为研究对象,结合最新的果蔬脆片研究成果和支持向量机机器学习方法,以苹果脆片近红外光谱吸收值的数据样本为训练样本,根据不同红外光谱吸收值的数据特征信息,产生不同的映射关系,然后通过苹果脆片红外光谱吸收值来预测苹果脆片的各项品质指标,以期完成对果蔬脆片各项品质指标的评价。
1 实验部分
1.1 仪器与设备
Antais II型傅里叶变换近红外光谱分析仪(美国,Thermo Fisher公司);Ta.XT2i/50型物性分析仪(英国,Stable Micro System公司)。
1.2 材料及样品制备
实验所用苹果原材料均选自不同产地、不同批次的产品,均采购于当地大型农场和超市,随机挑选24个大小相似、无机械损伤的苹果进行清洗、削皮等预处理,并将其均匀切片至5 mm,置于0.5%抗坏血酸钠溶液中浸泡30 min,然后将苹果薄片放入65 ℃减压干燥箱进行干燥处理6 h,每隔1 h进行取样测定,共得到144组苹果切片样本。
1.3 品质指标的测定方法
水分的测定:直接干燥法,参考文献[8];可溶性固形物的测定:折射仪法,参考文献[9];总糖的测定:蒽酮比色法;可滴定酸的测定:指示剂滴定法,参考文献[10];硬度的测定:采用质构分析法(Texture Profile Analysis,TPA)测定。物性分析仪参数设置:测试速度1.0 mm/s,测前速度和测后速度1.0 mm/s,数据采集速率200次/s,压缩距离80%,探头为P/1S。仪器自动测定应力的变化,给出应力时间变化曲线。硬度值等于曲线中力的峰值,单位为g,值越大表明产品越硬。
1.4 近红外光谱采集
近红外光谱分析仪仪器参数设置:分辨率为8 cm-1,光谱范围为10 000~4 000 cm-1,扫描次数为64次。开机预热30 min后先进行背景扫描,消除背景对光谱信息的影响,再用积分球固体采集模块对样本进行光谱扫描。每组样本测量5次,取平均值作为该样本的典型光谱,数据采集软件为OMNIC。
2 支持向量机(Support Vector Machine,SVM)建模方法
2.1 支持向量机基本思想
本文将采用支持向量机这一机器学习技术对近红外光谱数据进行建模,它通常在处理小样本、非线性、模糊性等特征的数据时表现出很强的高维辨识能力。支持向量机通过核函数实现非线性函数拟合,可有效解决样本高维和计算复杂度之间的矛盾,同时选择不同的核函数就构成不同的支持向量机。实验中发现,核函数参数和惩罚系数在很大程度上决定了支持向量机的学习和泛化能力,为此本试验中将多次对最优惩罚系数和最优核函数参数进行调整,以期取得更接近于实际情况的水分预测效果[11 - 12]。
2.2 模型建立
利用支持向量机建立回归模型对苹果脆片不同时刻的各项品质指标进行回归拟合。假设苹果脆片不同时刻的品质指标与其对应的红外光谱吸收值相关,即把苹果脆片近红外光谱吸收值作为对应时刻品质指标的自变量,此时刻的品质指标作为因变量。支持向量机采用的核函数是径向基函数(RBF)K(xi,xj)=exp(-‖xi-xj‖2)/g2。支持向量机建模的具体执行步骤如下:
(1)根据模型假设选定自变量和因变量:即把苹果脆片近红外光谱吸收值作为对应时刻品质指标(如水分含量)的自变量,此时刻的水分含量作为因变量。
(2)数据预处理:根据苹果脆片近红外光谱吸收值数据样本的特点,判断出数据样本不需要进行降维和归一化处理,只需将144组近红外光谱数据分为测试集和训练集,可用随机函数随机选取总数据的四分之三(108组)作为训练集,剩下的四分之一(36组)作为测试集。
(3)交叉验证选择回归的最优惩罚系数和最优核函数参数:在支持向量机回归问题中,交叉验证返回的是交叉检验下的平均分类均方根误差和平均相关系数,我们这里选择的交叉验证次数为5次,使用回归参数寻优函数进行参数寻优,得出最佳的惩罚系数和最优核函数参数。
(4)利用步骤(3)得到的最佳的惩罚系数和最优核函数参数来训练支持向量机,将最佳的惩罚系数和最优核函数参数代入到RBF核函数,使用训练函数在支持向量机中对训练集进行建模,得到训练模型。
(5)对测试集集进行拟合预测,即使用第四步中构造的模型,将其带入到预测函数中,对测试集进行预测拟合,并得出拟合预测指标平均均方根误差和平均相关系数。
3 结果与讨论
3.1 实验数据分析
本实验所用的苹果脆片近红外光谱吸收值数据样本为24个苹果脆片样本在6个时间节点观测值,共144条近红外光谱吸收值记录,每条红外光谱吸收值记录了苹果脆片在某时间节点下在10 000~4 000 cm-1的范围内苹果脆片近红外光谱的吸收值,按照上述红外光谱的采集方法,得到部分苹果样品在预先设定的6个时间节点的红外光谱吸收值数据如表1所示。
表1 苹果脆片近红外光谱数据
本实验把苹果脆片近红外光谱吸收值作为对应时刻品质指标的自变量,此时刻的各项品质指标(水分含量)作为因变量,根据近红外光谱吸收值来回归预测此时刻的水分含量。苹果脆片在加工过程中,按照上述各项品质指标的测定方法来获取水分,总酸,总糖,可溶性固形物,硬度等各项品质评价指标的部分变化情况如表2所示。
表2 苹果脆片品质评价指标数据
(续表2)
No.Water content(%)Total acid(mmol/100g)Total sugar(%)Soluble solids(%)Hardness(g)2-46.8312.1344.612.64108.02-54.2410.9167.303.78650.82-63.6811.2545.963.121210.93-170.585.7515.491.03105.83-254.985.8621.171.22047.53-338.9110.2934.792.54203.03-414.0113.9634.112.63993.63-57.3115.5859.833.76637.93-65.5615.4549.023.17404.24-174.682.426.910.44149.94-251.255.4824.641.43095.44-322.769.1729.422.03280.04-47.1113.2653.813.44770.24-55.2515.7647.152.66411.74-64.2515.2537.912.77575.85-175.994.2113.001.04076.05-265.826.3120.591.32949.35-348.2415.0725.131.63232.45-435.2514.6249.702.94451.25-517.6317.3951.862.96684.45-64.7716.5950.743.48919.7
3.2 仿真结果
利用上述执行步骤(3)交叉验证进行参数寻优可得到最优惩罚系数c为27.8576,最优核函数参数g为0.0039,将两参数代入到构造好的回归模型,即可进行果蔬脆片各项品质指标的回归预测。
图1 水分含量预测结果分布图Fig.1 The Prediction of water content distribution
样本测试集的水分含量拟合结果如图1所示,拟合预测过程得出拟合预测指标均方误差(MSE)为0.0057,相关系数R2为93.81%。从拟合结果图可以看出,受系统误差,环境因素和预测模型参数设置等众多因素的影响,个别预测数据和原始数据有较大差异,但这些误差仍在合理的范围波动之内,对水分这一指标的整体品质评价不会造成过多的影响,并且绝大部分回归预测数据的分布大致与原始数据相符,相关系数(R2)达到93.81%,表明我们的模型构造基本良好,对水分这一指标的整体评价在有效范围之内,对果蔬脆片的品质评价具有一定的指导作用。
本文以苹果脆片为研究对象,以水分含量这一品质评价为代表,对其进行了模型的构建与预测,对于总酸、总糖、可溶性固形物、硬度等其他果蔬脆片的品质评价指标的预测,本模型同样适用,并且预测结果良好,对于果蔬脆片的综合品质评价同样具有一定的指导作用,其预测方法与水分含量预测方法类似,只需把学习样本数据中的水分含量数据换成相应的其他品质评价指标的数据即可。
4 结论
本文选取苹果脆片为研究对象,结合支持向量机机器学习方法,以搜集到的苹果脆片近红外光谱吸收值的数据样本为基础,根据不同苹果样本、不同时序的红外光谱吸收值的数据特征信息,产生不同的映射关系,将某一样本在某一时刻的红外光谱吸收值映射到对应样本在对应时刻品质指标。然后利用支持向量机的方法对这些红外光谱吸收值的数据样本进行训练,从而建立了支持向量机模型,在模型建立过程中多次对最优惩罚系数c和最优核函数参数g进行调整,以期取得更接近于实际情况的品质指标的预测效果,最终寻得最优惩罚系数c为27.8576,最优核函数参数g为0.0039。该模型拟合预测过程中的平均相关系数达到93.81%。苹果脆片的各项评价指标大致与原始数据相符,表明我们的模型构造良好,对于果蔬脆片的评价体系具有一定的指导性意义,可以科学有效的帮助价格决策者对果蔬脆片进行品质评价。