APP下载

近红外光谱技术在蜂蜜检测中的应用

2020-06-17谢有超彭黔荣付阳洋

食品工业科技 2020年12期
关键词:校正蜂蜜预处理

谢有超,彭黔荣,2,*,杨 敏,张 荣,付阳洋

(1.贵州大学化学与化工学院,贵州贵阳 550025;2.贵州中烟工业有限责任公司技术中心,贵州贵阳 550009;3.贵州大学药学院,贵州贵阳 550025)

我国是世界上最早养蜂的国家之一,目前,蜂群总数已达到920万群,占世界蜂群总数的13%。由于蜂群种类和数量的纷繁复杂,我国既是蜂产品生产大国,也是出口大国,2018 年我国蜂蜜行业产量约54.25万吨,天然蜂蜜的出口量到达了10万吨[1]。蜂蜜是指蜜蜂从花朵中采集花蜜并储藏在蜂巢中的浓稠、甜味、似糖浆的物质,主要由碳水化合物(75%~80%)、水(15%~18%)、蛋白质(0.29%~1.69%)、有机酸(0.1%~1%)和矿物质(0.03%~0.9%)组成[2]。它是一味营养丰富、药食同源的食品,共有180多种营养成分,老年人和婴儿都能食用,具有补脾胃、润肠、润肺和解毒等功效。蜂蜜中含有的超氧化物歧化酶(SOD)是一种氧自由基清除剂,具有延缓衰老的功能[3]。此外,蜂蜜可作为辅助药物用于临床,能够起到防癌以及抗癌的良好功效[4-5]。

蜂蜜中由于具有复杂多样的化学成分,传统的检测方法如高效液相色谱法、高效液相色谱/质谱法、气相色谱法、气相色谱/质谱法等通过化学分析化学手段得出被测成分含量,是对蜂蜜内部品质检测及掺假判别检测的国际标准方法[6-7]。虽然这些方法敏感性较高,但设备成本高、检测手段单一、操作过程复杂,对样本有破坏,已难以满足生产实践中对蜂蜜品质及掺假鉴别的大批量、快速、无损的检测需求。近红外(NIR)光谱技术以其具有快速、高效、环境友好等特点,在石油化工[8-9]、制药[10-11]、烟草[12-13]等行业都扮演着重要作用。NIR分析手段也被广泛应用于蜂蜜中的果糖、葡萄糖、蔗糖、麦芽糖、水分以及微量成分的检测、分析鉴别蜂蜜掺假、植物花蜜来源和产地鉴别。本文基于近红外光谱技术在蜂蜜检测的应用现状,综述了化学计量学解析近红外光谱对蜂蜜定量和定性分析的研究成果,对近红外光谱技术在蜂蜜检测中存在的问题进行总结,并进一步对蜂蜜检测方法提出展望。

1 蜂蜜成分定量分析模型

近红外光谱技术作为一种较为成熟的光谱技术,可实现对蜂蜜中糖类、水分、羟甲基糠醛等理化指标的快速检测。定量模型的选择直接影响着对蜂蜜中成分含量的预测能力,可分为线性和非线性校正方法。偏最小二乘法(PLS)作为一种线性回归的多元校正方法,当各变量内部高度相关时,通过对检测样品的光谱阵X和浓度阵Y同时进行分解,并在分解时考虑X和Y两者间的相互关系,加强对应计算关系,保证最佳校正模型的建立[14]。PLS是多元线性回归、典型相关分析和主成分分析的完美结合,是所有多元校正方法里变量约束最少的方法,这种灵活性使之用于当样本数据远小于变量数时,也能得到最佳的回归系数,在光谱多元校正分析中得到了最为广泛的应用。

1.1 蜂蜜中糖类成分分析模型

蜂蜜之所以被认为是高价值的食品,是因为其碳水化合物(主要是葡萄糖和果糖)为生物体提供即时能量,蜂蜜中果糖和葡萄糖的含量及比例对蜂蜜的结晶状态和营养效能也有较大影响[15]。当前针对糖类的检测手段如液相色谱法存在着分析成本高、环境不友好、检测技术水平低等弊端,无法实现快速和实时检测。蜂蜜中果糖、葡萄糖、蔗糖和麦芽糖等糖类成分均有-CH2、C-O、O-H等基团,在近红外区均有特征吸收峰[16]。因此,采用近红外光谱技术可以实现对蜂蜜中的糖类成分的检测。

在目前的研究中,糖类成分的定量分析大多采用PLS校正模型,极少采用非线性定量模型如人工神经网络(ANN)对蜂蜜中的糖类成分进行预测。大部分的研究在于如何采用不同的预处理方法和特征变量选择提高PLS模型对蜂蜜中糖类含量的预测能力,通过模型建立和验证过程中用到的统计参数,如校正标准偏差(SEC)、预测标准偏差(SEP)、决定系数(R2)或相关系数(R)等对PLS校正模型进行评价。

邱琳等[17]以多批次不同产地、不同品种的原蜜、炼蜜及商品蜂蜜样本为研究对象,以液相色谱-示差折光法分别测定蜂蜜中果糖、葡萄糖和还原糖的化学值为参考值,用PLS分别建立三种糖类的近红外光谱与化学值的定量分析模型,以标准正态变量变换(SNV)、多元散射校正(MSC)、SNV作为预处理方法和以留一内部交互验证法确定最佳因子数所建的回归模型的R分别为0.97390、0.92794、0.95268,SEP分别为0.647%、1.300%、1.270%。蜂蜜中糖类含量的预测结果均较好,表明应用近红外光谱技术可用于对蜂蜜糖类成分进行定量检测。

丁家欣等[18]用高效液相色谱-蒸发光散射检测器(HPLC-ELSD),测定了国内不同地区蜂蜜样本中的葡萄糖和果糖,并将其测定的化学值作为建模的参考值。再用近红外透射光谱法采集光谱,为解析复杂和重叠的光谱信息,采用一阶导数和数据中心化对光谱进行预处理。以交互验证法优化葡萄糖和果糖分析模型的最佳因子数,建立蜂蜜光谱与葡萄糖和果糖的PLS模型,校正模型的R值分别为0.918、0.954,RMSEP为1.610、1.879。相比于HPLC-ELSD法测定蜂蜜中糖类含量,极大地减少了分析步骤和时间,为快速测定蜂蜜中葡萄糖和果糖提供了检测方法。

蜂蜜中糖类成分的检测可通过PLS建立线性的校正模型,在实际工作中,光谱变量与浓度之间具有一定的非线性。为了比较线性和非线性分析模型对于蜂蜜中糖类含量的测定能力,Özbalci等[19]采集了不同品牌的蜂蜜样品光谱,分别以PLS和人工神经网络(ANN)建立对葡萄糖、果糖、蔗糖和麦芽糖含量的预测模型,发现以PLS建立的分析模型R值为0.964、0.965、0.968、0.949,而在930种不同拓扑结构中选择出的四种最佳ANN模型的R值为0.965、0.965、0.978、0.956,这表明出两种分析模型都能快速准确测定蜂蜜中的糖类成分,并且由两种化学计量学所建立的回归模型得出的结果差异性不大,为检测蜂蜜含量提供了不同研究思路。

在对不同蜂蜜糖类的预测中,PLS模型的R值都能达到90%以上,表明近红外光谱技术采用PLS模型的预测值与传统化学分析手段的参考值相关性极高,可使用近红外光谱技术逐渐替代传统的分析方法实现对蜂蜜糖类的快速检测。非线性校正模型ANN和线性校正模型PLS的R值十分接近,但在模型建立的过程中,非校正模型的认知难度要大于PLS。因此,在对蜂蜜糖类成分进行快速、高效检测时,首先考虑建立PLS线性校正模型。

1.2 蜂蜜中水分含量分析模型

水是蜂蜜中的第二大成分,被认为是蜂蜜最重要的特征之一,其含量的多少会影响蜂蜜的理化性质,如粘度、比重量、风味和结晶[20]。水分含量高的蜂蜜在高温下容易发酵,引起变质。蜂蜜中水分含量的高低受多种因素影响,如蜜源的种类、温度和湿度、酿蜜时间的长短和养蜂人员的技术等[21]。目前,对蜂蜜中水分含量的测定方法常采用折光法,但其对检测环境和检测样本的均匀性要求较高,因此,近红外光谱法作为一种简单快速的分析手段被逐渐用于蜂蜜水分的检测之中。

水在近红外谱区有一些特定的吸收谱段区,研究者大多从特征波长的选择方法进行研究,通过对蜂蜜样本近红外光谱图的特征波段进行优化选取建立最佳的PLS校正模型,从而不断提高蜂蜜中对水含量的预测能力。

Li等[22]采用SN/T 0852-2000进出口蜂蜜检验方法对市售蜂蜜样品的水分含量进行测定,作为模型参考值。为尽可能地包含样品特征信息,降低噪音干扰,在对样品进行近红外采集光谱后,采用一阶导数+MSC+Savitzky Golay(SG)滤波平滑的方式对光谱进行预处理。通过特征吸收峰位置确定波长范围并建立水分的PLS定量分析模型。对校正模型进行准确性考察后得到其校正集的相关系数为0.9990,校正集的均方差(RMSEC)为0.174,实测值与模型预测值的相对偏差在±5%以内,证明了运用近红外技术检测蜂蜜水分的可能性。

为提取最有效的光谱信息,减少建模所用的变量数,提高模型对蜂蜜中水分的预测精度,屠振华等[23]在模型建立过程中利用了不同特征波长选择办法,以相对标准偏差(RSD)评价模型性能。结果发现,以反复遗传算法选择作为一种全局性的特征波长选取方法,不仅有效使建模所用的变量数减少了95%,同时也提高了模型的预测精度和稳定性,水分模型的相关系数也由未经变量选择的 0.9758 提高到了 0.9833,校正相对标准偏差(RSDC)和预测相对标准偏差(RSDP)分别由2.06%、2.34%下降到1.71%、2.04%。

不同光谱波段和不同预处理方法的选择会直接影响所建近红外光谱模型对蜂蜜水分的预测能力,刘晨[24]对77组蜂蜜样本通过近红外采集光谱,并通过由特征吸收和无特征吸收的六个波段建立模型。在六个不同波段之中分别以基线校正、消除常数偏移量、归一化和一阶导数四种不同光谱预处理方法校正模型,以相关系数和验证校正标准差(RMSECV)评价模型性能。结果表明,在4850~5120 cm-1波段中,R可以达到99.42%,RMSECV为1.01,采用的不同预处理方法结合PLS对水分的预测准确率都可以达到94%以上,这为快速建立蜂蜜水分分析模型的波段区间选择提供了参考。

特征选择作为近红外光谱分析中不可缺失的一个环节,其波长或波段的选择能显著影响PLS校正模型对于蜂蜜中水分含量的预测。特征变量提取的方法繁多,使用不同的方法可能会得到不同或差异较大的预测结果,因此,针对不同的蜂蜜样本,除了通过水的特征吸收峰确定校正谱段外,还应比较不同特征选择方法对模型的影响,从而建立对蜂蜜水分含量预测效果最佳的PLS模型。

1.3 蜂蜜中羟甲基糠醛定量分析模型

羟甲基糠醛(HMF)是衡量蜂蜜质量的一个重要指标,它几乎不存在于新鲜纯正的蜂蜜中,因此可以反映蜂蜜新鲜程度及加工处理条件的优劣。它是由糖的降解形成的,主要来自果糖,果糖在热稳定性上比蔗糖和葡萄糖差,在酸性条件下就会部分脱水生成羟甲基糠醛[25]。在过去的几十年里,美国国家环境健康科学研究所致力对HMF进行研究,以便获得与之相关的毒性信息,一些研究人员已证实了HMF具有致癌能力[26]。最近的研究也表明HMF的代谢产物也可能是致癌化合物,危害人体健康[27-28]。

蜂蜜中的HMF一般用高效液相色谱法进行测定,其前处理繁琐、检测时间长,不利于实时检测。HMF对人体有害,消费者们希望能快速方便地检测出其在蜂蜜中的含量,保证蜂蜜的品质。近红外光谱技术中的PLS校正模型由于在多元分析中能实现对小样本光谱数据的分析,研究者常通过对模型预处理方法和潜变量数进行优化得到最佳的回归模型,由显著性检验等方法判断近红外光谱法与传统分析手段有无差异。

郑连姬等[29]利用高效液相色谱测定97个蜂蜜样品HMF的化学值,并采用透反射方式采集样品光谱。为了提高校正模型的预测能力,通过Norris求导法(Norris derivative)和一阶导数及10个因子数对光谱进行预处理,建立了蜂蜜中羟甲基糠醛的近红外光谱与化学值间的校正模型,PLS模型的校正决定系数、交叉验证系数分别达到0.99874、0.99620,RMSEP为2.02,RMSECV为2.40。与传统高效液相色谱法所得的化学值进行t显著性检验,得出P>0.05,表示两种方法检测结果无显著性差异,证实了近红外光谱技术可用于对蜂蜜中HMF含量进行测定。

在蜂蜜精制过程中可能会产生影响人体健康的5-羟甲基糠醛(5-HMF),Li等[22]对同仁堂收集的蜂蜜样本通过近红外光谱技术建立PLS模型,采用一阶导数+SG平滑+MSC的光谱预处理方法,以预测残差平方和(PRESS)为判据选择潜变量因子数14建立校正模型,其模型很好地预测了不同精炼温度和精炼时间的蜂蜜样本,R到达了0.9963,RSEVC为0.7857,比率性能偏差(RPD)为11.3862,远大于RPD要求值3,这表明过程分析中使用的近红外光谱等技术可应用于蜂蜜的精制过程中5-HMF含量变化的定量测定。

为了快速测定意大利蜂蜜中5-HMF的含量,Apriceno等[30]将研究重点放在用近红外光谱技术对不同植物来源的5-HMF进行预测,采用高效液相色谱法获得41份不同产地蜂蜜样品的HMF,作为参考值。利用化学计量学对近红外数据进行特征提取,通过对光谱区域、回归模型、散射和导数校正的深入研究,结果得出偏最小二乘回归比主成分回归预测能力更强,以4252~4848 cm-1光谱区域结合光谱散射预处理所建立的分析模型的预测的相关系数为0.98,RPD为3.3,建立了鲁棒性良好的校正模型,证明了基于NIR-化学计量学的方法是一种强有力的工具,可用于蜂蜜等复杂食品基质的质量控制,判断蜂蜜的新鲜程度。

HMF的PLS模型的预处理方法和潜变量数经优化选择后,其R能达到95%以上,经t显著性检验和RSD值可以得出近红外光谱法与高效液相色谱法并无显著差异,可用于对HMF的测定,并且预测效果极佳。因此,近红外光谱法作为检测HMF的一种新颖手段,可逐渐替代操作繁琐的传统化学分析方法,实现对蜂蜜中HMF地快速、高效检测。

1.4 蜂蜜中微量成分含量分析模型

蜂蜜中微量物质往往和蜂蜜的抗菌、抗肿瘤、抗氧化、抗炎等生物学功能相关[31]。其含量在蜂蜜中较少,由于常规检测要求仪器性能好,检测方法合理,业务人员水平高,不确定因素过多往往会导致对蜂蜜中微量成分的检测不精确。而近红外光谱法采用透射原理,无需对样品进行任何的预处理过程,建立良好的校正模型就能对微量成分的含量进行快速预测。

pH是描述氢离子活度的参数,可作为区分花蜜和甘露蜜以及判断单花蜜是否真实的一个重要参数,而蜂蜜总酸度反映了蜂蜜中酸性物质含量的高低,是衡量蜂蜜是否发酵的重要参数,也是区分花蜜和甘露蜜的一个重要参考指标[32]。李水芳[33]对来自全国不同地区的15 种蜂蜜样本测得的pH和总酸度与样品近红外光谱进行分析。基于欧式距离的K-S方法把样本集划分为校正集和验证集,并利用蒙特卡洛方法剔除奇异值,再经竞争性自适应重加权采样(CARS)变量选择法结合PLS回归进行变量筛选来提高模型的稳健性,优化后pH和总酸度PLS模型的预测能力明显提高,R可以分别达到0.9058、0.9083,RMSEP分别为0.1196、0.4674。

酚类物质是蜂蜜外观和功能特性的重要组成部分,被认为具有很高治疗价值,而蜂蜜中矿物质(特别是铜和铁)的存在可能导致高活性羟基自由基的产生[34-35]。另一方面,水溶性维生素,特别是维生素C(抗坏血酸)的抗氧化特性,有助于提高机体免疫力[36]。Escuredo等[37]首次运用近红外光谱技术对蜂蜜中的抗氧化剂化合物进行预测,以伊比利亚半岛西北部的60个蜂蜜样本建立起酚类、类黄酮、铜和维生素C的分析模型,通过留一内部交互验证法选择最佳因子数避免过度拟合,分别采用不同的光谱的预处理方法建立四者的PLS模型,以RMSEV值和RPD量化模型性能。研究表明,所建模型对酚类和类黄酮总值具有较高的预测能力(RPD>3)。

为了进一步提高抗氧化活性以及酚类物质模型的预测能力,Haroon[38]基于近红外光谱技术对蜂蜜成分进行研究,对6 种不同的品种蜂蜜样品采用不同的预处理方法进行PLS分析,首次实现了对类胡萝卜素含量以及三价铁离子进行快速检测,其建立的五个定量模型对蜂蜜的总酚含量、总黄铜含量、总类胡萝卜素含量、三价铁离子和 1,1-二苯基-2-三硝基苯肼相关系数达到了0.95~0.96,RPD为3.45~3.89,所建立的校正模型能很好地量化蜂蜜的抗氧化性成分。

酶活性是评估蜂蜜质量的基础,Huang等[39]为了研究温度效应对淀粉酶活性的动力学机制,对来自不同植物来源的蜂蜜样本基于可见光和近红外(Vis/NIR)光谱分析,应用PLS和最小二乘支持向量机(LS-SVM)算法来建立Vis/NIR光谱与淀粉酶活性之间的定量关系。结果发现,通过高斯滤波平滑-标准正态变量(GF-SNV)预处理并结合连续投影算法(SPA)选择特征波长建立LS-SVM模型(GF-SNV-LS-SVM)比PLS更能快速测定蜂蜜的淀粉酶活性,在校正集和预测集中都有更高的决定系数,R2可以达到0.8872。因此,证实采用Vis/NIR光谱技术结合化学计量学可快速,无损地测定蜂蜜的淀粉酶活性。

PLS模型因其突出的优势,结合化学计量学方法被逐渐用于蜂蜜微量成分的检测之中。通过RPD值验证了近红外光谱技术的预测值和传统的分析化学、仪器化学手段对蜂蜜检测的化学值并无显著差异。非线性校正方法如(SVM)也可用于蜂蜜检测之中,在预测能力上看,可能比PLS方法的效果更好。因此,在进行系统地检测蜂蜜的成分时,不仅仅应考虑线性校正方法,对非线性校正手段如ANN和SVM都应进行模型建立的考虑,从而针对不同的蜂蜜样本成分含量的检测选择出最佳的定量分析模型。

2 蜂蜜鉴别定性分析模型

2.1 蜂蜜掺假鉴别分析模型

蜂蜜作为一种天然食品,其营养价值愈来愈受到人们的关注,然而不少不法商人受利益驱动,使蜂蜜掺假成为继橄榄油[40-41]和牛奶[42-43]之后,最有可能成为掺假的目标食品,蔗糖、果糖、葡萄糖、麦芽糖及高果糖浆等都是蜂蜜中最为常见的掺假物。蜂蜜掺假不仅极大损害了消费者利益,给消费者带来健康问题,同时也导致食品信任问题,影响了我国蜂蜜出口,因此,蜂蜜掺假问题越来越受到众多学者的关注。蜂蜜掺假鉴定技术随着掺假手段的发展也不断在发展,现代分析手段对蜂蜜掺假问题进行研究,为定性分析蜂蜜掺假的研究方向提供了思路。蜂蜜的鉴别掺假技术及特点如表1。

当前现有的蜂蜜掺假鉴别方法各具优缺点,近红外光谱技术因其具有快速无损鉴别的优势,一直是鉴定蜂蜜掺假问题的研究重点和热点,所涉及到的模式识别工具如无监督的聚类模型和有监督的分类模型从不同的角度对蜂蜜进行掺假鉴别。不同掺假类别的蜂蜜采用不同的定性分析模型的鉴别能力有所差异,研究者往往根据原理不同的算法建立多种分类器,比较得出合适特定蜂蜜样本的最佳分析模型。

麦芽糖浆(MS)是蜂蜜最常见掺杂的甜味剂,Li等[49]首次运用近红外光谱法鉴别掺杂MS蜂蜜,并比较不同掺杂程度的MS和高果糖玉米糖浆(HFCS)蜂蜜在最小二乘线性判别(PLS-LDA)模型中的鉴别能力。在PLS-LDA模型的优化过程中,CARS用来选择关键变量可以提高模型的预测精度,相比于未对波段进行特征选取的PLS-LDA模型,CARS-PLS-LDA方法对HFCS掺假蜂蜜和MS掺假蜂蜜的判断准确度可以达到86.3%和96.1%。

Ferreiro等[50]对西班牙的33 种不同花蜜来源的蜂蜜运用可见-近红外光谱与化学计量学相结合的方法快速鉴别蜂蜜掺假,通过不同的无监督和有监督学习方式对掺假蜂蜜进行区分。结果发现无监督学习方式、层次聚类法(HCA)和主成分分析(PCA)可以显示出不同程度蜂蜜掺假的空间分布,但是不能实现完全的区分。而通过有监督学习方式,LDA可以实现九种掺假水平(在10%~90%范围内)之间的完全区分,所建立的PLS回归模型得到了高相关系数,对于掺杂程度低于45%的蜂蜜,外部预测模型中的最大误差低于1%。

Guelpa等[51]将近红外光谱与化学计量学相结合,对南非蜂蜜、故意掺入糖溶液(葡萄糖和果糖)蜂蜜以及廉价进口蜂蜜进行鉴别。采用台式实验室仪器、小型手持便捷式以及移动模块化三种不同的近红外设备采集样品光谱,通过K-S算法改进后的duplexs算法将样本集划分为训练集和测试集。在不同的仪器设备上采集的光谱采用不同的光谱预处理方法建立PLS-DA判别模型,以交互验证和测试集的正确分类率来比较在不同仪器上所建立模型的性能。研究表明,采用有监督的PLS-DA在三种不同仪器上对掺假蜂蜜的总体分类精度都能达到93.3%以上。

PLS-LDA在蜂蜜掺假鉴别中应用十分广泛,作为一种有监督的分析模型,对掺假蜂蜜的鉴别精度都能达到90%以上,且通过对波段进行特征选择,其判断准确度能得到极大的提升。HCA作为无监督聚类分析中应用最为广泛的方法,因为没有数据的存在,其鉴别能力要低于PLS-LDA,甚至不能实现掺杂物类型的完全区分。因此,在对蜂蜜掺假进行检测时,尽量建立有“学习”样本的有监督的定性分析模型,并通过不同的分类算法比较得出最佳分类器,实现对掺假物的区分。

2.2 蜂蜜蜜源鉴别分析模型

蜂蜜是一种天然产品,蜜蜂从植物中采集花蜜,并储存在蜂巢中作为食物食用。蜂蜜的成分和性质取决于蜜蜂在其生产过程中捕获的花蜜的植物来源。而传统对于蜜源鉴定的方法一般都存在着需对样品进行破坏性处理,分析费时、操作复杂,同时分析过程中会用到强酸或强腐蚀性等有害试剂,影响检测人员的安全和健康[53]。因此,有必要探索一种新的快速、廉价、安全的测定蜂蜜蜜源的方法。

近红外光谱对蜜源的鉴别大多采用有监督的模式识别方法,如反向传播人工神经网络(BP-ANN)、偏最小二乘判别分析(PLS-DA)和SVM等。分类模型的算法原理不同,其正确判别率往往有所差异。鉴别分析人员不能通过蜂蜜光谱数据直接确定定性分析模型,往往需要建立不同分类器,比较得出分类正确率最高的模型。

为了实现快速无损识别蜂蜜蜜源,Chen等[54]使用带光纤探针的近红外仪器对洋槐蜜、椴树蜜、油菜蜜、荆花蜜和枣花蜜5种国产蜂蜜进行分类。分别采用一阶导数,SG平滑和二阶导数对光谱进行预处理,以基于主成分分析的马氏距离判别分析法(MD-DA)和反向传播人工神经网络(BP-ANN)建立分类模型。结果表明,BP-ANN模型比MD-DA具有更好的预测能力,其校准集和验证集的分类正确率均在90%以上。

单一花种蜂蜜往往比混合蜜更具商业价值,Minaei等[55]基于VIS-NIR高光谱成像技术对波兰的五种单一蜜源蜂蜜进行判别,从快速和非破坏角度为蜜源鉴别提供了检测手段。通过PCA对高光谱图像进行降维,以S-G平滑算法对图像去噪,使用径向基(RBF)神经网络、SVM和随机森林(RF)三种不同的机器学习算法预测蜜源。结果表明,RBF不论在预测精度和计算时间方面都优于SVM和RF,可对单一蜜源实现正确分类。

线性判别法和非线性判别法的性能孰优孰劣在化学计量学中一直是讨论的重点。Haroon等[56]基于6种不同蜜源的PCA数据分别建立线性LDA和非线性LS-SVM的判别模型,通过交互验证确定两者模型的最佳主成分个数。在优化过程中,以6个主成分建立的LDA模型和以9个主成分确定LS-SVM模型有最高的识别率,且LDA模型的判别率要高于LS-SVM,训练集和测试集的判别率均为100%。

Gan等[57]对不同植物来源的蜂蜜样品采用四种不同分析手段进行鉴别分析。使用SNV方法对光谱数据进行预处理,建立偏最小二乘判别分析(PLS-DA)模型用于植物来源分类,PCA用于减少数据的维度,剔除异常值,应用支持向量机判别分析(SVM-DA)和区间偏最小二乘(iPLS)分别优化分类器的判别结果。结果发现以电子鼻(EN)、电子舌(ET)、近红外光谱(NIR)和中红外光谱(MIR)四种分析手段建立的模型对校正集和预测集样本的鉴别精度几乎都是100%。

不同的判别模型的鉴别能力有所差异,但有监督的模式识别的正确率往往要优于无监督的模式识别,比如BP-ANN模型就比MD-DA具有更好的预测能力。由于有监督的模式识别的原理不同,孰优孰劣需要根据蜂蜜样本的光谱数据建立模型才能进行比较,但正确分类率都能达到90%。因此,对蜂蜜蜜源的鉴别首先考虑有监督的分类模型,结合光谱数据特点选择正确判别率最高的定性分析模型。

2.3 蜂蜜产地鉴别分析模型

蜂蜜品质与产地关系密切,欧盟规定:蜂蜜标签应标注产地,同一植物来源而产地不同的蜂蜜,价格会有所差异[58]。中国作为蜂蜜的生产和出口大国,日益严峻的商业竞争更要求加大对于蜂蜜产地标签的重视。由于蜂蜜产地的差异主要来自环境因素,这种差异较掺假和蜜源植物的差异小,因此产地判别比掺假和蜜源植物判别更加困难[59]。

近红外光谱技术在中药[60-61]、农产品[62-63]等产地溯源的研究已比较成熟。蜂蜜产地鉴别由于光谱数据差异性小,对其研究较晚,但还是通过化学计量学中的模式识别方法如PLS-LDA对蜂蜜产地进行鉴别研究,并采用不同的预处理方法和特征变量选择提高模型的判别正确率。

李水芳等[64]为实现蜂蜜产地的快速鉴别,对4种不同产地的蜂蜜样品通过近红外光谱结合化学计量学方法对蜂蜜产地进行判别分析。采用基于欧式距离K-S法把样本划分为训练集和预测集,对光谱数据进行一阶导数和归一化预处理,再用小波变换(WT)进行压缩和滤噪。以径向基神经网络(RBFNN)和偏最小二乘-线性判别分析(PLS-LDA)对不同产地的蜂蜜样品建立判别模型。研究表明,WT结合线性的PLS-LDA建模比WT结合非线性的RBFNN建模更适合蜂蜜产地判别,验证集的判别总正确率为90.9%,从而证实近红外光谱技术具有快速判别蜂蜜产地的潜力。

为创建特定的产地光谱指纹,Woodcock等[65]对法国科西嘉岛蜂蜜样品的近红外光谱数据通过一系列化学计量工具进行分析。通过PCA对科西嘉岛和非科西嘉岛的光谱数据进行初步分析,研究各种光谱预处理方法对偏最小二乘法回归模型的判别能力。研究发现,使用交叉验证确定主因子数,变量选择特定波段和二阶导数数据预处理开发的最佳PLS判别模型对科西嘉和非科西嘉蜂蜜样品正确分类结果分别是90.0%和90.3%,为科西嘉岛蜂蜜创建了特定光谱指纹。

Herrero等[66]为了开发单一,快速的判别模型,对15个是来自加利西亚受保护地理标志(PGI)的蜂蜜和15个非PGI标签蜂蜜的近红外光谱数据进行SNV预处理以消除基线漂移后,分别采用PLS-DA、簇类的独立软模式法(SIMCA)、K最邻近法(KNN)和多层前馈神经网络(MLF-NN)建立分类模型,从敏感性和特异性来评价模型用于判别分析的能力。结果显示,NIR信息数据与SIMCA算法的组合开发的模型,其特异性较高而敏感性较低,可以用于鉴别真正的PGI蜂蜜。

目前,采用近红外光谱技术对蜂蜜产地鉴别的研究不多,大部分建立的分析模型是PLS-LDA,通过不同预处理方法和变量选择方法提高PLS-LDA模型的判别能力,分析模型较为单一。因此,需结合蜂蜜光谱数据开发多种分类模型,拓展近红外光谱技术对蜂蜜产地的鉴别检测,从而深化对蜂蜜全面、系统地研究。

3 总结与展望

近年来,随着现代仪器分析技术的不断进步,近红外光谱技术在很多传统行业的检测方面方兴未艾。作为一种新型的分析手段,凭借其快速、准确、无损以及环境友好等优势,在蜂蜜成分含量测定、真伪掺假鉴别、蜂蜜蜜源鉴别和产地鉴别都已取得了很大的进展。但是,应用近红外光谱技术结合化学计量学对蜂蜜进行检测还存在一些问题:

a.在蜂蜜成分的定量分析中,采用的最多是PLS建立的线性回归模型来预测成分含量,而对于非线性模型的研究较少,如决策树回归、人工神经网络和KNN回归方法。此外,由于蜂蜜在不同地区,不同季节的成分含量差异较大,所建立的预测模型往往鲁棒性能差。

b.对于蜂蜜掺杂物的研究,目前的近红外光谱技术还无法做到对所有的掺杂物进行检测,随着蜂蜜需求量的增加,蜂蜜直接或间接掺入糖和劣质蜂蜜的问题会日益凸显,迄今为止也没有一种用于蜂蜜掺杂物测定的便捷式设备。

c.对蜂蜜的地理和植物来源的判别分析上,它涉及到多因素问题,往往需要多位经验丰富的专家才能实现对蜜源和产地的判别,因此在模型的建立上,前期成本比较高昂。

未来,对蜂蜜的检测会越来越朝着快速无损的分析技术方向进行,近红外光谱技术作为其中的佼佼者,也不会依循单一的分析手段,会结合多变量数据分析和机器学习方法,深度挖掘数据背后的含义,开发多类预测模型,扩展其在蜂蜜检测中的应用。另外,便捷式设备也将逐渐开发并应用到用到蜂蜜检测的各个方面之中,而不再局限在分析实验室中,更能保障食品安全,提升人们对蜂蜜食品安全的信心。

猜你喜欢

校正蜂蜜预处理
求解奇异线性系统的右预处理MINRES 方法
高COD二噻烷生产废水预处理研究
劉光第《南旋記》校正
爱是一捧浓浓的蜂蜜
蜂蜜,你真的了解吗
“蜂蜜”CP
基于MR衰减校正出现的PET/MR常见伪影类型
蜂蜜哪里去了
在Lightroom中校正镜头与透视畸变
基于预处理MUSIC算法的分布式阵列DOA估计