一种基于近红外光谱快速鉴别染色橙的新方法
2019-01-26桂家祥杨文侠邹俊丞王志飞
乔 宁,刘 韬,* ,饶 敏,桂家祥,杨文侠,邹俊丞,王志飞
(1.江西省检验检疫科学技术研究院,江西南昌330000;2.赣州出入境检验检疫局,江西赣州341000;3.赣南师范大学脐橙学院,江西赣州341000;4.国家脐橙工程技术研究中心,江西赣州341000)
近红外光谱(波长770~2500 nm)包含分子震动的倍频、合频光谱信息,信息量丰富,可实现复杂样品的快速无损检测[1]。无破坏性、速度快、效率高、成本低、测量方便等是近红外光谱分析技术的显著特征,它可选择性地利用样品全波段或某特定波段下的光谱数据实现对物质的定性判别和定量分析,现已经被广泛地应用于石油化工和制药工业等,近年来近红外光谱技术在食品和农产品检测领域的应用也越来越多。目前,国内外很多研究将近红外光谱技术用于区别物质品种,如白菜种子[2]、葡萄酒[3]、芒果[4]、薏仁[5]、蜂胶[6]、瓜果[7]等,也有部分学者将近红外光谱技术应用到产地鉴别领域,如橄榄油[8]、枸杞[9]、橡木屑[10]、奶酪[11]等,但尚没有近红外技术在染色果蔬鉴别方面的研究报道。
苏丹红是一类具有偶氮结构的亲脂性染色剂,包括苏丹Ⅰ、Ⅱ、Ⅲ、Ⅳ四种,我国禁止将其作为食品添加剂使用。近年来,有媒体报道部分不法商贩使用苏丹红对脐橙进行染色,“染色脐橙”的出现,引起消费者的恐慌,给消费者带来安全隐患的同时,也给监管部门带来压力,使脐橙产业受到一定负面影响。国内外在脐橙方面的研究多集中于内在品质指标检测(如总糖、总酸、糖酸比、可溶性固形物等)、农药残留检测及重金属检测[12-14],对脐橙染色剂的检测方面相对较少,现有染色剂检测方法多采用高效液相色谱和质谱分析技术,该方法前处理步骤繁琐,检测成本高,时间长[15-16]。本研究将近红外光谱技术应用到染色橙的鉴别,既快速简便,又无需进行复杂的样品前处理,可以满足市场监管部门快速检测的要求。
1 材料与方法
1.1 材料与仪器
脐橙 从江西省赣州市于都县同一脐橙果园采摘,共200个脐橙样品,完全成熟,直径约80 cm;苏丹Ⅰ、Ⅱ、Ⅲ、Ⅳ染色剂 国药集团化学试剂有限公司;苏丹Ⅰ、Ⅱ、Ⅲ、Ⅳ标准品 德国DR。
Micro NIR 1700近红外光谱仪 美国Viavi公司;Agilent 1260高效液相色谱仪 美国安捷伦公司;光谱数据分析软件 The Unscrambler 9.7。
1.2 实验方法
1.2.1 染色脐橙样品的制备 根据市场调查和走访,确定了一种通用的染色脐橙制备方法,并按此方法分别用苏丹Ⅰ、Ⅱ、Ⅲ、Ⅳ对脐橙进行染色:
用天平准确称取0.250 g(精确到0.001 g)苏丹红试剂,倒入盛有1 kg水的烧杯中,边搅拌边加热直至水温达50℃,将橙子放入烧杯中,浸泡10 s后用夹子取出,自然晾干。
1.2.2 染色剂含量检测 将染色橙去皮后,取可食部位用均质器均质(转速10000 r/min,时间10 min)经前处理后,取1 mL上清液,用液相色谱仪对染色剂含量进行检测。仪器方法如下:柱温:35℃;进样量:15μL;流动相A:纯水;流动相B:乙腈;色谱柱:Agilent C18液相色谱柱,150 mm ×4.6 mm,5 um;梯度洗脱程序如表1所示。紫外检测器:苏丹Ⅰ、Ⅱ:478 nm;苏丹Ⅲ、Ⅳ:520 nm。
表1 梯度洗脱程序Table 1 Gradient elution procedure
经检测,苏丹Ⅰ、Ⅱ、Ⅲ、Ⅳ四种染色橙均未检出染色剂残留。
1.2.3 样品光谱采集 实验使用美国Viavi公司的MICRO NIR 1700光谱仪,采样间隔为29 ms,测定范围900~1700 nm,扫描次数100次。采集样品光谱时,检测探头与待测脐橙果实表面垂直,距离脐橙果实表面5 mm。实验共采集五类脐橙样品光谱,分别为未染色脐橙、经苏丹Ⅰ染色脐橙、经苏丹Ⅱ染色脐橙、经苏丹Ⅲ染色脐橙、经苏丹Ⅳ染色脐橙,各取40个,共计200个样品,从每个脐橙赤道部(脐橙最大横向直径处)选择3个相距约120°的点测定果面反射光谱,将平均值作为该果实的一个光谱数据,从果实肩部选取3个相距约120°的点测定果面反射光谱,将平均值作为该果实的一个光谱数据,以上两个光谱数据为一组,重复测定五组。此方法采用平均光谱数据更具有代表性,所建预测模型的精度更高。
1.2.4 光谱数据处理与分析 采用The Unscrambler 9.7软件对2000个样品数据进行分组,其中90%用于建立近红外模型,为校正集;10%为预测集,用于检验所建模型的预测效果。为保证采集样品光谱信息的真实性,本文采用移动平均数(Moving Average)、中值滤波(Median Filter)、S-G 平滑(SGolay)等滤波方法和标准化(Normalize)、多元散射校正(Multiplicative scatter correction,MSC)等散射校正方法对光谱数据进行了预处理。滤波方法,可除去来自随机噪声、不均匀性、基线漂移、谱峰叠加、光散射等影响,而散射校正方法可降低样品状态、采集条件、仪器条件、操作条件和环境等特征的影响[1]。主成分分析(Principal component Analysis,PCA)可以对数据进行降维,使原始光谱数据通过线性组合等方式生成一组新指标,新指标数目较少,且能够反映原始光谱的绝大数信息。本文采用主成分分析(PCA)来实现染色橙的快速鉴别,利用鉴别准确率评价模型的预测性能。采用主成分分析与偏最小二乘(Partial least squares,PLS)相结合的方法建立染色橙鉴别回归模型,利用均方根校准误差(RMSEC)和决定系数(R2)评价模型性能。
2 结果与分析
2.1 染色橙样品的近红外漫反射光谱
五类脐橙的典型近红外光谱曲线如图1所示。图中横坐标为波长,范围是900~1700 nm,纵坐标为光谱漫反射率。从图中可以看出,不同类别染色橙的光谱曲线有明显区别,这些差异表明不同种类染色橙具有各自的特征和指纹,为是否染色及染色品种的鉴别奠定了基础。
图1 五类脐橙样品的近红外光谱曲线Fig.1 Near infrared reflectance spectra of the five different types of navel oranges
2.2 不同预处理方式对分类效果的影响
在建模过程中,分别采用移动平均数(Moving Average)、中值滤波(Median Filter)、S-G 平滑(SGolay)、标准化(Normalize)、多元散射校正(Multiplicative scatter correction,MSC)等方式对光谱数据进行了处理。不同处理方式的主成分得分图如图2所示,图中横坐标为样本的第一主成分得分值,纵坐标为每个的第二主成分得分值。由图2中可以看出,采用移动平均数、中值滤波、S-G平滑、标准化等数据处理方式所建模型的分类效果不明显,未染色脐橙、经苏丹Ⅰ染色脐橙、经苏丹Ⅱ染色脐橙、经苏丹Ⅲ染色脐橙、经苏丹Ⅳ染色脐橙这五类脐橙重叠在一起。因此本研究中先采用移动平均数(Moving Average)滤除各种因素产生的高频噪音,再进行多元散射校正(MSC),数据通过该处理后能较好的聚类,五种不同类别的脐橙被明显的分成五个区域,前两个主成分的累计贡献率约为99%,说明主成分一和二对染色橙有很好的聚类作用,如图2所示。图2中,五种类别脐橙分别分布在五个平行的聚类块中,呈条状聚类,经苏丹Ⅰ染色脐橙、经苏丹Ⅱ染色脐橙、经苏丹Ⅲ染色脐橙、经苏丹Ⅳ染色脐橙这四类染色橙被明显分成四类,这四类染色橙的聚合度很好,但经苏丹Ⅰ染色脐橙和未染色脐橙的分界线不如前面几种清晰,可能原因在于前两个主成分还不能很好的区分,需要其他成分协助分析。
图2 不同预处理方式对建模效果的影响Fig.2 Effects of different pretreatments on modeling results注:U:未染色脐橙;S1:经苏丹Ⅰ染色脐橙;S2:经苏丹Ⅱ染色脐橙;S3:经苏丹Ⅲ染色脐橙;S4:经苏丹Ⅳ染色脐橙。
2.3 主成分分析对染色橙快速鉴别
本文采用主成分分析对五类脐橙样品共计1800个样本进行主成分分析聚类。分析表明前两个主成分的累计贡献率达98.587%,对染色橙样品有很好的聚类作用,能定性区分不同染色剂染色橙以及是否染色。样品光谱从900~1700 nm共有125个点,采用这些点进行计算时计算量大,通过主成分分析,选取对于染色橙类别敏感的主成分建立染色橙鉴别模型,可提高计算速度和分类准确度。图3所示为前10个主成分对原始变量的解释程度。横坐标为主成分数量,PC1代表第一个主成分,PC2代表前两个主成分,以此类推。纵坐标表示主成分的解释方差,即主成分对原始光谱信息的解释程度。由图3可知,前5个主成分的累计贡献率为99.87%,前6个主成分的累计贡献率为99.91%,主成分数过多计算量过大,主成分数过少影响鉴别效果,因此确定主成分个数为6,能够解释原始波长变量信息的99.91%,可代表原来125个变量。说明主成分分析降维效果显著,它把原来的125个波长变量信息压缩成了新变量,这6个新变量能够代表原始光谱99.919%的信息,且彼此互不影响。
图3 主成分解释程度Fig.3 Accumulative reliabilities plot of the first 10 principal components calculated from the spetra of PCA model
五类脐橙快速鉴别模型的建模参数及效果如表2 所示,S0、S1、S2、S3、S4 五个模型的模型识别率依次为:95%、90%、100%、90%、95%,总模型识别率达到了94%。由此可见,采用主成分分析法建立染色橙快速鉴别模型是可行的。
表2 PCA模型的建模效果Table 2 The results of PCA models
2.4 PLS回归模型的建立及预测
在主成分分析的基础上,建立了PLS染色橙鉴别模型。图4为校正集、预测集样品分类变量预测值和真实值间的回归图,从图可以看出,回归模型能够将五类脐橙样品区分开,模型对未染色脐橙、经苏丹Ⅰ染色脐橙、经苏丹Ⅱ染色脐橙、经苏丹Ⅲ染色脐橙、经苏丹Ⅳ染色脐橙五类脐橙样本的预测值分别在其真实值1、2、3、4、5附近。模型的均方根校准误差(RMSEC)为0.26,决定系数 R2为0.96,模型效果较好。表明主成分分析与PLS相结合建立染色橙鉴别模型是可行的。
图4 五类样品PLS预测值与真实值回归图Fig.4 Relationship between true and predicted category
3 结论
本文采用移动平均数与多元散射校正相结合的方法对光谱数据进行处理,利用主成分分析实现了未染色脐橙、经苏丹Ⅰ染色脐橙、经苏丹Ⅱ染色脐橙、经苏丹Ⅲ染色脐橙、经苏丹Ⅳ染色脐橙五类脐橙快速鉴别,模型识别率为94%。并结合主成分分析和偏最小二乘建立回归模型,相关系数R2为0.96,模型效果较好。结果表明,近红外分析技术应用于染色橙的快速鉴别是可行的,而且检测效率和准确率较高,在染色橙快速鉴别方面有很大的应用前景,为染色橙市场监管提供一种快速的检测手段。
利用近红外法鉴别染色橙在国内外的研究较少,处于初步摸索阶段。为提高模型的适用性和稳健性,在后续研究中需采集大量染色橙样本,增加样本品种和数量,为我国染色橙快速鉴别提供一种高效低成本快速的新手段。