APP下载

应用光谱分析无损测定茄子果皮花青素含量方法

2021-07-24张东方范晓飞陈雪平申书兴

河北农业大学学报 2021年3期
关键词:花青素果皮预处理

张东方,张 君,范晓飞,谈 卓,陈雪平,申书兴

(1. 河北农业大学 省部共建华北作物改良与调控国家重点实验室/河北省蔬菜种质创新与利用重点实验室,河北 保定 071000 ;2.河北农业大学 机电工程学院, 河北 保定 071000;3. 河北农业大学 园艺学院, 河北 保定 071000)

关 键 字:茄子果皮;花青素;光谱;数据降维

茄子(S.melongenaL.)属于茄科茄属[1],茄子果色是茄子果实的重要商品性状,表型丰富,可用于育种选择,纯度鉴定等[2-3],茄子果皮含有丰富的花青素[4-5],花青素具有较强的清除人体内自由基的功效,可用于制作保健品和化妆品[6-7],花青素含量和叶绿素含量直接决定茄子的果色[8]。传统测得茄子果皮花青素含量的方法有分光光度计法[9]、高效液相色谱法[10]等,这些方法的测量需要破坏茄子表皮,需要大量人工和试剂,无法即时、大量的测量,因此需要一种准确、快速、无损的新型测定方法[11]。

鉴于光谱分析技术在农产品样本测定上无破坏性、实时快速、成本低的优势,已有国内外学者对植物各项生理指标与光谱反射率的关联性的研究。Mark 通过叶绿素理化试验得到苹果叶绿素含量与光谱数据建立叶绿素的回归模型,阐明了光谱扫描苹果后,光谱数据的处理方法[12]。Julio 等通过高光谱扫描葡萄表皮预测花青苷含量,先对葡萄进行高光谱扫描,然后对葡萄果皮进行测量,得到花青苷含量,进行果皮花青苷分类,通过花青苷等级分类,对葡萄进行颜色分类,表明光谱可以对果实颜色进行分类[13]。田明璐等通过使用高光谱扫描苹果叶片花青素含量确定苹果叶片花叶病病害等级,为使用光谱对植物进行病害检测提供了理论依据[14]。刘秀英等使用光谱扫描牡丹叶片,建立牡丹叶片相对花青素含量回归模型,揭示了光谱数据与相对花青素含量之间的关系[15]。王伟东通过高光谱建立小麦花青素相对含量的不同时期预测模型,其在小麦开花期的模型拟合度达到0.9128,表明不同时期的作物光谱模型并不相同[16]。刘旭使用高光谱扫描葡萄果皮建立葡萄果皮花色苷含量多元回归模型,结果表明使用光谱扫描技术,可以对植物花青素含量进行无损检测[17]。但是由于茄子果皮花青素获取困难,理化试验操作难度较高,所以关于茄子花青素与光谱数据的预测模型尚未见报道。本研究尝试利用光谱仪对茄子果皮进行扫描,并将所得光谱数据与通过理化分析所测的茄子表皮花青素含量进行统计学关联分析,从而建立花青素的光谱预测模型。旨在解决传统测量茄子果皮花青素费时费工、成本高昂的问题,探求利用光谱分析技术估测茄子表皮花青素含量的可行性。

1 材料与方法

1.1 试验材料

试验材料为河北农业大学蔬菜育种试验基地的茄子果实,进行花青素含量测定及光谱数据测量。将试材于2019 年7 月1 日播种于穴盘,并进行常规的育苗操作,待到幼苗长至4 ~6 片真叶左右,于8 月6 日定植于河北农业大学蔬菜育种试验基地,之后按常规方法进行田间管理。所使用的试验材料样本如图1 所示。为了获得不同果色的茄子样本,花后5 d 对果实进行套袋处理,以不套袋材料为对照,取套袋11 d 的材料削皮处理。为保障试验的准确性,使用医用级手术刀进行手工削皮;为保证果皮厚度一致,茄子皮厚度为0.15 0±0.01 mm,削下的果皮不能带果肉;为防止花青素降解,取下果皮后,立即放置于液氮中临时保存,整果取完果皮后,使用锡箔纸包住果皮,将锡箔纸放入-80°冰箱保存,之后使用pH 示差法进行花青素含量测定。

图1 茄子样品果色Fig. 1 Color of eggplant samples

1.2 数据的采集与分析

1.2.1 花青素含量测定 采集光谱信息后的样本,逐一进行削皮,将果皮均匀混匀后,取0.1 g 样本浸泡在缓冲液(0.05% HCl 甲醇溶液)中进行低温浸提12 h,离心,取上清液,分别加入0.4 mol/L KCl溶液(使用HCl 调节pH=1.0)和0.4 mol/L 柠檬酸(使用NaH2PO4调节pH=4.5),利用分光光度计测出样品在510、700 nm 波长下的吸光度A。

花青素的总含量(mg/100 g)计算公式:TA=A×Mw× 6 × 100 ×V/s。TA为花青素的总含量,V是最终混合液的体积(mL),A=[A510nm(pH1.0)-A700nm(pH1.0)]-[A510nm(pH4.5)-A700nm(pH4.5)]。s 表示最终混合液摩尔吸收率为26 900,Mw为最终混合液标准分子量449.2。每个样品重复测定3 次。

1.2.2 光谱数据采集与分析 使用便携式地物光谱仪(PSR-1100),其光谱范围为320 ~1 100nm,覆盖紫外—可见—近红外,PSR-1100 测量系统由光谱仪和光纤组成,是被动式测量反射率的光谱仪,包含512 线阵探测器,由固定全息光栅作为色散元件,配有25°光纤探头。为了避免外界的干扰,本设备安装在密封空间内,且在左右两端与光谱仪呈60°的方向装卤素灯(35 W 230 V),如图2 所示。

图2 用于茄子果皮花青素含量测定的光谱扫描系统Fig. 2 Spectral scanning system for determination of anthocyanins in eggplant peel

使用地物光谱仪对茄子样本表皮随机位置扫描4 次,取扫描结果的平均值作为该样本的光谱数据,包含320 ~1 100 nm 共计781 个波段信息,并对光谱数据进行预处理以及降维分析。本文利用卷积平滑滤波法(Savitzky-Golay, SG)和标准正态化(SNV)对原始数据进行预处理,卷积平滑滤波法可以在确保信号形状和宽度不变的情况下滤除噪声[19],SNV 可以消除表面散射和光程变化对近红外光谱产生的误差[20],同时利用主成分分析方法、连续投影算法对光谱数据进行降维处理,以提高模型的准确性和运行速度。

(1)光谱数据的预处理

采用SG 平滑滤波器法对光谱数据进行预处理。SG 平滑法是一种基于多项式和的移动窗口,在时域内利用偏最小二乘法实现最佳拟合的方法[21]。SG平滑既能提高信号的信噪比,又可较好的保持光谱中的有用信息。SNV 标准正态化方法主要用来消除固体颗粒的大小、表面散射以及光程变化对近红外漫反射光谱的影响,其按如下公式进行计算:

采集原始光谱数据后,利用SG 平滑滤波对原始光谱数据进行了预处理,该方法保证了原始光谱信号的形状同时滤除了噪声,使得光谱曲线更为光滑。使用SNV 标准正态化预处理光谱图像,该方法消除了表面散射的影响,该方法可以对样本间具有较大差异的光谱进行校正。对原始光谱通过SG 平滑滤波、SNV 标准正态变化进行预处理,这2 种方法的叠加既可以滤除噪声又可以对光谱进行校正且消除散射的影响。

(2)降维分析

利用主成分分析和连续投影算法进行降维分析。利用这两种降维分析方法可以用最少的变量代替数量众多的原始变量。连续投影算法(SPA)是一种使矢量空间共线性最小化的前向变量选择算法。其原理就是依据波长的长度进行变量筛选[22],即将波段信息通过数学变换在其他波长信息上进行投影,筛选出投影最大的波段信息作为特征波段选取下来。

对于预处理完的光谱数据进行降维处理,使用主成分分析和连续投影算法处理光谱数据,提取其中特征波段,可以使用少量的光谱数据代替预处理后的781 个变量,从而达到数据降维的目的。

(3)预测模型的建立

采取多元线性回归建立茄子花青素的预测模型。多元线性回归主要研究一个因变量与多个自变量之间的相关关系[23],以茄子的花青素含量作为自变量,由于样本量的限制,选取经过降维分析的变量作为自变量,即代表综合标量的主成分PCi或者特征波段变量Xi。最终的预测模型由R²和RMSE 对其进行评判。

2 结果与分析

2.1 花青素数据

使用PH 示差法测得茄子果皮花青素含量数据如表1 所示,套袋处理后的茄子表面颜色变浅,花青素含量较低。

表1 茄子表皮花青素含量Table 1 Contents of anthocyanins in eggplant epidermis

2.2 光谱数据预处理

本试验采用SG 卷积平滑、SNV 标准正态化、SG 卷积平滑加SNV 标准正态化3 种预处理方式,数据分析在Unscrambler X 和SPSS 中完成,原始光谱数据以及各种预处理后的光谱图像如图3 所示。

由图3a 可以看出原始光谱数据,对于套袋茄子其果皮颜色较浅,在紫、蓝、绿波段反射率较强,不套袋茄子颜色越深,其反射率越小;在近红外波段出现明显的波峰,在970 nm 左右波段,出现波谷,可能是因为970 nm 附近是O-H 倍频吸收带,果皮上含有水分,故导致在此波段出现波峰,图3b 是通过SG 平滑滤波处理后的图像,由于原始数据噪声较少,故使用SG 平滑滤波后,图像差异很小;SNV 归一化处理可以将样本间较大的差异进行校正,使得套袋茄子和不套袋茄子在反射率上差异变小,消除光谱中的散射现象,由于原始数据携带噪声较少,所以使用SNV 归一化处理后的数据噪声也较小,故图3d 中使用SG 平滑滤波后,与图3c差异很小。

图3 (a)原始光谱数据;(b)使用SG 平滑滤波对原始光谱数据预处理得到的图像;(c)使用SNV 标准正态化预处理光谱图像;(d)原始光谱经SG 平滑滤波后又经SNV 标准正态变化的光谱预处理图像Fig. 3 (a )Original spectral data; (b) Image preprocessed by SG smoothing filter;(c)Image preprocessed by SNV normalization; (d) Image preprocessed by SG smoothing filter and SNV normalization

2.3 降维分析

2.3.1 主成分分析 利用主成分分析法,将781 个变量用占有原始变量不足1%的综合变量代替,降低了模型的复杂度,提高了模型的适用性和鲁棒性。利用SG 平滑滤波预处理后的数据提取得到4 个主成分,利用SNV 标准正态化预处理后的数据提取得到5 个主成分,利用SG 平滑滤波结合SNV 标准正态化预处理后的数据提取得到了5 个主成分,利用主成分分析将因变量的个数均降到不足原始变量1%的维度,但可代表原始变量99%以上的信息。其中3 种方法所提取主成分的累计贡献率如表2 所示:

表2 不同方法提取主成分累计贡献率Table 2 Cumulative contribution rate of main components extracted by different methods

2.3.2 连续投影算法 基于SG 平滑滤波预处理后的数据选取了320、370、538、677、706、824、949、1 094 nm 8 个特征波段,基于SNV 预处理后光谱数据选取了321、461、478、756、797、849、937、1 100 nm 8 个特征波段,基于SG 平滑滤波与标准正态变量变化后的预处理数据利用连续投影算法选取了321、467、678、756、803、841、916、1 045 nm 8 个特征波段。

图4 (a)SG 平滑预处理后提取的特征波长;(b)SNV 预处理后提取的特征波长;(c) SG+SNV 预处理后提取的特征波长Fig.4 (a) Feature wavelength extracted after SG smoothing pretreatment; (b) Feature wavelength extracted after SNV pretreatment; (c) Feature wavelength extracted after SG +SNV pretreatment

2.4 预测模型的建立

本研究利用多元线性回归建模方法建立了茄子花青素的预测模型,分别建立了基于SG 平滑预处理、SNV 标准正态变化预处理以及同时采用2 种预处理后与主成分分析、连续投影算法结合的预测模型,共计6 种。表3 中列出基于主成分、特征波段建立模型的参数,采用可决系数(R2)、标准误差(RMES),对比分析与评价所建预测模型的优劣,对于所建立预测模型做出选择。

表3 花青素与光谱数据不同预处理建模Table 3 Modeling of different pretreatment of anthocyanins and spectral data

最终选取基于SG 平滑滤波与SNV 标准正态变化预处理方法结合特征波段建立的模型,此模型的R²=0.999,RMSE=0.001,该模型的方程为:

Y=2 0.1 6 8+7.0 4 9×X321+3 5.1 0 9×X467+6.3 8 4×X678-4 8.5 2 2×X756+2 4 2.7 4 8×X803-269.924×X841+104.524×X916-6.771×X1045

基于SG 平滑滤波结合SNV 预处理后建立的模型拟合图如图5 所示。

图5 花青素估测值与实际值线性关系Fig. 5 Linear relationship between estimated and actual values of anthocyanins

3 讨论与结论

本研究使用光谱技术对茄子花青素含量进行预测,通过理化试验建立花青素与光谱数据的数学模型,为今后实现无损测量茄子果皮花青素提供参考,采用光谱扫描茄子果皮和适当的主成分筛选与建模技术,可以较为准确地测定茄子果皮花青素含量,可以为茄子果皮花青素含量实时监测提供依据和技术支持。

本研究利用主成分分析方法和连续投影算法对原始数据进行降维处理,以4 个主成分代替了原始781 个变量,仅以原始变量0.5%的比例代替了原始变量,极大的降低了模型的复杂度。最终发现基于8 个特征波段的预测模型具有最优效果,经过主成分分析的模型不具有最好的效果,是由于经过主成分分析提取的主成分会损失信息,8 个特征波段仅为原始变量的1%。连续投影算法提取的6 个特征波长可以消除原始光谱矩阵中冗余信息,提取的变量能够代替原始变量的大量信息,且该方法结合自变量提取得到的特征波长具有代表性,模型的预测性能优。先利用SG 平滑预处理方法后SNV 正态标准变化预处理结合连续投影算法模型拟合程度最高,R²可达到0.999,而RMSE 低至0.001,确定了用光谱法测定花青素含量的最佳估测模型。

由于本试验茄子样本数量较少,导致没有进行模型的检验;光谱数据较多,茄子样本较少,本模型存在一定程度的过拟合,同时本试验只使用了一种茄子突变体材料且只在一个地区进行试验,因此,在不同品种和不同地区是否适用还需要进一步的验证。

基于光谱技术分析茄子果实花青素含量,采用光谱仪扫描茄子果实,通过实际花青素含量与扫描所得的茄子果皮光谱反射值进行模型建立,结果验证通过光谱技术获取茄子果皮花青素具有可行性,未来使用光谱检测方法可以大大的减少测量茄子果皮花青素所需要的时间和人力,为测量茄子果皮花青素提供极大地帮助。

猜你喜欢

花青素果皮预处理
KR预处理工艺参数对脱硫剂分散行为的影响
求解奇异线性系统的右预处理MINRES 方法
粉末预处理对钨坩埚应用性能的影响
污泥预处理及其在硅酸盐制品中的运用
别乱丢果皮
蓝靛果花青素稳定性研究
不乱扔果皮
不同处理对刺葡萄愈伤组织花青素和原花青素生物合成的影响
健康Q&A 花青素Q&A
哇,变色啦!