食用油储存期品质变化的太赫兹光谱无损识别
2021-07-08杨雨菲刘翠玲吴静珠孙晓荣
杨雨菲,刘翠玲*,吴静珠,孙晓荣
(北京工商大学计算机与信息工程学院,食品安全大数据技术北京市重点实验室,北京 100048)
作为人体的三大营养源之一,食用油脂的品质好坏与人体健康有直接的关系[1]。对于将地沟油、潲水油、工业油脂等用于食品加工生产从而引发的食品安全问题,已得到国家有关部门的高度重视和严厉打击,但消费者往往忽略了食用油脂在储存及使用过程中,同样存在着安全隐患。在食用油储存过程中,由于受到外界(水分、温度、光照、空气等)的影响,油脂中不饱和脂肪酸与氧气发生氧化反应,产生一系列过氧化脂质。过氧化脂质在体内积累,还会破坏体内细胞的结构和正常生理功能[2-5]。油脂在储藏过程中因储藏条件的不同氧化程度和速度也不同,评价食用油品的品质通常采用过氧化值:新鲜的油脂其过氧化值小于1.2 mmol/kg;过氧化值在1.2~2.4 mmol/kg之间时,感官检验无异常;过氧化值高于4.0 mmol/kg时,油脂出现辛辣味;过氧化值超过6.0 mmol/kg较多时,人们食用后可出现呕吐、腹泻等中毒症状[6-8]。
目前,在食用油脂检测技术方面,常见的检测技术有气相色谱法、液相色谱法[9-10]、色谱-质谱联用分析法[11]等,这些方法检测精度较高,但在样品提纯、萃取等预处理技术方面十分复杂,且后期的检测条件苛刻,检测周期较长。近年来,太赫兹光谱技术因其辐射具有较长的波长和良好的穿透特性而得到了迅速的发展。同时,太赫兹时域光谱在反映分子集体振动模式、分子间相互作用方面具有显著优势,可提供更多关于被测物分子的动态信息或鉴别分子类型[12-13];并且与红外、拉曼检测技术相比,太赫兹光谱的探测性能更加灵敏、信噪比更高,可同时获得样本的色散和吸收信息[14-15]。太赫兹技术可作为拉曼和红外的互补手段,不仅能获得分子中官能团的振动和转动的结构信息,还可以用于研究分子结构和成分鉴别。基于以上论述,本研究选用太赫兹技术检测食用油脂具有很高的理论可行性。
Ung等[16]率先采用太赫兹时域光谱技术检测了加热和未加热的花生油,观测到花生油吸收峰位于1~1.6 THz之间,加热后的吸收更强,应用太赫兹技术论证了温度变化对油品组分的影响。李利龙等[17]通过比较7 种植物油、2 种调和油特征吸收参数吸收峰的差异,验证了脂类有机大分子对太赫兹辐射具有差异性吸收,具备在太赫兹波段的识别基础,可通过太赫兹技术进行鉴别和定性分析。廉飞宇等[18]采用太赫兹时域光谱检测系统,探究4 种食用油在波段为0.2~1.6 THz的延迟特性和折射率特性,通过化学计量学方法精准鉴别出食用油的种类。聂美彤等[19]研究了食用油的衰减全反射式太赫兹时域光谱特性,其实验测量结果与食用油组分含量理论计算值相吻合,可认为太赫兹波段食用油的吸收峰与其脂肪酸分子种类和含量有关。以上研究成果表明:油脂类有机大分子对太赫兹辐射具有差异性吸收,具备在太赫兹波段的识别基础,可通过太赫兹技术进行油品鉴别和定性分析。虽然国内外众多研究机构在探索油脂品质和问题油脂的检测方法方面取得了一定的进展,但大多将太赫兹技术用于食用油种类鉴别和组分研究,鲜有用该技术对储存期油品新鲜程度和食用性判别的详细报道。因此利用太赫兹光谱技术分析贮存期不同氧化程度体现食用油脂品质的变化情况很有必要。
本研究以常用品种的食用油为原材料,依据食用油氧化的规律和标准,采用太赫兹时域光谱技术,建立食用油品质评判的定性分析模型,以期为快速无损鉴别食用油氧化品质提供参考。
1 材料与方法
1.1 材料
实验样本为不同氧化程度的玉米油、大豆油、菜籽油共48 个,由北京粮食科学研究院提供。本研究将过氧化值小于1.2 mmol/kg的油脂定义为新鲜油;过氧化值在1.2~2.4 mmol/kg之间的油脂定义为可食用油;过氧化值大于2.4 mmol/kg的油脂定义为不宜食用油,每一类油选取16 个样本作为研究对象。油品均成浅黄色透明状液体,在宏观上无明显差别。
1.2 仪器与设备
TeraPulse 4000太赫兹脉冲光谱仪 英国剑桥TeraView公司。工作时仪器参数设置如下:Terahertz光源:激光门控光电导体半导体发射器;激光器:超短脉冲光纤激光器;扫描范围:0~2 400 ps;快速扫描:30 次/s,光谱分辨率1.2 cm-1;光谱测量范围在2~133 cm-1(0.06~4 THz)之间,信噪比最高达到70 dB。
光谱采集由太赫兹脉冲光谱仪配备的单晶硅衰减全反射(attenuated total reflection,ATR)模块完成。ATR能够测量固体和液体样本,具有采样面积小、样品量小等优点,并且样品制备和采集方式简单。它的工作范围在10~120 cm-1左右的电磁频谱区域内,入射角35°。
辅助设备:JHY-H-1000L型恒温恒湿试验箱,温度范围-40~150 ℃,温度波动度≤±0.5 ℃,相对湿度20%~98%,本实验设置相对湿度为55%。
1.3 太赫兹光谱采集
太赫兹光谱易受温度影响,在不同温度下会显现出不完全相同太赫兹时域谱信息,所以本研究将食用油样品放置在温度和光线恒定的室内进行实验,环境温度为22 ℃,以尽量降低温度带来的噪声影响。由于水对太赫兹波存在极强的吸收,因此实验的结果很大程度受实验环境湿度的影响,所以实验过程中,用空气压缩机对TeraPulse 4000光谱仪腔体进行持续吹扫,以去除空气中水蒸气对实验数据的影响[20]。
在正式测定之前,要先确保ATR晶体上未放置任何样品并且干净无污染,再通过ATR采集空气得到参考信号,最后依次采集所有样品的太赫兹衰减全反射光谱。为保证对各样本有同样的吸收度,采用移液枪逐一取样(取样量统一为600 μL),采集样本期间,为防止样本间的交叉污染,每采集完一份样本,78%乙醇溶液反复擦拭与样本有接触的部位,确保不会有上一样本的液体残留再进行下一样本的采集。
1.4 数据分析方法
1.4.1 光谱数据预处理方法
光学常数是表征物质宏观光学性质的重要物理量。在从采集到的太赫兹光谱的时域波形中提取光学常数前,需要利用快速傅里叶变换将参考信号和样本的时域光谱进行转换,得到对应的频域光谱,进而利用频域信号的幅值和相位(实部和虚部)信息计算得到所需的光学常数[21]。此外,在获得信号频域谱的过程中,为避免信号数据开头和结尾不连续造成信号频谱显示的失真,必须对信号执行一个切趾(加窗)的过程,减少时域信号截断所带来的误差。切趾函数的种类多样,比如Boxcar用于高分辨率,Blackman Harris用于高信噪比[22-23],本研究选择最常用的Happ Genzel,因为它兼顾了信噪比和分辨率。太赫兹光谱分析中常用的光学常数是折射率和吸光系数。折射率是光在真空中的传播速度与光在该介质中的传播速度之比,可以通过不同样本在时域信号上的延迟反映出来;吸收系数定义为该样本单位厚度的吸光度。折射率n(ω)和吸收系数α(ω)计算如式(1)和(2)所示:
式中:ω为角频率;d为样本的厚度;c为太赫兹波在空气中的传播系数;所涉及的φ(ω)和ρ(ω)变量为样本的频域信号与参考频域信号作比后的比值函数所得,φ(ω)为比值函数的相位,ρ(ω)为比值函数的幅值[24]。
为了减少光谱的数据冗余,同时降低模型的学习时间,提高建模效率,本实验研究即对样品折射率光谱原始数据归一化处理后,用主成分分析(principal component analysis,PCA)法对得到的太赫兹全光谱进行分解,选择其中累计贡献率达到97%以上的PC,以此作为线性模型的输入[25-26]。
异常样本的剔除采用置信区间理论,它是一种由样本统计量所构建从而得到的总体参数估计区间,代表某一参数的真实值具有一定概率落在测量结果周围,其给出的是被测参数测量值的可信程度。置信区间是在预先确定好的显著性水平下计算出,显著性水平通常称为α,绝大多数情况会将α设为0.05,置信度为95%,实验中落在95%置信区间以外的样本均视为异常样本应被剔除[27-28]。
1.4.2 欧氏距离匹配法
采用欧氏距离匹配(euclidean distance matching,EDM)法对氧化食用油样本间的真实距离进行识别和分析,该方法为一种聚类分析方法,同一类样本间距离最小,可自动聚为一类[29]。
1.4.3 线性判别分析法
线性判别分析(linear discriminant analysis,LDA)是一种判断个体所属类别的统计方法,对待测的训练集样本进行投影,使样本投影到一条直线上,最终相似样本的投影点尽可能接近,不同样本的投影点尽可能远离。分类规则建立后判别测试集样本,将其投影到同一条直线上,并根据投影点的位置确定新样品的类别。该类判别方法属于一种分类方法,需已知用于建模和预测模型性能的待测样本所属类别[30-31]。
2 结果与分析
2.1 储存条件对食用油氧化性的影响
样本储存条件及水分含量对其过氧化值的影响如图1所示,除光照实验样本外制备过程均在恒温恒湿实验箱中进行。
图1 样本储存期品质变化规律Fig.1 Effect of storage conditoins on the quality change of oil samples
由图1可知,食用油品质变化受储存温度影响较显著,100 ℃高温储存仅10 h开始过氧化值就已经出现逐渐超过国家食用油质量标准限值6.0 mmo1/kg,而室温约30 ℃储存第40天时3 类食用油样本过氧化值均超限定值,冷藏储存0 ℃则过氧化值变化缓慢,最大变化量仅增加2.36 mmo1/kg;样本不同的水分含量对过氧化值影响呈现正相关,其中菜籽油受水分影响最为显著;光照也是影响食用油品质的关键因素之一,30 ℃室温储存第25天3 类油品过氧化值均超过限定值,而避光存储则氧化速度缓慢。
2.2 太赫兹光谱图分析
采集所获得的不同氧化程度的食用油样本的太赫兹时域光谱,如图2所示。从图2A可以看出,由于空气中水分等检测环境的影响,不同样品的太赫兹信号强度存在细微的波动,但波形波动相似则说明检测系统的稳定性良好。图2B为太赫兹时域光谱局部放大图,谱图变化差异主要体现新鲜油太赫兹强度最强、可食用油次之、不宜食用油最弱,分析原因:在不同氧化时期,食用油内部所含成分种类是相同的,而由于不同氧化程度引起的样本组分微观化学结构已经发生变化。
图2 不同氧化程度的食用油太赫兹时域谱图Fig.2 Terahertz time-domain spectra of edible oils with different oxidation degrees
2.3 太赫兹光谱数据预处理
2.3.1 光学常数提取
如图2所示,虽然光谱强度稍有差异,但谱图总体趋势相同,因此不易通过时域谱图进行食用油氧化性的有效研究,需进一步对时域信号进行提取光学常数处理。对样本时域信号太赫兹谱图做快速傅里叶变换后得到样品的频域信号,再对其根据式(1)、(2)计算出各样品的折射率谱图和吸收系数谱图,如图3所示。
图3 新鲜样本和不宜食用样本光学常数图Fig.3 Refractive index spectra (A) and absorption coefficient spectra (B) of fresh and inedible oil samples
对比图3A和图3B可知,不同种类的食用油在10~55 cm-1范围内分布在不同的折射率区间,故根据食用油的太赫兹折射率谱图即可清晰地判别出食用油的种类,但对于食用油氧化程度的研究谱图无明显区分特征,需进一步通过建立数学模型进行判别分析;而食用油的吸收系数谱图则无此现象,只有大豆油的吸收系数变化趋势较其他两类油差别较大,对于氧化程度的判别在谱图上同样没有明显吸收系数变化规律。
2.3.2 光谱数据降维
对太赫兹折射率谱和吸收系数谱数据分别采用PCA法进行提取优化,若选取PC数较少,可能会导致PC分量对样本特征信息表征不足,建模准确率不理想;PC选取较多,则容易引入干扰建模准确率的噪声信息,同样对模型准确率存在影响[32-33]。前7 维PCA结果如图4所示,累计贡献率分别为98.61%、97.6%均覆盖了原始数据绝大部分的信息量。
图4 PCA结果Fig.4 Principal component analysis plots
2.3.3 异常样本剔除
对样本折射率谱和吸收系数谱数据进行PCA后,两者前两维PC累计可代表原始数据的94.44%、88.87%,累计贡献率均在85%以上可用于表征样本特征属性,故利用前两维PC数据剔除异常样本,并尝试对不同氧化程度类别的食用油二维PC空间分布进行可视化,结果如图5所示。由图5A可知,折射率谱数据47号新鲜油样本和30号可食用油样本在了95%的置信区间外为异常样本;由图5B可知,吸收系数谱数据13号不宜食用油样本和47号新鲜油样本为异常样本,以上相应样本应被剔除。比较前两维PC的置信区间氧化程度样本类分布情况,样本在二维平面上分布集中,无明显分类界线,区分度较差,因此对于识别食用油氧化程度的研究还需要进一步结合其他机器学习模型进行分析。
图5 二维PC置信区间分布图Fig.5 Two-dimensional distribution of first two principal components at confidence intervals
2.4 食用油氧化定性分析
2.4.1 折射率谱建立的判别分析模型
对太赫兹折射率谱建立7 维PC特征下的食用油氧化程度类属性判别分析,EDM分类结果如图6所示。采用全折射率谱数据建立的LDA分类结果如图7所示。建模集与测试集划分比例为2∶1,即建模集31 个样本、预测集15 个样本。从图6可以看出,基于折射率数据的分析模型除了1 个新鲜油样本和1 个可食用油样本被错误的分类成不宜食用油类别外,剩余其他样本均识别正确,准确率可达95.65%。通过比较LDA模型输出的样本投影距离,得到建模集判别准确率为91.85%、预测集为82.59%。
图6 折射率谱的EDM聚类结果图Fig.6 EDM clustering of refractive index spectra
图7 折射率谱的LDA分类结果图Fig.7 LDA classification of refractive index spectra
对比2 种判别分析方法对食用油折射率谱的建模结果,EDM法的计算结果明显优于LDA算法,因此欧氏EDM法更适于对食用油的折射率谱进行分析。分析原因:对于食用油的折射率谱图表现为不同种类油品的谱图折射率值存在较大的差别、相同种类油品谱图折射率值相似,而LDA法为有标签约束的分类方法,因此采用折射率谱数据对所有种类的油进行新鲜油、可食用油和不宜食用油的分类时会受到食用油种类差别的影响,欧氏EDM的聚类方法无标签约束更适合分析食用油的折射率谱。
2.4.2 吸收系数谱建立的判别分析模型
基于太赫兹吸收系数谱建立的食用油不同氧化程度判别模型中,经PCA得到的7 维PC数作为输入与EDM法相结合的建模结果如图8所示,LDA分类结果如图9所示。建模集与测试集划分比例约为2∶1,即建模集31 个样本、预测集15 个样本。对于EDM法的分类模型中有7 个食用油样本识别错误,准确率仅为84.78%,与太赫兹折射率数据的分类效果相比建模结果不理想,未能达到实际应用要求。对于LDA分类模型中建模集判别准确率为95.89%、预测集为86.11%。
图8 吸收系数谱的EDM分类结果图Fig.8 EDM classification of absorption coefficient spectra
图9 吸收系数谱的LDA分类结果图Fig.9 LDA classification of absorption coefficient spectra
分析2 种建模方法所得到的结果,LDA法更适于分析食用油吸收系数谱数据,其计算结果有较高的判别准确率。分析原因:食用油的吸收系数谱图随氧化时间的不同吸收峰位置和强度变化较大,而同种类型的的使用油因氧化时间不同相似性小,因此在以氧化性为判别目标时采用有标签约束的LDA法有更高的可行性。
综合食用油折射率谱和吸收系数谱的2 种模型氧化性分析结果,如表1所示。线性判别分析法识别吸收系数谱数据,准确率为91.00%,经比较两模型识别准确率理想,分析效果良好。
表1 食用油氧化性识别模型分析结果Table 1Analytical results of edible oil oxidation recognition models
3 结 论
本实验探究储存条件对食用油品质的影响情况,其中温度、光照和样本水分含量对过氧化值影响较为显著。根据国家标准将因储存时间不同而氧化程度不同的油脂分为新鲜油、可食用油和不宜食用油3 类,首先利用太赫兹衰减全反射技术,采集所有实验样本的太赫兹时域光谱图,经数据预处理得到折射率和吸收系数光学常数数据,然后采用PCA法对数据进行降维处理,再利用置信区间剔除异常样本,最后分别建立了EDM法模型和LDA法模型。结果表明,基于太赫兹折射率数据的定性模型,EDM法模型和LDA法模型的分类正确率分别为95.65%和87.22%,EDM法模型更适用于分析食用油品质的太赫兹折射率谱数据。而基于太赫兹吸收系数数据的定性模型,LDA模型的分类正确率明显高于EDM模型的分类正确率,前者为91.00%、后者为84.78%。综上研究结果表明,太赫兹时域光谱技术作为一种快速无损、绿色环保的检测技术,利用其进行以氧化性为评判目标的食用油品质评价具有一定的可行性;同时本研究的实现为探究使用的油的油脂含量、极性组分值等奠定理论基础,并为太赫兹光谱技术应用于油品检测更广泛的领域提供分析思路;本实验研究得到储藏条件对食用油氧化的影响情况,还为有关企业和消费者日常使用提供指导。