发酵乳酸度近红外光谱快速检测方法的研究
2023-01-07佘之蕴黄宝莹王文敏沈宏林陈满英
佘之蕴,黄宝莹,王文敏,沈宏林,蒋 轩,陈满英,张 娟
(广东产品质量监督检验研究院,广东 佛山 528000)
发酵乳是指以生牛(羊)乳或乳粉为原料,经杀菌、发酵后制成的pH值降低的产品。其具有丰富的营养物质,包括生物活性蛋白、乳酸菌及其代谢产物[1],是叶酸、核黄素、硫胺素、烟酸、维生素B族及钙、镁、锌、磷等矿物质元素传递到人体的理想载体[2-3]。发酵乳的酸性使钙离子化,能够促进肠道对钙的吸收[4-5]。发酵乳具有多种保健作用,如调节肠道菌群[6-8],预防和降低糖尿病[9]、心脑血管疾病等慢性疾病发生风险等[10-12],已成为最受欢迎的乳制品之一[13-15]。酸度是发酵乳在生产过程中作为发酵终点的判定标准之一,适宜的酸度可以赋予发酵乳良好的凝固状态。酸度是影响发酵乳营养价值、感官品质和风味等因素的基础和原因,酸度过高会影响风味和口感,导致乳清析出,感官质量下降[16]。GB 19302—2010《食品安全国家标准发酵乳》中规定,酸度应≥70.0°T[17]。因此,酸度控制是企业最为关注的问题之一。
近红外光谱(near-infrared spectroscopy,NIRS)是介于可见光和中红外光之间的电磁波谱,其波长范围为780~2 526 nm[18]。近红外光谱技术是利用化合物中特定官能团引起振动造成近红外吸收峰不同,不同化合物呈现不同的峰值[19-20],从而对样品进行分析检测。由于近红外光谱与有机分子中含氢基团(-OH,-CH,-SH,-NH)振动的组合频与各级倍频的吸收一致,近红外光对这些化学键的振动频率有特定的吸收峰,如淀粉、蛋白质、脂肪酸、糖类和水分等。通过扫描待测样品的近红外光谱,样品中的分子选择性地吸收不同频率的近红外光,透射出来的近红外光线就携带样品中有机物结构和组分的信息。通过检测器分析透射光或反射光的光密度,就可以对组分进行定性或定量检测[21-22]。
本研究利用近红外光谱仪采集发酵乳的近红外光谱,对原始光谱进行预处理,结合电位滴定法测定的酸度值,建立近红外快速检测方法,并比较酸度实测值与模型预测值的差异性,从而验证模型的准确性。以期对发酵乳酸度的高效、快速检测提供一定参考。
1 材料与方法
1.1 材料与试剂
含活乳酸菌发酵乳样品81批次:市售。其中71批次用于发酵乳中酸度近红外光谱采集和模型建立,剩余10批次作为外部验证预测样品。
采样袋(聚乙烯密实袋,规格7 cm×5 cm):市售。
氢氧化钠(分析纯):天津市致远化学试剂有限公司;酚酞:天津市天新精细化工开发中心。
1.2 仪器与设备
Thermo ANTARIS Ⅱ近红外光谱仪(InGaAs检测器,安装Result 3数据采集软件和TQ Analyst 8数据分析软件):赛默飞世尔科技中国有限公司;785DMP自动电位滴定仪:瑞士万通中国有限公司;ML204/02分析天平:梅特勒托利多中国有限公司。
1.3 方法
1.3.1 酸度测定
按照GB 5009.239—2016《食品安全国家标准食品酸度的测定》[23],采用电位滴定仪法测定样品的酸度。
1.3.2 近红外光谱采集
ANTARIS Ⅱ仪器采用Result 3操作系统采集光谱,智能透射方式,以积分球漫透射方式和空气为背景,设置分辨率8 cm-1,扫描范围4 000~10 000 cm-1,扫描次数为32。使用聚乙烯密封袋(7cm×5cm)采样12~15 g,采样后密封并应在15 min内录制NIR光谱,为防止乳酸菌数在常温条件下发生变化而影响酸度,每个样品重复测定2次,取其平均光谱。测试过程在温度(23±2)℃、湿度(50±5)%的恒温恒湿环境中进行。采用自制透漫射采样模块:不锈钢材质,“[”型,长10 cm×宽3 cm×高3 cm,反射凹面经镜面抛光处理,凹面高度1 mm,光程3 mm。采集的光谱数据用TQ Analyst 8数据分析软件进行处理和计算。
1.3.3 模型的评价指标
为保证模型的预测结果与使用国标法获得的实测值具有较好的一致性,本研究在模型建立和验证过程中使用的评价指标如下:
校正集均方根误差(root mean square error of calibration,RMSEC)和预测集均方根误差(root mean square error of prediction,RMSEP):
交互验证均方根误差(root mean square error of cross validation,RMSECV):
相关系数R:
式中:n表示样品数;yi表示第i个样品使用电位滴定法获得的实测值;表示第i个样品的近红外预测值;表示样品使用电位滴定法获得的实测值的平均值。
RMSEC、RMSEP和RMSECV分别表示校正集、预测集样品和内部交叉验证时预测值和实测值偏离的大小,其值越小,表示所建模型的预测精度越大,且RMSEC、RMSEP和RMSECV之间的差异越小,模型的预测效果就越好。RMSEC、RMSEP和RMSECV的相关系数Rc、Rp、Rcv表示样品参数指标的实测值和近红外预测值之间的相关程度,其值越接近于1,说明实测值与近红外预测值之间的相关程度越好。理想状态条件下,相关系数R的值为1,均方根误差为0。
1.3.4 近红外模型建立
将1.3.1酸度实测值数据库与1.3.2近红外光谱数据库进行一一对应,以RMSEC、RMSEP、RMSECV及其相关系数Rc、Rp、Rcv为评价指标,通过剔除异常数据、选择建模波段、化学计量学方法、光程类型、数据格式、平滑类型等光谱数据预处理等步骤,建立酸度定量模型,并采用交叉验证法对定量模型进行内部验证。
1.3.5 近红外模型的外部验证
获得最佳定量模型后,按照1.3.1测定未参与建模的10批次样品的酸度,得出样品的酸度实测值,并按1.3.2采集其近红外光谱信息,将光谱信息导入定量模型,得出样品的酸度预测值,对比酸度实测值和预测值,参照GB 5009.239—2016《食品安全国家标准食品酸度的测定》,要求两种方法的相对误差不超过10%。
2 结果与分析
2.1 近红外模型的建立
2.1.1 剔除异常数据
采用主成分分析-马氏距离方法剔去异常样品,建立发酵乳酸度的预测模型,并与未剔除异常样品建立的预测模型进行比较。
由表1可知,建模时只采用主成分回归法(Principal componentregression,PCR),光谱没有进行预处理,没有进行模型的优化,采用主成分分析-马氏距离法剔去异常样品所建立的模型相关系数和校正集均方差均优于未剔除光谱前。
表1 异常数据对模型的影响Table 1 Effect of abnormal data on model
采用主成分分析-马氏距离方法剔除4批次异常数据,提高近红外光谱定量分析的可靠性,以剩余的67批次样品进行建模。发酵乳样品的近红外光谱原始数据图见图1。发酵乳中的酸度值主要取决于代谢产物有机酸的含量,有机酸含有多个C-H、O-H基团,基频振动400~4 000 cm-1的合频和倍频在近红外光谱区4 000~12 800 cm-1有吸收,表明试验中对发酵乳样品的近红外光谱采集方法可行且有效。
图1 发酵乳样品的近红外光谱原始数据图Fig.1 Near infrared spectroscopy original data diagram of fermented milk samples
2.1.2 建模波段选择
酸度近红外吸收波长与模型相关性关系图见图2。通过观察发酵乳近红外原始光谱曲线,可以发现相似的规律:光谱性状具有相似性,但不同样品由于组成、性状存在差异,光谱图稍有不同,其吸收峰位置的差异性不显著。在近红外定量分析中,波长优化可以简化模型,剔除不相关或者非线性变量,提高模型的预测能力和稳定性。获得近红外波段光谱信息中的波段范围为4 000~10 000 cm-1。根据相关光谱的相关性系数,定量分析波段确定为5 569~5 716 cm-1、5 724~6 403 cm-1、7 197~7 506 cm-1。
图2 近红外吸收波长与模型相关性关系图Fig.2 Correlation diagram of near infrared absorption wavelength and model
2.1.3 化学计量学方法选择
近红外光谱有其自身的缺点,如谱带较宽,重叠严重,样品中不同成分的迭加,都会造成分析过程中的干扰。借助合适的化学计量学方法,可以降低干扰,提高信噪比,有助于提升模型精度和稳定性。在近红外光谱技术分析中经常采用的化学计量学方法有逐步多元线性回归法(stepwise multiple linear regression,SMLR)、偏最小二乘法(partial least squares,PLS)、主成分回归法(principal component regression,PCR)等[21,24]。本试验在建模过程中,以RMSEC、RMSEP及其相关系数Rc、Rp为评价指标,比较SMLR、PLS、PCR三种分析方法,结果见表2。由表2可知,PLS建模方法的RMSEC、RMSEP最小,Rc、Rp最接近1,故PLS为最佳处理方法。
表2 SMLR、PLS、PCR建模方法的RMSEC、RMSEP和Rc、RpTable 2 RMSEC,RMSEP,Rc and Rp of SMLR,PLS,and PCR modeling methods
2.1.4 光谱数据预处理
近红外仪器的随机噪声和仪器偏差以及样品背景、散射光等干扰都会导致光谱偏移或漂移。如果直接使用原始光谱建立模型,会影响模型的准确度和精度。适当的光谱预处理能提高模型的预测性能。建立酸度定量模型时,预处理方法包括:(1)光程类型(Pathlength Type):恒定光程(Constant)、多元散射校正(multiplicative signal correction,MSC)、标准正态变量变换(standard normal variate,SNV)等;(2)数据格式(Data Format):原始光谱(Spectrum)、一阶导数(first derivative,1stDer)、二阶导数(second derivative,2ndDer);(3)平滑类型(Smoothing):不光滑(no smoothing,NS)、卷积平滑滤波(Savizky-Golay Filter数据点为7,3项式平滑滤波,S-G)、Norris导数平滑滤波(norris derivative filter,ND)等[25-28]。本试验以RMSEC、RMSEP及其相关系数Rc、Rp为评价指标,对恒定光程、MSC、SNV、1stDer(S-G)、2nd(S-G)、1st+MSC(S-G)、2nd+MSC(S-G)、1st+SNV(S-G)、2nd+SNV(S-G)分析方法比较,结果如表3所示。由表3可知,2nd+MSC(S-G)、2nd+SNV(S-G)的RMSEC最小,Rc最接近1,但其RMSEP最大,Rp最小、1st+MSC(S-G)、1st+SNV(S-G)的RMSEC、RMSEP较小,同时其Rc、Rp较接近1,选择1st+SNV(S-G)为最佳预处理方法。
表3 近红外光谱数据预处理方法的RMSEC、RMSEP和Rc、RpTable 3 RMSEC,RMSEP,Rc and Rp of near infrared spectral data preprocessing methods
2.1.5 采用交叉验证法对定量模型进行内部验证
本试验以样品的85%作为校正集(calibration)样品,15%作为验证集(validation)样品进行交叉验证,即以57批次作为校正集样品,另外的10批次作为验证集样品,进行多变量建立酸度的定量模型,校正集样品的酸度范围为55.7~135.0°T,验证集样品的酸度范围为58.2~111.3°T。酸度预测值和实测值的相关性关系见图3。由图3可知,Rc和Rp均高于0.9,RMSEC与RMSEP的值很接近,说明模型相关性好,精确度高。
图3 发酵乳中酸度定量模型的预测值和实测值的相关性关系Fig.3 Correlation between the predicted and measured values of quantitative model of acidity in fermented milk
模型的预测值和实测值的相对误差见图4。由图4可知,发酵乳中酸度定量模型中预测值和实测值的相对误差均<9%,参照GB 5009.239—2016《食品安全国家标准食品酸度的测定》,符合相对误差不超过10%的要求。
图4 发酵乳中酸度定量模型的预测值和实测值的相对误差Fig.4 Relative error of the predicted and measured values of quantitative model of acidity in fermented milk
十字交叉验证图(Cross validation)见图5。由图5可知,RMSEP和RMSECV数值相近,说明校正集样品与验证集样品都具有代表性,样品信息提取充分,模型信息拟合充分,模型预测性好。
图5 发酵乳中酸度定量模型的十字交叉验证图Fig.5 Cross validation diagram of quantitative model of acidity in fermented milk
2.2 近红外模型的外部验证
为进一步考察定量模型的准确性,利用外部样品对已获得的最佳定量模型进行了外部验证。
对未参与建模的10批次含活乳酸菌发酵乳样品,按照1.3.2电位滴定法测定样品中酸度实测值,按1.3.3采集其近红外光谱信息,将光谱数据导入定量模型,得出样品的酸度预测值,同时将酸度实测值和预测值对比,分析其误差是否在允许范围内,要求二者的相对误差不超过10%,具体结果见表5。由表5可知,酸度的实测值和预测值二者的相对误差为1.91%~6.76%,10组数据的相对误差都在10%以内,均在允许范围内,说明模型具有良好的预测性能。
表5 发酵乳酸度的实测值和预测值比较Table 5 Comparison of measured and predicted values of acidity in fermented milk
3 结论
试验结果表明,发酵乳中酸度实测值和对应采集的近红外光谱数据相关联建立快速定量模型后,经过剔除异常数据、光谱波段优化、化学计量学方法优选、光谱数据预处理等步骤建立的酸度定量模型。优化后模型的定量光谱区间段为5569~5716cm-1、5724~6403cm-1、7197~7506cm-1,化学计量学方法采用PLS,光谱数据预处理方法为1st+SNV(S-G),其RMSEC、RMSEP、RMSECV分别为3.27、4.39、4.84,相关系数Rc、Rp、Rcv分别为0.946 2、0.922 5、0.877 8。经外部验证后,该模型酸度预测值和电位滴定法实测值的最大相对误差为6.76%,不超过10%,满足要求。该定量模型具有快速、高效、准确、成本低、不污染环境等优点,能满足发酵乳产品在线质量检验的高效性和及时性要求。