基于化学计量学的近红外光谱法检测白酒中酯含量研究
2019-03-18宗绪岩邹永芳叶光斌刘恩满
宗绪岩 ,李 骥 ,邹永芳 ,王 陶 ,叶光斌 ,刘恩满 , 李 丽 ,3
(1.四川理工学院生物工程学院,四川宜宾 644000;2.酿酒生物技术及应用四川省重点实验室,四川宜宾 644000;3.固态酿造关键技术研究四川省院士(专家)工作站,四川宜宾 644000;4.舍得酒业股份有限公司,四川遂宁 629209)
白酒作为我国的一种传统酒精饮料,是中国特有的酒精类饮料[1]。白酒采用固态酿造、双边发酵[2-3]。白酒中富含醇、酸、醛、酯等风味物质[4],其中尤以酯类物质含量丰富为代表[5]。在生产过程检验时,基本使用传统化学方法,人为因素大、数据精确度不高。虽然近年来气相色谱分析基本在白酒企业普及,但仍然存在操作复杂、用时长等问题[6-7]。
随着技术的发展,有些学者开始运用光谱技术对白酒进行分析、检测。Zhu W等人[8]使用荧光光谱技术预测清香型白酒的年份。近红外光谱是近年来发展很快的光谱技术,能够快速、无损获取样品的化学指纹,在复杂的背景中分辨出待测物质[9-11]。近红外光谱主要是对有机分子中含氢基团X-H键(X为C,O,N,S等)的倍频和合频吸收。根据这些基团的近红外吸收光谱出现的位置、吸收强度等信息特征,结合数理统计对该成分作定性和定量分析。该法具有快速、无损、环保、可以实现在线分析等特点,已广泛用于食品领域中[12-14]。
通过对白酒中添加不同含量的四大酯制作出白酒样本,然后采用近红外光谱进行扫描,使用化学计量学方法对光谱进行定量分析,以期达到快速、无损检测白酒成分的目的,该研究为后续研究机理和工业化应用提供理论基础。
1 材料与方法
1.1 材料与试剂
白酒,舍得酒业股份有限公司提供;乙酸乙酯、丁酸乙酯、己酸乙酯、乳酸乙酯均为分析纯,购于Sigma-Aldrich公司;乙醇为分析纯,购于成都市科隆化学品有限公司。
1.2 仪器与设备
FTLA2000-160型近红外光谱仪,ABB公司产品;气相色谱质谱联用仪,美国安捷伦公司产品。
1.3 数据处理软件
Grams,ABB公司配套数据采集软件;MATLAB,数据转换和处理平台;PLS-Toolbox 8.11,数据处理和分析软件。
1.4 方法
1.4.1 样品制备
使用去离子水将乙醇稀释到52%(V/V),分别加入不同体积的酯,使其质量浓度达到表1中列出的含量。每个样品按照分别独立制备3个重复样品。
样品酯质量浓度见表1。
表1 样品酯质量浓度/mg·(100 mL)-1
1.4.2 气相色谱质谱联用分析
将舍得酒业股份有限公司提供的不同质量、等级的10个白酒样品分别采用直接进样的方式,使用气相色谱质谱联用仪进行酯的含量分析。
1.4.3 近红外光谱采集
使用ABB公司生产的FTLA2000-160型近红外光谱仪进行扫描,采用石英-卤素灯作为光源,迈克尔逊干涉仪进行波长选择,InAs检测器,波数扫描范围14 000~400 cm-1,采样间隔4,扫描次数8次,使用Grams软件采集数据。
1.4.4 光谱预处理
光谱数据经Grams采集后,由MATLAB平台下PLS-Toolbox读取。数据经过均值中心化后,进行均值中心化、标准正态变换(Standard normal variate,SNV)、矢量归一化(Vector normalization,VN)、一阶导数(First derivative,FD)、二阶导数、乘性信号校正 (Multiplicative signal correction,MSC)、SG平滑、波段选择等预处理方法[15]对光谱进行预处理,通过这些方法提高信噪比、滤除噪声、消除基线漂移造成的干扰等。
1.4.5 定量模型的构建
采用化学计量学方法中的偏最小二乘法(PLS)构建数学模型,将光谱数据和样品中酯含量数据导入PLS-Toolbox,利用软件进行计算和模型构建,同时对异常值进行剔除[16]。
1.4.6 模型的验证
将标准酒样的光谱数据代入软件,计算出酯含量,与气相色谱质谱联用仪测定的结果进行比较,并计算偏差。
1.4.7 模型的判断
构建的模型质量的标准一般考查模型的决定系数(R2)和交叉验证均方根(RMSECV)。其中,决定系数越大,说明模型越接近建模数据;交叉验证均方根越小,说明模型质量越好。模型预测质量一般用预测误差均方根(RMSEP)表征。预测误差均方根越小,说明模型预测越准确[17]。
2 结果与分析
2.1 光谱预处理
一阶导数处理后的光谱图见图1。
图1 一阶导数处理后的光谱图
从图1可以看出,在4 000~400 cm-1和14 000~12 000 cm-1内,噪音较大,光谱加载的数据信息较难处理。根据波谱学理论,水分子中羟基的对称和反对称伸缩振动的一级频谱带,以及醇分子的单聚体、多聚体的羟基伸缩振动的一级频谱带,都会集中出现在7 300~6 200 cm-1内。针对这些对含量信息有影响或不能高效表征这些信息的谱带进行剔除,增加后续分析的准确性,减少分析过程负荷。
分别对光谱数据进行了均值中心化、标准正态变换、矢量归一化、一阶导数、二阶导数、乘性信号校正、SG平滑等预处理,但发现经一阶导数和乘性信号校正处理后的光谱数据效果最好。
2.2 定量模型的构建
定量模型的构建过程就是将经过预处理的光谱数据与样品的含量等化学测量数据进行数学关联,通过计算机等工具找到他们之间关联关系的过程。
在使用偏最小二乘法构建定量模型时,关系模型实际预测能力的最直接参数是主成分数的选择。主成分数选择过少,会造成部分光谱信息丢失,不能充分体现出未知样品被测组分所对应光谱信息,造成模型预测不够准确;如果主成分数选择过多,会将一些噪声引入模型,导致模型过拟合,也会使模型的预测能力下降。误差是难以避免的,所以在近红外光谱采集过程中和化学分析测定过程中都会存在误差,一般在构建模型是将异常阈值设定为0.99,对于显著偏离平均误差的5个异常样本予以剔除,再利用偏最小二乘法等方法构建模型。
经过一阶导数和乘性信号校正预处理后的光谱,在主成分数为4时基本能够涵盖光谱信息,波数在9 800~7 500 cm-1和 6 100~5 400 cm-1范围内,模型的交叉验证均方根最小。应用交叉验证均方根和预测误差均方根作为标准,剔除了异常样品,对剩余光谱数据进行分析,利用校正集建立的乙酸乙酯定性模型的预测值与实际值,建立的4个模型均稳健、可靠,预测值和实际值具有极好的关联关系。
乙酸乙酯模型质量浓度预测值与实际值对照见图2。
图2 乙酸乙酯模型质量浓度预测值与实际值对照
2.3 模型的验证
利用气相色谱质谱联用仪对不同等级、不同质量的10个白酒样品进行成分分析,并计算出其中4种酯类物质的含量,同时进行近红外光谱扫描,将光谱数据导入已经构建的模型,计算出预测值。
各模型参数见表2。
从表2可以看出,近红外光谱的预测值与化学分析的实测值基本一致,模型的预测效果很好,在一定程度上能够较好地预测白酒中4种酯类物质的含量,从而实现无损、快速检测的目的。
3 结论
采用近红外光谱仪对白酒模拟样品进行了光谱扫描,对乙酸乙酯、丁酸乙酯、己酸乙酯和乳酸乙酯4种白酒中重要的酯类物质建立了偏最小二乘法定量模型,在光谱预处理、波长选择、异常值剔除、主成分数选择等方面进行了研究,模型预测值与实际值的相关系数均大于0.97。使用白酒样品进行验证试验,预测值与测定值无显著差异。说明采用近红外光谱进行白酒中酯类物质检测可以实现快速、无损、多参数、多指标检测,为白酒生产和质量控制提供了新的思路和理论。
表2 各模型参数