基于可见/近红外光谱分析技术的水性油墨黏度预测模型
2022-11-12白永利黄新国张姗姗钟云飞翟小阳谢小春
白永利 黄新国 , 彭 楠 张姗姗钟云飞 , 翟小阳 谢小春
1.湖南工业大学 包装与材料工程学院 湖南 株洲 412007
2.湖南福瑞印刷有限公司 湖南 长沙 410100
1 研究背景
水性油墨具有黏度低、流动性好、价格便宜、无毒无害、利于环境保护等优点,被认为是最有潜力的绿色环保油墨,在印刷业中发挥着重要作用[1-2]。水性油墨的印刷适性是衡量油墨质量的重要参数,主要包括黏度、黏着性、颜色、pH值、分散稳定性、触变性等性能指标[3]。印刷水性油墨通常为液体状态,印前黏度相对较高,需要添加酒精降低其黏度以达到印刷适性,但由于酒精易挥发,在印刷过程中水性油墨的黏度会不断变化,这严重影响印刷质量。因此,印刷过程中需要不断添加酒精来保证油墨黏度处于稳定的状态[4]。目前大部分企业主要通过有经验的工作人员手动添加酒精来调整水性油墨的黏度,这种方法主观性强,难以精确控制,费时、繁琐、效率低,无法保证油墨的稳定性和一致性等印刷性能。所以,水性油墨黏度光谱表征研究对提高印刷品质量具有重要意义。
可见/近红外光谱分析技术是通过光谱学原理结合实验方法确定被测物质组成结构和化学成分的一种低成本、操作简单、高效无损的检测技术[5]。近红外光谱分析广泛应用于农产品[6]、食品[7-9]、临床医学[10]、化工以及环境水质等检测领域,并成为生产现场、无人监守、连网工作环境下在线测控、野外环境监测等领域的重要分析检测手段。目前利用光谱分析技术对液体材料黏度的研究主要集中在航空润滑油、抗燃液压液、石油等方面。曾金等[11]通过傅立叶变换结合中红外光谱分析技术,建立红外光谱和润滑油黏度回归方程,以实现快速检测润滑油黏度,该方法可行且测定结果稳定。余良武等[12]利用中红外光谱分析技术将后向间隔偏最小二乘法(backward interval partial least squares,BIPLS)和主成分分析BP神经网络法(principal component analysis-BP neural network,PCA-BPNN)结合,对水-乙二醇抗燃液压液(water-glycol fire resistant hydraulic fluid,HFC)的黏度进行了研究,为HFC的黏度测量开发了一种新的检测技术,测量精度符合监测要求。冯新泸[13]应用近红外光谱技术结合量化自组织神经网络和BP神经网络方法,建立内燃机油在不同温度下(40,100 ℃)的黏度指数模型,相比来说,量化自组织神经网络模型具有较好的预测性能。
上述研究为利用光谱分析技术实现水性油墨黏度检测提供了参考,但它们大都使用中红外光谱法(λ>1000 nm),价格昂贵,不利于实现后期的在线检测研究。同时,基于原始全波段的光谱数据进行研究,数据量庞大繁杂,所建模型性能需进一步优化。本研究通过比较分析各种预处理效果,基于连续投影算法(successive projection algorithm,SPA)和竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)提取特征光谱,建立并优化水性油墨黏度预测模型,定量无损预测黏度, 为实现水性油墨黏度的在线检测提供了技术方法。
2 实验部分
2.1 实验试剂
WZ01系列黄色水性油墨,细度小于 20 μm,黏度为(23±6)s(25 ℃,蔡恩2号杯),初干性为10~30 mm,着色力为95%~105%,购于珠海市乐通化工有限公司;医用酒精,体积分数为75%±5%,购于河南华阳药业有限公司;蒸馏水,实验室自制。
2.2 实验仪器
光纤光谱仪,USB6500-Pro型,购于广州景颐光电科技有限公司;卤素灯光源,JY-L2000型,波长范围为300~2500 nm,输入功率为100 W,购于广州景颐光电科技有限公司。
光谱测量系统如图 1 所示,由光源、反射光谱测量支架、光纤光谱仪、适配器、标准反射白板及计算机组成。数据采集前,光谱设备需预热30 min并进行校正,主要的参数设置包括系统的积分时间为2.5 ms,扫描平均次数(参数优化后)为6次,光谱获取范围为 300.0~1023.1 nm。
图1 光谱测量系统Fig.1 Spectral measurement system
2.3 样品制备
通过添加一定体积分数(0%, 5%, 10%, …,70%)的酒精溶剂改变水性油墨的黏度,并采用蔡恩2号杯对其黏度进行测量。每组样品重复测量 3 次,读数并记录结果,取平均值作为该水性油墨样品的实测黏度值。在黏度可变化范围内共制得15组样品。
2.4 光谱数据采集
水性油墨具有混浊、不透明的特点,需要通过采集样品的反射光谱进行研究。为了避免仪器噪声、人员操作等对测得的光谱数据造成影响,每次采集时光纤光谱仪、光源、标准反射白板、反射光谱测量支架四者的位置保持固定不变,对同一目标连续采集10条光谱,将平均后的光谱作为样品的原始光谱数据。
2.5 光谱预处理
采集得到的光谱数据除样品本身包含的化学信息外,还包括噪声等影响模型准确性的无关背景信息,因此需要对光谱数据进行预处理。常用的预处理方法包括均值中心化(mean centering)、归一化、小波变换、平滑、标准正态变量转换(standard normal variate transformation,SNV)和多元散射校正(multiplicative scatter correction,MSC)等[14-15]。其中,均值中心化是通过将样品的光谱减去校正集的平均光谱;数据平滑法包括移动窗口平滑和Savitzky-Golay(SG)卷积平滑,旨在消除仪器噪声或因其他变量所引起的噪声;MSC是通过计算校正集样品的平均光谱,即“理想光谱”,将其他光谱与理想光谱进行线性回归,通过线性方程的截距和斜率校正样品的原始光谱;与MSC类似,SNV也用于校正样品间由于光谱散射而引起的光谱误差,但它不需要“理想光谱”,即通过原始光谱减去该光谱的平均值,再除以该光谱数据的标准偏差。本实验分别采用均值中心化、SG卷积平滑、移动窗口平滑、MSC和SNV等方法对原始光谱数据进行预处理。
2.6 光谱特征波长提取
原始光谱矩阵中共有2088个光谱波段,光谱数据量大而复杂,且数据之间相关性强,因此在全光谱波长内建立的模型运算速度慢,复杂且效率低,不利于后期在线检测。
特征变量选择方法,能够有效提取特征波长,通过压缩波长变量,简化模型,进而优化模型性能,提高模型的预测能力[16]。SPA是一种前向变量选择算法,能够从光谱信息中充分寻找出含有最低限度冗余信息的变量组,使变量之间的共线性达到最小[17-18]。CARS 是一种将回归系数作为变量重要性指标,结合蒙特卡罗采样算法的特征波长提取方法,其将每个变量看为一个个体,多次重复实验,通过自适应重加权采样技术优选出PLS模型中回归系数绝对值大的波长变量,最终比较计算得到的均方根误差(rootmean-square error,RMSE),选择均方根误差最小的子集作为最优变量子集[19]。本研究基于SPA和CARS提取用于黏度值检测的特征波长。
2.7 模型建立与评价
本研究分别基于原始全波段光谱、预处理后的全波段光谱数据和特征波段光谱数据,构建水性油墨黏度的偏最小二乘回归预测模型(partial least square regression,PLSR)和主成分回归(principal component regression,PCR)预测模型,并以决定系数(R2)和均方根误差(RMSE)为精度指标的评价模型。
3 结果与讨论
3.1 黏度统计分析
基于微型光纤光谱仪获取的光谱数据和蔡恩杯测定的实际黏度值,采用浓度梯度法,将所有样本集按照2∶1的比例划分为10个校正集与5个预测集,所得样本的黏度统计结果如表1所示。由表可知,样本校正集的黏度值范围大于测试集的黏度范围,因此划分结果合理可行。
表1 校正集和预测集中水性油墨的黏度统计结果Table 1 Statistics results of the viscosity of water-based inks in calibration and prediction sets
3.2 光谱预处理
原始光谱中首末两端存在闲散光、背景信息等大量噪声,对后期光谱数据分析造成严重影响,因此,本研究选取 300~1021nm 波段的数据作为原始光谱数据,共1084个波段,用于后续的预测分析。为了进一步消除可见/近红外原始光谱数据中噪声及光源强度分布不均匀等环境因素对实验精度的影响[20],分别采用均值中心化、移动窗口平滑、SG卷积平滑、MSC、SNV等5种预处理方法对原始光谱数据进行预处理。水性油墨样本的原始反射光谱(raw)以及5种预处理后对应的反射光谱如图2所示。
图2 水性油墨原始反射光谱及5种预处理后的反射光谱图Fig.2 Original reflectance spectra of water-based ink and reflectance spectra processed by 5 pre-treatments
由图2可以看出,所有光谱曲线的波形相似且平坦,没有明显的波峰和波谷,经过MSC和SNV预处理后,光谱曲线的散射效应明显减小。
为了比较不同光谱预处理方法对模型性能的影响,本研究分别基于原始全波段光谱信息和预处理后的全光谱数据建立了水性油墨黏度的 PCR、PLSR预测模型,预测结果见表2,其中和分别为校正集和预测集的决定系数,RMSEC和RMSEP分别为校正集和预测集的均方根误差。
表2 PCR和PLSR模型对水性油墨黏度的预测结果Table 2 Viscosity prediction results of water-based inks by PCR and PLSR model
由表2可知,经过 MSC和 SNV预处理后的光谱数据建立的水性油墨预测模型均比其他预处理方法效果好。对比这两种预处理方法,可以发现经过SNV预处理后建立的PLSR模型效果最好,其中高达0.9966,达到0.9796,RMSEC和RMSEP误差相对也是最小。同时,对比分析PCR和PLSR这两种模型效果,发现PLSR模型的性能要优于PCR模型。由此可见,对原始光谱进行预处理尤为必要。
3.3 光谱特征波长提取
经过SNV预处理后建立的PLSR模型达到了较好的预测效果,但该模型是以预处理后的全波段光谱数据量作为输入变量,数据量庞大且繁杂,影响模型的运算效率,不利于后续的在线检测。本研究通过分析和比较SPA和CARS两种特征光谱波长提取方法来筛选有效光谱,简化模型的复杂程度,进一步优化模型[21]。
3.3.1 基于SPA提取特征波长
采用SPA算法对预处理后的光谱数据提取特征波长,以预测模型的均方根误差为评价指标来确定特征波长变量个数,特征波长的提取过程如图3所示。图3a反应了RMSE随SPA中有效变量数的变化规律,可以看出RMSE随着有效变量数的增加先逐渐下降,当有效变量数为4时,RMSE最小,最小值为0.0732,当变量数大于4后,RMSE又出现波动,呈现先上升后下降趋势。因此,通过SPA算法选择4个特征波长变量,分别为 273, 322, 716, 721 nm,如图 3b 所示。
图3 SPA特征波长变量选择过程Fig.3 SPA feature wavelength variable selection process
3.3.2 基于CARS提取特征波长
图4显示了通过CARS算法提取特征波长的整个过程,设定其蒙特卡洛采样次数为50次,然后利用五折交叉验证的RMSECV值构建PLS模型,选取最佳特征波长。从不同采样次数下RMSECV的变化规律可知,当迭代到第35次时,RMSECV达到最小,此时该最优变量子集包含12个特征变量,分别为:194,196, 227, 231, 232, 239, 241, 255, 537, 729, 736, 740 nm。
图4 CARS特征波长变量选择过程Fig.4 CARS feature wavelength variable selection process
3.4 基于特征波长的建模分析
本研究分别将SPA算法得到的4个特征波长和CARS算法得到的12个特征波长光谱数据作为自变量,建立水性油墨黏度值的PLS预测模型,预测结果如表3所示。
表3 基于特征光谱建立的偏最小二乘法回归模型对水性油墨的预测结果Table 3 Viscosity prediction results of water-based inks by PLSR model based on the characteristic spectra
横向对比分析表3中两种特征波长提取算法建立的PLS模型发现,基于SPA-PLS和SNV-SPA-PLS模型不仅显著简化了模型,同时,预测模型也得到了较好的预测精度,优于基于CARS-PLS和SNVCARS-PLS建立的黏度预测模型,表明基于SPA构建的水性油墨黏度值模型预测效果优于CARS模型预测效果。同时纵向对比表3可以发现,原始全光谱经过SNV最优预处理后,基于特征变量提取算法(SPA、CARS)构建的PLS水性油墨黏度模型的预测性能远远优于不进行预处理的基于原始反射光谱特征波长的预测模型。综上,经过SNV预处理后,基于特征变量算法构建的SNV-SPA-PLS模型预测性能最佳,其中和分别高达0.9954和0.9992,RMSEC和RMSEP分别为0.2570和0.0732,表明利用SPA特征波长提取算法,不仅简化了模型,提高了模型的运算速率,而且显著提高了模型的预测精度。
4 结论
为实现快速无损检测水性油墨的黏度,提出了一种基于可见/近红外光谱技术结合化学计量学预测水性油墨黏度的方法。首先,将采集到的原始反射光谱数据进行预处理;然后,通过比较分析各种预处理方法的去噪效果,分别建立PCR和PLSR黏度预测模型;最后,利用SPA和CARS光谱特征波长提取方法从全光谱中优选出最优特征波长,建立PLS预测模型。结果表明,经SNV预处理后建立的预测模型效果好于其他预处理和基于原始光谱的预测模型;基于特征变量建立的模型效率得到了较大提升,并且预测能力也优于全光谱模型。本研究中SNV-SPA-PLS预测模型显著降低了模型的复杂程度,具有非常好的预测能力,其中,RMSEP为0.0732,表明采用可见/近红外光谱技术结合化学计量学方法建立的水性油墨黏度预测模型是极其可行的,为实现水性油墨黏度在线检测提供了技术基础。