基于红外光声光谱的农作物秸秆导热系数定量分析
2018-07-30黄光群段宏伟何金鸿韩鲁佳
黄光群 段宏伟 何金鸿 韩鲁佳
(中国农业大学工学院,北京 100083)
0 引言
导热系数速测分析对于实现农作物秸秆高效、高值化资源利用具有重要意义。据统计,我国每年可收集利用的农作物秸秆约7亿吨,以其材料化利用为例,近年来,隔热性好、性价比高的新型保温材料成为社会关注的热点。农作物秸秆因其导热性差、强度高、耐腐蚀、吸声好和生产成本低廉等优势,可与石膏、水泥和木材等做成夹心或复合保温材料[1-6]。然而,不同农作物秸秆的导热性不同,其所生成的复合材料隔热保温性能也差别较大。因此,导热性参数的快速准确获取对农作物秸秆制备复合保温材料至关重要。
红外光声光谱技术(Infrared photoacoustic spectroscopy)与传统的热流计法和近红外光谱分析技术相比,因其配备光声探测器,对样品因吸收红外光而产生的振动声波进行测量,基本不受样品颜色、形态等影响,且建模时所需样品少而被广泛应用于粉末状、膜状、纤维状和液态样品(如水果、谷物、土壤和秸秆等)关键指标的定量分析[7-13]。
常用的红外光声光谱建模方法[14]中,线性建模方法偏最小二乘法(Partial least square regression, PLSR)能同时对光谱和化学分析值进行主成分降维,所构建的定标模型稳健性相对较好;非线性建模方法支持向量回归(Support vector regression, SVR)通过引入核函数而具有较好的非线性拟合性能。考虑农作物秸秆组成较为复杂,不同种类间差异较大,有必要在构建农作物秸秆导热系数定量分析模型时进行线性和非线性模型的比较研究。当采用全波段红外光声光谱数据进行定标模型构建时,无信息变量和多重相关性变量可能会对定标模型精度产生影响。因此,需要进行特征变量提取。蚁群算法(Ant colony algorithm, ACA)作为一种新型的仿生类进化算法,具有较强的鲁棒性、分布式计算机制、信息正反馈、启发式搜索和易于实现的优点[15],因此,可将蚁群算法应用于农作物秸秆导热系数红外光声光谱特征波段提取,以提高定标模型精度。红外光声光谱耦合上述先进适用化学计量学方法构建我国主要粮食作物秸秆导热性定量分析模型的相关研究尚未见报道。
本文基于作者所在团队建立的我国农作物秸秆资源样本库,选用我国华北地区具有代表性的小麦、玉米、水稻秸秆样品,探索研究利用红外光声光谱耦合化学计量学方法构建我国主要粮食作物秸秆导热系数定量分析模型的可行性。通过比较分析偏最小二乘(PLSR)和高斯核支持向量机(RBF-SVR)分别构建单一和混合种类秸秆全波段定量分析模型的效果,并将蚁群算法与上述最优建模方法相结合,构建更加优化的我国华北地区小麦、玉米、水稻秸秆导热系数快速定量分析模型,为实现我国农作物秸秆高效、高值化资源利用提供指导。
1 材料与方法
1.1 样品收集与制备
从我国华北地区北京市、天津市、河北省、山西省和内蒙古自治区采集具有代表性的秸秆样品268个,其中:小麦秸秆120个,玉米秸秆119个,水稻秸秆29个。上述样品经粉碎机(WKF-130型,中国)粉碎过40目筛后密封保存备用。
1.2 导热系数测定
采用热特系数测定分析仪(KD2 Pro,美国)测定分析秸秆样品导热性,每个样品测定3次取其平均值[16]。
1.3 红外光声光谱采集
使用傅里叶型红外光谱仪Nicolet-IS50(ThermoScientific公司, 美国)获取待测样品红外光声光谱,配置专用光声附件PA300(MTEC Photoacoustics, 美国)、转子流量计和光声池等。
光谱采集前,以10 mL/s流量氦气吹扫光声池10 s,避免二氧化碳和水汽对样品谱线干扰。为获取最佳的信背比,动镜速率和光谱分辨率分别设为0.158 1 cm/s和0.482 cm-1。同时将单个样品的光谱采集点数和采集次数分别设为10和32,以减少样品基体效应的影响[17]。每间隔2 h重新获取炭黑背景光谱。光谱采集时,扫描器按照设定路径逐点扫描,并依次获取每个点在4 000~500 cm-1波段的光谱信息,扫描完成后将最终获取的10个点的平均光谱作为该样品光谱。
1.4 数据处理与模型构建
红外光声光谱数据分析与处理采用光谱软件OMNIC9.7-IS50(ThermoScientific公司, 美国)、Matlab 7.8(MathWorks公司,美国)和Origin 9.1(OriginLab公司,美国)。利用面积归一化法对获取的代表性秸秆样品红外光声光谱进行预处理,以校正由光程差引起的光谱差异。基于PLSR和SVR两种算法,分别构建单一和混合种类秸秆的全波段线性和非线性定标模型,并对比优选出较优建模方法。利用蚁群算法和优选建模方法相结合进行特征光谱提取,以构建最优的小麦、玉米、水稻和混合秸秆导热系数红外光声光谱定量分析模型。
1.5 模型效果评价
2 结果与讨论
2.1 样品导热系数分析
如表1所示,3种农作物秸秆和混合种类秸秆样品导热系数涵盖范围较广,表明样本具有良好的代表性。按照导热性的大小隔二选一进行分级,各分集和全集统计指标值接近,分集较为合理[20-21]。
表1 代表性农作物秸秆建模分集样品导热系数统计分析Tab.1 Statistics of thermal conductivity values of main crop straw samples in calibrations and validations
2.2 红外光声光谱分析
图1为小麦、玉米和水稻秸秆的平均红外光声光谱。由于农作物秸秆中纤维素、半纤维素和木质素相互铰链形成特殊的维管束结构,并且结晶纤维素能够在秸秆表面形成蜡质层外膜,使得导热系数相对较低。
图1 小麦、玉米和水稻秸秆平均光谱Fig.1 Average spectra of wheat stalk, corn straw and rice straw
表2 农作物秸秆光声光谱特征峰解析Tab.2 Photoacoustic spectra’ characteristic peaks of main crop straw samples
2.3 基于PLSR和RBF-SVR的全波段模型
基于所获取的代表性农作物秸秆样品红外光声光谱,应用PLSR和RBF-SVR算法,分别构建小麦、玉米、水稻和混合秸秆导热系数的线性和非线性定量模型,结果如表3所示。其中LVs为潜变量因子数,c和g分别为损失函数和核函数参数。
表3 PLSR和RBF-SVR建模结果比较Tab.3 Comparison of results of PLSR and RBF-SVR models
对于小麦秸秆,当选用的潜变量因子数(LVs)为8时,其PLSR模型效果达到最优,验证集的RMSEP和RPD分别为0.011 W/(m·K)和1.99;此时,RBF-SVR最优模型的RMSEP和RPD分别为0.009 4 W/(m·K)和2.33,对应的建模参数c、g为1.41、0.004。
对于玉米秸秆,当采用与水稻秸秆相同的建模参数时,其RBF-SVR最优模型的RMSEP和RPD分别为0.018 W/(m·K)和2.01,对应的PLSR模型的RMSEP和RPD分别为0.017 W/(m·K)和2.12,此时所选用潜变量因子数为5。
对于水稻秸秆,当参数c、g为0.5、0.003 9时,RBF-SVR最优模型的RMSEP和RPD分别为0.007 9 W/(m·K)和5.5,对应的PLSR最优模型的RMSEP和RPD分别为0.012 W/(m·K)和3.79。
对于混合种类秸秆,当潜变量因子数为4,建模参数c、g为1、0.003 9时,其PLSR和RBF-SVR模型效果均达到最优,对应的RMSEP和RPD分别为0.015 W/(m·K)、2.06和0.017 W/(m·K)、1.82。基于PLSR所构建模型效果优劣顺序为:小麦秸秆、水稻秸秆、混合秸秆、玉米秸秆;基于RBF-SVR所构建模型效果优劣顺序为:水稻秸秆、小麦秸秆、混合秸秆、玉米秸秆。由此可见,尽管所有秸秆混合后建模样本量增大,但是混合模型效果并未得到提升,原因可能是不同种类秸秆导热系数的特征光谱差异较大,当进行混合建模时,不同种类秸秆的特征信息可能存在相互干扰,从而降低了模型效果。然而,与PLSR模型结果相比,小麦和水稻秸秆的RBF-SVR模型的RMSEP值均较小,玉米和混合秸秆的RBF-SVR模型的RMSEP值均较大。结果表明,小麦和水稻秸秆RBF-SVR非线性模型效果更优,玉米和混合种类秸秆的PLSR线性模型效果较优。但是,仅小麦和水稻秸秆导热系数定标模型可用于实际定量分析,原因可能是全波段光声光谱中存在大量无信息变量和多重相关性变量,对建模效果和预测精度产生干扰。
2.4 基于蚁群算法的模型优化
将蚁群算法和上述最优建模方法相结合用于小麦、玉米、水稻和混合秸秆的红外光声光谱特征信息提取,建模结果如表4所示。
对于小麦秸秆,当建模参数c和g分别为5.66和0.003 1时,蚁群算法提取200个特征变量所构建的ACA-RBF-SVR模型效果达到最优,其RMSEP和RPD分别为0.007 8 W/(m·K)和2.81。对于玉米秸秆,当采用150个特征变量进行ACA-PLSR模型构建时,其RMSEP和RPD分别为0.015 W/(m·K)和2.41。对于水稻秸秆,蚁群算法提取的最佳特征变量数为200,其所构建的ACA-RBF-SVR模型的RMSEP和RPD分别为0.005 9 W/(m·K)和7.39。对于混合秸秆,当特征变量数和潜变量因子数分别为350和4时,最优的ACA-PLSR模型的RMSEP和RPD分别为0.014 W/(m·K)和2.15。分析可知,与全波段模型效果相比,特征波段模型效果均较优(如图2所示),表明蚁群算法能够有效提取不同种类秸秆红外光声光谱中的有效建模信息。
图2 基于蚁群算法的PLSR和SVR建模散点图Fig.2 Plots of PLSR and SVR models based on ACA
在所构建的4种最优定量分析模型中,小麦、玉米和水稻单一种类秸秆模型的RPD值均大于2.25,而混合秸秆模型的RPD值低于2.25。结果得出:与混合秸秆相比,单一种类农作物秸秆分别与先进适用化学计量学方法相结合所构建的红外光声光谱定量模型,在快速分析导热系数方面具有可行性和推广应用前景。但对混合秸秆不适用,其模型精度有待进一步提高。
3 结束语
选用我国华北地区具有代表性的小麦、玉米、水稻秸秆样品,对比研究了偏最小二乘和高斯核支持向量机分别构建单一和混合种类秸秆全波段定量分析模型的效果,研究发现,小麦秸秆和水稻秸秆导热系数RBF-SVR非线性模型,以及玉米秸秆、混合种类秸秆的PLSR线性模型效果较优。进一步应用蚁群算法与上述最优建模方法相结合,构建了更加优化的小麦秸秆、玉米秸秆、水稻秸秆和混合种类秸秆导热系数模型。研究结果表明,红外光声光谱技术结合先进适用的化学计量学方法分析我国主要粮食作物秸秆导热系数具有良好的可行性和推广应用前景。