乙醇浓度预测的多元线性回归模型建立及验证
2021-12-23肖雄亮陈长明
肖雄亮,陈长明
〈红外应用〉
乙醇浓度预测的多元线性回归模型建立及验证
肖雄亮,陈长明
(湖南信息学院 电子科学与工程学院,湖南 长沙 410151)
设计了由光源、气室、探测器和控制器等组成的非分散红外吸收系统,往气室内通入不同浓度的多组分气体(含有乙醇、二氧化碳和水蒸气),采用红外光谱仪进行光谱数据采集,得到多组分气体混合光谱图。根据数据集样本求解回归系数,建立了多元线性回归模型,并进行干扰修正以降低二氧化碳和水蒸气对乙醇浓度预测的影响。对建立的多元线性回归模型进行评价,结果表明:模型真实有效且具有良好的线性回归效果,可以用于预测气体浓度,乙醇、二氧化碳和水蒸气浓度预测误差均在可接受的范围之内,其中乙醇浓度预测误差最小,不超过2.0×10-4。通过干扰修正尽可能排除二氧化碳和水蒸气的干扰,能够较准确地预测乙醇浓度。
多元线性回归模型;乙醇浓度预测;非分散红外技术;干扰修正
0 引言
非分散红外技术(non-dispersive infrared,NDIR)是一种基于气体吸收理论的检测手段,具有检测精度高、稳定性好且对待测样本无损害等优点,适用于单一组分气体和多组分气体浓度检测[1-4]。二氧化碳、甲烷等气体的吸收系数较高,浓度检测相对容易,而乙醇的吸收系数较低且易挥发,其浓度检测较为困难。不同于其他气体,乙醇通常与二氧化碳、水蒸气等混合存在,例如人饮酒后呼出的气体属于多组分气体,含有乙醇、二氧化碳、水蒸气等单一组分气体。由于水蒸气具有红外全谱吸收的特性,加之二氧化碳的吸收系数较高,而乙醇的吸收系数较低,二氧化碳和水蒸气的吸收特性对乙醇浓度检测产生干扰,这给乙醇浓度检测造成很大困难。
乙醇浓度检测近年来受到较多关注,国内外学者针对乙醇的吸收特性开展了一系列的研究,证实了傅里叶光谱分析技术和可调谐半导体激光吸收光谱技术可以检测乙醇浓度[5-8]。然而,这两种技术检测条件严苛且易受干扰。NDIR具有良好的稳定性和鲁棒性,抗干扰能力相对较强,已被用于一氧化碳、甲烷、二氧化硫、二氧化碳等气体浓度检测,并能够得到较为理想的结果[9-12]。虽然NDIR尚未直接用于乙醇浓度检测,但相关研究结论表明NDIR检测乙醇浓度具有良好的可行性。鉴于乙醇浓度易受二氧化碳和水蒸气等的干扰,单纯进行NDIR检测很难实现较准确的检测。笔者通过对乙醇与其他干扰组分的浓度检测数据进行分析,结合多元线性回归(multiple linear regression,MLR)算法建立多元线性回归模型,然后进行干扰修正和校准以降低干扰组分对乙醇浓度的影响,实现乙醇浓度较准确的预测。
1 NDIR原理和算法
为了实施NDIR,设计了非分散红外吸收系统,由光源、气室、探测器和控制器等组成,如图1所示。该系统原理是:光源发出的红外光经调制后穿过气室,气室内充满多组分气体(含有乙醇、二氧化碳和水蒸气)。在此过程中,光强信号被一定程度吸收,吸收后的光强信号穿透特制滤光片,被探测器接收转换为电压信号。电压信号的强弱反映了多组分气体的吸收情况,通过控制器进行数据处理后,得到多组分气体的浓度。
假设多组分气体中含有种单一组分气体,根据红外吸收特征和吸光度的加和性,采用公式(1)可以得到多组分气体的总吸光度:
式中:total表示某一波段下多组分气体的总吸光度;A表示多组分气体中第种单一组分气体在此波段的吸光度;表示多组分气体中第种单一组分气体在此波段的吸光系数;表示多组分气体中第种单一组分气体的浓度;表示多组分气体吸收光程。
需要说明的是,乙醇的浓度是基于比尔-朗伯红外吸收理论得到,可以用公式(2)表示:
式中:表示乙醇的吸光度;0表示红外光源光强;表示吸收后的光强;表示乙醇浓度;表示乙醇吸收光程;为比例常数。
2 MLR算法和干扰修正
非分散红外吸收系统中采用特制滤光片,该滤光片的不同波段用于检测多组分气体中的单一组分气体。假设多组分气体含有乙醇、二氧化碳和水蒸气3种单一组分气体,那么滤光片的不同波段对应不同通道,依次命名为通道0、通道1、通道2。由于每个通道的总吸光度是一系列吸光度的叠加,那么3个通道可建立MLR方程组:
式中:Atotal0、A total1、Atotal2分别表示乙醇、二氧化碳、水蒸气的总吸光度,可以根据电压信号直接得到;Ai0、Ai1、Ai2分别表示乙醇、二氧化碳、水蒸气在通道i的纯吸光度,为待求解的未知量。根据数据集样本求解回归系数,进而建立多元线性回归模型。采用建立的多元线性回归模型求解方程组得到乙醇、二氧化碳和水蒸气3种单一组分气体的浓度,然后进行干扰修正和校准得到准确浓度。图2所示为MLR算法和干扰修正流程。
3 实验与分析
3.1 信号通道选取
往气室内通入3种不同浓度的多组分气体,采用精密流量计控制气体浓度,并采用红外光谱仪进行光谱数据采集,其中光谱分辨率为1cm-1,波数范围为700~4500 cm-1。实验时依次通入不同浓度的气体,实验后通入氮气净化气室排除残留气体干扰。第一种多组分气体中乙醇所占比重远高于二氧化碳和水蒸气,第二种多组分气体中二氧化碳所占比重远高于乙醇和水蒸气,第三种多组分气体中水蒸气所占比重远高于乙醇和二氧化碳。之所以控制多组分气体中单一组分气体的浓度,目的是获取乙醇、二氧化碳和水蒸气的特征吸收谱图并对比干扰条件下每种单一组分气体的吸收状况,便于信号通道选取。
图3所示为某浓度下多组分气体的吸收谱图,明显可见乙醇、二氧化碳和水蒸气的特征吸收峰,参考HITRAN数据库并通过分析吸光度,选取通道0(3.45mm)作为乙醇信号通道,通道1(4.26mm)作为二氧化碳信号通道,通道2(2.70mm)作为水蒸气信号通道。
3.2 回归系数计算
在室温和一个标准大气压条件下,分析3种不同浓度的多组分气体,求解乙醇、二氧化碳和水蒸气在各个通道的吸收系数,进而得到每种单一组分气体在通道0、通道1和通道2的响应系数。在95%置信度条件下,各个通道的响应系数估值及置信区间如表1所示。
图3 某浓度下多组分气体的吸收谱图
表1 各个通道的响应系数估值及置信区间
3.3 多元线性回归模型验证
对建立的多元线性回归模型进行评价及回归方程显著性检验,结果如表2所示。其中,2表示回归模型决定系数,表示统计量,表示统计量的概率值,2表示误差方差的估计值。与显著水平(设定为0.05)比较可知值落在拒绝域,所以回归方程是显著的。通道0、通道1和通道2回归模型决定系数2分别为0.9932、0.9846、0.9901,都非常接近于1,表明建立的多元线性回归模型具有良好的线性回归效果。
表2 回归模型评价参数
为了验证建立的多元线性回归模型有效性、干扰修正及理论计算的正确性,定量分析干扰条件下每种单一组分气体的吸收状况,对3种不同浓度的多组分气体中乙醇、二氧化碳和水蒸气浓度分别进行预测。利用滤光片的不同波段对应不同通道干扰修正后的吸光度直接反演气体浓度,得到乙醇、二氧化碳和水蒸气浓度预测值,并将预测值与实测值对比得到预测误差。3种多组分气体相关成分浓度的预测值与真实值对比、预测误差情况分别见图4~图9。
图4、图6、图8分别为乙醇浓度预测值与实测值对比、二氧化碳浓度预测值与真实值对比、水蒸气浓度预测值与真实值对比,图5、图7、图9分别为乙醇浓度预测误差、二氧化碳浓度预测误差、水蒸气浓度预测误差。由图4、图6和图8可知,乙醇浓度预测值、二氧化碳浓度预测值和水蒸气浓度预测值与实测值都非常接近,这表明理论计算正确并且建立的多元线性回归模型真实有效,可以用于预测气体浓度。由图5、图7和图9可知,乙醇浓度预测误差绝对值不超过2.0×10-4,二氧化碳浓度预测误差绝对值不超过3.0×10-4,水蒸气浓度预测误差绝对值不超过5.0×10-4,均在可接受的范围之内,其中乙醇浓度预测误差最小。这表明通过干扰修正尽可能排除二氧化碳和水蒸气的干扰,能使乙醇浓度预测误差控制在合理范围内,证实了建立的多元线性回归模型干扰修正效果良好,预测结果较准确。
图4 乙醇浓度预测值与实测值对比
图5 乙醇浓度预测误差
图6 二氧化碳浓度预测值与实测值对比
图7 二氧化碳浓度预测误差
图8 水蒸气浓度预测值与实测值对比
图9 水蒸气浓度预测误差
对乙醇浓度样本数据进行误差分析,得到误差评价参数如表3所示。其中,MSE(mean square error)表示样本均方误差,MAE(mean absolute error)表示样本平均绝对误差,MAPE(mean absolute percentage error)表示样本平均绝对百分比误差,MSPE(mean square percent error)表示样本均方百分比误差,RMSE(root mean square error)表示样本均方根误差,SSE(the sum of squares due to error)表示样本误差平方和。理想的预测模型应具有较低的MSE、MAE、MAPE、MSPE、RMSE和SSE。由表3可知,将干扰修正后的吸光度用于反演乙醇浓度,乙醇浓度预测样本的误差评价参数都较低,进一步证实建立的多元线性回归模型能够较准确地预测乙醇浓度。
4 结论
1)利用自行设计的由光源、气室、探测器和控制器等组成的非分散红外吸收系统,通过光谱数据采集得到多组分气体混合光谱图,进而确定了乙醇、二氧化碳和水蒸气信号通道。并通过分析3种不同浓度的多组分气体,根据数据集样本求解回归系数,建立了多元线性回归模型。
2)建立的多元线性回归模型真实有效,乙醇浓度预测值、二氧化碳浓度预测值和水蒸气浓度预测值与实测值都非常接近,且预测误差均在可接受的范围之内,乙醇浓度预测误差最小,不超过2.0×10-4。通过干扰修正尽可能排除二氧化碳和水蒸气的干扰,并将干扰修正后的吸光度用于反演乙醇浓度,能够较准确地预测乙醇浓度。
[1] 张珅, 王煜, 赵欣, 等. 基于NDIR开放光路CO2浓度测量的标定方法研究[J]. 仪表技术与传感器, 2020(3): 100-104.
ZHANG Shen, WANG Yu, ZHAO Xin, et al. Research on calibration method of CO2concentration measurement based on NDIR open optical path[J]., 2020(3): 100-104.
[2] Muller M, Graf P, Meyer J, et al. Integration and calibration of non-dispersive infrared (NDIR) CO2low-cost sensors and their operation in a sensor network covering Switzerland[J]., 2020, 13(7): 3815-3834.
[3] Dinh T V, Lee J Y, Ahn J W, et al. Development of a wide-range non-dispersive infrared analyzer for the continuous measurement of CO2in indoor environments[J]., 2020, 11(10): 1024.
[4] 张施令, 李京伟. 基于NDIR技术的高压组合电器中CF4气体检测方法研究[J]. 高压电器, 2019, 55(7): 158-164.
ZHANG Shiling, LI Jingwei. Research on CF4gas detection method in GIS gas chamber based on NDIR technology[J]., 2019, 55(7): 158-164.
[5] 邓波, 庞小锋. 乙醇在静磁场作用下的傅里叶红外光谱研究[J]. 激光与红外, 2008, 38(2): 141-144.
DENG Bo, PANG Xiaofeng. Study on the infrared spectra of ethanol under action of static magnetic field[J]., 2008, 38(2): 141-144.
[6] GENG H, LIU J G, ZHANG Y J, et al. Ethanol vapor measurement based on tunable diode laser absorption spectroscopy[J]., 2014, 63(4): 043301.
[7] GAO H, XIE L, GONG P, et al. Detection of ethanol using a tunable interband cascade laser at 3.345mm[J]., 2018(8): 303-309.
[8] 耿辉, 刘建国, 张玉钧, 等. 可调谐半导体激光吸收光谱法测量空气中乙醇蒸气[J]. 光学学报, 2014, 34(8): 315-321.
GENG Hui, LIU Jianguo, ZHANG Yujun, et al. Measurement of ethanol vapor in air with tunable diode laser absorption spectroscopy[J]., 2014, 34(8): 315-321.
[9] 孙友文, 刘文清, 汪世美, 等. 非分散红外多组分气体检测技术及其在CEMS中的应用[J]. 红外, 2011, 32(5): 23-26.
SUN Youwen, LIU Wenqing, WANG Shimei, et al. Non-dispersive infrared multi-component gas analysis technology and its application in CEMS[J]., 2011, 32(5): 23-26.
[10] 凌慧娇, 陶胜康, 林雨倩, 等. 非分散红外法测定烟气中二氧化硫常见问题的探讨[J]. 现代盐化工, 2020(3): 27-28.
LING Huijiao, TAO Shengkang, LIN Yuqian, et al. Discussion of common problems in analyzing sulfur dioxide by non-dispersive infrared method[J]., 2020(3): 27-28.
[11] Mikuta R, Silinskas M, Bourouis R, et al. Characterization of non- dispersive infrared gas detection system for multi gas applications[J]., 2016, 83(7-8): 410-416.
[12] WU Y Z, SHI Z H. The design of the test chamber that offers environmental conditions to detect non-dispersive infrared gas concentration[J]., 2014(602-605): 2285-2289.
Establishment and Verification of Multivariate Linear Regression Model for Prediction of Ethanol Concentration
XIAO Xiongliang,CHEN Changming
(,,410151,)
A non-dispersive infrared absorption system comprising a light source, gas chamber, detector, and controller is designed, and multi-component gases of different concentrations (including ethanol, carbon dioxide, and water vapor) are injected into the chamber. An infrared spectrometer is used to collect the spectral data, and amulti-component gas mixture spectrum isobtained. A multiple linear regression model is established based on the regression coefficients of the dataset samples, and interference correction is performed to reduce the effect of carbon dioxide and water vapor on the concentration of ethanol. The established multiple linear regression model is evaluated, and the results indicate that the model is reliable and effective with a good linear regression effect. The model can be used to predict the gas concentration, and the prediction errors of ethanol, carbon dioxide, and water vapor concentration are within an acceptable range. The prediction error of ethanol concentration is the minimum, which is less than 2.0×10-4. The interference of carbon dioxide and water vapor can be mostly eliminated through interference correction. Importantly, the ethanol concentration can be predicted more accurately.
multiple linear regression model, prediction of ethanol concentration, non-dispersive infrared, interference correction
O432
A
1001-8891(2021)12-1228-06
2021-02-07;
2021-05-01.
肖雄亮(1978-),男,副教授,主要研究方向:机械自动化控制、智能算法等。E-mail:teacher_xiao410@126.com。
湖南省教育厅科学研究重点项目(20A347)。