基于光谱特征约束非负矩阵分解的轮胎橡胶太赫兹混叠光谱分离
2020-12-04殷贤华奉慕霖
殷贤华,刘 昱,奉慕霖,李 安,莫 玮
1. 桂林电子科技大学电子工程与自动化学院,广西 桂林 541004 2. 广西自动检测技术与仪器重点实验室,广西 桂林 541004 3. 国家橡胶及橡胶制品质量监督中心(广西),广西 桂林 541004
引 言
太赫兹波是一种处于红外和微波之间的频率间隙中新兴的振动光谱分析技术, 通常覆盖0.1至10 THz[1]。 在过去的十年里, 该技术已经成为在医学诊断[2]、监测结晶度和多态性[3]以及多组分混合物的定量检测方面的研究工具。 然而, 其研究对象的多为纯净物或者已知组分的混合物白色系统,面对混合物成分完全未知的黑色系统, 如何从未知混合物测得的数据中提取出纯组分的光谱数据就成为进一步探索物理或化学机制的首要任务。 针对此问题,Ma[4]等将自模型曲线分辨法引入太赫兹混叠光谱分解,但是该方法需要知道光谱的一些先验知识进行交互; Gan[5]等将基于纯变量初始化的非负矩阵分解方法应用于太赫兹混叠光谱分解,相较于随机初始化的非负矩阵分解方法,该方法在精度和速度上都有所提高,但是该分解方法缺乏适当的约束,对于三组分混合物的分解结果稍微较差。
轮胎橡胶是由胶料(生胶)和一些加工助剂(硫化剂、防老剂等)组成的多组分混合物。 对于轮胎制造企业,生产轮胎的橡胶及助剂混合物组分都是已知的,属于白色分析体系,对其检测可以防止轮胎生产过程中用错原材料成分而造成轮胎质量问题; 对于轮胎橡胶和助剂检测部门而言,轮胎橡胶及助剂混合物组分则是全部未知或部分已知,属于黑色分析体系或灰色分析体系,对其检测可以知道有效成分是否达标,从而实现对轮胎产品的质量监督检验。 丁腈橡胶(nitrile-butadiene rubber, NBR)具有耐油性好、耐磨性较高的特点,在汽车、航空和石油等行业中得到广泛应用。 2-硫醇基苯并噻唑(MBT)和一硫化四甲基秋兰姆(TMTM)是轮胎橡胶工业中常见的两种橡胶硫化促进剂。 MBT是橡胶工业中广泛使用的硫化促进剂,常常作为其他硫化促进剂的母体原料[6]; TMTM使硫化橡胶拉伸强度偏低,适用于工程车辆。 因此对于丁腈橡胶、MBT和TMTM组成的混合物体系进行光谱解析,对于轮胎产品质量的检测具有重要意义。
针对轮胎橡胶黑色分析体系以及现有方法难以准确对太赫兹混叠光谱进行分离的问题,本工作以丁腈橡胶、MBT和TMTM组成的多组分混合物为研究对象,结合太赫兹光谱曲线特征,将带有连续约束和稀疏约束的非负矩阵分解方法引入到橡胶混合物的太赫兹光谱分离问题上,针对橡胶混合物的混叠光谱问题展开研究。
1 实验部分
1.1 装置
装置采用美国Zomega公司的Z-3透射式太赫兹时域光谱系统和德国的TOPTICA Photonics AG公司的飞秒光纤激光器组成[7]。 飞秒激光器进光功率约为120 mW,脉冲持续时间为100 fs,中心波长为780 nm,重复频率为80 MHz。 本系统主要由THz波辐射源、THz波探测器和时间延迟控制装置组成,系统示意图如图1所示[8]。
图1 透射式THz-TDS原理图
1.2 样品
实验对象为以丁腈橡胶为主要成分,结合硫化促进剂MBT和TMTM组成的二组分和三组分混合物。 丁腈橡胶购于天津明基金泰橡塑制品加工有限公司,其纯度为93.75%,硫化促进剂MBT和TMTM均购于东莞市百亿塑料制品有限公司,其纯度在96%以上,所有实验样品均为固体粉末。 样品制备方法采用压片法,每个样本为厚度约1 mm,半径6.5 mm,重量约为180 mg的圆形样片。 样本压制前后,分别将原材料和压制好的样片放入真空恒温干燥箱中于50 ℃干燥2 h。 每种比例的样片压制6个,采用等梯度法进行浓度配比,其各组分含量的具体比例见表1和表2。
表1 二组分混合物浓度配比信息Table 1 Concentration ratio information of binary system
表2 三组分混合物浓度配比信息Table 2 Concentration ratio information of ternary system
1.3 光学参数提取
THz-TDS检测的主要目标是获得表征材料特征的宏观光学常数,一般包括复折射率、介质损耗、电导率、吸收系数等[9]。 利用透射式太赫兹时域光谱系统在获得参考信号Eref(t)和样品信号Esam(t)后,经过快速傅里叶变换,得到参考信号和样本信号的频域信号Eref(ω)和Esam(ω)。 吸光度表示太赫兹波被材料吸收的程度,其为无量纲的相对量。 使用吸光度来描述样品的吸收特性,可以减少样本厚度不均匀对光谱分析产生的影响。 吸光度的计算公式如式(1)所示[10]
(1)
其中ω为太赫兹波振动的角频率。
1.4 模型评价方法
采用相关系数(correlation coefficient,r)和光谱角(spectral angle,SA)作为模型的评价指标,r表征变量之间线性相关的程度,SA从向量夹角方面比较了光谱在形状上的相似性。 相关系数越大,光谱角越小,说明模型的性能越好。 如式(2)和式(3)所示
(2)
(3)
2 结果与讨论
2.1 光谱分析
通过使用太赫兹透射系统分别对NBR,MBT和TMTM三种纯净物和不同比例组成的混合物样本进行检测,由于实验仪器两侧的信噪比较低,选取包含吸收峰的0.3~1.5 THz波段进行分析。 各样品的太赫兹吸光度谱如图2和图3所示。
图2 NBR,MBT和TMTM纯净物吸光度Fig.2 THz absorbance spectrum of NBR, MBT and TMTM
由图2可知,丁腈橡胶在0.3~1.5 THz频段内存在两个明显的特征吸收峰,分别位于0.99和1.29 THz,防老剂MBT在0.91 THz处有较为明显的特征吸收峰,TMTM在1.01和1.41 THz有两个特征吸收峰。 随着频率的增加,吸光度曲线呈现上升的趋势,其中NBR峰最强,TMTM次之,MBT峰最弱。
图3(a)对应丁腈橡胶和MBT按照不同比例混合而成的二组分混合物吸光度图谱。 从图中可以看出随着MBT含量的降低,0.93 THz处的吸收峰在丁腈橡胶的作用下吸收峰逐渐向高频移动,在1.1~1.5 THz区间内,不同浓度配比的吸收曲线交织在一起,看不到明显的规律; 图3(b)为对应丁腈橡胶、TMTM和MBT按照不同比例混合而成的三组分混合物吸光度图谱。 从图中可以看出,三组分混合物主要在0.93和1.37 THz附近存在两个比较突出的吸收峰,相比于二组分混合物的吸收光谱,三组分混合物的吸收曲线重叠效应更加明显,没有明显的梯度关系,因此有效的混叠光谱分离算法意义重大。
图3 九种不同浓度配比混合物吸光度谱(a): 二组分混合物; (b): 三组分混合物Fig.3 THz absorbance spectrum of ninedifferent concentration mixtures(a): Binary system; (b): Ternary system
2.2 混叠光谱剥离
常规的混合物检测分析中,都是在混合物组分已知的前提下,针对光谱曲线与浓度之间的关系进行建模; 然而,当分析对象为复杂的混合物时,由于光谱重叠或失真的影响,或者当混合物组分完全未知时,面对测得的光谱结果则无法进行有效的光谱解析。 因此,有效的混叠光谱分离算法至关重要。
非负矩阵分解[11](non-negative matrix factorization,NMF),自1999年由Lee和Seung提出以来,被广泛应用在图像处理和模式识别。 本研究结合太赫兹光谱平滑性和矩阵稀疏性的特点,在原始非负矩阵分解的基础上加入特定约束项,利用欧氏距离构造逼近误差的目标函数,实现太赫兹混叠光谱的有效分离,其数学过程如式(4)
W,H,α,β≥0
(4)
使用乘法迭代规则对光谱矩阵和浓度矩阵H进行迭代更新,如式(5)和式(6)
(5)
(6)
由于乘法迭代更新规则对初始矩阵的选择较敏感,随机初始化难以达到要求,所以本文利用Gan提出的基于纯变量初始化方法初始化光谱矩阵和浓度矩阵[5],在利用主成分分析(PCA)确定混合物组分数之后,进行迭代更新,实现混合光谱矩阵的解析。
在进行矩阵分解之前,针对获得的混合物数据矩阵进行主成分分析,通过主成分的方差贡献率来预测混合物组分数。 为消除噪声的影响,减小误差,对表2和表3中每种浓度配比对应制作6个样片,每个样品正反各测三次,对每种浓度配比获得36个光谱数据取平均后得到最终的吸光度光谱矩阵。 针对9组不同浓度配比组成的的数据矩阵进行主成分分析,确定混合物组分数,组分估计如图4所示
图4 基于方差贡献率的纯组分估计(a): 二组分混合物; (b): 三组分混合物Fig.4 A plot of relative contributionversus factor number by PCA(a): Binary system; (b): Ternary system
。
从图4(a)可以看出,第一个主成分的方差贡献率为84.57%,第二个主成分的方差贡献率为12.43%,前两个主成分的方差贡献率累计达到97.00%; 从图4(b)可以看出,前两个主成分的方差贡献率为92.56%,加入第三个主成分的方差贡献率累计达到99.18%。 依照经验,主成分方差贡献率累计达到95%基本可以包含主要信息,所以图4(a)中纯组分数可初步认定为2种,图4(b)中可初步认定纯组分数的种类为3种。
确定混合物纯组分种类数之后,利用基于光谱CNMF,与NMF和PNMF算法进行对比分析,验证本算法的有效性。 其中,利用CNMF方法得到的混合物光谱解析如图5和图6所示。
图5 对二组分混合物使用CNMF的结果(a): 丁腈橡胶; (b): 二巯基苯并噻唑Fig.5 Best resolved spectra of binary systemextracted by CNMF(a): NBR; (b): MBT
经过纯组分数预测和矩阵的初始化后,经过多次迭代,正则化参数和分别取1和0.1时迭代误差最小。 针对二组分混合物进行光谱解析,结果如图5所示,丁腈橡胶和MBT的主要特征吸收峰都能较好的提取出来。 从图5(a)可以看出,丁腈橡胶在0.99 THz处的特征吸收峰可以较好的分离出来,但是由于两物质相互作用的影响,1.29 THz处的吸收峰存在左移的现象; 从图5(b)可以看出,相较于丁腈橡胶,MBT特征吸收峰可以较好的分离出来,且两者的趋势基本一致。 但是在1.1~1.5 THz频段,受丁腈橡胶的影响,MBT产生了两个多余的较弱吸收峰。
图6 对三组分混合物使用CNMF的结果(a): 丁腈橡胶; (b): 二巯基苯并噻唑; (c): 硫化四甲基秋兰姆Fig.6 Best resolved spectra of ternary systemextracted by CNMF(a): NBR; (b): MBT; (c): TMTM
经过纯组分数预测和矩阵的初始化后,经过多次迭代,正则化参数和分别取0.7和0.32时迭代误差最小。 针对三组分混合物进行光谱解析,结果如图6所示,MBT和TMTM的特征吸收峰均可以较好的分离出来,丁腈橡胶的吸收峰分离结果相对存在一些偏差。 从图6(a)可以看出,丁腈橡胶分解的结果和实测结果趋势基本一致,但是受MBT吸收峰的影响,两个主要的吸收峰都存在一定的低频移动; 从图6(b)可以看出,MBT的特征吸收峰可以较好的对应起来,但是受TMTM的影响,在1.45 THz处存在一个较明显的多余吸收峰; 从图6(c)可以看出,TMTM的分离结果和实测结果基本一致,在1.41 THz处的吸收峰存在微弱的高频移动,其主要原因还是三种物质混合物作用的结果,导致分离结果存在一定的偏差。
采用相关系数和光谱角两个评价指标对实验结果做进一步分析,结果如表3和表4所示。
表3 二组分混合物光谱分离结果Table 3 Spectral separation result of binary system
表4 三组分混合物光谱分离结果Table 4 Spectral separation result of ternary system
从表3可以看出,针对丁腈橡胶和MBT分解结果的相关系数和光谱角中,CNMF算法的效果最佳,结果分别为91.21%和0.357,PNMF算法次之,NMF最差; 相较于丁腈橡胶的结果,MBT的分离结果更佳,CNMF算法的相关系数和光谱角分别为96.89%和0.102。 总体而言,CNMF算法效果更好。
如表4所示,丁腈橡胶分离结果的相关系数和光谱角中,CNMF算法最佳,分别为89.33%和0.439,但是由于三组分混合物的复杂性,其结果相较于二组分混合物分离结果有所下降; MBT分离结果的相关系数和光谱角中,PNMF算法效果更佳,分别为92.49%和0.419,然而CNMF算法分离结果与PNMF算法结果较接近,效果相对较好; TMTM分离结果的相关系数和光谱角中,CNMF算法效果最佳,分别为98.88%和0.089。 综合三种物质的分离结果,虽然CNMF在MBT的分解上稍差于PNMF,但是总体而言,CNMF算法效果更佳。
3 结 论
太赫兹时域光谱技术在物质检测的广泛应用,使得未知混合物吸收峰构成的准确解析变得尤其重要。 针对轮胎橡胶的太赫兹混叠光谱问题,提出基于光谱特征约束非负矩阵分解的太赫兹混叠光谱分离方法,分别对丁腈橡胶和MBT组成的二组分混合物,丁腈橡胶、MBT和TMTM组成的三组分混合物进行光谱分离实验。 实验结果表明,相较于NMF和PNMF算法,CNMF方法分离的准确性得到了提升,效果最佳。 本研究较好的遵循了混合物分析中“从整体到局部,先定性后定量”的分析准则,为太赫兹混叠光谱分离提供了更优的方法,也为绿色轮胎的无损、快速检测提供了新的技术参考,具有一定的应用与研究价值。