APP下载

紫外光谱细菌检测的数据研究方法综述

2020-11-02董英龙

发明与创新·职业教育 2020年10期

董英龙

摘 要:细菌是对人类生活有着重大影响的双刃剑生物,其快速、高检测极限对食源性传染性疾病的防护与控制是不可或缺的。本文首先介绍了紫外光谱检测细菌的基本原理,然后综述了紫外光谱的预处理方法与特征拾取方法,包括最小二乘法,偏最小二乘法,标准正态变量变换法,Savitzky-Golay卷积平滑法,连续投影法,二维相关分析法,并对此6种方法进行分析,最后对紫外光谱在细菌检测领域进行展望。

关键词:紫外光谱;细菌检测;特征拾取

一般来说,紫外光谱是紫外和可见光谱(Ultraviolet and Visible spectrum),简写为UV两个字母,也被称作紫外可见光吸收光谱。紫外光分别为远紫外区间与近紫外区间。要研究此波长区的吸收光谱只能在真空中去完成,因此,对实验设备要求较高,技术难度很大,暂时在有机物分子定性定量实验中用途较小。来测定物质成分结构等信息被称为紫外可见光光谱法。

一、紫外光谱检测的原理与朗伯比尔定律

朗伯比尔定律的全称为布格-朗伯-比尔定律。皮埃尔·布格是法国造船工程之父,一名优秀的大地测量学家,在1729年的论文《从光到光梯度光学实验》中,首次讨论了光线通过一定范围内大气层时损失的能量,最早提出了朗伯比尔定律的雏形。1760年,德国数学家约翰·海因里希·朗伯在论文中阐述了不同物质对光的吸收程度与吸收介质厚度之间的数学关系。1852年,德国数学家、物理学家奥古斯特·比尔又提出光的吸收程度和吸光物质浓度也具有类似关系,并在1854年出版《高级光学启蒙》一书。三人研究经过结合得出了现在的朗伯-比尔公式,公式如下式1-1:

公式中的A为吸光度,也就是光通过物质后(一般为气体液体)的被吸收程度,是射入光强度I0比出射光强度I的对数,T为透射比,也被称为透光度。K为摩尔吸光系数,它是物质本身的固有属性,只与吸收物质的物理性质与入射光的波长λ有关。C为吸光物质的浓度,单位为mol/L,b为吸收层厚度,单位为cm。

二、紫外光谱细菌检测数据处理方法

(一)最小二乘法

1806年,一位在法國默默无为的数学家,阿德里安-马里·勒让德独立发明了最小二乘法,由于翻译问题,它也叫做最小平方法,他在基于随机误差的情况下,提出了让总体的误差的平方和最小为我们需要的真值,公式为下2-1:

通过校正每一条光谱来得到我们需要的真实光谱,是检测细菌的最常用算法。

(二)偏最小二乘法

在蛋白组学及代谢组学等高通量数据分析中,由于我们所知道的信息较少,导致我们知道的自变量数目大于方程数,也就是未知数大于方程个数,这是将无法直接使用传统的统计分析模型。1983年由S·伍德等人提出的偏最小二乘法(也被称为偏最小二乘法回归)解决了这一问题,该算法在近几十年得到了飞速发展。具体的想法是首先把矩阵X与Y都标准化,设驻的第一个主成分为p1,Y的第一个主成分为q1,两者都经过了单位化。这一步看起来和典型关联分析是一样的,但是这里的p和q都有主成分的性质。然后求主成分的投影,我们的平均值(期望)是方差最大。最后优化目标的协方差Cov(u1,v1)。再引入拉格朗日算子如下公式2-2:

最后多次迭代映射分解,但是最终组合起来,仍然是一个Y与X的线性回归Y=XB+F,最后得到我们想要的精度,但是增加了计算量。

(三)标准正态变量变换法

在各种光谱预处理方法中,平滑处理结合多元散射校正(MSC)或标准正态变量变换(SNV)的效果是最好的。该方法主要是消除固体颗粒大小,表面散射以及光程变化对漫反射光谱的影响。公式如下式2-5:

根据2-5式我们可以看出,首先要求出原始光谱减去光谱的平均值,再比上该光谱值的标准差的值。式中Xi,j表示为第i个与第j个光谱的数据。

(四) Savitzky-Golay卷积平滑法

用Savitzky-Golay方法进行平滑滤波,可以提高光谱的平滑性,并降低噪音的干扰。Savitzky-Golay卷积平滑关键在于矩阵算子的求解。

设滤波窗口的宽度为n=2m+1,各测量点为x=(-m,-m+1,0,1,…m-1,m)采用k-1次多项式对窗口内的数据点进行拟合。公式如下2-6:

此公式结合了最小二乘法与多项式近似求解法,由于是低通滤波,所以可以很好的减小紫外光谱的高频噪声。

(五)连续投影法

连续投影算法(SPA)可以筛选出有效波长,也就是实验所需要的特征值,是紫外光谱细菌检测的重要方法。它是一种类似通过向前正反馈的方式选择需要的波长,选出波长后计算循环中在其余波长留下的投影长度,以此来选择出我们需要的特征波长。选出投影最大的波长后再以最大的投影作为投影量进行循环,直到筛选出其他冗余波长,找出光谱的更多特征。

(六)二维相关分析法

二维光谱技术指用一个低频率的扰动(如温度、压强、光学等)作用在样品上,更好地引起光谱中特征值的变化来找出光谱中的特征值。其实验原理如下图2-1:

体系受外扰引起的动态光谱如下式2-7:

但是在绝大多数情况下,我们选用的是光谱的平均值如下式2-8:

然后把时域中的光谱转化到频域中,对2-8式做傅里叶变换得到式2-9,以及共轭形式2-10如下式:

对以上两光谱进行交叉分析,得到一个广义的二维相关光谱如式2-11:

在多数据时,计算傅氏变换是比较麻烦的,此时可以选用希尔伯特(Hilbert)变换更为简便。二维相关光谱技术可以很好的找出光谱特征,但是增加了实验的复杂性和计算的难度。

三、总结

细菌准确快速地检测是十分必要的,2020年6月14日出现了喜茶、奈雪的茶菌落数严重超标的问题,2018年美国也发生多起沙门氏菌感染事件,食品安全事件近些年频发,细菌的快速检测更应该受到重视。紫外可见光谱法快速的算法如最小二乘法算法,标准正态变量变换法,可以用在精度要求不是太高的场合,其余四种算法可以根据实际情况进行选择符合需要的场合。

参考文献

[1] 胡永翔,刘蓉,张雯,等.二维相关光谱分析在无创血糖检测特异性研究中的应用[J].光谱学与光谱分析,2017,37(2):491-496.