APP下载

纳通道内λ-DNA过孔信号的小波去噪及统计分析

2013-09-17中华云飞

关键词:过孔层数小波

王 霏 倪 中华 陈 云飞 刘 磊 马 建 毕 晨

(东南大学江苏省微纳生物医疗器械设计与制造重点实验室,南京 211189)

纳通道内λ-DNA过孔信号的小波去噪及统计分析

王 霏 倪 中华 陈 云飞 刘 磊 马 建 毕 晨

(东南大学江苏省微纳生物医疗器械设计与制造重点实验室,南京 211189)

针对λ噬菌体中的脱氧核糖核酸(λ-DNA)通过纳米通道时的过孔信号噪音大,强度弱且非平稳的缺点,提出了使用具有良好时频域分辨能力的小波分析方法对其进行去噪处理,并对有效去噪后的λ-DNA过孔信号进行了统计分析.首先根据小波去噪原理,选择合适的小波函数,确定最佳的分解层数并选取合适的阈值,对实验采集到的含噪声信号进行去噪处理.根据最终去噪效果可得,以sym7为小波基函数、分解层数5层、使用默认软阈值可以有效降低信号中的噪声,提高信噪比.然后,对具有48 000个碱基对(48 kbp)的λ-DNA通过60 nm氮化硅(SiN)纳米孔的特征信号进行了统计分析,分析结果表明,阻塞电流和过孔时间分别符合双峰高斯分布和偏正态分布,这为后续DNA分子的辨识工作提供了依据.

纳米通道;λ-DNA过孔信号;小波去噪;信噪比;统计分析

利用纳米通道(nanopores)研究DNA等生物大分子的结构是一种崭新的生物技术[1],而对纳米通道内的检测信号进行分析是研究生物大分子结构的基础.作为基于微纳制造的第三代基因测序系统中基础理论研究工作的一部分,本文采用膜片钳记录nA级甚至pA级[2]的λ-DNA通过氮化硅纳米孔的离子电流信号,由于有效信号相对于噪声信号很微弱,分析的准确度较低,因此需要对检测到的λ-DNA信号先去噪再分析.

信号处理中常用的去噪方法包括Fourier分析、短时 Fourier变换、Wigner-Ville 分布等[3],其中基于Fourier分析的方法只能使用在信号和噪声频带重叠部分非常小或者完全分开的情况下,对于纳通道内微弱、非平稳信号,Fourier分析方法有一定的局限性.小波分析是一种时间窗和频率窗都可以改变的时频局域化分析方法,即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率[4].信号和噪声在小波变换下表现出截然不同的性质,它能更准确地得到信号上特定点的奇异性信息[5].

目前国内外关于纳通道λ-DNA检测信号去噪的研究,主要是根据噪音产生机理在实验过程中进行去噪.在氮化硅膜片上涂PDMS可以有效降低高频噪音,实验前用水虎鱼溶液对纳米通道进行表面化学处理可以有效降低低频噪音[6].郑华等[7]在对电泳荧光信号去噪时使用了小波分析的方法,季忠等[8]也运用小波变换对微弱非平稳脑电信号成功去噪.

本文根据实验信号的特点,采用小波去噪的方法,去除λ-DNA微弱电信号中的噪声信号,获取有效的二次数据,为准确识别其分子结构提供可靠的数据.小波去噪处理后,根据λ-DNA在纳米通道输运过程中微弱电流脉冲信号的变化,即信号的驻留时间和幅度,对过孔信号的阻塞电流(Ib)以及过孔时间(td)进行了统计分析,为今后DNA分子测序中的信号分析以及大分子辨识工作奠定基础.

1 小波去噪

1.1 原理

小波变换是Fourier变换思想的发展与延拓.Mallat算法利用小波变换将信号分解成不同的频段成分,信号C经过离散小波分解可获得在不同尺度下的带通项,如图1所示.其中,Di(i=1,2,…,n)为信号中的高频部分,称作细节信号,分解次数越多,高频的成分越少.Ai(i=1,2,…,n)为信号中的低频部分,称作近似信号.

实际应用中,有用信号通常表现为低频的或者一些比较平稳的信号,而噪声则通常表现为高频的或者一些非平稳的信号.对小波分解后的高频部分进行去噪处理,再将信号重构,得到需要去噪后的信号,一般过程如下:

图1 小波分解示意图

1)信号的小波分解.选择确定的小波基函数和小波分解层数N,对信号进行N层小波分解.

2)高频系数的阈值量化.选择一个阈值量化准则,对每一个分解层次中的高频系数进行阈值量化处理.

3)小波重构.根据阈值量化后的第1层~第N层的高频系数和第N层的低频系数进行小波逆变换,重构去噪后的信号.

1.2 效果判定

信噪比(SNR)和最小均方误差(MSE)是判断去噪效果的依据.信噪比越大,均方误差越小,去噪效果越好.要得到理想的去噪效果,需要选择合适的小波基函数,确定最佳的分解层数并选取合适的阈值.对某一信噪比的含噪声信号,分别改变所取的小波基函数、分解层数和阈值取法,通过大量的对比仿真实验找到最好的去噪方法.然后再对不同信噪比的含噪声信号进行去噪处理.

1)信噪比SNR

2)均方误差MSE

式中为原始信号的功率;为原始信号中噪声的功率;f(n)为原始信号;(n)为去噪后的信号.

1.3 λ-DNA实验信号去噪

图2为λ-DNA在氯化钾溶液中通过60 nm氮化硅纳米孔时用膜片钳记录的离子电流信号.采样频率为 50 kHz,采样点数为 2.5 ×105.

1.3.1 小波基函数的确定

由于小波分析中的小波基函数具有多样性,在λ-DNA电流信号去噪过程中,主要从经过小波变换处理后所获得信号曲线不失真的角度来选择小波基函数.

图2 λ-DNA通过氮化硅纳米孔的电流信号

通过在Matlab7.1中对纳通道内的过孔信号进行仿真,发现采用symN和dbN函数进行小波去噪处理后,信号的峰形良好,且这2种小波基函数的性质也较好.因此,本文采用信噪比和最小均方误差来确定最佳小波基函数.

对实验信号在默认软阈值下进行5层分解,比较不同小波基函数的去噪效果(见表1).由表可知,对λ-DNA电流信号,sym7小波基函数的信噪比最高,均方误差最小,所以sym7为最佳小波基函数.

表1 使用不同小波基函数的去噪效果

1.3.2 分解层数的确定

分解层数是决定去噪效果的重要因素,需要根据实际信号的特点确定.本文中,将信号分解层数设置为1~8.比较不同分解层数去噪后的效果,结果见图3.可以明显看出,分解层数越多,去噪效果越好;但分解层数超过5层后,改善效果不是太明显,且信号会出现失真.所以本文确定分解层数为5层.

图3 不同分解层数L的去噪效果图

1.3.3 阈值的选取

噪声是一种随机信号,其方差是未知的,首先要对其阈值进行估计.经过小波分解后,信号的系数要大于噪声的系数,但可以找到一个合适的数值作为阈值.当分解系数小于该临界阈值时,认为主要是由噪声引起的,因此可将噪声截掉;当分解系数大于该临界阈值时,认为主要是由信号引起的,可以保留该分解系数.

表2为3种不同阈值量化处理方法的信噪比和均方误差.由表可知,使用各层不同阈值去噪,虽然消噪效果最明显,但峰高误差较大,信号失真较严重,所以最后确定使用默认阈值消噪为λ-DNA消噪的阈值量化处理方法,去噪前后信号对比见图4.

表2 3种不同阈值选取方法的消噪效果

本文针对λ-DNA在氯化钾溶液中通过纳米孔时产生的电流信号的特点,对小波基函数、分解层数和阈值进行了研究.结果表明,选择sym7为小波基函数,分解层数为5层,使用默认软阈值,去噪处理后,信噪比提高,峰高误差较小,便于开展后续的信号分析工作.

图4 默认阈值消噪效果图

2 信号统计分析

从图2的实验信号中可以看出,电流幅度有一系列的下降,这是由于单个λ-DNA分子在电场力的作用下穿过纳米通道时会形成阻塞,导致通道内离子电流减小.由于核酸链上各碱基尺寸和分子结构的差异,在穿孔过程中对孔的阻塞程度也不同,因此在一定实验条件下,通过分析阻塞电流Ib和过孔时间td来监测电流信号的变化,能够推测出生物大分子的化学组成、空间结构等特性.

图5为λ-DNA(48 kbp)在1 V电压下通过60 nm的SiN纳米通道时,拉直状态(nonfolded)、半折叠状态(partially folded)、折叠状态(fully folded)3种类型特征事件的信号[9],分别表示λ-DNA分子以不同姿态通过纳米通道.由于纳米孔厚度相对于λ-DNA分子长度要小很多,故过孔时间只考虑λ-DNA的长度.理论上拉直状态的λ-DNA过孔时,物理占位较小,由此引起的电流降也较小,同时,由于拉直状态的λ-DNA长度较长,因此过孔时间也会相应较长;同理,折叠状态的λ-DNA引起的电流降幅度较大,且过孔时间变短;半折叠状态的λ-DNA的电流降和过孔时间均应该位于前两者之间.从图5(a)的半折叠状态信号形态可以看出,信号明显有2个电流降水平(虚线处),这证明了DNA通过纳米通道时先是折叠状态后是拉直状态,由此可以判断此类信号为DNA半折叠状态的过孔信号.

图5 λ-DNA(48 kbp)通过60 nm SiN纳米通道电流信号统计分析

从大量事件中对阻塞电流和过孔时间进行了统计,得到的阻塞电流Ib的统计直方图(见图5(c))、过孔时间td的统计直方图(见图5(d))以及特征事件的阻塞电流对过孔时间的散点分布图(见图5(b)).由于半折叠状态的事件发生概率很低,数目较少,不易统计得到分布规律,故本文重点统计分析了其余2类事件.图5(b)中的每个散点表示一个λ-DNA过孔事件,由此可以看出拉直和折叠2种状态的过孔信号Ib和td分布,从而可以计算得到其平均阻塞电流分别为(1.237 1±0.226 3)nA和(2.140 9±0.352 1)nA;平均过孔时间分别为(0.497 1±0.251 2)ms和(0.376 6±0.226 5)ms.

对直方图的高斯拟合可以反映统计数据的实验意义[10].图5(c)为Ib统计直方图,图中的双峰分别表示了拉直和折叠2个状态的过孔信号.对其进行双峰高斯拟合,结果证明这2种信号的阻塞电流各自符合高斯分布.图5(d)为td的统计直方图,由于2种信号的过孔时间差异在0.1 ms左右,因此没有明显的双峰,整体符合偏正态分布.

阻塞电流包含了大分子的尺寸和结构信息,而过孔时间反应了大分子在纳米通道内运动的快慢,过孔时间越长采集到的大分子信息越多,更容易大分子辨识工作[11].

3 结语

本文提出了采用小波去噪的方法消除纳通道中微弱电信号中的噪声,并对膜片钳采集的48 kbp λ-DNA通过60 nm SiN纳米孔的含噪声信号进行去噪处理,确定了合适的小波基函数、最佳的分解层数和合适的阈值.对去噪后的信号进行分析,分辨出3种不同状态的过孔信号,并对拉直状态和折叠状态的λ-DNA信号进行了统计和拟合,得到其阻塞电流和平均过孔时间的分布图.

[1]Gupta P K.Single-molecule DNA sequencing technologies for future genomics research[J].Trends Biotechnol,2008,26(11):602-611.

[2]刘振伟.实用膜片钳技术[M].北京:军事医学科学出版社,2006.

[3]高清清,贾民平.基于EEMD的奇异谱熵在旋转机械故障诊断中的应用[J].东南大学学报:自然科学版,2011,41(5):998-1001.

Gao Qingqing,Jia Minping.EEMD method based singular value spectral entropy in fault diagnosis of rotating machinery[J].Journal of Southeast University:Natural Science Edition,2011,41(5):998-1001.(in Chinese)

[4]吴伟,蔡培升.基于MATLAB的小波去噪仿真[J].信息与电子工程,2008,6(3):220-222.

Wu Wei,Cai Peisheng.Simulation of wavelet denoising based on MATLAB[J].Information and Electronic Engineering,2008,6(3):220-222.(in Chinese)

[5]郑华,王立强,石岩,等.DNA测序信号去噪分析的一种新方法[J].光谱学与光谱分析,2008,28(5):1126-1129.

Zheng Hua,Wang Liqiang,Shi Yan,et al.A novel analyzing method for the signal denoising of DNA sequencing[J].Spectroscopy and Spectral Analysis,2008,28(5):1126-1129.(in Chinese)

[6]Tabard-Cossa V,Trivedi D,Wiggin M,et al.Noise analysis and reduction in solid-state nanopores[J].Nanotechnology,2007,18(30):1-6.

[7]郑华,石岩,汪洁,等.DNA测序电泳荧光信号的小波去噪分析[J].光学仪器,2007,29(2):17-21.

Zheng Hua,Shi Yan,Wang Jie,et al.Analyzing the wavelet denoising of electrophoresis fluorescence signals for DNA sequencing[J].Optical Instruments,2007,29(2):17-21.(in Chinese)

[8]季忠,秦树人.微弱生物医学信号特征提取的原理与实现[M].北京:科学出版社,2007.

[9]Schneider G F,Kowalczyk S W,Calado V E,et al.DNA translocation through graphene nanopores[J].Nano Lett,2010,10(8):3163-3167.

[10]Tsutsui M,Taniguchi M,Yokota K,et al.Identifying single nucleotides by tunnelling current[J].Nature Nanotechnology,2010,5:286-290.

[11]Lagerqvist J,Zwolak M,di Ventra M.Influence of the environment and probes on rapid DNA sequencing via transverse electronic transport[J].Biophysical Journal,2007,93(7):2384-2390.

Wavelet denoising and statistical analysis of signal of λ-DNA translocation through nanopores

Wang Fei Ni Zhonghua Chen Yunfei Liu Lei Ma Jian Bi Chen

(Jiangsu Key Laboratory for Design and Manufacture of Micro-Nano Biomedical Instruments,Southeast University,Nanjing 211189,China)

To overcome the shortcomings that the signal of λ-DNA translocation through nanopores has high-noise,weak-strength and non-stationary,a wavelet analysis method with excellent resolution capabilities in time and frequency domain is proposed to analyze the signal of λ-DNA translocation.A statistical analysis is applied to the λ-DNA signal after effective denoising.First,according to the principle,suitable wavelet base function and the best decomposition level are chosen,and the denoising threshold is determined.The results indicate that by using sym7 wavelet base function,decomposition level at 5 and using default soft threshold the noise in the signal can be reduced effectively and the signal to noise ratio(SNR)can be improved.And then,the characteristic current signals,which arise from λ-DNA molecules of 48 kbp translocating through silicon nitride nanopores of 60 nm are statistically analyzed.The analysis results show that the current blockade and translocation time correspond to bimodal and skewed normal distribution respectively,which provides basis for subsequent DNA molecular identification.

nanopores;signal of λ-DNA translocation;wavelet denoising;signal to noise ratio;statistical analysis

TH776

A

1001-0505(2013)01-0050-05

10.3969/j.issn.1001-0505.2013.01.010

2012-05-12.

王霏(1986—),女,硕士生;倪中华(联系人),男,博士,教授,博士生导师,nzh2003@seu.edu.cn.

国家重点基础研究发展计划(973计划)资助项目(2011CB707601,2011CB707605).

王霏,倪中华,陈云飞,等.纳通道内λ-DNA过孔信号的小波去噪及统计分析[J].东南大学学报:自然科学版,2013,43(1):50-54.[doi:10.3969/j.issn.1001-0505.2013.01.010]

猜你喜欢

过孔层数小波
倾斜排列差分过孔间串扰抑制方案
填筑层数对土石坝应力变形的影响研究
上海发布药品包装物减量指南
构造Daubechies小波的一些注记
面板过孔设计对聚酰亚胺液扩散的影响
基于MATLAB的小波降噪研究
MoS2薄膜电子性质随层数变化的理论研究
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
TFT-LCD过孔接触电阻研究
住在哪一层