基于心音信号谱分析的身份特征提取算法
2010-09-04赵治栋
刘 娟,赵治栋
(杭州电子科技大学通信工程学院,浙江杭州310018)
0 引 言
随着交通、通讯和网络技术的飞速发展,人类的活动范围越来越大,使得身份鉴别的重要性变得越来越突出。传统的生物识别的特征主要有指纹,虹膜,视网膜,人脸,声纹,签字,步态等[1,2]。相比于传统的生物识别技术,心音识别技术具有独特的优势:不易被轻易仿制,具备普适性,采集方便。近年来,国内外一些研究人员对心音身份识别进行了研究,并取得了一定进展。将心音序列通过短时离散傅立叶变换的频域方法来分析,证明了采用心音信号进行个人身份识别的可能性[3]。然而,该方法在训练GMM模型时所需的迭代次数较多,当数据量较大时,就会影响工作速度,造成效率低下的问题。基于数字心音序列S1,S2的频域特性的个人身份识别方法,在频域分析前,先要对心音信号进行分段,提取出S1,S2信号[4],但分段过程容易受噪声的影响,带来较大误差。基于MFCC特征的心音信号个人身份识别方法[5]借鉴了MFCC在语音信号中的应用,利用MFCC系数作为特征矢量再结合一定的匹配算法能较好的完成识别任务,但是MFCC不能反映心音信号的动态特性。本文提出了一种基于Welch方法的心音信号谱特征提取算法。将预处理后的信号通过谱分析提取出谱系数,最后根据欧氏距离的方法完成识别任务。与目前已有的心音身份识别特征提取算法相比,该方法计算简单,对心音样本质量要求不高,并且在保证了系统准确性的同时,增强了系统的鲁棒性,极大地增强了系统的实用性。
1 心音信号的预处理
本文采用的心音信号的数据库来源于实测的30个正常人的心音信号,其采样频率为2kHz。心音信号在采集过程中易受外界因素的影响,引入了各种噪声,因此在特征提取前,需要进行预处理,主要的步骤包括去均值、归一化和小波去噪,具体方法如下:
(1)去均值。数据通过处理,使其均值为0。对于初始输入的数字心音信号s(n),设均值为μ,则s′(n)=s(n)-μ;
(2)归一化。把需要处理的数据通过某种算法限制在所设定的范围内。本文将心音信号归一化到[-1,1]的范围内,消除幅度、心率对特征提取的影响;
(3)小波去噪。本文采用硬阈值去噪的方法,基本思想是:当小波系数小于某个临界阈值时,认为该系数主要是由噪声引起的,舍弃;当系数大于这个临界阈值时,认为该系数主要是由信号引起的,那么这部分系数直接保留,然后,新的小波系数通过小波重构得到去噪后的信号。此方法通过以下3步实现[6]。
1)对心音信号做小波变换,得到一组小波系数wj,k;
2)对wj,k用硬阈值函数进行阈值处理,得到估计小波系数w′j,k;
3)利用w′j,k进行小波重构,得到去噪后的信号。
硬阈值函数:
式中,λ是阈值,阈值的选择是小波去噪最关键的一步,实验中选用固定阈值,其中N为小波系数的个数,σ为噪声信号的偏差。心音信号去噪前后对比如图1所示:
图1 去噪前后心音信号对比图
2 基于Welch方法的心音信号谱特征提取
2.1 Welch方法
心音信号是一种非平稳的随机信号,其谱分析指基于一组有限的数据来描述频率成分以及各成分的相对强弱。普通的周期图法估计功率谱密度是先采样得到序列f(n),然后进行离散傅立叶变换,将得到的频谱取绝对值平方,最后进行归一化处理,以保证估计是渐进无偏的。该方法的缺点是方差大,且方差不随采样数目的增加而减小。Welch对普通的周期图法做了改进,减小了估计的方差,改善了估计的信噪比。该方法将采样信号分成不相互叠加的几部分,然后进行平均,分割的段数越多,方差越小。
Welch方法是由Welch提出的对周期图法的修正算法。该算法原理简单,易于理解,便于计算和实现,并且通过一定的处理,能有效地减少频谱泄漏和噪声干扰,提高频谱分析的准确性,是经典谱估计中获得有效应用的一种算法[7]。与周期图法比较,welch法可以改善谱曲线的光滑性,大大提高谱估计的分辨率。其算法步骤如下[8]:
(1)将N点的数据段分成L个小段,每小段M点,相邻小段间交叠M/2点,各段数据有一定的重叠是为了增加段数,减小方差;
(2)各小段加相同平滑窗w(n),做傅里叶变换;
(3)各小段功率谱取平均。
2.2 实验结果和分析
本文采用的心音是实测的30个正常人的心音组成的数据库,采样频率为2 000Hz,量化精度为8bit,实验中对每个人的心音做了两次记录,每次记录10s,其中一次用于训练,另一次用于认证。
选用了Hanning窗作为估计用的平滑窗w(n),窗函数的宽度为200点,重叠率为50%。采用该方法绘制的心音信号频谱如图2-5所示。该频谱分别采用了2个人的5个连续心动周期绘制而成,第一心音信号的频谱如图2,4所示,第二心音信号的频谱如图3,5所示。
据图2-5可以得出,第一心音信号的频谱重合度很高。特别是在频谱的主峰范围内,顶峰的幅值差距在7%以内,峰值所在的频点的浮动在5Hz以内,频谱的波形几乎完全重合。相比较而言,第二心音信号的频谱重合度就差了些,但也基本保持了相似的变化趋势。在特征模板数据库中,将5个心动周期S1、S2信号频谱求平均作为特征模板。5个人的第一心音信号频谱如图6所示,可以得出,对于不同人的心音频谱,其变化趋势完全不同,不论是主峰的范围、顶峰的幅值还是其所在的频点都有很大的差距。
3 匹配算法
从以上实验结果可知谱分布是心音信号谱分析的一个唯一性特征,每个人的心音信号都有其独特的分布,这样就可以根据谱分布的特征,采用欧氏距离来计算谱系数的距离来实现个人身份识别。具体方法如下[4]:
(1)设已知A的第一心音信号频谱为X,待识别的频谱为Y,单条谱线的总频点数为N,第i个频点的幅值分别是Xi、Yi,则有:
(2)若d(X,Y)的值小于阈值T则认为该被测者即为A,否则认为不是。
距离分布图可以用于身份识别。实验选用了10个被测者的5个相邻心动周期,因此,每个被测者都有5个S1,S2信号。这样对于同一被测者要计算出10对距离,两个不同被测者要计算出25对距离。考虑的是一个二维矢量如图7所示,横轴表示S1的距离,纵轴表示S2的距离。在这个直角平面中,同一被测者距离集中在原点附近,而不同被测者的距离远离原点。为了减小因信号的非平稳性引起的误差,图7中采用的是平均距离,o是同一个人的S1,S2信号之间的距离坐标,该坐标的计算是根据同一被测者5个S1,S2信号谱的距离取平均得到,x表示的不同人之间的S1,S2信号之间距离的坐标,该坐标是根据不同人之间的S1,S2信号谱的距离取平均。划出一条分开o和x的直线如图7所示,在进行个人身份识别时将这条直线作为阈值,两个信号之间的距离小于阈值,则认为是同一个人,反之,则不是。实验得出,对于小数据量,很容易根据心音来完成个人身份识别的任务,错误拒绝率FRR和错误接收率FAR都为0。
图2 A的s1频谱
图3 A的s2频谱
图4 B的s1频谱
图5 B的s2频谱
图6 5个不同人的第一心音信号的频谱
图7 S1,S2谱之间的距离分布图
4 结束语
本文提出了提取心音特征的谱分析方法,该方法选用心音的S1,S2谱系数作为识别特征,根据欧氏距离完成身份识别。实验结果显示,在样本量较小的情况下,识别的FRR和FAR都为0,证明了该方法的可行性。需要指出的是实验中采用的样本量较少,当样本量扩大,可以利用主频的范围、峰值点的幅度,S1和S2之间的能量比等作为辅助判别因子增强识别的准确性。按照特征在识别过程中的重要性,设定一个合适的函数,对待识别频谱与样本频谱在这些辅助因子上的相似程度进行量化。综合所有的辅助判别结果的量化值,对欧氏距离匹配算法的判定结果进行纠正,以提高个人身份识别的准确性。
[1] 陈洪京.几种生物识别方法的比较研究[J].河北省科学院学报,2007,24(4):33-37.
[2] JainA K,Ross A,Prabhakar S.An introduction to biometric recognition[C].Michgan:IEEE Transactions on circuits and systems for video technology,2004:4-20.
[3] Phua K,Chen J F,Dat T H,et al.Heart sound as a biometric[J].Pattern Recognition,2008,41(3):906-919.
[4] Beritelli F,Serrano S.Biometric identification based on frequency analysis of cardiac sounds[C].Catania:IEEE Transactions on Information Forensics and Security,2007:596-604.
[5] Beritelli F,Spadaccini A.Human identity verification based on mel frequency analysis of digital heart sounds[C].Santorini-Hellas:International conference on digital signal processing,2009:1-5.
[6] Donoho D L,Johnstone IM.Adapting to unknown smoothness via wavelet shrinkage[J].Journal of American Stat Assov,1995,90(12):1 200-1 224.
[7] 罗敏,刘嵩.基于Welch算法的功率谱估计的实现[J].中国工商大学学报(自然科学版),2007,25(3):58-59.
[8] 张玲华,郑宝玉.随机信号处理[M].北京:清华大学出版社,2003:91-94.