嵌入式心音身份识别系统研究
2011-09-04赵治栋
王 佳,赵治栋
(杭州电子科技大学通信工程学院,浙江杭州310018)
0 引言
心音身份识别是指一种利用人体心音信号进行身份识别的技术,心音是心脏及心血管系统机械运动状况的反映,包含了心脏各个部分本身及相互之间作用的生理和病理信息。因此,心音信号在不同的人身上有着完全不同的特征并且具有极高的稳定性,可以用作生物识别技术的识别特征。心音信号除了很难伪装,伪造及篡改外还具有容易获取的优势,因此人体心音信号可以为一种新型生物识别方法[1]。本文开发了一种基于LabVIEW的嵌入式心音身份识别系统,该系统使用方便灵活,能够实现对用户身份的注册、辨识和确认。
1 心音信号身份识别原理
心音信号用于个人身份识别主要包括两步:特征提取和模式匹配,特征提取是从心音信号中提取到唯一的表现被测者身份的有效且稳定可靠的特征,模式匹配是对训练和鉴别时的特征模式做相似性匹配[2],本文采用基于梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征提取和矢量量化(Vector Quantization,VQ)模型匹配的识别算法设计心音身份识别系统。
MFCC主要运用于说话人识别,它将频谱转化为基于频率的非线性频谱,然后再转换到倒频谱上[3],MFCC特征提取过程如图1所示。
图1 MFCC特征提取算法流程图
对MFCC做适当的改进,即可适用于心音的身份识别。根据心音信号的频域特性,Mel滤波器组截止频率选择为500Hz;由于心音信号具有准周期性,没有语音信号那么强的非平稳性,所以信号的帧长选择为256ms而非语音信号的20ms;MFCC系数选择为32阶,并且心音信号的高阶MFCC系数所含信息更多,加上一阶差分的系数可使信号动态特性强[2]。
VQ是由标量量化推广和发展而来的。标量量化是用若干个离散的数字值来表示每一个幅度具有连续取值的离散时域信号,矢量量化则是将若干个幅度连续取值的时域采样信号分成一组,即构成矢量,然后用若干离散的数字值来表示各种矢量,在模式识别的研究中,需要完成对每一个所要识别的矢量进行分类的任务。基于VQ的心音身份识别模型,相对于其它的识别模型(如高斯混合模型)来说,计算简单,具有实时性[4]。
2 系统实现
2.1 硬件系统实现
本系统硬件由上位机和下位机组成,整体结构如图2所示。上下位机之间通过HC-06蓝牙模组进行通信,HC-06蓝牙模组采用CSR BC04蓝牙技术,内置蓝牙天线,发射功率为Class 2,灵敏度可达-80dBm。
图2 系统整体结构图
下位机以dsPIC数字信号处理器为核心来控制心音信号的采集、放大以及ADC,而后通过HC-06蓝牙模组(从)将心音信号发送到上位机,下位机主要包括模拟电路和数字电路两部分。模拟电路包括心音传感器,30Hz高通、500Hz低通Butterworth滤波器和增益可调节音频放大器。心音传感器由听诊器探头、驻极体话筒和导管组成;Butterworth滤波器都为4阶,选用Sallen-Key结构,该结构可于进行独立的增益设定。增益可调节音频放大器选用LM4811,其CLOCK和UP/DN脚与dsPIC的RG6、RG7脚相连,实现对心音信号放大的控制。数字电路主要是 dsPIC主控芯片和 HC-06蓝牙模组,选用dsPIC33FJ128MC506作为主控芯片,系统时钟设为40MHz,采样频率设为2kHz,波特率设为11.5kbps;模拟信号经其12位ADC转换为数字信号后由UART传输至HC-06蓝牙模组(从)发送。
上位机是以工控主板为核心的终端,对心音信号进行显示、分析、存储和识别。包括HC-06蓝牙模块(主)、TTL-RS232电平转换电路、工控主板以及液晶触摸显示屏,HC-06蓝牙模块(主)接收传输的心音信号通过电平转换电路将TTL电平变为RS232电平;工控主板通过RS232接口连接蓝牙模组(主)完成心音信号的接收工作;液晶触摸显示屏则作为人机交互设备,通过LVDS总线和USB总线与工控主板相连,LVDS总线传输视频信号,USB总线传输触摸信号。
2.2 软件系统实现
选用自行设计的Windows Embedded Standard操作系统,由于它是组件化的XP系统,不需要设计文件系统和开发驱动程序,大大缩短了开发周期和开发难度。独特的增强型写过滤器技术将选定的磁盘I/O重新路由到内存或其它的存储媒体,从而让操作系统认为您的只读存储器是可写的;可定制开机画面和自定义壳作为系统启动的运行Shell,防止人为恶意修改系统配置或是误操作而破坏系统,保证平台稳定和数据安全。
3 心音身份识别软件开发
本文使用LabVIEW虚拟仪器开发基于MFCC特征提取和VQ模式匹配算法的心音身份识别软件,软件设计过程中需要用到NI公司的Database Connectivity Toolkit工具包,Database Connectivity Toolkit提供完整的SQL功能,使用Microsoft ADO技术与大多数常用数据库连接,实现与本地或远程数据库的交互式操作[5]。心音身份识别软件实现3个功能:用户注册、用户辨识和用户确认,每个功能都有独立的功能界面,利用Subpanel实现动态载入界面。
用户注册分为两步:第一步为基本信息的输入存储,包括用户名、年龄、性别等;第二步为采集心音信号,提取其MFCC特征参数,利用LBG算法生成一个最佳码本存储在本地的数据库中。用户辨识是1:N的模式,采集待识别的用户的心音信号,提取MFCC特征参数,与本地数据库中已经存在的所有用户码本进行比较,根据最小平均量化失真度准则,选择最优码本进行匹配。用户确认则是1∶1的模式,首先用户输入已注册的用户名,而后采集待识别的用户的心音信号,提取MFCC特征参数,与用户指定身份的码本进行比较,如果其平均量化失真度小于既定的阈值,则确认其身份。
4 实验结果
用于衡量本系统的性能指标主要有两个:正确辨识率(Correct Recognition Rate,CRR)和相同错误率(Equal Error Rate,EER)。CRR是用户辨识时正确识别的样本占总体样本的比率;而EER是用户确认时错误拒绝率和错误接受率相同时的值,CRR和EER可用来衡量系统的安全性和方便性。
本次实验中,采用上述心音信号身份识别系统对30名同学(20名男生,10名女生)进行了身份注册、辨识和确认,心音信号均采集于心脏的P区。身份注册过程中心音信号采集时间分别为10s、20s、30s、40s和60s,而身份识别过程中心音信号的采集时间则为5s、10s、20s和40s,以上各种情况的CRR如表1所示。EER是在上述CRR最高且注册时间和辨识时间最短,即注册时间为40s,辨识时间为10s的情况下进行分析的,此时身份确认的时间也为10s。
表1 正确辨识率 (%)
针对CRR分析,表1横排代表注册时间,竖排代表辨识时间,从表1中可以看出,注册时间越长识别率越高,但超过40后,延长注册时间CRR已经不会再有明显的提升;理论上讲,辨识时间也是越长越好,但时间越长需要处理的数据量越大,并且会影响整个系统的辨识效率,在保证注册时间长度为40s的情况下,辨识时间为10s即可,延长辨识时间对CRR无任何明显影响。针对EER,在CRR最为理想的情况下进行分析,注册时间为40s,确认时间与辨识时间一样为10s,此时EER为6.67%,即有3个人无法正确确认。经过分析,没有被正确辨识和确认的心音信号中含有较多噪声,心动周期不明显,导致不能被正确确认和辨识结果错误。
今后将研究基于自适应增强技术的心音去噪方案,提高识别算法的鲁棒性;虽然在本次小容量模板实验情况下EER为6.67%,但在大容量模板情况下,为保证EER仍然是一个比较小的值,用户确认模式下的阈值选取将是下一步研究的重点。
5 结束语
本文在MFCC特征提取和VQ模式匹配识别原理的基础上,基于LabVIEW开发了一种嵌入式心音身份识别系统,具有用户注册、用户辨识和用户确认功能。在小容量心音模板下具有较高CRR和较低EER,充分证明了嵌入式心音身份识别技术的可行性,这将为当前社会所面临的各种身份鉴定和信息安全问题提供一种准确率高、防伪能力强的生物识别新设备。
[1] 刘娟,赵治栋.基于心音信号谱分析的身份特征提取算法[J].杭州电子科技大学学报,2010,4(30):181-185.
[2] Phua K,Chen J F,Dat T H.Heart Sound As a Biometric[J].Pattern Recognition,2008,41(1):906 -919.
[3] 赵力.语音信号处理[M].北京:机械工业出版社,2003:45-56.
[4] 陈伯胜.基于VQ和GMM的与文本无关的说话人识别研究[D].重庆:重庆大学,2007:35-44.
[5] 罗保钦,曾庆宁,陈远贵,等.基于LabVIEW的心音信号分析系统设计[J].仪器仪表学报,2009,30(10):110-113.