基于自发性脑电信号身份识别的方法
2017-09-28王一薄华
王一,薄华
(上海海事大学信息工程学院,上海 201603)
基于自发性脑电信号身份识别的方法
王一,薄华
(上海海事大学信息工程学院,上海 201603)
研究一种基于自发性脑电信号的身份识别方法,采用小波变换的方法对脑电信号高效预处理,快速提取脑电信号的时域和频域特征(自回归滑动平均模型系数及功率谱密度),对BP神经网络算法和K近邻算法分类的结果进行比较。实验结果显示,我们的方法在一定的范围内,K近邻分类正确率高达94.21%,但耗时较长,而BP神经网络识别率略低,其分类耗时仅为0.18秒,进一步证明了在个体身份的识别中,自发性脑电信号可作为一种独立的生物特征进行应用。
脑电信号;身份识别;预处理;特征提取
0 引言
身份识别是保证公共和信息安全的重要前提,比较传统的识别方法包括证件、智能卡片、钥匙、专属密码等,但是,传统的方法可能会出现遗失、伪造或者被破解的问题。目前,伴随着对脑电信号进行持续的深入探索,研究表明在一定时间内,它具有相对稳定、不易伪造或者被破解的特点。TouYama等人提出通过使用脑电信号的P300电位作为工具,对个体身份进行辨识,具体如下。受试者随机抽取照片,然后对选定相应的照片来对他们进行刺激,每个受试者的刺激目标都不同,实验结果得出识别率在77.2%到97.6%之间[2]。M.Poulos研究团队对样本库中的4个人的脑电信号进行分类识别,采用学习矢量量化神经网络法,识别的准确率在72%到78%之间[2]。由此可见,通过诱发性脑电信号来进行身份识别的研究有其实际的可行性,但是,在国内关于脑电信号在身份识别中的研究,特别是在普适环境下,其相关研究成果还是相当匮乏的。我们通过自回归滑动平均(Auto Regressive Moving Average,ARMA)模型对自发性脑电信号(EEG)进行建模,分别提取脑电信号的时域和频域上的特征,最后放入相应的分类器中对个体进行身份判断。
1 脑电身份系统框架
建立使用者的信息和脑电数据特征库,记录和存储用户的脑电信号作为样本。如图1脑电信号身份识别系统分为如下四步:
(1)在安静的环境下收集受试者的脑电信号;
(2)对脑电信号进行预处理,剔除与噪声相关的信号,保留脑电中有用的成分;
(3)分别从时域和频域上提取脑电信号特征。
(4)通过分类器,对采集到的受试者脑电信号的特征来匹配在数据库样本中的脑电特征,从而识别匹配受试者的信息[3]。
图1 脑电身份识别系统框图
2 脑电信号的采集和噪声处理
2.1 脑电信号的采集
我们实验数据均采用NeuroSky公司生产的便携式单电极脑电采集设备采集得到。该设备通过蓝牙连接,设备包含一个位于前额处的电极,以及一个置于左右两侧耳垂的接地电极。耳机与电脑相连,将接收到的脑神经信号转换成电脑可以识别处理的数字信号。该设备输出频率是512 Hz,采集到的脑电数据为有符号整型数值,以.mat格式存储。采集过程中,测试者不能进行剧烈的思维或者肢体运动,尽量要保持双目闭合,情绪稳定。
2.2 噪声来源
脑电中干扰信号的来源:眼电、心电、肌电、工频干扰、电极松动、出汗。其中,眼电(眼睛的眨动)的主要频域范围为0-16Hz,幅度为50 μV-1 mV[4]。工频噪声来源于日常电器产品中的电磁感应和电阻容性耦合,工频干扰的频域为50/60Hz。肌电是在采集脑电的过程中,被测试人员一些微小的面部以及肢体的动作会产生频率范围在1-100 Hz肌电信号[5]。
2.3 噪声处理
第一步是脑电数据的采集和截取,然后对截取后的信号进行带通滤波、小波阈值剔除噪声。脑电信号的幅度一般是 50 μV-100 μV,但是最大会达到 200 μV,我们将阈值设定的是200 μV[6]。通过对后期特征进行分析得出,阈值的截取取决于时间的长度,截取的EEG数据需要取连续60s(60×256个釆样点)的时间。由于EEG是非平稳信号,在频域上,EEG信号很容易受到其他瞬态信号的干扰(如眼电)[7],我们通过小波变换的方式把所产生干扰信号在频率上进行不同尺度的分解和重构,具体如下:
(1)用高阶小波和离散小波对眼电噪声干扰的时间进行检测,见图2;
(2)在确定的眼电噪声的区域中,把一维平稳小波变换及DB7,当做基础函数来应用,见图3;
(3)选取合理的阈值,在眼电的标记区域里,利用小波变换分解出第一步中的脑电信号各个频率的分量;
(4)利用一维小波逆变换(ISWT)获得EEG降噪后较纯净的信号。
3 特征提取
我们的身份识别系统主要用到AR模型系数及功率谱密度两类特征。
自回归滑动平均(Auto Regressive Moving Average,ARMA)模型为一个线性时不变系统,当阶数趋于无穷时,任意一个有限方差的ARMA过程都与一个AR过程是等价的,它相当于一个无限全极点响应冲激滤波器[8],用差分方程表示如式(1):
图2 Haar小波检测并标记眼电噪声
图3 小波去除区域内眼电
式(1)是比较常见的数学模型,通常用来描述复杂的不规则的EEG。(1)式中e(n)代表独立同分布的白噪声,是该模型的激励信号;{x(n)}代表离散随机过程,在我们中是一个脑电信号,代表其线性响应;C为常数;P为AR模型的阶数;AR的模型系数可以由唯一的一组a1… ap。a1… ap表示出来,这样,AR系数可以确定出相应的脑电信号,因此,AR系数可以作为脑电信号在时域上非常重要的特征,在其使用过程中,人们一般只需计算出AR参数即可。
从时域上,我们可以通过AR参数来对脑电信号进行描述,但它在频域上的特性也是我们关心的问题。在随机离散过程中,功率谱密度表示在不同频带上它的能量变化及具体分布[9],这是在脑电波信号一类研究中,常见且典型的特征。下面介绍本实验用到AR参数谱估计法。
AR参数谱估计法是现代功率谱估计法的代表。在线性时不变系统中,离散的时间信号输入x(n)信号和输出信号y(n)的功率谱密度关联如式(2):
在上述的线性时不变模型中,x(n)可作为方差是σ2、均值是0,独立同分布的白噪声输出的响应[10]。同时σ2代表输入的信号功率谱密度Sx(ω),AR的传递函数关系如式(3):
相应的模型频率响应函数是:
所以脑电波信号的功率谱密度从(5)式可以估算出。在这里用只需用Burg算法获得模型参数ak,k=1,…,p 即可。
图4为对个体脑电信号采用Burg AR参数谱估计法(19阶)的实验结果,频带范围为[5Hz,32Hz]。在下图中,红绿两条线分别表示两位受试者在不同时间收集的八条EEG数据所获得的功率谱密度(Power Spectral Density,PSD)PSD特征。显然,即使4条数据采集自不同时段不同状态,同一受试者的不同条特征曲线走势基本一致,这表明每个人的脑电信号在一定时间内会维持其特征,各个个体特征曲线的波峰位置和尾部波动等能量分布状况是不一样的,这又说明每个人的EEG具有类间差异特性。本实验中的身份识别系统把Burg AR作为其功率谱密度特征,同时为了增加其细节分辨率需要对功率谱进行对数处理。由于AR模型避免了窗函数的影响,Burg谱估计法求得的PSD曲线比较平滑。
图4 两位不同受试者Burg AR功率谱密度
我们首先对脑电信号进行预处理,采用19阶AR模型系数和49阶Burg AR功率谱密度[5Hz,30Hz]特征矢量相互结合的方法。如果分类过程采用所有特征点,其计算量相当庞大复杂,所以在获取特征以后如图5所示,特征矢量的降维可以通过线性判别(LDA)方法进行[11],把高维特征矢量投影到最优鉴别矢量空间中,这样既有效降低了特征维度,也得到最小类内距离及最大类间距离。
图5 脑电波识别系统框图
我们使用10折交叉验证的方法对计算分类结果:即将已建立的数据库的数据平均分为10份,选择将其中9份轮流作为训练数据,1份作为测试数据,进行试验。将10次的结果的正确率的平均值当作对算法精度的估计,之后进行多次10折交叉验证,接着计算出平均值。此外,其分类正确比例可以表示为公式(6),式中aii代表第i个人分类到第j个人的次数。
通过特征数量判断BP神经网络输入层数量,如果身份识别中,EEG数据所提取个体的特征是N个,那么神经网络输入层数量同样是N个[12]。此外,在BP网络输出层数量方面,主要通过个体种类判断。比如,受试者为20名,用M表示,假设采用二进制表示要5位,那么其输出层数量是5个。一般情况下,通过使用H=sqrt(N+M)+Q计算出所隐藏层节点数量。在上式中,H代表隐藏层节点数量,Q代表1至10间的整数,一般情况下依据经验选用或者通过反复实验才能确定。我们可知,MATLAB中的神经网络工具箱能够实现BP神经网络算法。
相比于其他分类方法,K邻近算法不仅简单,而且识别率非常高。在分类过程中,通常先比较待识别样本和训练集数据,接着经运算后获得未知样本和己知种类训练样本间的距离,寻找K个相距最近样本,由这些样本中出现次数最多的种类可得到判别结果。此外,K可以为任意整数,如果K为1,分类器将会退化到最近邻判决法[13],即比较待识别者所反映出的数据和库中所收集的所有种类样本,同时将其认定为与它相距最近样本所在种类。找到距离最近的K个样本,如式(7)欧几里德距离,我们中将设置K=1,与待识别人的脑电特征矢量距离最小的样本的标签即是识别结果。
4 测试结果
我们采集20个受试者的脑电信号,所有的被测试者都是20到28岁的健康青年,30天内无服用任何药物。受试者安静闭眼时,脑电信号由单电极便携式脑电采集仪记录,采样率为512Hz,时长为60秒,每四秒对特征进行一次运算,同时时间窗的重叠为两秒左右。如果脑电的时间达到m秒时长,那么其分类次数为(m-2)/2次。假设,PDF(i,j)表示分类结果向量的概率密度函数,即:
最终,式(8)中如果j使得PDF(i,j)最大,则认为某位受试i为j。
由上文可知,PDF及S所使用的数据往往不同,其中对于所有脑电数据,每进行一次脑电识别,都产生一个PDF函数。所不同的是,S主要面向全部脑电信号识别系统,每进行一次试验,将只获取一个分类正确比例。
我们分析对比了BP神经网络和K邻近(K=1)算法,在下表1中对比它们在身份识别时的正确比例及所消耗的时间。
表1 BP神经网络与K邻近算法比较
5 结语
选择滤波与阈值小波相结合的方法,对20位个体的脑电信号的进行去噪,取得了良好的预处理效果,同时提取脑信号的时域和频域的特征进行分析,比较了两种分类器,K邻近分类正确率高达94.21%,但耗时较长,BP神经网络识别率为90.4%,其分类耗时只有0.18s。经过研究被试者脑电的判断正确率及误判率之后,发现其正确分类率均高达90%以上,进一步证明了自发性脑电信号是可以用以作为个体身份识别领域未来的发展方向。
参考文献:
[1]Palaniappan R.Mandic D P.EEG Based Biometric Framework for Automatic Identity Verification.The Journal of VLSI Signal Processing,2007,49(2):243-250.
[2]Palaniappan R.Method of identifying individuals using VEP Signals and Neural Network.IEE Proceedings Science,Measurement and Technology,2004,151(1):16-20.
[3]王亮,胡卫明,谭铁牛等.基于步态的身份识别[J].计算机学报,2003,26(3):353-360.
[4]Wardzinski R.Emerging biometrics:EEG-based identity 2008,1:4118-21.
[5]林江凯.脑—机接口中运动想象脑电信号的特征提取和分类方法研究[D].重庆大学,2010.
[6]李金瑞.基于图像的金属表面直接标记条码的质量评价和信息增强[D].山东大学,2014.
[7]朱丽敏.基于希尔伯特黄变换和源定位的精神分裂症MEG分析与识别研究[D].南京邮电大学,2016.
[8]王佳威.脑电波信号的处理方法与应用[D].北京邮电大学,2015.
[9]马静.干涉高光谱图像高效压缩技术研究[D].西安电子科技大学,2009.
[10]付海涛.基于循环平稳的单信道时频重叠信号分析[D].电子科技大学,2010.
[11]叶洪雨.基于收缩LDA的ERP成分分类研究[J].哈尔滨师范大学自然科学学报;2014年02期.
[12]邹清.基于AR模型的脑电信号特征提取与识别[D].中南大学;2008年.
[13]张志国.时间序列分析在导弹结构模态识别中的应用[J].四川兵工学报,2014,35(3):122-125.
[14]张金颖.动态口令身份认证方案的研究与实现[D].西南交通大学,2006..
Research on Electroencephalograph(EEG)Based Biometrics
WANG Yi,BO Hua
(College of Information Engineering,Shanghai Maritime University,Shanghai 201603)
Proposes an identification method based on EEG signal in a certain range,uses the method of wavelet transform is to process the electrical signals efficiently,rapid extraction of EEG at the time domain and frequency domain features(Auto Regressive Moving Average and Power Spectral Density),and the BP neural network algorithm and K recently nearby comparison,at the same time,K neighboring classification accuracy as high as 94.21%recently,but takes longer,and the BP neural network recognition rate is only slightly lower,its classification takes just 0.18 seconds.It is further evidence that the spontaneous EEG signal can be used as an independent biometric mode applied to the identification of individual identity.
1007-1423(2017)23-0022-05
10.3969/j.issn.1007-1423.2017.23.005
王一(1991-),男,硕士研究生,研究方向为模式识别与图像处理薄华(1971-),女,博士,副教授,研究方向为模式识别与图像处理
2017-05-08
2017-08-10
Electroencephalograph;Identity;Pretreatment;Feature Extraction