APP下载

基于稀疏编码的手指心电信号身份识别算法*

2017-02-18赵治栋孙淑强

传感器与微系统 2017年2期
关键词:欧氏电信号心电

林 娟, 赵治栋, 孙淑强

基于稀疏编码的手指心电信号身份识别算法*

林 娟1, 赵治栋2, 孙淑强2

(1.杭州电子科技大学 通信工程学院,浙江 杭州 310018;2.杭州电子科技大学 电子信息学院,浙江 杭州 310018)

研究了心电(ECG)信号在身份识别中的应用,提出了基于过完备字典下稀疏编码的手指心电身份识别认证算法。在预处理阶段,对ECG信号进行预处理消噪,去除心电信号里的噪声、基线漂移和心率变异的干扰。在特征提取阶段,提取单周期心电信号构成特征向量并构建字典模型,用核奇异值分解(KSVD)训练成冗余字典,然后对每一部分特征向量进行稀疏编码,实现在该字典上的稀疏表示。在分类识别阶段,利用得到的稀疏系数矩阵构建特征模板向量作为特征参数。通过欧氏距离匹配输出个体身份信息,实现个体身份识别认证。通过两个手指心电信号数据库对该算法进行了性能测试,获得了较高的识别率。

手指心电信号; 稀疏编码; 稀疏系数矩阵; 欧氏距离

0 引 言

心电信号(ECG)是人类较早研究并应用于医学临床的生物电信号之一,从不同层面上反映了心脏的生理和病理状态,在临床心诊断中得到了广泛应用。近年来越来越多的专家学者把目光投到了用ECG进行身份识别上,它最早由Biel L等人[1]在2001年提出,利用ECG的波形信息(振幅,斜率,特征点之间的时间距离等)作为特征实现了个体的身份识别。随着半导体、微电子和集成电路技术的发展,无需导电胶的小体积、低功耗和易集成心电采集芯片已经出现,ECG的采集方式也从多导联到单导联,从胸、四肢到手指等的拓展。

2008年,Chan A D C等人[2]采用两个Ag/AgCl按钮电极从50受测者的手指上采集90s的心电信号,检测出QRS波群,最后通过残差百分比、相关系数、基于小波的距离测量等完成分类识别,识别率分别为75 %,82 %,95 %;2012年,Lourenço等人[3]利用Ag/AgCl干电极从32个受测者的手指上采集心电信号,滤波后检测出QRS波群进行分割、时间和幅值归一化得到标准心电信号,取5个连续的分割后的心电信号的平均波作为模板,分别通过最近邻分类器和支持向量机完成识别,识别率为93.75 %和90.63 %;2013年,Silva H P等人[4]在Lourenço等人[3]工作基础上,首次提出将分割后的心电信号送入异常值去除系统剔除异常心跳,然后通过支持向量机完成识别;2014年,Silva等人[5]将Ag/AgCl干电池和Electrolycra电极分别放置于手掌上和手指上成功采集到心电信号,并将采集到的信号收集于CYBHi数据集中。

本文提出了一种基于冗余字典下稀疏编码的心电身份识别方法,实验证明用本文方法得到的身份识别率高达98.333 %。

1 手指心电身份识别算法

稀疏编码是一种模拟哺乳动物视觉系统主视皮层V1区简单细胞感受野的人工神经网络方法,该方法具有空间局部性、方向性和频域的带通性,是一种自适应的图像统方法,目前,稀疏编码方法在盲源信号分离、语音信号处理、自然图像去噪及特征提取和模式识别等方面已取得了很好的进展,本文提出了一种基于冗余字典下稀疏编码的心电身份识别方法,通过对心电信号进行稀疏表示之后得到的稀疏系数对测试者的身份进行分类识别。

本文算法流程图如图1所示。

图1 基于超完备字典下稀疏编码的手指心电身份识别算法流程图

对心电信号进行特征提取之前,需要先进行去噪、R点检测及单周期划分,得到一系列的单周期手指心电波群,然后对其进行取平均,得到平均单周期的归一化心电信号,最后对信号进行稀疏编码得到稀疏系数作为特征值用欧氏距离匹配算法进行分类识别。

1.1 基于单周期信号特征向量K-SVD算法

稀疏的数学定义为:一个信号中仅有的少数采样点为非零的,而其他采样点都为零,则这个信号是稀疏的[7]。1993年,Mallat S G和Zhang Z[8]提出了信号在冗余字典上分解的思想。稀疏表示使得信号的很多重要信息只集中在少量原子上,然后用这些少量原子线性表示测试者的心电信号,求出其稀疏系数,这些非零系数对应的原子揭示了信号的特征。

字典是稀疏分解的基础,其性质直接影响稀疏分解的效果, 2005年Aharon M等人[9]提出了一种K-SVD算法,为稀疏表示设计过完备字典,在K-SVD算法训练得到的字典基础上,通过稀疏分解去除图像中存在的零均值高斯白噪声。

本文提出用基于单周期信号特征向量的K-SVD字典学习方法,正交匹配跟踪(orthogonal matching pursuit,OMP)稀疏编码,这些算法常用于压缩感知和图像去噪方面[10],ECG信号在去噪之后,在采样率为1 000 Hz时,信号以R点为中心进行分割,分别向前向后各取200个点和399个点,这样可以得到一系列长度为m(m=600)的单周期信号,把这些一系列单周期信号特征向量作为样本集,初始化冗余字典。整个算法可分为两步,首先是稀疏编码(sparse co-ding):固定字典D,通过目标函数(1)采用OMP匹配追踪算法找到样本的最佳稀疏矩阵;然后字典更新(dictionary update):按列更新字典,依据是MSE最小的原则,通过奇异值分解(SVD)循序的更新每一列和该列对应的稀疏系数矩阵的值

(1)

本文中稀疏系数模型可以描述为

y=Dα=[d1,…,di,…,dN][α1,…,αi,…αN]T

(2)

式中y∈Rm×1为一测试单周期信号,D为训练字典,由N个训练信号的单周期波形组成,di=[di1,…,dik]∈Rm×k为第i训练个体的所有k段单周期训练信号,dij为第i个训练个体的第j段单周期波形,α为待求的稀疏解,αi=[αi1,…,αik]∈R1×k为第i个人的稀疏系数。对于任意一段测试信号yi可近似的由该训练字典中的原子线性组合而成,即

yi=Dα+ε=d11α11+…+dikαik+,…,+dNkαNk+ε

(3)

理性情况下,通过稀疏算法求得的稀疏解α=[α11,…,αi1,…,αik,…,αNk]T中,只有与第i类个体相对应的稀疏不为零,其他的系数αjk(j≠i)全为零或者接近于零,即测试信号由相对较大的那一部分稀疏值线性表示。

为了减少稀疏编码的运行时间,可以通过降维技术将训练字典和测试信号分别进行降维处理,以减少数据中的冗余信息。本文采用主成分分析(principal component analysis,PCA)降维的方法对原始数据进行简化,训练数据经过PCA降维处理之后,维数大大降低,减少了手指心电身份识别时间。

任选CYBHi数据库中的55个测试者进行稀疏分解,训练时长18 s,通过去噪、单周期提取以及PCA降维后组成特征向量,通过KSVD以及OMP进行稀疏分解之后,分解结果如图2,图3所示。

图2 同一个人不同心跳信号的稀疏系数

图3 不同人心跳信号的稀疏系数

由图2和图3可以看出,心电信号经过OMP稀疏分解之后得到的稀疏系数大部分为零,仅有少数的几个值接近于1,稀疏效果很好,而且同一个人即使不同心跳信号经过稀疏分解之后得到的稀疏系数也很相近,而不同的人稀疏分解之后得到的稀疏系数值有很大差异,这样测试信号就可以由训练字典和非零的稀疏系数值线性表示,从而实现个体的身份识别。

1.2 欧氏距离匹配算法

欧氏距离(Euclidean distance)也称为欧几里得度量、欧几里得距离,它是在m维空间中两个点之间的真实距离,在二维空间中欧氏距离就是两点之间的直线段距离。本文由上节步骤得到稀疏系数矩阵组成的特征向量作为分类器的特征,用欧氏距离为度量函数,当输入的手指心电信号的特征向量与训练集中的特征向量的距离越小,说明这两个样本最相近。这里欧氏距离的公式为

(4)

式中X为手指心电信号特征向量训练集中的样本,Y为待识别人的手指心电信号的特征向量。

识别时,计算出训练集中的模板Xi与未知模板Xu之间的欧氏距离,当得到最小欧氏距离时,未知样本Wu被判别为与Wi属于同一个人的样本

(5)

2 实验结果与讨论

对上述提出的基于稀疏编码的心电身份识别方法,通过MatlabR2007软件验证算法的有效性和可靠性,讨论测试时间固定为9s的条件下,不同的训练时间,不同的特征值个数以及不同的参数设置对身份识别的影响。实验中的数据来自于CheckYourBiosignalHereinitiative(CYBHi)数据库[5]和SurfaceECGdata[2]数据库,受测者的人数分别为60,55,一共115人,全部为健康个体。

2.1 不同的训练时间对身份识别的影响

一般来说,训练时间过短的话,每个样本中得到的单周期心电信号个数比较少,不能很准确的表征个体,但是,如果训练时间过长,就会使得存储信号空间增大,处理信号时间花费更过的时间,所以需要讨论训练时间对心电识别和识别时间的影响。令测试时间固定为9s,训练时间分别为9,12,15,18,20s,选取2个数据库的115个个体进行测试。

从图4(a)可以看出,随着训练时间的增长,识别率呈现增长的姿势,并最终得到很高的值100 %,在训练时长为20s时,两个数据库的身份识别率都达到100 %。从图4(b)可以看出,随着训练时间的增长个体识别时间也呈上升趋势。综合考虑,训练时间设置为18s比较好。

图4 不同训练时长对识别率和总识别时间的影响

2.2 PCA不同特征值对身份识别的影响

由2.1小节里的图4可以看出,随着训练时间的增加赠的识别时间也在增加,当样本持续增加时,识别时间也会加大,为了避免上述情况的发生,采用PCA对数据样本进行降维。设定特征值个数分别为10,20,30,40,50,对识别率和个体识别时间的变化进行讨论,选取2个数据库的115个个体进行测试。

由图5(a)可以看出,一开始随着特征值的增加识别率增加,但当特征值取到30的时候,识别率达到最大之后便趋于稳定,结合看图5(b),随着特征值的增加个体识别时间也在增加,当特征值小于30的时候,虽然识别时间相对较短但是识别率没有达到最理想的状态,所以综合考虑,特征值个数取30的时候,识别效果最好。

图5 不同的特征值个数对识别率和总识别时间的影响

2.3 不同识别算法对身份识别率的影响

基于手指心电的身份识别算法近年来取得了很大发展,各种识别算法也是层出不穷,对识别算法的要求也随之增高,身份识别率的大小和识别时间的长短决定着算法的实用性和有效性,本文找了相同数据库下不同文献中的算法作对比,如表1所示。

表1 手指心电不同识别方法比较

方法数据库(大小)识别算法识别率/%文献[2]SurfaceECGdata(50)MeanECG+小波距离测度89文献[4]CYBHi(37)MeanECG+SVM90.9文献[11]CYBHi(56)SurfaceECGdata(50)广义S变换+ZM96.498本文算法CYBHi(55)SurfaceECGdata(60)超完备字典下OMP+欧氏距离10098.333

本文利用超完备字典下的OMP算法进行心电身份识别,实验参数设置为:训练时长18 s,测试时长9 s,单周期信号PCA降维之后特征值个数为30,采用OMP进行稀疏分解,通过欧氏距离匹配算法进行分类识别,该算法在不同数据库中的识别性能如表2所示。

表2 本文提出的算法在不同数据库中的识别性能

手指心电信号数据库受测人数身份识别率/%个体识别时间/sCYBHi551000.601表面ECG数据6098.3330.857

从表2可以看出,本文提出的算法在两个手指心电信号数据库中的个体身份识别率都很高,而且高识别率条件下识别时间很短,该算法可以很好地应用到系统及生活当中。

3 结 论

基于手指心电信号的身份识别具有广阔的应用范围,与临床上相比,从手指上采集心电信号降低了其入侵水平,提高了以ECG为基础的身份识别的实用性和用户对其的接受能力。本文提出了基于冗余字典下稀疏分解的手指心电个体身份识别算法,通过实验证明,该方法原理简单,识别速度快,特别实在PCA降维之后,在调高速率的同时也保证了识别率的稳定,更重要的是,在个体数很多的条件下仍能在较短的时间内得到较高的识别率,具有具有实用性和有效性。

[1] Biel L,Pettersson O,Philipson L,et al.ECG analysis:A new approach in human identification[J].IEEE Transactions on Instrumentation and Measurement,2001,50(3):808-812.

[2] Chan A D C,Hamdy M M,Badre A,et al.Wavelet distance mea-sure for person identification using electrocardiograms[J].IEEE Transactions on Instrumentation and Measurement,2008,57(2):248-253.

[3] Lourenco A,Silva H,Fred A.ECG-based biometrics:A real time classification approach[C]∥Proceedings of the 22nd IEEE International Workshop on Machine Learning for Signal Processing,Santander,Spain,2012.

[4] Silva H P D,Fred A,Lourenco A,et al.Finger ECG signal for user authentication:Usability and performance[C]∥2013 IEEE the Sixth International Conference on Biometrics:Theory,Applications and Systems,2013.

[5] Silva H P D,Lourenco A,Fred A,et al.Check your biosignals here:A new dataset for off-the-person ECG biometrics[J].Computer Methods and Programs in Biomedicine,2014,113(2):503-514.

[6] 薛缠明,李丽宏.小波分析在激光测距传感器中的应用[J].传感器与微系统,2015,34(6):151-152.

[7] Hung S,Jan J C.Machine learning in engineering analysis and design: An integrated fuzzy neural network learning model[J].Computer-Aided Civil and Infrastructure Engineering,1999,14(3):207-219.

[8] Mallat S G,Zhang Z.Matching pursuits with time-frequency dictionaries[J].IEEE Transactions on Signal Processing,1993,41(12):3397-3415.

[9] Aharon M,Elad M.K-SVD and its non-negative variant for dictionary design[C]∥Proceedings of SPIE,The International Society for Optical Engineering,2005:327-339.

[10] 沈小正,王 彪.基于压缩感知理论的声矢量阵方位估计方法[J].传感器与微系统,2016,35(7):35-37.

[11] 邹申申,赵治栋,袁昌成.基于广义S变换和香农熵的手指心电信号身份识别算法研究[C]∥2015浙江省信号处理学会2015年学术年会论文集,2015.

Algorithm for finger-ECG signal identity recognition based on sparse coding*)

LIN Juan1, ZHAO Zhi-dong2, SUN Shu-qiang2)

(1.School of Communication Engineering,Hangzhou Dianzi University, Hangzhou 310018,China; 2.School of Electronic Information,Hangzhou Dianzi University,Hangzhou 310018,China)

Application of ECG signal in identity recognition is studied and is proposed,sparse coding algorithm based on complete dictionary.In preprocessing stage,denoise noises in ECG like baseline wander and interference of heart rate variability.In feature extraction stage,extract single periodic signal to form feature vectors.Utilize the feature vectors to build the dictionary model and then be trained to be redundant dictionary by KSVD.Then every part of feature vectors is used for sparse coding,implement sparse representation in the dictionary. In classification stage,utilize sparse coefficient matrix to build characteristic template vector and use it as characteristic parameters.Then matched output individual identity information through Euclidean distance realize personal identity authentication.Performance test on the proposed algorithm is carried out through two fingers ECG database named CYBHi and surface ECG data and won high recognition rate.

finger ECG; sparse coding; sparse coefficient matrix; Euclidean distance

10.13873/J.1000—9787(2017)02—0142—04

2016—11—29

国家自然科学基金资助项目(61571173);浙江省自然科学基金资助项目(LY14F010021);浙江省公益性技术应用研究计划资助项目(2015C31086,2015C31085);浙江智慧城市区域协同创新中心资助项目

R 318

A

1000—9787(2017)02—0142—04

猜你喜欢

欧氏电信号心电
本刊2022年第62卷第2期勘误表
基于联合聚类分析的单通道腹部心电信号的胎心率提取
心电向量图诊断高血压病左心室异常的临床应用
基于非接触式电极的心电监测系统
穿戴式心电:发展历程、核心技术与未来挑战
基于Code Composer Studio3.3完成对心电信号的去噪
更正启事
基于随机森林的航天器电信号多分类识别方法
欧氏看涨期权定价问题的一种有效七点差分GMRES方法
基于生物电信号的驾驶疲劳检测方法