APP下载

基于心脏信号生物识别综述

2021-11-15许文曜

计算机应用与软件 2021年11期
关键词:电信号身份心脏

肖 剑 董 威 邵 强 林 峰 许文曜

1(长安大学电子与控制工程学院 陕西 西安 710064) 2(浙江大学计算机科学与技术学院网络空间安全研究中心 浙江 杭州 310027) 3(纽约州立大学布法罗分校计算机系 美国 纽约 14200)

0 引 言

生物识别技术是根据个体的生理和行为属性[1]进行身份识别的方法。在现代社会中,生物识别技术广泛应用在关键区域的访问和控制、海关进出口管理和执法等过程中。生物识别技术应用的前提是这些生理或行为是每个个体所独有的,这些特征可以可靠地获得并且用于识别目的。生物识别技术为身份识别提供了先进的技术手段,与传统的身份识别手段(密码、锁具等)相比,其优点[2]是:(1) 长期至终身不变;(2) 不存在丢失;(3) 伪造模仿难度太高或不可能伪造。

Jain等[3]首次提出能够作为生物特征的性能评价指标,一种特征要成为识别标志必须具备以下几个条件:(1) 普遍性;(2) 唯一性;(3) 稳定性;(4) 可测量性;(5) 识别性能;(6) 可接受性;(7) 受环境影响性。而心脏的生理特征具备生物特征识别的条件[4],因此基于心脏的生物特征识别成为众多学者关注的研究热点。

近些年Broek等[5]提出利用人体医学生理信号作为下一代身份识别以及认证的可行性。医学生理信号是由人体肌肉细胞、神经元细胞和汗腺组织细胞等生物电化学反应生成的[6]。表1是部分心脏信号与传统的生物特征识别的对比,心脏信号已经被证实在识别方向的巨大潜力,识别性能出色[4]。基于心脏信号的生物特征识别相比于传统的生物特征识别的优势在于其具有以下特点:(1) 内在活性[7]:心脏运动仅存在于“活”用户中,系统能够区分验证对象是“活”用户还是伪造攻击。(2) 高度安全[8]:生物识别应该具备高度安全性和特异性,从而不易被伪造和被盗。心脏信号取决于用户的心脏肌肉结构,因此不可能被完全模仿[9]。(3) 经济高效且易于使用[10]:一些生物识别技术虽然具有可靠和强大的功能,但信息采集需要昂贵的设备和特定的条件,如虹膜/视网膜认证系统,而心脏信号的信息采集较为便利、经济。

表1 心电信号(Electrocardiograph,ECG)和 光学体积描记术(Photoplethysmograph,PPG) 与其他生物特征识别的比较

1 心脏信号产生机理及采集

1.1 心脏信号

人的心脏包含四个腔室[11]:左心房、右心房、左心室和右心室,通过对血液流动提供压力,为人体各部分送血。这种机械活动是由心脏内部的电刺激驱动的,心脏特定部分(心房或心室)的去极化(电活动)导致机械收缩,复极化导致机械松弛。

不同主体间的心脏信号变异性是健康监测和医学诊断的重要依据[12-14],这种特异性在识别领域中有助于区分生物识别的各个主体,这些异变主要来源于以下几个方面:

(1) 心脏几何特征:心脏体积、心肌厚度、心脏的形状决定了心脏内部电流路径、心肌细胞去极化的数量、心脏运动周期。运动员身体素质好,心脏较大,心肌较厚,这都会对ECG信号有影响,QRS波群电压较高,基础心率较低[13,15]。

(2) 个人属性:年龄、体重和怀孕会导致心脏位置以及方向发生变化,这些偏移量会改变向心脏传导的电流向量方向,从而使得不同角度的电极采集到的心电信号会有所差异[16]。

(3) 运动状态:心脏信号周期的持续时间与间隔会随着心率的变化而变化,在心动过速或心动过缓的情况下,心电信号QRS复合波与T波之间的间隔变化非常明显[17]。

(4) 心脏病:心脏的医学状况也会干扰电脉冲传导并使心脏信号产生变化,在目前的生物识别技术中,研究最多的病症之一是心律失常,它会使心率随时间的变换很大,对基于心脏信号的生物识别系统的性能影响有一定的影响[18-19]。

(5) 姿态:站立与躺下等姿势会对包括心脏在内的内脏器官位置和形状产生影响,从而改变信号采集装置放置的参考位置,导致收集到的信号发生变化[16]。

(6) 情绪和疲劳:神经系统中的交感神经和副交感神经系统控制心率的增加和降低,该系统会受到心理状态的直接影响,因此压力、恐惧和其他强烈情绪以及疲劳和困倦会使得心率和心电信号受到影响[15,17],此外还有电极采集位置错误[20]等影响。

1.2 心脏特征信号

心脏提供了非常多的生物信号,如图1所示,其中有多种信号具有生物识别的能力,下面对主要信号进行介绍。

图1 心脏特征信号分类

1.2.1ECG信号

心电信号ECG,主要描绘心脏起搏的电活动过程,反映了人体潜在的生理特征。心电采集装置基本上通过附着在人体皮肤上的传感器来获取这些电活动,并以mV为单位来绘制电活动。心电信号有着个体丰富的身份信息,满足生物特征用于个人识别的重要特性[21],关于心电信号的个人身份识别的研究已经是生物特征识别技术领域的一个热门课题。心肌细胞一次完整的去极复极过程产生一个心动周期,其由P波、QRS波群、T波和U波组成,ECG信号波形图如图2所示。这些波形蕴含了大量的医学信息和个体差异性信息,为心脏疾病的诊断和ECG身份识别提供了基础。心电信号具有普遍性,由于每个人的心脏的大小、位置、胸腔结构等因素的影响,任何不同个体间的ECG信号都有所差异。在没有外力损伤和突发疾病的情况下,心电信号在相当长的一段时间内不会发生变化,稳定性好。随着心电采集装置的小型化,心电信号的采集技术越来越成熟。

图2 ECG信号

电极采集是医疗领域经常用来采集心电信号的方式,有3种类型电极:湿电极、干电极和非接触式电极。医学上和早期ECG身份识别广泛采用12导联方式,考虑到电极在手臂及手腕上采集接受性更高也常采用Ⅱ导联采集方式。

1.2.2PPG信号

光学体积描记波PPG利用光电容积描记技术进行人体运动心率的检测,是种红外无损检测技术。PPG信号利用光的透射和反射原理来测量动脉脉搏信号,PPG信号波形图如图3所示。PPG信号主要有以下四个特点:(1) 特异性。每个采集个体因其年龄、性别、心脏大小、血液稠密、血管壁弹性等生理因素存在差异,这些差异单独或综合作用时会使得采集到的PPG信号因人而异。(2) 低频率。PPG信号的主要频谱分布在0 Hz~20 Hz,反映的是心脏舒张压缩的频率。(3) 时变性。由于采集个体自身因素的原因,例如年龄的增长、健康状况的影响,会导致同一个人的PPG信号在不同时间点的测量结果不一样。(4) 弱信号易受干扰。PPG信号的输出幅度一般在几十μV至几mV,极易随着人的生理因素或者外界采集环境的改变而改变,信噪比低。

图3 PPG信号

PPG信号的采集利用了光的透射和反射原理,人体不同组织吸收光强大小不同,但是同一种类型的组织对光强吸收能量不变。通过电光学方法采集到的心脏信号,可以将波长λ的光源放置在身体的凸出部(例如手指)的一侧上,并且在另一侧上放置光电检测器,该检测信号提供关于流经人体测试区域并接近皮肤的血量信息。

1.2.3SCG信号

心震信号SCG反映了身体由于心脏活动而产生的运动。SCG目前被认为是一种潜在的生物特征,与分析心脏活动的ECG相比,SCG是从机械角度来测量心血管活动,在胸腔上量化与心脏相关的机械活动,例如心脏壁运动和血流情况。SCG一般采用三轴加速度计贴在胸口测量,量化心脏产生的各种压缩波。目前SCG已经成为各种冠状动脉疾病的主要测量方法,同时也可用于生物特征识别领域。

从机械角度测量心血管活动,量化与胸壁上的机械心脏活动相关的加速度,例如心脏壁运动和血流。SCG采用不同的基于接触的感测模式,即使用三轴加速度计,放置在更靠近心脏的位置(例如贴在胸部)进行数据采集。

1.2.4心脏运动

心脏运动的行为特征与心脏内在的几何结构、血液循环系统等相关的多种生物学特征紧密结合,这些身体特征使得心脏运动成为每个人独特的身份认证信息,Lin等[7]使用多普勒(Doppler)雷达以无线方式映射心脏尺寸和心脏运动。

1.2.5LDV信号

激光多普勒测速仪LDV(Laser Doppler Velocimetry),LDV信号是用于检测由于颈动脉的动脉壁运动以及呼吸等其他生理活动引起的表面振动脉冲的信号,具有线性特性,采集过程具有不需要接触的优点,并且精度高、响应快[22]。通过激光多普勒测速仪采集到的LDV信号同样被应用到生物特征识别领域。激光多普勒测振仪用于检测与中央血压脉搏相关的颈动脉壁上方皮肤表面的振动,使用非接触方法记录颈动脉LDV信号。这种技术的主要优势在于获得信号的隐蔽性。

1.2.6其他信号及其采集方法

除了上述信号及采集方法,还有许多方法可以用于心脏信号的采集。例如,通过数字或电子听诊器对心脏运动产生的声音进行采集得到的心音图(PCG)可以用来进行身份识别。Garbey等[23]通过一个高度敏感的热成像系统获得远处人类的心脏脉搏。Zhuang等[24]提出了非接触式心脏运动传感,以非接触式手段获取心脏的运动信息从而达到生物识别。Yang等[25]使用Kinect 2.0来捕捉人体的视频,估计心率和节奏。Aarts等[26]通过分析由血液循环引起的皮肤颜色的细微变化,使用单个常规数字照相机记录来自RGB视频的估计心率。Antink等[27]提出了一种贝叶斯方法,该方法使用从网络摄像机记录的视频中提取的机械心冲击(BCG)信号、皮肤颜色变化和头部运动,以提供心跳心率估计。

目前心脏信号的采集方式如图4所示。

图4 心脏信号采集方式

2 基于心脏信号的生物识别

基于心脏信号的身份识别步骤与传统生物特征识别步骤具有相似性,一般包括信号预处理、特征提取和模式识别三步。其中特征提取是基于心脏信号身份识别中非常重要的一步,方法的好坏和识别率的高低很大程度上取决于特征提取的结果。

心脏识别有两种基本的操作模式。第一种是验证(或认证)模式,在这种模式下,系统将所捕获的特征与存储在生物特征数据库中的特定模板进行一对一的比较,以验证个体是否是正确对象。第二种是识别模式,系统对试图建立未知个体身份的生物特征数据库执行一对多比较。如果生物特征样本与数据库模板的比较落在预先设定的阈值范围内,系统将成功识别个体,心脏信号识别原理如图5所示。

图5 心脏信号身份识别系统原理

2.1 基于ECG生物特征信号识别

基于ECG的人体识别技术是目前心脏信号中相关研究最多的一项工作,基于ECG生物特征信号识别的步骤是:通过对由传感器采集到的心电信号进行预处理,再对特征进行提取,最后分类处理特征得出识别结果。

2.1.1心电图的预处理

收集的心电数据通常包含噪声,由于存在噪声,特征提取和分类变得不太准确。为了理想的数据结构,必须处理原始ECG数据。第一步必须确定噪音源。在此基础上设计一个滤波器并应用于原始数据。用过滤后的数据执行特征提取。预处理阶段涉及的步骤是:

(1) 数字滤波:这是预处理中最重要的一步。它用于过滤ECG信号中的噪声。例如用于消除电源线干扰的数字陷波滤器。使用截止频率为0.5 Hz的高通滤波器来消除采集信号上的直流偏移[28-29]。

(2) 下采样:对于高采样信号的算法,下采样常作为可靠的解决方法。

(3) 峰值检测:在峰值检测中,收到原始信号,进行数字滤波,并在特征选择设置中使用检测到的峰值指数。

(4) 分割:在该步骤中,识别信号的特定峰值以及识别点,再将ECG波形分割成单独的心跳周期[30-31]。

2.1.2特征提取

预处理之后提取特征用于识别目的。其特征提取方式可以分为基准方法[32-33]、非基准方法[34-35]、混合方法[36-37]三种。基准方法依靠心跳的局部特征进行生物特征模板设计,如连续基准点之间的时间差或幅度差,并用于识别目的。基准特征的缺点是它们对噪声敏感。此外,在心律失常异常情况下检测基准特征可能包括数据错误。非基准方法最初由Plataniotis等[38]提出。为了消除心电信号的基准点定位的必要性。它整体处理心电信号或孤立的心脏跳动,并根据波形的整体形态提取特征。混合方法是将基于基准特征方法与非基准特征方法结合起来,混合方法提高了技术的复杂性和识别效率,当前还没有相关出版物评估其实用性,因此在考虑到实际应用的可行性和系统复杂度后建议优先选择基准方法或非基准方法。该模块的主要目的是将ECG波形转换为某种类型的参数表示以供进一步分析和处理,常采用的方法有:

(1) 小波变换:小波变换与傅里叶变换相似[39-40]。小波变换使用在实数和傅里叶空间中定位的函数,小波变换有两种类型,即离散小波变换和连续小波变换。

(2) 主成分分析[41]:在对数据运行机器学习算法之前,经常使用主成分分析法实现维数降低技术将高维数据集转换为较小维数的子空间。

(3) 线性判别分析[12]:它是Fisher线性判别式的一种推广,是统计学中常使用的方法,可以找出表征或分离两类或多类物体或事件的线性组合特征。

2.1.3分 类

预处理和特征提取之后,下一步是对输入进行分类。这是为了检查系统的健壮性。常用的分类器包括贝叶斯网(Bayesian Network,BN)[39]、支持向量机(Support Vector Machines,SVM)[20,39]、K最近邻分类算法(k-NearestNeighbor,kNN)[19,41],以及基于度量的欧几里得距离[42-43]等。基于这些分类器,用户可以轻松地确定技术的可靠性和效率。现有基于ECG的生物识别技术文献的总结如表2所示。

表2 当前ECG生物识别技术总结

续表2

2.2 基于PPG生物特征识别

身份识别技术中,基于PPG信号身份识别技术起步较晚,但信号易采集、实用性好、发展比较迅速。现在的基于PPG信号的身份识别方法主要有以下两类:

(1) 基于P波特征点的识别。此方法以PPG信号的特征点为基础,采用了峰值、间隔、斜率等时域特点作为特征值,来实现身份识别。基于P波特征点的身份识别方法优点在于取特征值简便,计算复杂度较低,适用于小样本数据条件。

(2) 基于波形的识别。此方法一般以P波为基准点分割出单周期的PPG信号波形,然后通过数据降维处理,处理后的数据作为特征值。此种方法优势在于不易受到噪声干扰、稳定性强,不过因为提取的特征数据量庞大,会导致识别速度有所下降。

Spachos等[58]对29名健康受试者的指尖进行光电容积脉搏波(PPG)信号采集,采用近邻分类器进行分类,验证了PPG作为生物识别的可行性。Salanke等[59]以PPG信号的P波为基准,分割出单周期的PPG信号波形,通过主成分分析法对PPG信号单周期波形进行特征取,并分析了在受试者紧张的条件下分类器的识别性能,结果显示在紧张条件下取得的信号特异性更明显,紧张比放松状况下的识别效果更显著。Bonissi等[60]对PPG在生物识别系统中连续认证情况下进行了初步研究,所获得的实验结果说明PPG信号具有作为生物识别的辨识性,然而获得的特征呈现低耐久性,因此他们认为PPG技术应该应用在连续认证系统中。

Namini等[61]定义了PPG的97个参数特征用于决策和分类。使用前向特征选择算法,分别对30个上级特征进行排序。研究了四个分类器的结果:K最近邻、高斯混合模型、Parzen窗口和模糊K最近邻分类器。这些分类器被应用于从主要特征的组合提取的两组人工特征上。该研究表明,使用PPG的身份认证可以达到2.17%±0.31%的等错误率。Karimian等[62]采用PPG做生物识别,使用神经网络以及支持向量机进行分类,对42名受试者使用了基准和非基准方法进行实验比较结果,发现采取非基准特征方法达到的准确度为100%,而使用基准特征的准确率为95.0%~99.5%。

2.3 其他心脏信号识别方法

目前认为SCG是一种潜在的实时变化的生物特征模式与分析心脏活动,与ECG相比,SCG是从机械角度来测量心血管活动,在胸腔上量化与心脏相关的机械活动,例如心脏壁运动和血流情况。

Bui等[63]提出了基于SCG的生物识别验证系统,如图6所示,利用自相关特性进行特征提取,使用主成分分析(PCA)方法降维,并且通过结合三轴SCG信号实现数据融合,提高了系统的精度和鲁棒性,通过实验得出SCG可以作为生物识别方式的结论。然而SCG信号可能容易受到各种情况的影响,例如SCG信号会随着被测者的当前状态(坐着、站立、躺着等)以及走动、跑步等而变化,也会因为被测者的情绪状况(平静、悲伤、喜悦等)而变化。另外根据Bui等的观察,同一个用户的SCG信号会在很长一段时间(如2至5年)内发生显著的变化,这会使SCG生物认证很难大规模部署,不过在短期内被测者的SCG信号比较稳定,所以利用SCG信号作为生物认证需要在短期内更新数据。

图6 基于SCG身份识别系统原理

通过使用非接触式多普勒激光探测颈动脉中的血压脉冲引起的皮肤机械振动,获得LDV信号并应用于生物识别,并不需要直接检测心脏信号。Chen等[64]开发了一种用激光多普勒测振仪遥测与颈动脉脉搏有关的机械活动的新方法。Odinaka等[65]研究了285名受试者并证实激光多普勒振动信号识别可行性。

心脏运动的行为特征是与心脏内在的几何结构、血液循环系统等相关的多种生物学特征紧密结合,这些身体特征使得心脏运动成为每个人独特的身份认证信息。Zhuang等[24]提出了非接触式心脏运动传感,以非接触式手段获取心脏的运动信息从而达到生物识别,对心脏运动进行检测,利用发射的微波击中对象时获得由心跳引起的身体位移,通过解调这个相位信息获得心脏运动的特征信息。Lin等[7]使用多普勒雷达以无线方式映射心脏尺寸和心脏运动,如图7所示。心脏的形状和跳动独一无二,因此可有效识别用户、验证身份、解锁设备等。相比指纹、视网膜扫描和面部识别系统,该系统更具优势,它不需要直接接触,也无须持续监控用户。不同的人站在计算机屏幕面前,该系统会识别出不同的用户,阻止未授权人的登录。

PCG通常能听到的两个最响亮的声音是第一声S1和第二声S2,S1是在心室的等容收缩期间产生,S2是在舒张期间时产生。Phua等[66]对身份识别中使用心音的可能性进行了研究,需要电子听诊器,用于执行识别任务的简单的处理器和数据库服务器。研究提出的倒谱特征以及相关的预处理可以用于身份识别,在实验评估中产生了相对较好且稳健的结果。Beritelli等[67]提出了一种通过心音频率分析来识别个体的自动系统。研究了心脏听诊PCG(心音图)信号的生物特征。PCG信号具有特定的个人特征,可以将其作为生物特征识别系统中使用的有效生理符号来考虑。

3 基于心脏信号的身份识别技术研究趋势

由于应用心脏信号进行身份识别的研究还在研究阶段,且作为识别特征也有其局限之处。本节结合目前存在的问题指出以下几点未来研究方向:

(1) 大规模心脏信号数据库的建立。表2列出的数据库主要是由麻省理工大学的研究人员建设的MIT-BIH心律失常库和MIT-BIH正常窦性心律库[68-69],Lugovaya为其研究所建立的ECG-ID数据库[49]以及PTB诊断ECG数据库[70],这些数据库中的ECG数据只有几十到上百种,最大的库为多伦多大学心电数据库[71],共采集了1 019个志愿者的心电数据。其他心脏信号只能由科研人员自行收集,往往采集的信号数量不多,只能满足于科研要求,无法对基于心脏信号的身份识别系统大规模应用提供可靠的数据。目前中国、美国、印度等人口大国正在筹备搭建全国范围的识别系统[72],为了进一步推动基于心脏信号进行身份识别的研究,并真正能够应用于实际生活中,建立大规模的心脏信号数据库是未来一项重要的工作。

(2) 引入生物医学学科经验,结合研究更为稳定的算法。目前以心脏信号作为生物识别方式的实验结果还存在识别率不够稳定的缺陷,一种方法进行多次实验的结果会有波动,随着实验人数的变化,识别的准确率也会变得不稳定。目前健康个体的识别能够达到较高的识别率,而患有心脏病的患者的识别率明显降低。心脏病患者产生的心脏信号具有变异性,提高了系统准确识别的难度。医疗学科对于心脏信号的研究以及心脏病患者的心脏信号变化情况的研究会对基于心脏信号的生物识别技术的准确性和稳定性有很大的帮助。

(3) 心脏信号采集的集成化与可穿戴性研究。传统的心电信号需要利用电极直接接触皮肤进行采集,这很大程度上降低了心脏信号识别的实用性,目前Zhang等[73]已经表明可以从单臂采集到ECG信号,并成功应用于识别。Nymi band[74]是一种可穿戴式的腕带,在其内部利用两个金属电极采集ECG信号,可以实时进行识别工作,不过这种识别产品需要长时间佩戴,并且每次开始认证还需要另一只手触碰外部电极。Yathav等[75]开发了一种可以同时采集ECG和PPG信号的系统,命名为miBEAT,该系统可以用在智能手机或平板电脑上进行信号采集并用于个人识别或认证。虽然目前已经存在上述可穿戴设备和集成系统,但仍然有很多需要改进的地方,它们仍然需要与两肢接触,今后的工作将对采集方式进行改进,尽量减少与肢体的接触,可以进行中距离采集信号识别工作,增加设备的用户友好性。

(4) 心脏信号与其他生物信号的多模态融合研究。由于基于心脏信号的身份识别相比于传统的识别方案更有优势,信号采集的方式更加地趋近于隐蔽性、安全性、便携性,并且通过多种信号的融合识别可以提高识别率和稳定性,多种生物信号融合识别成为了研究者们的热门课题。目前已存在一些结合心脏信号识别的多模态识别系统,如心电信号与指纹融合识别[76],心电信号自融合进行识别[77-78],心电信号与面部融合识别[79],以及心电信号、面部和指纹三者融合进行识别[80]。进行融合可以增加识别的可靠性和准确性,因此心脏信号的多模态识别系统的研究会是今后主要的发展方向。

4 结 语

基于心脏信号的生物特征为其他传统生物特征提供了一个有吸引力的替代选择,主要优势在于在监督环境下伪造者难以进行攻击。本文阐述了基于心脏信号的身份识别方法,从心脏信号的产生原理、分类、感知形式等方面进行介绍,并对基于不同心脏信号的生物特征识别技术做了一些比较和评价。通过这些分析可以看出,心脏信号作为一种新的生物特征在生物识别领域有广阔的前景,研究者们可以解决当前存在的问题,提出更具竞争力与实用性的心脏信号识别系统。

猜你喜欢

电信号身份心脏
基于窗函数法的低频肌电信号异常分类仿真
基于单片机的心电信号采集系统设计
神经元电生理模型的构建及分析
跟踪导练(三)(5)
妈妈的N种身份
身份案(下)
了解心脏
有八颗心脏的巴洛龙
放松一下 隐瞒身份
一种心电信号采集放大电路的简单设计方法