胎儿心电信号提取算法的研究进展
2022-09-26杨玉瑶郝婧宇吴水才
杨玉瑶,郝婧宇,吴水才
(北京工业大学生物医学工程系,北京 100124)
0 引言
随着我国三胎政策的开放,孕妇人数急剧上升,对于便携式、家用式孕妇远程监护系统的需求也急剧上升。胎心监护仪(cardiotocography,CTG)[1]是目前临床实践中使用率最高的产检监测仪,通过超声探头发送超声波,接收频移回波信号并对其进行处理,得到胎儿心动周期,利用胎儿心动周期和子宫动脉的搏动指数进行计算,可同时得到胎心率(fetal heart rate,FHR)和宫缩(uterine contraction,UC)2条曲线。利用CTG进行监护稳健、可靠,但难以有效地获得可靠的瞬时胎儿心率的变异信息[2],且需要接入庞大复杂的医疗器械,设备笨重、佩戴不舒适,不适用于院外家庭远程监护[3]。胎儿心电(fetal electrocardiogram,FECG)信号[4]既能提供胎儿心率信息,又能提供胎儿心脏活动周期的微小电位变化。该信号采集时将高精度小型传感器和多个体表电极置于孕妇胸腹部,通过分析FECG信号的P波、P-R间期、QRS波、ST段及T波可判断胎儿是否存在宫内缺氧、胎儿窘迫、新生儿窒息、缺血缺氧性脑病等具体疾病。
获取FECG信号的方法有2种:一种是侵入式胎儿心电信号(invasive fetal electrocardiogram,I-FECG)采集方法,该方法直接将电极置于胎儿头皮,提供了较高的信号采集质量,但只能用于胎儿分娩时,存在胎儿被感染的风险,且当电极与胎儿头皮接触不足时,会导致信号传输不良、等值线波动;另一种是非侵入式胎儿心电信号(non-invasive fetal electrocardiogram,NI-FECG)采集方法,该方法可以实现围产期胎儿健康状况的长期监护,是FECG信号提取的发展方向,但从母体腹壁采集得到的信号会混合生物伪影[母体心电(maternal electrocardiograph,MECG)信号、母胎肌电信号、子宫收缩等]和技术伪影(基线漂移、工频干扰、脉冲伪迹等),其中母体心电信号对FECG信号干扰较强。在时域,母体心电成分幅度远大于FECG信号幅度;而在频域,两者的频谱相互重叠。如何从这些混合成分中提取出高质量的FECG信号是该方法的难点。许多FECG提取算法会导致提取到的FECG信号有波形缺失、混杂噪声等问题。基于上述原因,需要利用合适的FECG信号提取算法得到高质量的FECG信号,通过对胎心率及波形变化的分析,及早发现妊娠期的胎儿病理情况(胎儿缺氧、先天性心脏病等),从而预防新生儿疾病并降低胎儿死亡率。
本文对传统的和融合2种或多种算法的FECG信号提取算法进行综述,并基于常用FECG信号数据库对这些提取算法进行性能比较。
1 FECG信号常规提取算法
随着信号处理技术的发展,许多算法都具有从混合信号中获取目标信号的能力,但每种算法都有其各自的优势和劣势。目前常用于FECG信号提取的算法有卡尔曼滤波(Kalman filtering,KF)、奇异值分解(singular value decomposition,SVD)、非负矩阵分解(non-negative matrix factorization,NMF)、自适应神经模糊推理系统(adaptive neuro-fuzzy inference system,ANFIS)、小波变换(wavelet transform,WT)、经验模态分解(empirical mode decomposition,EMD)和独立成分分析(independent component analysis,ICA)。
KF框架是一种很有前景的自适应滤波器,在其基础上对非线性函数进行泰勒展开后进行一阶线性化截断,进而完成非线性函数的近似线性化,从而得到扩展卡尔曼滤波(extended Kalman filtering,EKF)算法。Niknazar等[5]基于KF框架从母体腹壁心电(abdominal electrocardiograph,AECG)信号中扩展并联合多个心电图构建模型,生成一个高度真实的合成心电图模型。由于每个心电图中都有对应项,所以在噪声水平较高的情况下,该模型仍可以有效区分心电信号。但当MECG信号的QRS波与FECG信号R峰重合时,使用该模型提取FECG信号会导致R峰缺失,从而导致提取准确度降低。
SVD被广泛应用于各个领域,在超声成像领域该算法可以抑制杂波[6],在FECG信号提取领域该算法可以较好地解决波形缺失问题。Ayat等[7]在分类器中引入SVD和多项式分类器的组合,先利用SVD估计MECG信号,然后将MECG和AECG信号依次输入到多项式分类器的输入端,最后利用估计的MECG信号动力学和非线性特性提取FECG信号。该算法有效地解决了波形缺失问题,并将合成数据的信噪比提升至7.5 dB。
NMF算法能够从生理信号光谱中提取特定特征。Dia等[8]基于NMF算法直接估计胎心率,首先对单通道AECG信号进行预处理衰减,通过源滤波模型确定特征FECG信号,然后对其谱图进行NMF,胎心率对应于估计出的源部分基频。与传统估计胎心率的方法不同,该方法既不需要检测R峰也无需训练参数,因此大幅提高了胎心率检测的准确性和时效性。
上述几种算法只能用于提取妊娠后期的FECG信号。
ANFIS同时具备人工神经网络的自我学习能力和模糊推理系统的广泛适应能力。Nasiri等[9]利用ANFIS算法确定了母体腹部源信号和胸部源信号中母体心电成分的非线性变换关系。利用遗传算法训练ANFIS,通过从AECG信号中减去MECG信号提取FECG信号,取得了良好的效果。该算法能够有效地提取出妊娠早期的FECG信号,但计算量较大,计算成本较高。
WT算法有很多类型,如离散小波变换(discrete wavelet transform,DWT)、复小波变换(complex wavelet transform,CWT)、基音同步小波变换(pitch synchronous wavelet transform,PSWT)等。Wu等[10]借助DWT算法提取FECG信号并检测R峰,但由于MECG信号能量远高于FECG信号能量,虽然在提取到的FECG信号中成功检测到与原始心电图相同数量的R峰,但是信息损失较多,提取质量较低。Kumar等[11]利用PSWT算法从AECG信号中估计MECG信号并恢复所需的FECG信号,该算法在检测FECG信号和MECG信号时提供了最小的信息损失,将信噪比提高至0.497 0 dB。但由于WT算法可以聚焦细节部分的特点,相较于提取FECG信号,其在后续标注FECG信号特征部分有更好的效果。
EMD是将信号分解为固有模态函数的一种算法。Ghobadi等[12]利用EMD将AECG信号分解为单个振荡函数,然后确定参考FECG信号与AECG信号振荡函数之间的相关性,找到与基准信号相关度最高的振荡函数,将所有与基准信号相关度最高的振荡函数叠加即为增强的FECG信号。利用该算法检测胎儿QRS波时平均准确率可达100%。
ICA是目前使用最广泛的自适应FECG信号提取算法,因此许多基于ICA的算法被提出,如快速独立成分分析(fast independent component analysis,FastICA)、单通道独立成分分析(single channel independent component analysis,SCICA)、非参数独立成分分析(nonparametric independent component analysis,NpICA)等。但该算法存在2个劣势:对初始权重敏感容易陷入局部最优;技术性能高度依赖于数据集维度(即观测数量m≥信源数量n)。Yuan等[13]在传统FastICA算法的基础上,引入牛顿迭代算法中的超松弛因子处理初始权值,解决了ICA算法易陷入局部最优收敛不平衡的问题,使得平均迭代次数由改进前的35次降到13次,并将信噪比提高至1.55 dB。Jiménez-González等[14]将传统FastICA算法使用的低维数据集投影到高维空间,以建立适合ICA分析的稳健多维表示,该改进后的算法称为ST-FastICA(space-time FastICA)。ST-FastICA算法有效解决了ICA算法低维记录的问题,使得ST-FastICA算法成功实现低维4通道FECG信号的稳健分离。
上述算法的原理及优劣势见表1。
表1 各种FECG信号提取算法的优缺点分析
2 融合2种或多种算法提取FECG信号
由表1可知,各种算法都具有优势和劣势,若单一使用某种算法很难得到高质量的FECG信号,为后续FECG信号的分析增加了难度。最近的研究[8,16,26-40]表明,将多种算法进行组合的效果优于单一算法。因此,本文的后续研究工作旨在总结2种或多种算法的不同组合,这些组合算法可以克服单一方法的局限性,同时结合各算法的优点,从而提高FECG信号提取算法的性能。
2.1 基于ICA算法的组合
FastICA算法用于FECG信号提取时,以多通道腹部心电信号为输入,通过假设信号源为非高斯线性混合信号,最大限度地提高统计独立性,从而分离出混合信号源。
韩亮等[26]在Yuan等[13]和Jiménez-González等[14]改进的FastICA算法的基础上与其他算法进行结合,从而提取高质量的FECG信号。韩亮等[26]将FastICA算法与EKF算法相结合,在信号预处理后首先基于FastICA算法从母体腹壁多元化混合信号中分离得到MECG信号和FECG信号,然后进行MECG信号R峰位置检测,并基于该位置信息采用EKF算法从FECG信号中得到残留MECG成分并将其抑制,最后从含噪声的FECG信号中检测FECG信号的R峰位置,进而基于该位置信息再次采用EKF算法提取并获得清晰的胎儿心电信号。相较于传统FastICA算法,上述FastICA算法与EKF算法的组合可以得到清晰的FECG信号,同时解决了EKF算法依赖于母体R峰精确位置的劣势,但其并未改善传统EKF算法易导致波形缺失问题。Sarafan等[27]则在信号预处理后,首先采用模板相减(template subtraction,TS)算法去除AECG信号中的MECG信号,最大程度地保留FECG信号;然后基于Pan-Tompkins算法对四通道信号进行MQRS检测,利用参考FQRS注释选择F1分数最高的通道;最后采用FastICA算法提取FECG信号。TS算法可以最大程度地抑制FECG信号中的MECG信号,故将FastICA算法与TS算法组合可以很好地解决波形缺失问题,且在低信噪比条件下具有较高性能,但其计算量大,执行时间较长。Alkanfery等[28]将FastICA算法与WT算法相结合,首先应用分数阶巴特沃斯滤波器进行预处理,然后利用互相关方法选择参考信号作为直接FECG信号,将腹部信号作为输入信号,并对上述2种信号进行WT,最后利用FastICA算法消除AECG信号中的噪声,分离MECG信号和FECG信号。该算法为基于FECG信号验证胎心率提供了一种有效的方法。
2.2 基于SVD算法的组合
SVD算法用于FECG信号提取时,首先利用单通道或多通道腹部混合心电信号构造测量矢量矩阵,然后对其进行SVD,进而获得每个奇异值对应的心电信号估计,选择第一个奇异值或者前2个奇异值分别重构获得母体心电成分估计,最后针对该母体心电成分估计,进一步结合其他算法实现提取信噪比较高的FECG信号[29-30]。该方法仅适用于FECG信号信噪比较高的情形,否则分离出来的FECG信号噪声仍较大,算法提取性能急剧下降。在使用SVD算法前,通常先使用一种FECG信号提取算法处理AECG信号,得到信噪比较高的混合信号后再利用SVD算法进行处理。Varanini等[31]将SVD算法与FastICA算法组合,在信号预处理后首先采用FastICA算法提取MECG信号并检测MQRS,然后利用加权SVD算法估计并消除MECG信号,最后采用ICA算法分离残差信号并进行FQRS波检测。SVD算法与FastICA算法的组合得到Computing in Cardiology Challenge 2013关于胎心率和胎动间隔的最高官方分数,且该算法无需为每条记录提供特定参数,属无监督方式。卜朝晖等[32]在使用SVD算法前先利用EKF算法进行预处理。在信号预处理后,首先利用EKF算法通过检测孕妇单通道腹部信号的MECG信号R峰来估计母体心电分量,然后用单通道腹部信号减去MECG信号得到FECG信号的初步估计,最后利用SVD算法对初步估计的FECG信号进行降噪处理,以获得高信噪比的FECG信号。相较于传统单独使用SVD算法,该算法首先利用EKF算法提高FECG信号的信噪比,为后续使用SVD算法得到高质量FECG信号进行预处理。但该方法未解决EKF算法使FECG信号R峰幅度衰减进而导致SVD降噪后FECG波形缺失的劣势。杨珣等[16]使用2次SVD算法进行FECG信号提取,在信号预处理后,先进行改进SVD算法的心电信号重构,从而得到FECG信号的预估计。然后构建FECG信号的重构矩阵进行SVD运算,为进行降噪处理仅保留较大的奇异值,最终得到信噪比较高的FECG信号。该方法有效地改进了卜朝晖等[32]方法的波形缺失问题,经过SVD算法预提取到的FECG信号R峰幅度几乎未受到衰减,后续利用SVD降噪后可获得无缺失的FECG波形。
2.3 基于WT算法的组合
WT算法用于FECG信号提取时,采用多尺度DWT方法进行特征提取,基于小波峰识别(waveletbased peak recognition,WPR)方法识别QRS波复合物[17]。WT是一种有效的去噪技术,但其仅适合于增强纯净FECG信号且目前的FECG信号监测技术缺乏准确的胎心率监测和FECG波形特征提取。Jallouli等[33]提出了一种从AECG信号中提取FECG信号的WT算法/Multi-WT算法。首先从单导联腹部心电图中提取FECG信号,然后从重构MECG信号中定位母体R峰,最后消除重构信号现有噪声,并检测与FECG信号的相关参数。关于原始数据的重建水平问题,该研究构建shannon熵变量,基于测量信号相对于提取/重建信号的有序性/无序性,精确、自动评估能代表现实信号的最优重建水平。Mollakazemi等[34]将DWT与主成分分析(principal component analysis,PCA)相结合提取FECG信号,在采用DWT去除基线漂移和梳状切口滤波器去除工频干扰的预处理后,首先采用PCA算法基于信号质量评估(signal quality assessment,SQA)获取最佳AECG参考通道,用于母体R峰检测,然后从AECG信号中去除MECG信号从而提取FECG信号,最后对提取到的FECG信号进行10级DWT分解,利用分解得到的2、3、4级信号重构新的FECG信号,去除各种噪声和伪影,保留频率最接近胎儿QRS复合波的FECG分量。该组合方法成功克服了PCA算法对噪声的敏感性较高的局限性,后续利用DWT进行FQRS检测,从DWT产生的分解信号中选取有效层次,重构分解信号,因此,即使在1个或2个AECG信道被噪声严重污染的情况下也能提取到高质量的FECG信号。Krupa等[35]将WT与分数阶傅里叶变换(fractional Fourier transform,FrFT)相结合提取FECG信号。FECG信号属于多分量非平稳信号,与单一时间、空间或频率域相比,此类信号在分频域的分析效果更好[36]。FrFT使信号在时频平面上以预定义的旋转角度旋转,通过选择适当的旋转角度,将AECG信号映射到分频域,在分频域可以很容易地分辨出在时域和频域上重叠的母胎成分,利用最大似然估计法构建一个包含QRS复杂形态的MECG信号,故而较准确地分离出MECG信号,再利用WT对识别出的MECG分量进行分离,并对残差信号进行增强。FrFT对母体心电有较强的抑制作用,而WT对FECG有较好的增强作用,因此FrFT-WT算法结合了FrFT和WT的优点,能够有效去除MECG信号得到清晰高质量的FECG信号,且在预测胎儿心率方面具有较高的准确性。
2.4 基于NMF算法的组合
利用NMF算法提取FECG信号的最大优势是该算法适用于单信道环境[37]。目前,大多数文献中的FECG信号提取算法需要大量腹部传感器,多导联的AECG信号需消耗更多传输功率和更多传输带宽且对于远程监护而言操作困难,而NMF算法适用于单通道环境,简单易操作,为FECG信号的远程监护提供很大的便利性。Dia等[8]将NMF算法与非线性自适应滤波算法相结合,在信号预处理后,首先以胸部心电信号为参考对AECG信号使用非线性自适应滤波器,得到FECG估计信号,然后基于NMF的胎心率估计算法进行心电信号和频谱图的时域建模,基于NMF的谐波估计提取胎心率。ECG信号是少数可以进行压缩的真实信号,Gurve等[38]采用了压缩感知(compressive sensing,CS)的思想,并在压缩域中直接对AECG信号进行NMF,在物联网上实现节能传输以及经济、高效地分析FECG信号。该研究从原始AECG信号、压缩域AECG信号和压缩后恢复的AECG信号3个角度,对比分析NMF和ICA 2种算法在不同域提取FECG信号的性能。
2.5 基于EMD算法的组合
EMD算法用于FECG信号提取时,一般最后利用集合经验模态分解(ensemble EMD,EEMD)对目标信号进行平滑处理,若在开始使用EMD算法将AECG分解为基本模态分量(intrinsic mode function,IMF),则需要利用直接FECG信号找到最相似的IMF。He等[39]将EMD算法与NMF算法结合起来,在信号预处理后,首先利用EMD算法将单个腹部信号分解为IMF,然后计算IMF的相关矩阵,并使用特征值法估计独立的心电信号数,根据确定的数和分解的IMF构造非负矩阵,最后利用NMF算法实现MECG信号和FECG信号的分离。Barnova等[40]将EMD算法与ICA和递归最小二乘(recursive least squares,RLS)算法组合使用,在信号预处理后,首先使用ICA算法估计得到MECG和AECG信号,然后选取最高质量的2个分量作为RLS算法的输入,从而获得高质量FECG信号,最后利用EEMD算法将信号分解为IMF,根据准确性参数ACC找到分解的IMF分量中合适的IMF,其和为增强FECG信号,实现对FECG信号的平滑目的。该方法可以提取到高质量的FECG信号且可以进行后续的形态分析,但3种算法进行组合计算复杂度较高。
3 各种算法的性能评估
3.1 常用FECG信号数据库
表2为在算法研究中常使用的NI-FECG信号数据库。
表2 现有NI-FECG信号数据库
(1)DaISy数据库。
DaISy数据库[41]由比利时学者Lathauwer建立,包含8导联数据,前5导联信号来自孕妇腹部电极,后3导联信号来自孕妇胸部电极。该数据库的建立目的是增加科学论文报告结果的复现性,但该数据集中的数据仅来自一个孕妇,数据量少,通过实验验证发现,FECG信号也相对容易分离,故该数据库对FECG信号提取算法的准确率要求较低。
(2)NIFECGDB数据库。
NIFECGDB数据库[42]包含55条多通道腹部无创胎儿心电图记录,取自怀孕21~40周的孕妇,每条记录的持续时间不同,因此该数据库中的记录信号规律性低,对于提取算法的精度要求较高。
(3)ADFECGDB数据库。
ADFECGDB数据库[43]是在西里西亚医科大学通过KOMPOREL胎儿心电信号采集和分析系统获得的。每个记录包括从母体腹部获得的4导联数据和从胎儿头皮记录的作为FQRS注释参考的直接胎儿心电(fetal scalp electrode,FSE)信号,因此该数据库可通过胎儿头皮信号对FECG信号提取算法的准确率、阳性预测值等参数进行评估。例如,Gurve等[38]利用该数据库比较了算法提取到的FECG信号与真实FECG信号的差异,易于后续的算法改进与训练。
(4)PhysioNet数据库。
PhysioNET数据库[44]分为3个部分:SETA为训练集,研究人员应用新算法在SETA上进行训练;SETB为验证集,用于评估算法,以保证各种算法之间可以进行客观的评估和比较;SETC为测试集,该数据集为隐藏测试集。该数据库为目前使用最广泛的数据集,例如韩亮等[26]、Sarafan等[27]和Barnova等[40]均采用该数据集验证算法,因此他们的实验结果可进行横向对比,量化各算法的检测性能。但该数据集无胸部导联记录,无法应用于评估自适应提取系统。
(5)FECGSYNDB数据库。
FECGSYNDB数据库[45]是一个模拟成人和无创胎儿心电信号的大型数据库,为该领域的可重复性研究提供了可靠的资源。该数据库是使用FECGSYN模拟器生成,将母亲和胎儿的心脏表示为具有不同大小和空间位置的准时偶极子,将每个腹部信号成分(MECG、FECG和噪声信号)作为单独的信号源。FECGSYNDB数据库包含胎动、子宫收缩、心率加速/减速和异位心跳等非平稳事件。因此,该数据库能够提供更多FECG信号的形态信息,并为每个信号源提供单独的波形文件,可以更有效地对比算法的提取质量。
(6)NIFEADB数据库。
NIFEADB数据库[46]中包括12条胎儿心律失常的FECG信号记录和14条对照的正常节律的FECG信号记录,故该数据库适用于测试设计目的为自动检测心率异常的算法。
3.2 FECG信号质量评估
对于真实数据,由Clifford和Behar领导的牛津研究团队发起了一项名为“内科网络、心脏病学计算挑战2013”的国际竞赛[44]。该竞赛对算法的效果评估做出了重大贡献。FECG信号提取算法的性能一般使用灵敏度(Se)、阳性预测值(PPV)、谐波平均值F1和准确性(Acc)4个参数进行衡量。这些参数由检测到的胎儿QRS波复合物的分类来定义真阳性(TP)、假阳性(FP)和假阴性(FN),即正确识别、错误检测和漏检QRS波复合物。
对于FECG信号合成数据,除了可以应用上述统计数据,还可用其他参数评估,如信噪比(SNR)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)。虽然合成数据的评价方式更加完备,但是真实数据的评估仍是研究重点。若想将某种算法应用于实际医疗,必须要证明该算法能够提取到胎儿监护的主要临床特征。
3.3 组合方法的比较
近年来国内外多种算法组合提取FECG信号结果比较见表3。
表3 近年来国内外多种算法组合提取FECG信号结果比较
4 总结与展望
本文对传统算法和目前常用的2种或2种以上算法的组合进行了简单原理介绍及优劣势分析,并总结了目前常用FECG信号数据库及算法评估参数。随着科技的发展,许多算法都具有提取FECG信号的能力,根据本文综述的最新文献,2种或2种以上算法的组合可以改善单一算法的局限性,是未来用于FECG信号提取以达到准确评估胎心率并进一步实现FECG信号智能分析最有希望的方向。其中在无需胎儿头部参考信号和母体胸部信号的前提下,FastICA算法与SVD算法的组合是目前处理NI-FECG信号的最优方法,可提取到高质量的FECG信号。
FECG信号后提取算法近几年发展十分迅速,通过综述国内外研究现状,对该领域亟须解决的关键问题总结如下。
(1)后续对FECG信号进行形态分析。
目前,胎儿心率及其变异性是唯一能够获得的足够准确的参数,然而FECG信号的波形形态学分析能够提供更多的有意义的临床数据(如QT段、ST段、T/QRS等),因此在提取到高质量的FECG信号后,要对FECG信号进行自动检测分析与智能诊断,对用于临床诊断的关键特征信息进行判断。Pan&Tompkins算法[47]、希尔伯特变换[48]和WT[49]是目前最常用的3种特征提取算法。Pan&Tompkins算法生理约束较多,虽然存在自适应阈值,但是不能适应信号中的强变化;希尔伯特变换对于运动噪声伪影及基线漂移的鲁棒性较强,在存在噪声阈值的情况下,该算法仅固定在当前窗口,不影响其余信号,但其仅可用于R峰监测,无法得到形态信息;WT在低频部分具有较高的频率分辨力和较低的时间分辨力,在高频部分又具有较高的时间分辨力和较低的频率分辨力,特别适合处理像心电信号这样的非平稳信号。WT算法可以聚焦到心电信号的任意细节部分,有效地从心电信号中提取到有用信息,因此该算法十分适合提取出FECG信号后对FECG信号进行关键特征检测。
(2)缺少大型开放式NI-FECG数据库。
由表2可知,不同数据库的采样频率、采样时间、信号数量和采样通道数均不一致,这就导致每个数据库对于算法的精度要求不同(如DaISy数据库NI-FECG相对容易分离,对算法的精度要求就较低;PhysioNet数据库数据量很大,这就要求提取算法适用于多种情况,对算法精度要求就较高),因此不同的数据库对于算法性能检测差异较大。为客观评估提取算法的性能,应尽快建立一个大型开放式NI-FECG数据库,该数据库必须包含来自腹部和胸部电极的信号,从而可适用于自适应算法评估,且需要分娩期录制胎儿头皮电极信号,通过FSE进行参考记录,便于进行形态分析并对具体FECG信号智能分析功能的算法进行测试。
综上所述,FECG信号提取算法及数据库仍须进一步优化改进,从而量化比较各种算法,提取到具有完整清晰波形的FECG信号,实现FECG信号的形态分析,提供更多临床实践信息,保障母胎安全。