胎儿心电信号检测算法的研究进展
2021-07-01郝婧宇南格丽吴水才
郝婧宇,南格丽,吴水才
(北京工业大学环境与生命学部生物医学工程系,北京100124)
0 引言
胎儿心电信号(fetal electrocardiogram,FECG)是记录胎儿心脏动作电位在传导过程中图形的变化,可反映胎儿在子宫内的发育状况和心脏活动的生理特征[1]。妊娠期间,孕妇的心电图检查可发现胎儿的异常状况,通过采取有效措施可避免早产和妊娠意外的发生,保障母体和胎儿的安全[2]。在临床上,评估胎儿发育正常与否,需要医生对FECG的关键点以及关键区间进行分析,通过判断RR间期得出胎心率(fetal heart rate,FHR)基线、变异性、加减速等特征参数,进而得出诊断结果与意见。然而FECG的采集过程经常会受到各种噪声的干扰,这些干扰导致心电信号(electrocardiogram,ECG)波形种类多、变化大,医生难免会因经验知识和信号质量问题导致漏检、错检的发生。除此之外,目前的ECG检测算法存在对波群定位不准确的情况,如果不能正确识别波形,误导临床处理,将会给母体和胎儿带来巨大损失。因此FECG的检测一直是医学信号处理领域的研究热点。FECG检测首先需要对采集的母体和胎儿混合ECG进行预处理,随后再对提取出的FECG进行检测与识别。本文对FECG预处理方法进行简单阐述,并对国内外存在的FECG检测算法进行详细综述与分析。
1 FECG预处理
FECG预处理一般是抑制或减弱在信号采集过程中引入的干扰噪声,包括基线漂移、工频干扰、肌电干扰等,这些噪声的引入会对信号特征的识别产生干扰。在FECG检测过程中,由于母体与胎儿的混合ECG频谱在一定范围内有重合(如图1所示),因而对母体ECG的影响最为严重[3]。临床表明,FECG与母体ECG R波重叠发生的概率为15%~30%[3]。在滤除这些噪声干扰时,FECG的有效成分也可能被滤除,导致信号的重要片段丢失。如何在有效信号不损失的情况下滤除噪声干扰是需要研究的一个重要内容。
图1 母体ECG与FECG频谱图[3]
近年来,随着现代信号处理新方法的不断提出,信号预处理方面的研究有了很大的进步。黄艺格等[4]采用基于小波变换(wavelet transform,WT)法的自适应滤波器对母体和胎儿混合ECG进行白化和去均值处理后,利用基于负熵的快速固定点算法(fast independent component analysis,fastICA)分离混合ECG,再使用小波去噪去除信号中的噪声。张淼等[5]采用集合经验模态分解(ensemble empirical mode decomposition,EEMD)法与准周期成分提取方法相结合的算法获得ECG的本征模函数(intrinsic mode function,IMF),判断出含噪IMF的数量,再将各个通道信号相对应的IMF进行组合,用准周期成分提取方法提取FECG的信息,消除母体噪声,获得纯净的FECG。Kaergaard等[6]考虑到经验模态分解(empirical mode decomposition,EMD)法所存在的模态混叠效应以及利用神经网络算法的高效去噪,采用EEMD法和自适应相结合以及WT法和神经网络算法相结合的方法,使得噪声得到很好的抑制。Kaleem等[7]也通过临床数据检验信噪比和均方误差,比较了用于FECG提取的最小均方误差自适应滤波器和基于神经网络算法的自适应滤波器,发现基于神经网络算法的自适应滤波器滤除噪声的性能更优。
2 FECG检测
当FECG预处理完成后可以获得较为纯净的FECG,想要准确计算RR间期以及其他特征参数就需要对其波形特征进行识别与分析。FECG检测是对P、QRS、T、U波的起点、峰值和终点的位置进行检测。在这些波形中,QRS波群是最明显的波群,一般包含大部分的心电特征参数。因而在特征参数检测中,也是从QRS波群开始。首先对R波峰值进行检测,再对QRS波群的起点和终点位置进行检测。QRS波群起点和终点的位置不明显,因此如何准确定位QRS波群起点和终点是FECG检测算法亟须解决的问题之一。
QRS波群的检测方法主要包括差分阈值法(defference threshold arithmetic,DTA)、WT法、EMD法、机器学习算法、多导联融合检测算法等,这些方法都是先经过一系列变换和处理来突显QRS波群、降低噪声,然后利用阈值或其他方法进行波形检测。
2.1 DTA
DTA是利用QRS波群的斜率变化来进行R波的定位。R波的位置就是一阶差分过零点与二阶差分极值点。在FECG检测中,首先选取相对平稳的波段,然后使用DTA对其进行一阶、二阶差分来完成R波定位。
Pan等[8]提出的Pan&Tompkins算法(以下简称“PT算法”)是最经典的阈值检测方法。该算法通过设定可变阈值将ECG依次经过带通、差分、平方、积分等步骤,对QRS波群进行斜率、幅值的分析。于海兰[9]采用Mexican-hat小波变换,在8尺度的小波域上检测胎儿QRS波群,应用阈值检测法定位R波和平面几何数学的方法定位Q波和S波。Zietek等[10]对FHR及宫缩曲线进行研究,在PT方法的基础上设置一个可滑动窗口,通过检测窗口内R波的分布与R波波峰的距离获得FHR与宫缩值的频数分布,进而判断该窗口是否存在宫缩,但该时间加窗法时延过长且效率低。针对这个问题,张仙伟等[11]提出基于加权平均的检测算法,将窗内自动加权平均且窗外指数加权平均修正,对窗内的FHR加以限制,从而使输出结果更加稳定。
固定阈值的检测会出现偏差,如果阈值太高,R波不容易被识别,如果阈值太低,会遗漏R波,而PT算法避免了这种问题,效果比固定阈值更好,抗干扰性更强,但这种传统的阈值检测法难以准确识别翻倍和减半的FHR。因而Zhou等[12]提出一种基于峰值估计和阈值测量的自相关峰值定位方法,通过建立自适应算法和阶段性循环平均幅度差函数模型识别胎儿QRS波群的分布,进而准确计算FHR,消除翻倍和减半的情况。田应忠等[13]也提出一种FECG检测方法,通过对信号中QRS波群进行自相关及乘积项计算,取自相关计算中的最大值为第一主峰值、第二大值为第二主峰值,当第一主峰值为第二主峰值的倍数时,用第一主峰对应的心率值的最大乘积项除以第二主峰对应的心率值的最大乘积项,得到的数值比率如果大于预定阈值,则第一主峰为所求的FHR,此方法能解决FHR减半和翻倍的弊端,而且改善了FHR计算延迟的问题。
DTA以原理简单、速度快的优点在心电监护中得到较为广泛的应用,其对明显的QRS波群定位准确度高,但是对于T波以及异常ECG的波群特征不能很好识别。除此之外,DTA在高噪声干扰下检测率较低,对于掺杂了伪差的数据漏检率高。针对DTA的这些弊端,还需要对其进一步研究并改进。
2.2 WT法
WT法作为一种信号检测技术,在信号奇异性检测方面具有很大优势。WT法先将信号进行多尺度的小波分解,针对尺度分量设置合适的阈值,判断各尺度分量上的模极大值,确定模极大值之间的过零点位置,然后经过位置修正来识别ECG。ECG中QRS波群是典型的奇异信号,因而WT可以很好地对QRS波群进行识别。
1995年,Li等[14]首次将WT法用于ECG的检测,但WT法在信号分解和重构过程中极易产生不必要的频率成分,使得ECG特征的识别不准确。随后,Li等[14]又利用样条小波作为小波函数,定位到信号的急剧变化点,采用模极大值法对ECG进行处理,在特征点的确定上比传统小波更准确,但该算法的处理速度较慢,不能分析长时间的ECG数据。面对该问题,国内外学者对小波函数的选择和阈值的设定进行了广泛研究,基于WT的优化算法层出不穷。占海龙[15]通过对算法收敛速度和稳态误差的比较,确定最优小波基函数和小波分解层数,借助小波基的多尺度分析在时、频域上检测FECG。Ghaffari等[16]提出一种采用几何特征和小波变换相结合检测FECG的方法,该方法可以高精度提取胎儿QRS波群,并且无需将FECG与母体ECG分离,但该种方法不能检测与母体QRS波群重叠的FECG。针对这一问题,Almeida等[17]首先定位母体的ECG,然后在胎儿QRS波群中标记与母体心跳相关的信号奇点,合并到一个带有后处理规则的单一注释器中,最后计算胎儿RR间期和FHR。除此之外,还可以在检测之前先对整个区间做一次循环,滤除掉无用的函数值,再运用二分法检测,可有效地提高速度。
WT法提高了检测的准确性,但算法较复杂,降低了检测速度。DTA原理简单,计算量小,但不能很好地控制高频干扰。Elmansouri等[18]提出了一种将WT法和DTA相结合的算法,首先利用最优奇异值分解法从单通道混合ECG中检测胎儿QRS波群,该方法基于差分频谱能量(差分频谱能量序列表示2个相邻奇异值之间的变化状态),采用非抽样WT法得到峰值位置的准确信息。与DTA相比,WT法的计算量较大,但检测率较高,在一定程度上能够解决DTA对高频噪声干扰不敏感的弊端。
2.3 EMD法
EMD法是分析非线性、非平稳信号的有效方法,通过检测R波波峰,得到RR间期的时间序列,然后对得到的FHR变化序列进行EMD处理,把复杂的信号自适应地分解为有限的基本模式分量,然后对分量进行希尔伯特黄变换(Hilbert-Huang transform,HHT),最后计算FHR的希尔伯特边界谱在不同频带范围内的功率,建立一个定量测量的方法。
1998年,Huang等[19]提出了EMD法,并引入希尔伯特谱分析方法。徐雯[20]通过HHT对FHR变异进行分析,提出了基于EMD和HHT检测FECG的R波波峰,进而计算出RR间期。由于通过RR间期计算得到的是非均匀的信号序列,若直接对其进行谱分析,会带来频谱噪声干扰。因而,徐雯[20]又提出将FHR序列的横坐标由心跳数改为时间,使信号频谱的频率轴由Hz来衡量,这样信号的实际物理意义就更加确切。Wilson等[21]提出了一种鲁棒希尔伯特变换结合独立成分分析的方法检测FECG,该方法可应用于单个通道或一组通道导出的信号,在多通道数据的情况下,可以结合这些通道提高FECG数据的信噪比,该方法具有对胎儿的位置或运动不敏感的优点。张淼等[5]提出一个基于EMD法和准周期成分提取方法的多通道FECG提取方法,首先,采用EMD法将各通道腹壁混合ECG分解为一系列IMF,消除IMF中母体ECG的成分,用准周期成分提取方法提取FECG的信息。最后,由提取的IMF重构出FECG,完成FECG的检测。
EMD法具有完全自适应性,能够根据信号的特点自适应地产生“基”,但这样的“基”没有明确的解析表达式,需要人为去设定分解的总体平均次数,除此之外,还会产生模式混叠效应。针对这些问题,研究者们相继提出EEMD法、自适应完备总体经验模式分解(complete ensemble empirical mode decomposition,CEEMD)法等算法。EEMD法与CEEMD法是对EMD法中模式混叠效应的改进,通过加入幅值为零的白噪声,使得信号在尺度上具有连续性。由于EMD法具有完全自适应性的优点,与其他算法相融合的新方法是未来的研究方向。
2.4 机器学习算法
机器学习算法是通过已知数据集对新数据进行判断或预测,其目标是设计可以根据先验知识和观测数据不断改进性能的算法。机器学习算法主要包括传统的机器学习算法和基于深度学习的机器学习算法,可以从海量的数据中提取关键特征并进行识别,提升在特定任务上的性能,其凭借准确、高效的特点,在ECG检测领域快速兴起。
2.4.1 传统的机器学习算法
传统的机器学习算法包括特征提取和分类识别2个过程,主要有支持向量机(support vector machine,SVM)算法、迁移学习(transfer learning,TL)算法、最小二乘支持向量机(least squares support veotor machine,LS-SVM)算法、随机森林(random forest,RF)算法、K最近邻(K-nearest neighbor,KNN)算法等。近年来,针对这些算法的特点,国内外学者在方法本身的基础上不断改进,取得了不错的检测效果。
SVM算法是定义在特征空间上的间隔最大的线性分类器,是对所给定的数据集进行隔离,其强大的数据挖掘能力在机器学习算法中具有很大的优势。Liao等[22]应用WT法检测母体QRS波群,用相干平均法构造母体ECG并去除后,利用SVM算法从残留信号中定位胎儿QRS波群,阳性预测值达89.60%。Warrick等[23]利用霍特林变换(Karhunen-Loève transform,KLT)与SVM算法结合的方法,从250 ms的心电片段中检测母体和胎儿QRS波群的存在和缺失,结果表明,当胎儿QRS波群未叠加在母体QRS波群上,能被较好地检测,而当胎儿QRS波群叠加在母体QRS波群上时,胎儿QRS波群检测效果下降。Delgado等[24]通过结合WT法和SVM算法,应用Haar WT法降维和特征提取,采用四分位间距和不替换采样分别处理离群值和不平衡类问题,最后采用SVM算法进行测试,胎儿QRS波群的识别率为89.59%。为了提高检测精度,Delgado等[25]在上述方法[24]的基础上进行改进,构建2个SVM分类器分别对无噪声片段和有噪声片段建模,识别率提高到90.95%。
叶明珠等[26]在检测FECG时,引入TL算法,采用盲分割、插值法对截取的信号进行降噪预处理,采用广义S变换捕捉信号的频率特征,然后作为SVM输入进行FECG的异常检测,准确度为97.9%。引入TL模型后,模型的学习效率加快,收敛性能更好。
面对FECG复杂、多变的特性,SVM分类器运算时间过长,可能无法给出最优解,LS-SVM算法改变了求解最优解的方法,采用最小二乘线性系统作为损失函数,解决了该问题。张扬[27]对FECG提取时域、频域和非线性特征等参数后,采用LS-SVM算法对其进行检测,代替传统SVM算法的二次规划方法,降低了计算复杂性。LS-SVM算法是目前医学信号处理中常用且性能优良的方法,适用于大样本数据的检测,但是会发生过拟合现象。
RF算法是一种基于决策树的集成学习算法,可以很好地解决过拟合问题。当预测新样本时,总输出将是RF算法中每棵树检测结果和投票的最大值。黄立勤等[28]运用RF算法学习样本特征的重要性分数,对数据降维与可视化后,利用RF分类器对FECG数据样本进行分类。Zhong等[29]提出一个基于前缀树的框架(QRStree),用于直接从腹部混合ECG中检测FECG,该框架的新颖之处在于利用FHR范围来建立胎儿QRS波群之间的连接。RF算法可理解性较好,可平衡数据集的误差,但设置参数较复杂,模型训练和预测过程时间较长。
KNN算法是最简单的机器学习算法之一,判断方法为:每个样本都可以用它最接近的K个邻居来代表。张扬[27]运用线性插值解决类不平衡的问题后,使用3个近邻计算每个波形的信息,从原始数据集中选择出良好的特征子集,提高了FECG检测准确率。
以上检测算法都存在共同的问题,需要训练大量的样本,并进行额外的特征提取,步骤复杂且效率较低。因此,不少研究人员运用深度学习算法来解决各种复杂的信号异常问题。
2.4.2 基于深度学习的机器学习算法
深度学习网络在提取高层次特征、表述特征能力上具有良好的性能,它将特征提取和分类识别2个过程一起执行。最早的深度学习是运用神经网络来处理特征层。人工神经网络(artificial neural network,ANN)是通过对样本的学习训练,不断改变网络的拓扑结构及连接权值,使得输出值不断地接近期望输出值。卷积神经网络(convolutional neural network,CNN)相比ANN具有更好的形态特征提取能力,对信号细节的识别更有效。CNN的结构如图2所示[30],通过卷积运算学习数据特征,按阶层结构对输入信息进行特征选择和信息过滤。
图2 CNN的结构图[30]
Yilmaz[31]设计不同的ANN模型来检测FECG,实验发现,当多层前向神经网络由2个隐层和具有线性传递函数的输出层神经元组成时,检测准确度最高。该算法避免了手动提取特征的步骤,但还需提高准确度。Li[32]将一维FHR作为输入,通过不同时频参数和不同分辨力对FHR进行处理,将输出反馈给CNN进行检测,模型使用3个卷积层和1个全连接层,检测准确度明显提高。Zhao等[33]也运用深度CNN检测FECG,利用WT法得到时频图像后,经过调整参数发现,当卷积核为8层、滤波器的数量为15时,可获得最佳检测结果。
对于FECG中母体ECG的干扰问题,Lee等[34]提出一种基于CNN并且可以不分离母体ECG就可检测出胎儿QRS波群的算法,包括7个卷积层、2个完全连接层,能够充分提取胎儿QRS波群的特征,但该种方法需要大量数据作为训练集,模型训练较复杂。
针对机器学习算法训练较复杂的特点,谢晓路等[35]通过最小化误差函数构造人工序列,将人工序列与腹部混合ECG作差,自适应地滤除母体ECG,接着通过基于K均值聚类的胎儿R波尖峰检测算法和精筛选算法提取胎儿的R波尖峰。该算法计算复杂度低,避免了对混合ECG建立复杂的模型。徐伟等[36]将二维CNN应用于FECG检测中,结合批量标准化和Dropout技术,提高了CNN的性能,最终在不去除母体ECG的基础上使用CNN进行检测,得到了较高的敏感度、阳性预测值和准确度。VO等[37]提出了一个纯端到端深度学习模型来检测胎儿QRS波群,该方法采用新颖的一维八度卷积(octave convolution,OctConv)来代替传统卷积,能在提升检测效果的同时节约计算资源的消耗。此外,该模型运用残差网络架构,通过增加相当的深度来提高准确度。除此之外,TL算法的出现也可以改善模型训练较复杂的问题。例如,Comert等[38]用短时傅里叶变换得到二维图像后,引入TL算法并结合CNN来对FECG进行检测。孙梦莉[39]在对FECG检测时,也引入TL算法来缩短训练时间。TL算法的主要优点是节省训练时间,在预先训练的CNN上进行特征提取是最简单、最快的方法。
机器学习具有很强的自适应能力及学习能力,检测精度更高、鲁棒性更好,但机器学习算法过度依赖数据集,需要较长的训练时间,且数据集的好坏会影响算法效率,这对高质量的QRS波群数据集的建立提出了实质性的要求。
2.5 多导联融合检测算法
单导联检测算法在近年来逐渐走向成熟,除了单导联方法外,多导联融合检测算法可以联合多个导联的QRS波群信息提高结果的灵敏度与准确度。
多导联融合检测算法主要用于母体和胎儿ECG分离时母体的R波检测。Varanini等[40]利用波群的伪周期性和时域特征,设计综合这些特征的质量指数,该方法首先查找最大母体质量指数和母体QRS波群的线性组合,增强母体QRS波群,通过加权奇异值分解对母体心电分量逼近和去除,然后查找最大胎儿质量指数和胎儿QRS波群的线性组合增强胎儿QRS波群并进行FECG检测。Wilson等[21]在多通道数据的情况下,提出的鲁棒希尔伯特变换结合独立成分分析的方法可提高提取FECG数据的信噪比。
上述方法都是直接采用多导联融合检测算法,而当某个导联ECG质量高时,算法效率和检测准确度就会降低。为解决这一问题,Ghaffari等[41]基于噪声分布和胎儿R波波峰可见度对信道进行智能评分以找到最佳信道,该方法可对图形结构差异前向纠错,并减少提取FHR所需的时间。Varady等[42]根据FECG的相关特性,提出一种双通道采集装置,使用一个通道传感器采集环境噪声,另一个通道采用听诊器结构的腔体在孕妇腹部采集信号,然后运用带通滤波器、WT以及互相关等方法对信号进行降噪等处理,最后计算出FHR。
使用多导联融合检测算法能提供更好的输入信号,且组合使用2种不同的检测方法可提高检测结果的准确度,但有些胎儿的R波波峰受噪声影响严重,即使进行融合决策,最终的检测结果仍不理想。虽然该方法有一定的效果和前景,但是在实际应用时,还是需要考虑加以改进,尽可能使用噪声检测算法来调整2种算法的最小阈值,避免噪声干扰。
3 各种算法的优缺点分析
胎儿FECG检测算法中,WT法和EMD法为分析QRS波群这种非线性、非平稳信号提供了有力方法,成为目前FECG分析领域的热点。然而小波函数的选择对小波分析波形有很大的影响。相对而言,EMD法的自适应性更有利于FECG的检测。但是EMD法在分解FECG时存在模态混叠现象以及端点震荡效应。EEMD法虽然解决了EMD法的模态混叠问题,但白噪声的引入又产生了信号重构误差的问题。深度学习算法虽然准确度高,但需要对大量的模板进行训练,耗时较长,在实际应用中有一定难度。各种检测算法都存在其优势与不足,详见表1。
表1 各FECG检测算法的优缺点分析
4 未来研究展望
目前,国内外学者对FECG检测的研究成果颇丰,如何设计更加先进、高效的FECG检测算法是一直致力研究的方向,还需要进行大量的算法测试来解决检测准确度低、模型训练时间长等现实问题。通过比较国内外学者的研究,发现可以从以下几个方面对算法进行改进:
(1)融合多种检测算法。
每一种FECG检测算法都有其优点和局限性,一般而言,融合使用多种方法可以更好地识别信号中的有用信息。比如WT法具有良好的时、频域特性,但算法较复杂,而DTA原理简单、计算量小,但不能很好地控制高频干扰,因而WT法和DTA相结合可以更好地实现FECG的特征提取。除此之外,EMD法具有完全自适应性的优点,与WT法相融合的新方法也具有好的发展前景。再比如针对机器学习中模型训练较复杂的特点,可以先采用离散WT法对信号预处理后,计算出频域特征,再使用SVM算法或神经网络算法进行FECG的检测识别。
(2)设计轻量型训练模型。
机器学习在FECG处理领域中占据着至关重要的作用,无论是应用传统的机器学习算法,还是应用深度学习对目标函数进行拟合,都有不足之处。前者耗费成本过多,后者模型参数越多,训练所需数据量就越大,有过拟合的风险。
为解决此类问题,可以研究一种轻量级的网络模型,具体可以采用:①卷积降维,在模型中添加一维卷积,降低输入通道数,对卷积核个数和网络层数进行参数配置与优化,使得复杂度降低。②使用低维的卷积核区代替高维的卷积核。③在全连接层进行最大池化,减少运算量和参数量,使得运算复杂度降低。④特征层融合,分别通过传统的机器学习和深度学习提取出不同的特征,然后按一定的规则进行特征融合。
(3)引入TL算法。
在深度学习中TL算法是在预先训练的CNN上进行特征提取。FECG数据集复杂、庞大,各个医院检测标准难以集中统一。TL算法可借助现有数据集对网络进行源域训练,再将训练好的网络模型迁移到目标域中。因而可以将深度学习与TL算法结合,通过TL算法对所传输的数据进行调整以适应新的数据,再利用深度学习挖掘其特征。
(4)提高算法自学习能力。
现有的FECG检测算法自学习能力不高,信号预处理及波形检测识别算法的性能需要提升。可行的解决方法有:①在算法中加入自主学习过程,通过识别新的数据集来扩充自己的训练集,通过迭代增强算法的准确性与鲁棒性。②可引入进化计算等优化方法进行自优化,提升对特定数据的识别。③可进行模糊计算,将人类的模糊推理融入算法的自学习过程中,优化识别模型。
综上所述,针对FECG检测的算法仍需要进一步优化改进,从而研究出FECG参数在产前的变化趋势以及与新生儿预后健康的相关性,保障母体和胎儿安全。