基于迁移学习和支持向量机的胎心率分类方法
2020-06-08叶明珠赵治栋
叶明珠,赵治栋
(杭州电子科技大学电子信息学院,浙江 杭州 310018)
0 引 言
电子胎心宫缩监护(Cardiotocography, CTG)作为胎心率和子宫活动的图形表示,是正确评价胎儿宫内状况最常用的方法。CTG评估的临床实践很大程度上取决于临床医师的经验和主观判断,造成CTG分析的差异性和不准确性。胎心率是判断胎儿在子宫内的安全指标,是CTG最重要的组成部分。胎心率诊断系统一般分为胎心率(Fetal Heart Rate,FHR)信号预处理、FHR信号特征提取、特征降维和状态分类。纵观现有的CTG分类算法,可分为传统手动特征提取算法和特征自学习算法。2000年以来,多位学者对FHR参数进行研究,提取出多个线性、时域、频域及非线性等特征,采用不同算法对特征进行降维和分类,在小数据下取得了较为理想的效果。G.G.Georgoulas等[1]采用隐马尔可夫模型对CTG参数进行分类,将胎儿分为正常组和低氧组。J.Spilka等[2]在分析胎儿心率信号时,增加了一些非线性特征,提高了信号分类的准确性。但是,此类算法的准确性在很大程度上取决于选择的特征是否能准确反应胎心率的波形变化状态,且手动提取特征过程过于繁琐。为了提高分类性能,许多学者对分类算法进行深入研究,如人工神经网络、基于机器学习的算法。A.Georgieva等[3]使用人工神经网络对FHR进行监控,省去繁琐的特征提取过程,且分类效果有所提升。
为提高胎儿评估算法的准确率,并简化胎儿评估算法的步骤,本文提出基于迁移学习和支持向量机(Support Vector Machine,SVM)的胎心率分类算法,节省了胎儿状态评估的时间成本,取得了较好的分类效果。
1 基于迁移学习与支持向量机的二分类算法
本文算法分为4个步骤:预处理、FHR信号转换为图像、AlexNet特征提取和SVM分类,如图1所示。首先,对原始的FHR信号进行插值预处理。然后,将预处理后的信号从参数有限的时域转换为具有更详细局部特征的频域。FHR轨迹图像通过在频域的每个时间点绘制当前FHR轨迹(每种情况下用N个点绘制N个FHR轨迹)获得,实现了对二维图像的一维信号处理,充分反映了FHR信号在一个连续周期内的频谱特征趋势。AlexNet作为输入轨迹图像的特征提取器,节省了手动特征提取、特征降维等复杂步骤。最后,从卷积神经网络中提取特征作为SVM的输入,SVM比卷积神经网络的Softmax分类器具有更好的泛化能力,且针对二分类问题具有更好的分类效果。
图1 算法流程图
1.1 数据集
本文采用的数据库来自捷克技术大学布尔诺大学医院(Czech Technical University-University Hospital in Brno,CTU-UHB)CTG数据库,包含552个原始FHR信号,数据为2009—2012年在捷克共和国布尔诺大学医院产科病房获得的9 164次分娩CTG记录的子集,所有信号采样频率均为4 Hz。CTU-UHB数据库中使用的孕妇和新生儿生理参数的详细信息见文献[4]。
临床实践中,新生儿脐动脉血的pH值是一种常用的胎儿注记方法。本文选择pH值为标准,对胎儿心率信号进行跟踪分类。pH<7.15为异常,pH≥7.15为正常。数据库含正常胎儿447例,病理异常胎儿105例。数据库中正常和异常CTG信号的1个例子如图2所示。本文从CTU-UHB数据库中随机选取正常和异常信号各100例进行训练和测试,其中训练集占70%,测试集占30%。
图2 正常和病理异常FHR信号示例
1.2 信号预处理
本文采用线性插值方法对原始信号进行预处理,减少了由于胎儿运动和换能器位移引起的伪影和尖峰。首先,移除值为0,且持续时间大于15 s的FHR信号;然后,当信号不稳定时,即相邻2点的绝对值大于25次/min,在初始采样点和下一个稳定部分的第一个点之间进行插值;最后,采用埃尔米特(Hermite)样条插值填补信号值大于200 bpm和小于50 bpm的信号。数据库中的每例FHR信号包括14 400个时间点,实验随机截取信号的1 800个点以供后续工作。预处理的效果如图3所示。
图3 FHR信号预处理结果
1.3 广义S变换
信号的瞬时频率特征反映信号在不同时刻的频率变化规律。本文采用广义S变换(Generalized S-transformation, GST)对信号进行时频分析[5],得到比原始时域更为丰富的信息。与传统的时频分析方法相比,广义S变换具有可变形态的窗口,可以对信号的特定区域进行时频聚焦,得到更好的局部谱和时频聚集。因此,本文采用广义S变换对FHR信号进行时频域转换处理,将一维的时域信号映像到二维的图像信号处理,得到FHR信号的二维图像,作为卷积神经网络(Convolutional Neural Networks,CNN)的输入层。
S变换是连续小波变换的“相位校正”,即多分辨率下小波变换的扩展。而广义S变换是在S变换基础上,对高斯窗函数的改进。
首先,x(t)的S变换表示为:
(1)
式中,τ为窗函数的中心点,t为积分时间,f为频率,j为虚部符号,广义高斯窗口函数表示为:
(2)
式中,λ和p为调节因子,用于调节高斯窗口函数的形状,使时间窗适应频率的变化,从而细致地表征信号的局部特性,获得理想的时频分析效果。将式(2)代入式(1),得到广义S变换的标准形式:
(3)
式(3)得到复数矩阵,矩阵的每一列代表每一个时刻的瞬时时频域特征。每例FHR信号中含1 800个时间点,从中随机抽取100个时间点,对其进行广义S变换,得到100个时频特征,样本包含200个FHR信号,于是,采用广义S变换得到的FHR轨迹图共有20 000幅,其中胎儿的正常类别和异常类别各占10 000幅,每幅图像的分辨率为227×227×3。
1.4 特征选择和分类
CNN使原问题转化成图像分类问题,通过大量样本数据的训练,无需图像预处理和手动特征提取即可获得理想的分类结果。图4给出了一个典型的CNN网络结构,主要包括卷积层、下采样层、池化层、全连接层。卷积层通过卷积运算来提取图像特征;下采样层在减少数据处理量的同时保留有用信息;池化层减少网络参数,缓解模型过拟合问题;全连接层得到CNN提取的图片特征,Softmax作用于输出层,得到每个像素的分类结果。CNN避免了传统的手动提取特征的步骤,但其强大的特征自学习功能依赖于大数据库的长时间训练。迁移学习的主要优点是节省训练时间,而且在大多数情况下,不需要通过大量的数据来提高性能。在预先训练的CNN上进行特征提取是最简单、最快的方法。
图4 CNN结构图
AlexNet模型是文献[6]提出的一种深卷积神经网络模型,在2012年的ImageNet比赛中获得冠军,模型成功地对1 000个物体进行分类,取得了准确率为99.99%的识别结果。本文采用预训练的AlexNet对数据集进行特征提取,数据集由20 000条输入的FHR轨迹组成,分为训练集和测试集。10 000例正常CTG数据中,7 000例纳入训练组,其余纳入测试组。10 000例病理数据以同样的方式划分。详细的网络架构如表1所示。微调预训练的AlexNet对新的图像集合进行分类,首先加载并划分数据集,然后调整图像大小以适应网络的输入大小,指定最小批量,将神经网络的Softmax分类器替换为SVM,从网络中提取测试图像的特征并输入到SVM中。SVM是一种用于数据二分类的监督学习分类器,其决策边界是求解学习样本的最大边缘超平面。相比于Softmax,SVM对于未见过的测试样本具有更好的推广能力,且得到的是全局最优解,解决了神经网络中无法避免的极值问题。
表1 网络架构
2 实验结果与分析
本文采用3个评价指标来评价FHR信号分类算法的性能,分别为:真阳性率(True Positive Rate,TPR)、假阳性率(False Positive Rate,FPR)和准确率(Accuracy, ACC),TPR又称灵敏度,FPR为特异性。这些指标的定义如下:
PTPR=NTP/(NTP+NFN)
(4)
PFPR=NTN/(NTP+NFP)
(5)
PACC=(NTN+NTP)/(NTP+NTN+NFN+NFP)
(6)
真正例(True Positive,TP)表示原始正确样本被归类为正确的样本。真反例(True Negative,TN)表示最初错误样本被归类为错误的样本。假正例(False Positive,FP)表示原始错误样本被归类为正确的样本。假反例(False Negative,FN)表示原始正确样本被归类为错误的样本。这些参数有规律地应用于具有二分类问题中,以测试分类方法的性能。实验结果得到PACC,PTPR,PFPR分别为97.90%,98.38%和97.42%。
为了验证本文方法的分类性能,在使用相同的数据集CTU-UHB数据库的基础上,与EMD、统计检验和短时傅里叶变换进行比较,结果如表2所示。
表2 本文方案与前人方案比较
通过表2可以看出:本文方法的分类准确率达到97.90%,优于传统胎心率分类算法。与文献[7]和文献[9]方法相比,本文通过采用广义S变换对FHR信号进行图像变换,大大提高了模型的精度;与文献[8]相比,本文方法基于AlexNet的迁移学习进行特征自学习,省去了特征提取的繁琐步骤;与文献[9]相比,本文方法的输出层将卷积神经网络的Softmax分类器替换成SVM,得到更好的分类效果。因此,可以通过迁移学习和SVM来提高FHR信号的分类效果。
3 结束语
本文通过研究胎儿状态评估方法,提出基于迁移学习和SVM的胎心率分类算法,较传统分类算法有更高的分类精度,且分类过程简单。本文亦存在不足之处,一方面实验使用的数据库较为单一,另一方面实验算法没有得到临床验证,下一步把算法运用在临床数据中,不断改进算法的临床可实践性。