APP下载

基于卷积神经网络-长短期记忆神经网络模型利用光学体积描记术重建动脉血压波信号*

2024-02-26吴佳泽梁昊陈明

生物化学与生物物理进展 2024年2期
关键词:收缩压波形卷积

吴佳泽 梁昊 陈明**

(1)北京中医药大学中医学院,北京 102488;2)湖南中医药大学中医诊断研究所,长沙 410208)

高血压是常见的心血管疾病,其不仅会导致动脉粥样硬化、心肌梗死、脑卒中等严重的心血管疾病,而且会累及眼、脑、肾等全身器官,危害极大[1]。由于高血压形成缓慢,民众不够重视,导致中国高血压知晓率、控制率普遍不高[2],因此造成了社会医疗资源的严重消耗,给个人和国家造成了严重负担。黄锦荣等[3]研究得出,控制高血压最有效的方法是社区防治,所以为了提高高血压知晓率和治疗率,除加强健康教育外,更需要一种方便快捷、可长期连续进行的无创血压监测方法。

目前临床上常用的血压监测方法是直接血压监测法和间歇血压监测法[4]。相比直接血压监测法,间歇血压监测法无法持续监测血压,充气袖带也不适用于患有“淋巴水肿”等疾病的患者,并且血压测量值会因肢体活动或袖带压迫等原因受到影响;直接血压监测法虽然可以获得动脉血压(arterial blood pressure,ABP)波而得以持续监测血压,并且其测量值也被定为“金标准”,但侵入式监测方法对技法、设备和医疗专业知识要求较高,且有引发并发症的可能,因此不适于家庭等环境,也无法大规模推广应用。基于以上原因,连续无创血压监测越来越受到重视,尤其是容积脉搏波法[5],容积脉搏波可以反映测量位置处的血容量变化,这与血压密切相关。因此,可以利用其来监测血压,如联合使用容积脉搏波和心电图(electrocardiogram,ECG)信号的脉搏波传递时间(pulse transit time,PTT)[6]和脉搏波到达时间(pulse arrival time,PAT)[7]方法,以及基于PTT或PAT的脉搏波传播速度(pulse wave velocity,PWV)[8]方法。虽然得到的结果令人满意,但是PTT和PAT方法需要容积脉搏波和ECG两种信号数据,PWV方法还需要测量体表动脉节段间的距离,这不仅增加了操作复杂性和成本,而且难以保证信号间的同步性。因此,若能利用单一容积脉搏波信号进行连续无创血压监测,那么就会因装置简单、操作难度小等优势而有诸多临床应用价值。机器学习方法常用于该方向的研究,一些学者分别将自容积脉搏波信号中提取的特征信号[9-10]和容积脉搏波原始信号[11-12]作为模型输入来进行连续无创血压监测研究,其中原始信号因比特征信号包含更多信息而使模型效果较优。然而,这些研究都只聚焦于收缩压和舒张压,而非ABP波[13],这导致呈现的血压信息不全面,有价值的心血管信息有所缺失。

血流动力学研究表明,ABP波相比收缩压和舒张压包含更多信息[14]。因此,有学者希望利用容积脉搏波重建ABP波,如此就得以方便、快捷地获取ABP波以实现连续无创血压监测,并借以提高高血压诊断的准确性[15]。如Cheng等[16]构建的ABP-Net模型,虽然其重建ABP波的性能较优,但是模型输入除容积脉搏波原始信号外,还包括其一阶导数和二阶导数,这显然增加了计算复杂度;Li等[17]构建的GRNN模型不仅可以重建ABP波,还可以计算其频域特征,这为相关研究提供了基础,但需额外构建相应的编码器和解码器,且GRNN模型的空间复杂度也较高。因此,本文构建了卷积神经网络-长短期记忆神经网络(CNNLSTM)模型以从容积脉搏波重建ABP波,进而实现连续无创血压监测。该模型的输入仅为容积脉搏波原始信号,无需ECG等其他信号数据,并且也无需对其进行人工特征提取;该模型的输出为ABP波,除可从中获得收缩压和舒张压外,还可借以提高高血压诊断的准确性。

1 光学体积描记术和ABP波

脉搏波是由心脏搏动向动脉血管和血流传播形成的。图1所示为光学体积描记术(photoplethysmography,PPG)、ABP波的测量及典型波形,其中PPG波是由光电传感器检测血管容积随时间变化而得到的[18],光电传感器会测量经血流吸收和反射后的衰减光,将不易测量的光信号转换成易测量的电信号来检测血流容积变化,ABP波是将导管直接置入动脉内测量ABP随时间变化而得到的。

Fig.1 Measurement and typical waveforms of arterial blood pressure wave(a) and PPG(b)

从波形采集来看,PPG波的采集相对简便,光电传感器对灵敏度和体位的要求较低,可长时间无创采集[19],ABP波的采集较为复杂,且可能引发并发症,多于重症监护室内采集。从波形形态来看,PPG波相比ABP波缺失了潮波,又称重搏前波,即FGC段。从各波段代表的生理意义来看:AB段为快速射血期,此时主动脉瓣开放,微血管的容积增大,形成上升支,因此主波波峰B为收缩压,波谷A为舒张压;BC段为减慢射血期,此时微血管流向周围的血量大于流向微血管的血量,微血管的容积回缩,形成下降前支;CE段为心室舒张期,此时微血管中的血量进一步减少,形成下降后支,下降后支中出现的小波为重搏波,重搏波是由于心室扩张,主动脉瓣关闭,主动脉内血液向心室方向反流而使主动脉根部容积增大,血流冲击主动脉瓣形成反射脉搏波并再次传递至微血管处形成的[20];FGC段是由主动脉根部的初始波向外周传播时受外周因素而产生的折返波多次叠加形成的[21]。

2 模拟实验

2.1 数据集

本文实验使用的数据集来自无袖血压估算数据集(cuff-less blood pressure estimation data set)[22],该数据集包含以125 Hz的频率在不同时间采集的多位患者PPG、ABP同步信号数据。该数据集的原始数据来自重症监护医学信息集(medical information mart for intensive care,MIMIC)[23],该数据集作者对原始数据进行了预处理和验证,从而得到了一个相对干净有效的数据集,本文从中共选取263 000组PPG和ABP采样点数据。图2展示了该数据集正常血压、高血压前期、高血压3部分的PPG与ABP同步数据,并根据Pearson相关系数计算了PPG与ABP波间的形态相关性,结果均为r>0.9,表明PPG与ABP波在形态上具有强相关性。

Fig.2 Morphological correlation between PPG and arterial blood pressure waves

2.1.1 预处理

PPG信号微弱,在采集过程中不可避免会受到工频干扰[24]、基线漂移[25]、运动伪迹[26]等噪声的影响,因此,数据集作者使用小波对PPG进行降噪处理[27]。首先以1 000 Hz的固定频率对原始信号重新采样,并使用Daubechies8(db8)小波将重采样后的信号分解到10个分解层;然后通过归零极低频率(0~0.25 Hz)的分解系数以消除基线漂移,归零极高频率(250~500 Hz)的分解系数以消除工频干扰和运动伪迹;接着对剩余分解系数采用Rigrsure软阈值算法进行常规小波降噪;最终重构分解后的信号得到降噪信号。

2.1.2 数据集划分、归一化和滑窗

预处理后,该数据集作者剔除了部分错误数据并对信号进行了重新拼接,因此为避免训练集和测试集重叠,且使模型更加泛化,本文将数据集的前80%划分为训练集,后20%划分为测试集,其中选取训练集的10%作为验证集进行十折交叉验证,选择指标最佳的模型,然后用其评估测试集。考虑到奇异样本的不良影响和模型的收敛速度,需将训练集和测试集中PPG和血压值归一化至区间[0,1]。然后对其进行数据滑窗(图3),单位时间内大致可采样两个PPG周期,为了充分使用序列数据,本文使用窗口步长为1,窗口长度分别为62、125、187、250、312、375采样点的窗口对PPG进行滑窗。

Fig.3 Sliding windows with different window lengths

2.2 模型构建

2.2.1 卷积神经网络

卷积神经网络(convolutional neural network,CNN)是一种带有卷积结构且能进行卷积计算的神经网络,其由卷积层、池化层和全连接层交叉堆叠组成[28]。其特有的卷积计算核心可以根据局部相关性原理对数据进行邻域间采样,故经常用来进行特征提取[29]。

2.2.2 时序神经网络

时序神经网络,又名循环神经网络或递归神经网络(recurrent neural networks,RNN),其能够提取并分析数据中的序列特征且具有短期或长期记忆,是处理序列数据的首选神经网络[30]。RNN由输入层、隐藏层、输出层3部分组成,隐藏层即循环层,为RNN的核心所在,RNN的输入层接受序列数据,经隐藏层处理后输出序列数据。经典RNN模型可以处理短期记忆问题,但无法处理长期记忆问题,因为当输入序列较长时,会遇到梯度消失问题。长短期记忆(long short-term memory,LSTM)[31]神经网络引入“细胞状态”和“门控制”的概念解决了梯度消失问题,因此可以很好地处理长期记忆问题。

2.2.3 CNN-LSTM混合神经网络

波形数据具有空间和时间两个方面的特征,单纯应用CNN会丢失波形的时间特征,单纯应用RNN会丢失波形的空间特征。因此本文提出基于CNN和LSTM的混合神经网络,其中CNN用以提取波形的空间特征,LSTM用以提取波形的时间特征。

本文实现的CNN-LSTM混合神经网络以PPG的滑动窗口数据为输入,以与之窗口长度对应的ABP波为输出,输入和输出的维度均为(n,1)(n为窗口长度)。其模型结构(图4)主要由2层一维卷积层(Convolution1D)、1层一维最大池化层(MaxPoo1D)、2层LSTM层、2层全连接层(Dense)组成。第一层卷积层的卷积核大小为3,数目为64,采用ReLU激活函数,其维度为(n,64)(n为窗口长度)。第二层卷积层的卷积核大小为3,数目为96,采用ReLU激活函数,其维度为(n,96)(n为窗口长度)。最大池化层的池化核大小为2,其维度为(n/2,96)(n为窗口长度)。卷积计算主要提取PPG波形的空间特征,池化层对卷积层提取的特征进行降维处理以减少神经网络的计算量,并增强特征的不变性;池化层提取的特征向量经Flatten和RepeatVector操作后得以匹配至窗口长度,其维度为(n,n/2×96)(n为窗口长度),便于后续输入LSTM层;LSTM层是寻找波形的空间特征在时间序列上的关系,第一层LSTM层拥用100个记忆单元,采用Tanh激活函数,其维度为(n,100)(n为窗口长度),第二层LSTM层拥用200个记忆单元,采用Tanh激活函数,其维度为(n,200)(n为窗口长度),为防止过拟合,Dropout正则化会在训练过程中随机“抛弃”20%的神经元;最后两层全连接层经TimeDistributed处理后,其维度被压为(n,1)(n为窗口长度),得以使网络输出,即ABP波的窗口长度匹配至网络输入,即经滑窗操作后的PPG。网络训练时,损失函数为均方误差(mean square error,MSE),优化器为Adam,学习率为0.000 1,迭代次数为10。

Fig.4 CNN-LSTM hybrid neural network model

3 结果

图5所示为CNN-LSTM神经网络分别采用不同窗口长度时的ABP波重建情况,其可以直观地表明重建ABP值的准确性及与实际ABP值的拟合情况。可以看出,除图5c,f外,其余图中的重建ABP值和实际ABP值大致拟合,没有出现较明显偏差。其中,图5b,e拟合精度较高,重建波形中的收缩压和舒张压基本准确,并且不同程度地放大了重搏波这一特征,表明神经网络中的卷积计算很好地学习到了该特征。图5e比图5b的拟合精度要更好,体现了LSTM长期记忆的优势。重建波形中的收缩压与实际值略有差异,并且出现多次明显重搏波(图5a,d);重建波形中的重搏波拟合较为准确,但是收缩压明显高于实际值(图5c);重建波形中的收缩压明显高于实际值,并且重搏波不明显(图5f),表明采用窗口长度为375的神经网络并未很好地学习到该特征。

表1通过平均绝对误差(mean absolute error,MAE)(公式1)和均方根误差(root mean square error,RMSE)(公式2)评价指标展示了该神经网络使用不同窗口长度时,重建ABP波形与实际ABP波形间的误差情况。可以看出,使用窗口长度312的神经网络时误差最小,MAE和RMSE分别为2.79 mmHg和4.24 mmHg,符合美国医疗器械促进协会(Association for the Advancement of Medical Instrumentation,AAMI)标准。

余弦相似度(cosine similarity),又称余弦距离(公式3,其中A,B为n维向量),其使用n维空间中两个n维向量之间角度的余弦值作为指标来衡量数据间的差异大小,取值范围为[-1,1],余弦值越接近1,表明两组数据越接近,反之则越不接近。表2所示为使用不同窗口长度时,重建动脉血压值与实际动脉血压值的余弦相似度,可以看出,当使用窗口长度312的神经网络时,重建ABP值和实际ABP值间的余弦相似度最大,为0.999 61,表明两者最接近。

Table 1 Reconstruction errors of arterial blood pressure waves in models with different window lengths

Table 2 Cosine similarity between reconstructed arterial blood pressure values and actual arterial blood pressure values when using different window lengths

Fig.5 Reconstruction of arterial blood pressure waves in models with different window lengths

Fig.6 Histogram of error distribution between reconstructed arterial blood pressure values and actual arterial blood pressure values

图6所示为使用窗口长度312的神经网络时,将重建ABP值与实际ABP值间的误差值四舍五入到其最接近的整数生成的离散化误差分布直方图,用以直观地显示重建ABP值与实际ABP值间的误差分布情况。可以看出,误差分布直方图整体表现为“窄”而“高”,呈正态分布趋势,其中误差0 mmHg占比最多,误差绝对值大于10 mmHg占比非常低,表明重建ABP值与实际ABP值整体上较为接近,拟合情况较好。

图7所示为使用窗口长度312的神经网络时,根据重建ABP值与实际ABP值的平均值及误差值生成的Bland-Altman图,其通过计算两者的一致性界限,并以图形方式直观反映,可用于评价重建ABP值和实际ABP值的一致性。可以看出,高密度点集中于平均线附近,大部分点也落于95%一致性区间内(即1.96个标准差范围内),偏倚程度为-8.08~9.21 mmHg,表明重建ABP值与实际ABP值间的一致性情况良好,该模型的重建精度比较理想。

Fig.7 Bland-Altman diagram of reconstructed arterial blood pressure values and actual arterial blood pressure values

图8所示为使用窗口长度312的神经网络时,根据重建ABP值与实际ABP值生成的回归图,用以表明两者间的一致性。其Pearson相关系数r=0.975,较接近于1,可以看出,大部分点集中于回归线附近,两者之间具有强线性相关性,表明重建ABP值与实际ABP值间一致性较好,整体上相关度高。

4 讨论

目前基于PPG波的连续无创血压测量研究主要分为人工特征参数分析和机器学习两个方面,焦学军等[32]分析了PPG波传导时间、K值、面积、降中狭高度、重搏波高度、脉率等特征参数,并根据受试者自身特点建立特征方程来计算受试者的收缩压与平均压,结果表明PPG波法较其他连续无创血压监测法有更高的测量精度。吴丹[33]研究得出,通过神经网络建立的血压估算模型的精度要高于线性和非线性回归方法,并且神经网络模型可以在无人工提取特征的情况下自动学习特征并分析关联特征,这些特征分布得更加客观,涵盖的血压信息也更加丰富,这是人工特征参数分析无法相比的。因此,基于PPG波及机器学习的连续无创血压监测法相比其他基于动脉导管、袖带等的血压监测法具有诸多优势,如非侵入式操作、测压简便快捷、可长期连续监测等。然而,既往研究只专注于通过PPG波获取单一收缩压和舒张压,而非ABP波。李嘉玮等[34]使用多波长光电传感器采集PPG波以拟合Rossmax电子血压计测量的血压,进而分析二者相关性以预测血压;彭莉等[35]同步采集了II导ECG和食指PPG波,使用医用臂式电子血压计测量的血压作为参考值,通过建立血压的偏最小二乘回归模型以预测血压;谭志坚等[36]使用的血压数据集也只包含收缩压和舒张压,而非ABP波。因此,如果可以通过PPG波重建ABP波,则在获得收缩压和舒张压的同时还能获得更为丰富的循环生理信息。

综上,本文基于CNN-LSTM混合神经网络,利用MIMIC数据库中的同步记录信号数据,通过PPG波重建ABP波,进而实现连续无创血压监测。实验结果表明,当窗口长度为312时,该神经网络的重建ABP波与实际ABP波拟合最佳,其MAE和RMSE最小,分别为2.79 mmHg和4.24 mmHg,余弦相似度值最大,为0.999 61。误差分布直方图、Bland-Altman图和回归图显示重建ABP值和实际ABP值间误差较小,一致性和相关性情况良好。表3为本文研究与既往研究的对比。Kachuee等[27]人工提取了ECG和PPG信号波的特征参数,并通过机器学习模型AdaBoost进行血压预测,结果收缩压MAE为8.21 mmHg,舒张压MAE为4.31 mmHg,均高于本文结果2.79 mmHg,表明神经网络对波形的特征提取及拟合能力相比人工特征提取及传统机器学习方法有较大优势;成刚等[37]基于BP神经网络使用PPG波特征参数预测血压,结果为收缩压BP神经网络的RMSE为5.92 mmHg,舒张压BP神经网络的RMSE为6.11 mmHg,而本文CNNLSTM神经网络的RMSE为4.24 mmHg,重建结果明显优于BP神经网络,表明CNN对波形特征的提取能力和LSTM对序列特征的提取能力均优于BP神经网络;胡军锋等[38]基于CNN使用ECG与PPG同步采集数据预测血压,结果平均脉压MAE和RMSE分别为3.25 mmHg和4.68 mmHg,高于本文结果,表明将CNN提取的波形特征输入LSTM会进一步提取序列特征,减小误差值,提高准确率;李帆等[39]分别使用RNN和LSTM神经网络对同一数据集进行训练,结果RNN的MAE和RMSE分别为11.58 mmHg和17.03 mmHg,LSTM神经网络的MAE和RMSE为4.05 mmHg和8.78 mmHg,表明在处理长序列数据时,LSTM神经网络要优于RNN,同时表明本文CNN-LSTM神经网络中的CNN较好地提取了波形特征,效果要优于单一LSTM神经网络。关于既往使用CNN-LSTM神经网络预测血压的研究,Baker等[40]基于CNNLSTM神经网络使用ECG与PPG同步采集数据预测血压,结果MAE为3.66 mmHg,高于本文结果MAE,且其输出为收缩压和舒张压,而非动脉血压波,Mou等[11]基于CNN-LSTM神经网络使用PPG预测血压,其平均脉压的MAE和RMSE分别为4.42 mmHg和6.01 mmHg,均高于本文结果,究其原因,可能是其网络结构较简单,仅一层32卷积核的卷积层和两层50记忆单元的LSTM层,导致其网络拟合能力较弱。综上,既往对连续无创血压监测的研究多基于PPG和ECG两种传感器的同步数据,对数据的采集较繁琐,要求也较高,且结果为收缩压和舒张压的离散值。而本文研究只需PPG一种传感器数据,采集简便,且输出结果为ABP波的连续值,可以方便、快捷地获得完整心血管信息。Cheng等[16]的研究也明确了连续ABP波相较于单一收缩压和舒张压包含更多的生理病理信息,其基于FCNN构建了ABP-Net模型以从PPG信号波重建ABP波信号波,其结果MAE和RMSE分别为3.20 mmHg和4.38 mmHg,略高于本文结果,且其模型输入除PPG外,还包括PPG的一阶导数和二阶导数,这无疑增加了计算成本;Li等[17]采用GRNN模型自PPG信号波重建ABP波信号,结果平均脉压的MAE和RMSE分别为3.18 mmHg和4.50 mmHg,略高于本文结果,可能是GRNN的结构和参数较LSTM简化所致的拟合不足,但其训练成本也大大降低,为本文模型的优化提供了参考。

Table 3 Comparison of this study with previous studies

MIMIC数据库的采集频率只有125 Hz,要想获得更加丰富的波形特征,就必须提高采集频率。同时,为获得更高准确率的重建结果和更加泛化的模型能力,使模型应用于生产环境,还需要更大的样本量,以及参数量和结构更复杂的神经网络。此外,MIMIC数据库主要采集自重症患者,其血压数据较常人有所差异,因此为获得更高准确率,样本覆盖范围也需扩大。

5 结论

本文基于CNN-LSTM混合神经网络和MIMIC Ⅱ数据集,通过PPG波重建了ABP波,重建ABP波与实际ABP波间一致性较好,在相位和振幅方面拟合度较高,符合AAMI标准,可用于连续无创血压监测。同时,相较于收缩压和舒张压,ABP波蕴含更多信息,希望有助于提高高血压诊断的准确性。

数据可用性声明本论文的关联数据(DOI:10.57760/sciencedb. 06337/CSTR: 31253.11.sciencedb. 06337)可在Science Data Bank数据库(https://www.scidb.cn/)中访问获取。其中*.ims文件的打开软件为Imaris,*.pzfx文件的打开软件为Graphpad Prism。

猜你喜欢

收缩压波形卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
对《压力容器波形膨胀节》2018版新标准的理解及分析
从滤波器理解卷积
老年人群收缩压与射血分数保留的心力衰竭预后的关系
基于LFM波形的灵巧干扰效能分析
基于傅里叶域卷积表示的目标跟踪算法
健康年轻人收缩压高会增加动脉硬化风险
强化降低收缩压不增加卒中风险
基于ARM的任意波形电源设计
改良的心血管健康行为和因素评分与老年人短时收缩压变异性的关系