APP下载

基于PPG信号的LSTM网络同步动脉血压预测

2020-09-02李帆程云章边俊杰

软件导刊 2020年8期
关键词:深度学习

李帆 程云章 边俊杰

摘 要:为通过光电容积脉搏波信号获取动脉血压参数,并将其作为判断个人健康状况的依据,基于Tensorflow框架训练LSTM网络模型与传统RNN模型,使用625 000条光电容积脉搏波数据序列通过忘记、选择记忆、输出阶段得出符合生理规律的血压参数,将两种模型放在125 000条样本的测试集中进行有效性验证。实验结果表明,训练后的LSTM模型对血压的预测比传统RNN模型更准确,LSTM预测评价指标MAE、RMSE、STD和R2_score分别为4.05、8.78、7.42和0.89,且预测结果符合美国医疗仪器促进协会标准(MAE<5mmHg,STD<8mmHg),而传统RNN模型则为11.58、17.03、14.54和0.73。LSTM模型能较好地预测血压参数,在生物医学领域有较高的应用价值,其效果优于传统RNN模型。

关键词:同步血压预测;PPG信号;LSTM网络;循环神经网络;深度学习

DOI:10. 11907/rjdk. 192606 开放科学(资源服务)标识码(OSID):

中图分类号:TP312文献标识码:A 文章编号:1672-7800(2020)008-0044-05

Abstract: In order to obtain the parameters of arterial blood pressure through the photoplethysmography signal, which is the basis of judging personal health status,the LSTM network model and the traditional RNN model were trained based on tensorflow framework, and 625 000 photoplethysmography data sequences were used to obtain the blood pressure parameters that conform to the physiological rules through forgetting, selecting memory and outputting stages, and the validity of the two models was verified in 125 000 sample test sets. The experimental results showed that the prediction of blood pressure of the trained LSTM model was more accurate than that of the traditional RNN model. The MAE, RMSE, STD and R2_score of LSTM were 4.05, 8.78, 7.42 and 0.89 respectively, and the prediction results were in line with the standards (MAE < 5mmhg, STD < 8mmhg) proposed by the American Association for the promotion of medical instruments, while the traditional RNN model was 11.58, 17.03, 14.54 and 0.73. The results show that LSTM model can predict the parameters of blood pressure better and has higher application value in biomedical field, and the effect is better than the traditional RNN model.

Key Words: synchronous blood pressure prediction; photoplethysmography signal; LSTM network; recurrent neural network; deep learning

0 引言

血壓(Blood Pressure,BP)是表征人类身体状况的重要生理指标之一,也是防治心血管疾病的重要血流动力学参数。持续较高水平血压会诱发中风、心肌梗死等心血管疾病[1]。因此对于该类人群的持续血压监测十分重要,可预见、方便、低成本的连续无创血压监测的重要性日益凸显。

传统侵入式血压测量虽然测量结果精确,且其中动脉插管法被誉为“金标准”[2],但因对患者伤害大、操作复杂等原因逐渐被无创方式取代。无创测量也分为间歇式和连续式,其中间歇式有柯氏音法和示波法等,连续式有扁平张力法、恒定容积法和脉搏波传递时间测量法等[3]。

以扁平张力法为原理的产品,如浙江善时医疗公司的T-Line系列[4],虽然可测得实现较长时间连续的人体血压,结果较准确,但在使用中需长时间定位在一个位置,压力传感器难以保证位置不会有偏差,同时长时间压迫手腕使受试者感觉不舒适;而以恒定容积法为原理的袖带式测量则不便于长时间观测血压,且会压迫大臂,同样产生不适。

近年来,利用机器学习[5]算法进行血压测量的方法逐渐兴起。2005年,Kim 等[6]综合考虑了PTT、体重、身高、体质比、臂长等不同的生理因素,挑选出两个与血压相关性最高的特征,然后将这两个特征输入到人工神经网络中建立血压估算模型,其精度高于线性和非线性回归方法;2016年,Kachue 等[7从ECG(Electrocardiogram)和PPG(photoplethysmography)信号中提取许多生理参数并进行多重回归,然后采用人工神经网络进行训练,得到了不错的结果;2016年,He等[8]通过随机森林的方法筛选有用特征,结果发现随机森林方法优于线性回归以及普通的PTT模型。总的来说,使用机器学习方法训练的血压模型在一定程度上提高了估计精度,然而该方法目前最大阻碍是找到合适的特征集合,并且计算机模型背后的潜在机制尚不明确,有待进一步研究。

由于PPG信号与动脉血压值均是与时间有强烈关联性的数据,且两者本身有明显的呼应关系,所以可采用深度学习算法中对存在规律的时间序列有良好处理能力的传统循环神经网络(Recurrent Neural Network,RNN)模型[9]。通过已知PPG信号同步预测血压值,从而避免传统血压监测方法繁琐的操作与带给受试者的不适感。但由于传统RNN模型在前向传播过程中只能考虑最近时刻的生理状态,然而血压预测需全面考虑先前的多种生理状态,所以本文采用RNN的变种——长短时记忆网络(Long Short-Term Memory,LSTM)模型[10]。LSTM可决定之前的哪些状态需被强化或弱化,完全符合血压预测的真实状况。本文将系统介绍PPG信号原理与LSTM网络原理,分析实验结果并提出改进之处。

1 PPG信号数据集

1.1 PPG信号原理

PPG信号是通过光电容积脉搏波描计法获得的一种波形信号,其测量原理为:将光照射到皮肤表面,由于人体组织(肌肉、皮肤等)可吸收光从而削减光强,光电探测器接收到的光强减弱,整个血液循环过程中减弱的光强值是稳定的。因此,当血液随心脏搏动呈现出容积变化时,接收到的光强也呈同步脉动变化,将接收到的这种光强信号转换为电信号,即为光电容积脉搏波[11]。其理论基础是朗伯·比尔定律[12],其关系式为:

其中,A为吸光度,I0为入射光光强,It为被介质吸收后透射光光强,K为吸收系数,l为吸收介质厚度,c表示吸光物质浓度。

由于人体指端血流感受面积大,测量灵活方便,因此光电容积脉搏波描计法通常通过测量指端血流吸光度获得PPG信号。

1.2 数据预处理

本文使用麻省理工学院计算生理学实验室提供的多参数重症监护智能监测(Multi-parameter Intelligent Monitoring in Intensive Care,MIMIC-II)在线波形数据库[13]作为实验数据集。2001—2008年期间,各医院监测员记录了心血管病患者上千万个血流动力学参数,波形信号以125 Hz的频率、至少8位精度采样。本实验从该数据库中提取了2组共约75万个PPG、动脉血压(ABP)数字信号共6 000秒采样时间,分别作为训练集与测试集。

由于MIMIC数据库信号包含了大量失真和伪影部分,导致最终结果误差巨大,所以为了使神经网络能准确提取出数据特征,首先通过预处理进行去噪。预处理总体思路是将数据集按照同一标准分割成若干波形段,然后对每个波形段进行包含4个步骤的处理:①使用简单的平均滤波器平滑所有信号;②去除明显不合逻辑的动脉压值;③去除严重不连续信号;④计算PPG信号的自相关度,即波段间的相似度,并去除产生数值突变的信号。

数据集均经过以上步骤处理后方可划分成神经网络的训练集与测试集。处理后的PPG信号与ABP信号如图1、图2所示。

1.3 PPG信号特征

PPG信号中包含大量与血压相关的特征,这些特征会帮助LSTM网络提高预测精度。将单个周期PPG信号波形数据归一化至[0,1]区间内,可得如图3所示特征。

LSTM内部结构如上所述,通过门控状态控制传输状态,记住需要长时间记忆的,忘记不重要的信息,而普通RNN只能以仅有的一种记忆叠加方式。LSTM对很多需要“长期记忆”的任务,如血压监测、股价预测等优势尤为突出。

2.2.3 LSTM网络参数调节

数据集预处理后,使用默认的超参数设置,观察loss的变化,初步定下各个超参数范圍,再依次进行调参。本实验遇到的loss变化主要为train loss不断减小,test loss不断增大,是较为明显的过拟合现象,即模型已记住所有训练数据,对训练集数据预测效果非常好,但对测试集数据的预测效果非常差。由于数据集已经过预处理并且样本量足够,实验将采取以下两种解决方法。

(1)使用L2正则化。正则化方法包括L0、L1和L2正则,LSTM通常使用L2正则。正则一般是在目标函数之后加上对象范数,L2范数指先求向量各元素平方和然后求平方根,可使应受惩罚影响的权重W的每个元素都加剧减小且不等于0。更小的W意味着模型复杂度更低,适用于训练数据拟合,不会过分拟合训练数据,避免过拟合,从而提高模型泛化能力。

(2)使用Dropout。Dropout方法在神经网络中十分常见,该方法在训练时让神经元以一定概率不工作,即在训练时以一定概率P跳过指定百分比数量的神经元。

3 实验结果与分析

3.1 训练过程

整个LSTM网络训练过程预测值与真实值对比如图8所示,可明显看出训练前期预测值与真实值差距较大,随着训练样本的不断增多,预测值与真实值重合度越来越大,模型准确率也越来越高。

3.2 评价指标

LSTM网络与传统RNN测试集中模型结果各项指标对照如表1所示,指标包括:平均绝对误差(MAE)、均方根误差(RMSE)、标准差(STD)、R2值(R2_score),图9进一步展示了两种模型四大指标实时对比曲线,显然LSTM网络在同一测试集中各项指数均表现更佳。同时LSTM测试指标中平均绝对误差不大于5mmHg,标准差不大于8mmHg,符合美国医疗仪器促进协会(AAMI)提出的标准,模型可靠性得到证明。

本实验中平均绝对误差(MAE)反映ABP预测误差实际大小。均方根误差(RMSE)衡量ABP预测值同真值之间的偏差。标准差(STD)反映了ABP误差值离散程度。R2值(R2_score)表示ABP预测值与真值的拟合优度,R2_score=1,达到最大值,意味着样本中预测值和真实值完全相等,没有任何误差,模型最为理想,此后小于1且越远离1即意味着预测值与真实值相差越多,模型越差。

3.3 误差分布

LSTM与RNN误差数值频数分布如图10所示。RNN模型训练在测试集中误差多集中在-10~10mmHg,而LSTM模型则更多集中在-5~5mmHg。且RNN误差在-20mmHg之前以及10mmHg之后仍有一定量分布,而LSTM则基本没有。

4 结语

无创血压预测方法虽然有很多种,但多数存在一定缺陷,例如数据样本少导致不同受试者预测结果差异巨大[18]、更换受试者需要不断校准[19]等问题。本文方法利用神经网络结合大数据很好地解决了这些问题,同时为稳定、免校准的血压估计提供了足够的实验支持。另外,本文使用的MIMIC-II数据库包含从医院获得的临床数据,由于对患者隐私的保护,缺少一些有价值的参数,例如年龄和身高,如能将这些重要特征添加到神经网络输入中,将获得更准确的结果。

参考文献:

[1] LIM S S, VOS T, FLAXMAN A D, et al. A comparative risk assessment of burden of disease and injury attributable to 67 risk factors and risk factor clusters in 21 regions, 1990-2010: a systematic analysis for the Global Burden of Disease Study 2010 [J]. The Lancet, 2012, 380(9859): 2224-2260.

[2] KASHANI A, DOYLE M, HORTON M, et al. Direct innominate artery cannulation as a sole systemic and cerebral perfusion technique in aortic surgery[J]. Heart Lung Circ, 2019, 28(4): 67-70.

[3] 李顶立. 基于脉搏波的无创连续血压测量方法研究[D]. 杭州:浙江大学, 2008.

[4] DUECK R,GOEDJE O,CLOPTON P. Noninvasive continuous beat-to-beat radial artery pressure via TL-200 applanation tonometry [J]. Journal of Clinical Monitoring Computation, 2012, 26(2): 75-83.

[5] 周志华. 机器学习[M]. 北京: 清华大学出版社,2016.

[6] KIM J Y, CHO B H, IM S M, et al. Comparative study on artificial neural network with multiple regressions for continuous estimation of blood pressure [C]. Proceedings of the 27th IEEE Annual Conference of Engineering in Medicine and Biology, 2005: 6942-6945.

[7] XING X M, SUN M S. Optical blood pressure estimation with photoplethysmography and FFT-based neural networks [J]. Biomed Opt Express, 2016, 7(8): 3007-3020.

[8] HE R, HUANG Z P, JI L Y, et al. Beat-to-beat ambulatory blood pressure estimation based on random forest [C]. Proceedings of the 13th IEEE  International Conference on Wearable and Implantable Body Sensor Networks , 2016: 194-198.

[9] 王敏, 曾浩. 循環神经网络语言模型定点化优化算法研究 [J]. 软件导刊, 2017, 16(2): 63-66.

[10] 李佳, 黄之豪, 陈冬兰. 基于 LSTM 等深度学习方法的股指预测研究 [J]. 软件导刊, 2019, 18(9): 17-21.

[11] DING X R, ZHANG Y T, LIU J, et al. Continuous cuffless blood pressure estimation using pulse transit time and photoplethysmogram intensity ratio [J]. IEEE Transactions on Biomedical Engineering, 2016, 63(5): 964-972.

[12] MOSOROV V. The Lambert-Beer law in time domain form and its application [J]. Applied Radiation and Isotopes,2017,128(10): 1-5.

[13] SAEED M, VILLARROEL M, REISNER A, et al. Multiparameter intelligent monitoring in intensive care II: a public-access intensive care unit database[J]. Critical Care Medicine,2011, 39(5): 952-960.

[14] ELGENDI M. On the analysis of fingertip photoplethysmogram signals [J]. Current Cardiology Reviews, 2012, 8(1): 14-25.

[15] PALOMBO C, KOZAKOVA M. Arterial stiffness is associated with adipokine dysregulation in non-hypertensive obese mice [J]. Vascul Pharmacol, 77(2): 1-7.

[16] TAI K S, SOCHER R, MANNING C D. Improved semantic representations from tree-structured long short-term memory networks [DB/OL]. https://arxiv.org/abs/1503.00075.

[17] HOCHREITER S,SCHMIDHUBER J. Long short-term memory [J]. Neural Computation, 1997, 9(8): 1735-1780.

[18] GESCHE H, GROSSKURTH D, KUCHLER G, et al. Continuous blood pressure measurement by using the pulse transit time: comparison to a cuff-based method [J]. European Journal of Applied Physiology, 2012, 112(1): 309-315.

[19] WONG M Y, POON C C, ZHANG Y T. An evaluation of the cuffless blood pressure estimation based on pulse transit time technique: a half year study on normotensive subjects [J]. Cardiovascular Engineering, 2009, 9(1): 32-38.

(責任编辑:江 艳)

猜你喜欢

深度学习
从合坐走向合学:浅议新学习模式的构建
搭建深度学习的三级阶梯
有体验的学习才是有意义的学习
利用网络技术促进学生深度学习的几大策略
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
构建“单元整合、主题牵引”诗歌鉴赏“深度学习”课堂的策略