基于机器学习方法的血压预测研究进展
2024-03-24张凯钧诸海燕周科群徐佳敏
张凯钧,诸海燕,董 奥,周科群,徐佳敏
绍兴市人民医院,浙江绍兴 312000
随着移动互联技术的发展,医护人员能够通过更加便捷的途径搜寻到大量患者的个人健康数据[1]。据研究[2]表明,高血压形成受到多种复杂致病因子的影响,这些因素同时也伴随着高血压的后续发展。因此,对高血压患者的个人健康数据进行分析,挖掘出影响高血压形成和发展时各个致病因子的影响情况,对后期的血压预测以及高血压的治疗具有重要的意义。为了高效且准确地分析出数据之间的隐藏规律,许多学者应用机器学习方法同有创和无创血压预测方法相结合,对患者或志愿者的相关数据进行挖掘、分析和管理,同时还建立了相关的血压预测模型,对后续血压预测起到良好的辅助作用,并取得了显著的成效[3-5]。为此,本研究基于各种机器学习方法在血压预测领域的研究进行综述,探寻未来该种方法在血压预测领域内的发展前景,加强医护工作者对其的认知。
1 机器学习概况
机器学习方法属于人工智能领域,该方法可以从有限的观测数据中分析并获取规律,并利用这些规律对未知的数据进行预测。传统的医疗信息领域是通过对已有数据进行整合,进而得到相关的特征,这种方法的效率往往过低,而且难以获得较好的效果。而多数机器学习方法是基于数据驱动,自行发现数据与数据之间的深层联系,无论是对于线性还是非线性关系,都能在保证较高精度和效率的前提下获得良好的效果[6]。因此,机器学习方法可以为医护工作者在处理相关临床工作时提供一定的参考,使得做出的决策更加精准有效[7]。利用机器学习进行预测一般包括4个步骤:数据预处理、特征提取、特征转换和预测,其中预测是机器学习的核心部分,通过挖掘数据与数据之间的映射关系,学习一个函数,并进行预测。常见的机器学习方法有多种,包括神经网络方法、支持向量机(support vector machine,SVM)、随机森林算法、贝叶斯学习算法等。
2 机器学习在血压预测中的应用
2.1 神经网络方法在血压预测中的应用
神经网络方法是一种受到人脑启发的机器学习算法,神经网络的结构包括3层:输入层、隐含层和输出层。神经网络方法具有很强的联想记忆、非线性映射、分类识别以及知识处理能力,基于此,目前许多类型的神经网络方法应用到了血压预测中。中医通过面部诊断可以良好地确定身体器官的健康状况(包括心脏)。基于此,Xing等[8]提出了一个使用深度卷积神经网络(convolutional neural network,CNN)预测血压的人工智能框架,将人脸诊断理论同计算机视觉相结合。首先通过652个面部视频提取脉搏波信号,然后建立神经网络预测模型,结果表明,真实预测率在90%以上。李帆等[9]基于长短期记忆神经网络(long short term memory,LSTM),利用光电容积脉搏波(photoplethysmography,PPG)信号,对人体血压进行了预测,同时还与循环神经网络(recurrent neural network,RNN)模型对比,发现LSTM网络对人体血压的预测更为准确,且性能优于RNN模型。朱林[10]针对血压值波动具有周期性和非平稳性等特点,提出将添有注意机制的双向长短期记忆神经网络(bidirectional long short term memory,Bi LSTM)和CNN相结合,形成血压预测的模型,能够很好地吻合血压的变化趋势,且预测误差也在允许范围内。Rong等[11]利用深度学习模型自动提取PPG特征,该模型包括两个用于PPG信号形态和频谱特征训练的CNN和一个训练PPG信号时间特征的BiLSTM,其预测结果符合美国医疗器械促进学会(The Association for the Advancement of Medical Instrumentation,AAMI)以及英国高血压协会的国际标准。除此之外,诸如广义回归神经网络[12-14]、自组织映射神经网络[15]、邻近算法[16]等方法也应用到了相关领域。由此看出,神经网络方法对于血压预测有着良好的效果,而且已被广泛应用,其技术也比较成熟,对于不同特征的血压数据,可以选用不同的神经网络方法进行拟合,给血压预测的实施带来了灵活性和便利性。但也存在着一些不足,比如在构建神经网络预测模型时,特征的选取很大程度会影响预测模型的预测精度,研究者往往会选取同高血压相关的特征进行预测,这在一定程度上存在局限性,后续研究需要进一步分析潜在的影响特征,从而提升模型的性能。
2.2 SVM在血压预测中的应用
SVM是一种建立在统计学基础上的机器学习方法。通俗来讲,SVM的目的是去寻求两类数据的分割线(超平面),该种方法可以很好地解决小样本情况下的相关问题,有着良好的泛化能力。目前有学者使用该方法进行血压预测。彭莉[17]通过采集多名受试者的透射式手指PPG信号和反射式前额PPG信号建立了SVM血压预测模型,并与偏最小二乘血压模型对比,同时还利用可穿戴式的血压计获得参考血压值,结果显示,预测模型的血压预测结果良好。Zhang等[18]提出利用SVM回归算法对血压进行预测,并且利用六种典型机器学习评价指标验证该方法的有效性,结果表明,该预测模型可以准确有效地预测血压,可以大幅度提高传统血压测量的准确性。樊海霞等[19]使用遗传算法和主成分分析法改进SVM学习模型,将PPG和心电信号等进行处理,建立优化后血压预测模型,并通过水银血压计测得实时血压值,以此作为对照的真值。结果表明,优化后的预测模型其预测精度更高,能满足不同人体特征的预测,符合实际需求。Rong等[20]通过网络摄像头采集191名志愿者的面部视频,然后利用成像光电体积扫记术从视频中提取脉搏波信号,共提取26种特征,随后利用SVM等4种方法建立血压预测模型,结果显示SVM是最佳血压预测模型,收缩压和舒张压的标准差和平均相对误差都很小。整体而言,SVM方法在血压预测方面的使用较少,主要原因是SVM方法较适用于小样本数据,当今属于大数据时代,数据量越来越大是大趋势。但是SVM方法可以和其他方法相结合,这样既能发挥出该方法的优势,同时还能克服超出其限度的问题。因此,SVM方法对于血压预测的研究还有较大的潜力。
2.3 随机森林算法在血压预测中的应用
随机森林算法是基于决策树的集成学习算法。可以将决策树当作一个树状的预测模型,而随机森林算法则是将多个树整合,利用整体进行预测。该方法有着一定的抗噪声能力,对于数据集的适应能力也比较强。目前该方法已被广泛应用于各个领域。孟丽芳[21]基于重症监护医疗信息数据集,利用随机森林算法等方法建立不同的血压预测模型并对比预测结果,结果表明提出的预测方法和模型都能较好地提升血压预测的精度。黄晓祥[22]采集55名志愿者的多种与血压相关的生理参数,将遗传算法结合到随机森林算法中,用以分析贡献度较大的生理参数,然后利用随机森林算法建立血压预测模型,并与SVM方法对比,结果显示模型预测结果满足AAMI的标准,但是相对而言受试者量偏少,带来的问题是预测模型的说服力不足,因此后续还需增加受试者数量。Chiang等[23]研究血压与健康行为之间的关系,从可穿戴设备和家庭血压监测仪器中收集数据,利用随机森林算法建立预测模型,结果显示该方法的血压预测精度较高,并且能生成健康行为的个性化推荐。Zhou等[24]基于随机森林算法和高斯核SVM回归等8种机器学习方法,提取光电体积扫记图的8个特征建立预测模型,并对收缩压进行预测,结果显示基于随机森林算法回归和高斯核SVM回归的组合预测模型的预测精度最高。总体而言,随机森林算法在血压预测的领域中应用较为广泛,预测性能较好,且拟合能力也比较强。但这里值得注意的是,上述的研究中建立的随机森林算法血压预测模型多数为短时间的血压预测模型,在长时间内的血压预测方面,还需要进一步的验证。
2.4 贝叶斯学习算法在血压预测中的应用
贝叶斯学习算法是基于贝叶斯定理与特征条件独立假设的分类方法,其基本原理是在已知先验概率与类条件概率的情况下获得后验概率分布。目前在血压预测领域,贝叶斯学习算法多数同其他机器学习算法一同应用,并分析对比。马文彬[25]将贝叶斯学习算法同随机森林算法、SVM等方法共同构建高血压预测模型,然后利用多个指标对这些预测模型进行对比,最终发现随机森林算法模型的各项指标最好。孙斌等[26]运用贝叶斯学习算法对极端梯度增强算法的超参数进行寻优,建立优化后的血压预测模型,结果显示,预测结果与水银血压计测得的结果有着良好的一致性。Zhu等[27]基于LSTM算法和贝叶斯学习算法,使用长期环境参数建立高血压疾病模型,以预测老年人在其环境建筑中的高血压风险,结果表明男性和女性的综合环境风险不同,在单一环境因素下,男性的高收缩压风险更高,而女性的高舒张压和高血压的风险更高。也有学者单独基于贝叶斯学习算法进行血压预测,Shen等[28]提出基于贝叶斯模型平均方法的无袖血压预测模型,以减少其中的不确定性。总体而言,国内贝叶斯学习算法在血压预测方面的应用还较少,但是考虑到该方法有着稳定的分类效率且能处理多分类任务,因此该方法在血压预测领域还是有必要进行更加深入的研究。
3 结语
相对而言,机器学习方法在血压预测领域的研究处于迅速发展的阶段,有着良好的应用和发展前景,而且该方法血压预测领域的应用对于医护工作者能起到良好的辅助作用,因此有必要加强医护工作者对其的认知,提升机器学习的相关能力。目前机器学习方法有多种,包括神经网络方法、SVM、随机森林算法、贝叶斯学习算法等,在血压预测领域获得较好应用。伴随而来的也存在一些不足之处,比如考虑到实际的临床情况和数据特征,单一的机器学习方法不具备普适性,因此,有必要去探寻更多其他种类的机器学习算法在该领域的适用性。除此之外,在该领域中多数使用的还是机器学习中有监督学习的方法,而无监督学习和半监督学习的应用较少,后续的研究可考虑将这两类方法应用在血压预测中。