基于多因素布谷鸟算法的心力衰竭患者死亡率预测模型研究
2022-04-02陈蒙蒙CHENMengmeng方振红FANGZhenhong涂文怡TUWenyi温伟伟WENWeiwei
□ 陈蒙蒙 CHEN Meng-meng 方振红 FANG Zhen-hong 涂文怡 TU Wen-yi 温伟伟 WEN Wei-wei
心力衰竭是心脏病发展至严重阶段的综合征,死亡率较高[1],在得到有效治疗之前心力衰竭患者的死亡率和恶性肿瘤患者死亡率相似[2-4]。病情较重的心力衰竭患者,其1年的存活率只有50%,而病情较轻的,其4~5年的存活率,大约为50%。关于心衰患者死亡率相关因素的研究,已经有很多研究成果[5-6]。一项来自加州大学洛杉矶分校的研究表明,神经肽Y水平较高的患者在1~3年内死亡的可能性是神经肽Y水平较低患者的10倍[7]。同型半胱氨酸可影响冠心病合并心衰患者PCI术后死亡[8]。抑郁症能够增加心衰患者的死亡率[9]。
现有的心力衰竭患者死亡率预测模型,基本都没有综合考虑多种影响心力衰竭患者死亡率的因素,因此综合考虑多种因素来预测心力衰竭患者的死亡率是本文要解决的问题。布谷鸟算法是一种新兴的启发式算法,它由剑桥大学博士杨新社于2009年提出[10]。布谷鸟算法以其高效的寻优能力,一经提出就获得了广泛关注。本文提出的心力衰竭患者死亡率预测模型,是基于多因素布谷鸟算法的一种新型心力衰竭患者的死亡率预测模型。本研究旨在提出基于多因素布谷鸟算法的心力衰竭患者死亡率预测模型并探讨其在预测心力衰竭患者死亡率问题中的应用效果。
基于多因素布谷鸟算法的心力衰竭患者死亡率预测模型
1.多因素原则。假设影响心力衰竭患者死亡的n个因素,记为X=[x1,...,xn]。给出本文模型的多因素测试函数如下:
2.基于多因素布谷鸟算法的心力衰竭患者死亡率预测模型。基于多因素布谷鸟算法的心力衰竭患者死亡率预测模型步骤如下:
(1)根据数据集的样本设置好所有的参数与测试函数⑴;
(2)随机生成可行解的集合,规模为n,记录其中最优解;
(5)若不满足算法终止条件,执行步骤2;否则输出式(1)中的权重wi和阈值Ψ。
(6)根据权重wi和阈值Ψ,度量数据集中患者的死亡率。
3.基于多因素布谷鸟算法的心力衰竭患者死亡率预测模型流程图,见图1。
图1 基于多因素布谷鸟算法的心力衰竭患者死亡率预测模型流程图
资料与方法
1.一般资料。使用加州大学欧文机器学习库的心力衰竭临床记录数据集[11]验证被提出的模型在预测心力衰竭患者死亡时的有效性。该数据集的299个心力衰竭患者分为训练集(n=203)和测试集(n=96)。该数据集有13个特征,这些特征的信息如表1所示。
表1 数据集特征的含义、度量单位和区间
该数据集的13个特征之间的相关性度量如表2所示。
从表2中我们看出,该数据集的13个特征之间的相关度不高,一个特征不能很好地被另一个或者另几个特征所表示,所以在计算心力衰竭患者死亡情况时,需要把所有的特征都考虑进去才更科学合理。
表2 数据集的特征之间的相关度
2.方法。使用多因素模型预测心力衰竭患者的死亡率,采用Matlab R2019a软件进行数据分析。
3.结果。表3是多因素模型预测心力衰竭患者的死亡率准确率情况。
表3 本文数据集(n=299)的实际死亡率和预测死亡率
讨论
表3表明多因素模型能够准确地预测出心力衰竭患者的死亡率,因为多因素模型充分考虑了心力衰竭临床患者的多种因素,比如是否贫血、是否患有高血压、血液中CPK酶的水平、是否患有糖尿病、心脏每次收缩时的血流百分比、血液中的血小板浓度、性别、血液中肌酸的水平、血液中钠的含量、是否吸烟等因素,多因素模型是一种非常合理和人性化的死亡率预测模型。多因素模型基于布谷鸟算法充分考虑了多种影响心力衰竭患者死亡率的因素。布谷鸟算法基于Levy飞行,能够在给定空间中高效地进行寻优。布谷鸟算法被证明在很多方面都比传统的启发式算法具有更好的信息搜索能力。本文测试函数中的权重和阈值都是通过布谷鸟算法计算得出的,因此非常科学有效。
总结
针对传统的心力衰竭患者死亡率预测模型不能充分考虑多因素的问题,因此提出基于多因素布谷鸟算法的心力衰竭患者死亡率预测模型。使用加州大学欧文机器学习库的心力衰竭临床记录数据集来测试多因素模型在预测心力衰竭患者死亡率问题上的准确率,实验结果显示,多因素模型能够高效地预测心力衰竭患者死亡率。