APP下载

LSTM神经网络模型在冠心病月度入院人数预测中的研究

2021-10-12贾子舟张钰嘉荣书玲

中西医结合心脑血管病杂志 2021年18期
关键词:入院冠心病预测

贾子舟,张钰嘉,荣书玲,李 保

冠心病(coronary heart disease,CHD)是指因动脉粥样硬化斑块形成及破裂导致冠状动脉管腔狭窄或闭塞,阻断心肌的血供,进而引起心绞痛、心肌梗死等心肌缺血表现的疾病。随着我国人口老龄化加剧及人们生活方式的改变,冠心病人数持续增加,目前,我国冠心病患病人数约为1100万人[1]。据报道,全球冠心病年死亡人数超过700万人,在全球死亡率单一疾病中排首位[2]。Zhou等[3]2016年在Lancet杂志发表的研究表明,冠心病是中国居民第二大死亡原因。冠心病严重危害我国居民身体健康和生命安全,带来极大的社会及经济负担。目前,关于冠心病发病情况已进行了相关研究[4-7],但是对月度入院数是否具有变化趋势研究证据较少。随着深度学习的发展,已有部分学者将深度学习LSTM模型应用于传染病预测[8-10]。LSTM模型本质上是一种循环神经网络模型,在拟合和预测传染病时序数据时有较好的效果,但还未有学者将该深度学习模型应用于预测冠心病入院人数。本研究基于太原市某三级甲等综合医院的冠心病月入院人数数据,探究冠心病月入院数的趋势及变化特征,进一步应用深度学习LSTM模型对冠心病月入院人数的时序数据进行训练和预测,并将LSTM模型的预测效果与传统预测模型ARIMA[11]和GM(1,1)模型[12]的预测性能进行对比,验证LSTM模型对冠心病月入院人数预测的有效性,为落实冠心病防治措施提供帮助,同时也为医院合理配置医疗资源、提高救治能力提供科学依据。

1 资料与方法

1.1 资料来源 将太原市某三级甲等综合医院心血管内科2015年1月—2021年3月冠心病月入院数作为研究数据,详见表1、图1。

表1 数据集信息

图1 2015年1月—2021年3月冠心病月入院人数变化图

1.2 LSTM模型介绍 LSTM深度学习模型是非线性模型循环神经网络(RNN)的一种形式,LSTM在RNN的基础上增加了3个Gate结构,即Input Gate、Output Gate、Forget Gate。Gate结构的出现解决了RNN在层数较多时出现梯度消失的问题。 LSTM的具体组成结构见图2。

图2 LSTM模型组成结构图

LSTM具体计算公式如式①~式⑥所示。

t=sigmoid(Wf·[ht-1,xt]+bf)

it=sigmoid(Wi·[ht-1,xt]+bi)

ot=sigmoid(Wo·[ht-1,xt]+bo)

ct=t·ct-1+it·

ht=ot·tanh(ct).

式①~式⑥中,it为Input Gate,ot为Output Gate,t为Forget Gate,t为t时刻Cell中输入的值,ct为t时刻Cell中的更新值,hi为储存了t时刻以及之前时刻隐藏信息的向量; sigmoid、tanh均为激活函数;Wf、Wt、Wc、Wo均为权重矩阵,bf、bi、bc、bo为对应Wf、Wi、Wc、Wo的偏置,具体各个神经元模型结构图详见图3。

图3 非线性数学模型LSTM各单元结构图

1.3 仿真实验

1.3.1 评价指标选取 为检验LSTM模型对冠心病月入院数预测的效果,选取平均绝对误差(MAE)指标作为评估的标准,指标计算公式如式⑦所示。

1.3.2 建模 应用python软件对LSTM进行建模,建模时首先对数据进行z-score标准化预处理,拟合该模型核心用的到库为tensorflow、keras、sklearn以及pandas。该非线性模型有3层结构,即Input、Output、Hidden层,将非线性数学模型LSTM的epochs设置为500,units设置为128。采用Mini-Batch法来训练非线性数学模型LSTM。其中,batch_size设置为1,loss函数设置为均方误差即mean_squared_error,优化器设置为Adam(Adaptive Moment Estimation),Adam一般形式如式⑧所示。

mt=β1mt-1+(1-β1)gt

vt=β2vt-1+(1-β2)gt2

2 结 果

2.1 模型拟合及预测效果 运用LSTM模型对表1中数据进行拟合,此时,该模型的loss值为0.016 4,预测集的MAE值为50.368,模型拟合效果以及预测效果见图4、图5。可以看出,LSTM模型有较好的拟合效果以及预测性能,能够较准确地预测出冠心病月入院数的趋势以及人数。

图4 LSTM模型拟合效果图[蓝线代表Raw data(原始数据);黄线代表Fitted data(拟合数据)]

图5 LSTM模型预测效果图

2.2 模型对比 为进一步验证LSTM模型在冠心病月入院数预测中的算法性能,将LSTM模型预测性能与传统预测模型ARIMA及GM(1,1)模型进行对比。3个模型的训练集均为2015年1月—2020年12月数据,预测集为2021年1月—2021年3月数据,采用MAE评价预测的效果。详见表2。从表2可以看出,LSTM模型预测性能最佳,ARIMA模型预测性能次之,GM(1,1)模型预测性能最差。

表2 模型对比结果

3 讨 论

在我国冠心病人数整体呈上升趋势,对冠心病月入院数的准确预测能够为该病的防控工作提供一定的科学理论指导。本研究根据太原市某三级甲等综合医院心血管内科2015年1月—2021年3月冠心病月入院数,将LSTM模型应用到冠心病月入院数的预测中。结果表明,冠心病月入院数呈长期持续上升趋势,而且存在季节波动性,11月、12月是冠心病病人入院的高峰期。

总体上看,当前我国冠心病入院数仍处于上升阶段,本研究结果与全国趋势保持一致。 随着我国国民经济快速发展,人们行为生活方式发生极大改变,导致肥胖、高血压病、高血脂、糖尿病等患病率明显上升,这些均被证实与冠心病密切相关[13-14]。另外,吸烟、饮食结构、身体活动等是明确与冠心病发生相关的因素[1],共同促进冠心病发生发展。

心血管疾病有明显的季节性,冬季较冷的月份入院率最高[15]。本研究结果提示,冠心病月度入院数在11月、12月呈高峰,呈季节波动性。主要考虑与温度有关,在寒冷的环境下,交感神经系统激活,儿茶酚胺分泌增加,通过增加心率和外周血管阻力增加心肌氧耗,进而导致心绞痛或心肌梗死发生。另外,血清胆固醇水平升高已被证实与冠心病发展和死亡的风险增加有关;许多研究报道血浆胆固醇水平呈现显著季节性变化,在冬季水平最高,夏季水平最低[16]。同时,血浆纤维蛋白原水平和凝血因子活性的升高与冠心病入院密切相关,而两者浓度在寒冷月份达到峰值。这些机制综合作用于冠心病的发生发展,在其季节性变化规律中起着重要作用。本研究发现2020年2月冠心病月入院数呈现断崖式下降,考虑受新冠肺炎疫情影响,我国严格执行居家隔离政策导致冠心病入院人数大幅下降所致。

综上所述,冠心病入院人数变化受环境、季节等多方面的影响,具有一定的周期性和季节性。另外,研究发现LSTM模型有较好的拟合效果,并且LSTM模型的预测性能优于ARIMA 乘积季节模型及灰色GM(1,1)预测模型,可用于冠心病入院数的短期预测。在未来医疗资源配置时,应了解季节和其他因素的影响,参考入院数预测值,优化资源分布,合理利用有限的医疗资源。

利益冲突所有作者均声明不存在利益冲突

猜你喜欢

入院冠心病预测
无可预测
《住院医师规范化培训入院教育指南(2021年版)》解读
冠心病心绞痛应用中医辨证治疗的效果观察
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
sST2水平与冠心病预后的相关性分析
全膝置换术后再入院可以预防吗?
ADAMTs-1、 CF6、 CARP在冠心病合并慢性心力衰竭中的意义
如何使用冠心病保健盒