APP下载

深度学习模型在糖尿病及其并发症预测中的应用

2022-10-13肖丽刘崇玉朱红霞黄玲向海平赵移彪林晓东

成都中医药大学学报 2022年3期
关键词:决策树卷积准确率

肖丽,刘崇玉,朱红霞,黄玲,向海平,赵移彪,林晓东▲

(1.成都中医药大学,四川 成都 610075;2.四川省卫生健康信息中心,四川 成都 610041)

糖尿病是一种长期维持高血糖并影响人体新陈代谢的疾病,因体内长期高血糖环境诱发心脑血管疾病、各种功能组织(尤其是眼、肾、心脏、血管、神经)的慢性损伤、功能障碍的并发症,甚至有可能会导致死亡[1]。据2015年国际糖尿病联盟发布数据,全球糖尿病的患者人数为4.15亿,患病率8.8%,其中75%的患者分布在中低收入国家,患病情况呈快速上升趋势,预计2040年糖尿病患者数将达6.42亿,患病率将上升至10.4%,中国糖尿病患者数为1.10亿,居全球首位[2]。糖尿病的患病率不断上升,患病的年龄范围不断扩大,越来越多的人在没有意识的情况下就患上了糖尿病甚至已经出现并发症。因此,在糖尿病及其并发症发生之前,患病预测将成为糖尿病预防的主要任务。

1 深度学习在糖尿病及其并发症预测中的应用基本概况

随着健康医疗和新一代人工智能等领域的发展,深度学习已经成为研究医疗大数据的重要技术。深度学习主要是通过建立模拟人脑进行分析和学习的神经网络,旨在解决复杂的模式识别难题。针对不同人种,国内外已经建立了不同人群的糖尿病个体发病预测模型[4]。随着卷积神经网络模型、深度信任网络模型、堆栈自编码网络模型,BP神经网络模型等深度学习模型的快速发展,糖尿病及相关并发症预测研究迎来新一轮浪潮,如刘飞等运用卷积神经网络算法实现了糖尿病患者和非糖尿病患者的识别;明帅利用深度学习人工智能辅助诊断糖尿病视网膜病变,均取得了不错的研究成果[3,5]。本文对深度学习的前期应用基础进行分析和总结,并展望深度学习在糖尿病及其并发症预测中的应用前景。

2 糖尿病及其并发症预测深度学习模型分析

2.1 深度学习建模

神经网络是计算机模拟人类神经建立的数学模型,通过不同神经网络构建深度学习模型,实现糖尿病及其病发症的预测。深度学习模型具有深度挖掘数据的能力,通过深度学习模型可以自主学习糖尿病并发症的特征,预测未来某一时间段内患糖尿病及其并发症的概率[6],提高并发症预测准确性。构建深度学习模型的神经网络类型包括:卷积神经网络(CNN),循环神经网络(RNN),深度生成模型(GAN),图神经网络(GNN),深度强化学习(DRL),自动编码器(AE),神经结构搜索(NAS)。不同类型的神经网络对建模的结果有影响,不同的输入指标和中间隐含层神经元数对建模也有影响[7]。下面对一些现有的不同类型的神经网络构建的深度学习糖尿病预测模型进行分析。

2.1.1 卷积神经网络模型

卷积神经网络模型是由特征提取器和分类器构成的前馈神经网络。输入层、卷积层、池化层、全连接层和输出层组成该模型,如图1卷积神经网络的卷积层与池化层结构。卷积神经网络模型具有较强的识别功能,该模型的核心是卷积层。卷积层可以激活数据层,随着卷积层数的增加,可以获得更多具有更高识别功能的卷积核。输入糖尿病及其并发症相关数据集,经过卷积层后获得与有关患病风险因素相关的数据集特征分类,卷积层通过这样自上而下的卷积操作,生成数据特征。池化层类似一个特殊的卷积,将数据过滤进行子采样。全连层的工作原理是通过上一层输入来决定最初输入的数据,程序需要预测患糖尿病的概率,那么全连层会寻找最符合糖尿病及其并发症的患病特征,并且具有相应的权值,以获得正确的预测概率。

图1 卷积神经网络的卷积层与池化层结构

构建卷积神经网络模型步骤包括:收集数据集、预处理数据集、通过数据分析修改缺失数据和错误数据。XGBoost算法相比其他算法具有更优的分类功能,用该算法对数据集进行特征分类,选择对糖尿病及其并发症影响较大的特征,并获得数据特征子集;最后,利用CNN算法对获得的数据特征子集进行分类[8],得到卷积神经网络构建的糖尿病及其并发症的预测模型。

2.1.2 多层感知器模型

多层感知器模型是具有线性结构的神经网络,并且只有一个前驱和一个后继节点。模型的内层与层之间的连接方式为全连接,每一个神经节点与上一层的所有神经节点相连,形成最典型的模型如图2多层感知器模型结构。该模型适用于多变量非线性分析,对数据没有严格要求。

图2 多层感知器模型结构

多层感知器模型的构建包括以下步骤:首先,采集糖尿病及其并发症样本数据集,进行数据预处理。处理后的数据分为糖尿病预测有效数据和模型测试数据。有效数据用于构造模型,测试数据用于测试模型的预测准确率。优化器用于将数据优化,计算数据分类损失,均方误差函数用于计算回归损失。然后训练模型,用多层感知器构建预测模型,用检验集检验和评估预测模型。经过检验与评估,均方误差最小的模型则是最佳的糖尿病及其并发症预测模型。输入自变量为各项指标量,糖尿病及其并发症种类为因变量。由于糖尿病及其并发症指标种类较多[9],用Boosting方法创建总体模型,可提高准确率,降低拟合度。

2.1.3 Logistic回归模型

Logistic是一种线性神经网络模型,具有计算简单、可用于大规模数据集运算、运算速度快的特点。该模型可以根据导致糖尿病及其并发症的危险因素预测发生糖尿病及其并发症的发生概率。Logistic函数预测出一个样本属于正样本的概率值,预测过程中只需要计算一个线性函数。训练数据时,采用最大似然估计,优化过程中凸函数可以保证收敛到全局最优解。

模型建立步骤:单因素 Logistic 回归将糖尿病及其并发症相关变量进行转换和赋值,筛选出有效数据指标作为输入自变量,进行数据集回归分析,建立糖尿病及其并发症患病风险的预测模型[10]。

2.1.4 BP神经网络模型

在深度学习中,BP神经网络属于多层前馈神经网络,如图3BP神经网络模型。该神经网络有两种传播方式,当正常输入数据时进行正向传播:若输出值与预期值之间的差值大于可接受的误差,则执行反向传播,逐层修改数据,减小误差。

图3 BP神经网络模型

模型构建基本步骤如下:收集数据集,将数据集分为训练集和测试集,数据集用于构建预测模型,检验集用于检测学习的模型是否达到预期效果。当达到预期效果时,可以输入测试样本数据进行仿真;若不能达到预期效果,则按照连接路径顺序返回测试样本数据,并按照一定的规则调整连接权值和阈值,直到误差达到预期效果。糖尿病及其并发症诊断样本的期望输出值定为(1,0),输出值与真实值误差>0.5未达到预期效果,若≤0.5则达到预期效果。第一组模型训练实验完成后,对训练好的神经网络进行验证检测,并重复第二组实验以确保精准性。

BP神经网络模型训练量和存储量较大,若将共轭梯度算法与BP神经网络结合,能优化算法。通过数据集输入,预测糖尿病及其并发症患病机率,通过数据分析临床验证准确率达到85%以上[11]。

2.1.5 决策树模型

决策树根据分支策略不同可分成多种[12],决策树模型中比较典型的算法包括CRAT算法、ID3算法等。决策树模型本质是分类,通过不断拆分找出糖尿病及其并发症影响较大的因素。但由于拆分后可能出现纯度不高,过度分支,影响较大因素后出现等问题,引入了信息熵的概念[13]。在连续分类过程中,根据熵值判断预测糖尿病及其并发症的最优属性,选择整个预测模型中熵值最大的属性为测试模型属性,不断拆分后,熵越小,信息值越大,预测模型的准确率越高[16]。研究发现,影响糖尿病及其并发症因素有空腹血糖浓度,糖尿病家族史,心血管疾病家族史等。

决策树模型构造过程中,数据集由糖尿病及其并发症患者和健康人群组成,变量选择的过程构成了树。决策树模型选择的变量是树的内部节点,类的标号是树的叶节点,根节点是树的最顶层。在分类过程中,数据集特征由大到小不断拆分。决策树用于构建糖尿病及其并发症预测模型,如图4II型糖尿病的决策树模型。该模型需要一个训练集,并且每个数据由对糖尿病及其并发症有较大影响的特征和一个类别标记来描述。构造分类回归树的目的是找出患病属性和糖尿病及其并发症类别间的关系,找出这种关系,就能用于预测未知数据集中患糖尿病及其并发症的概率。

图4 II型糖尿病的决策树模型

2.2 模型构建算法比较

2.2.1 比较多层感知器模型和Logistic 回归模型

多层感知器(MLP)模型和Logistic 回归模型的受试者工作特征曲线曲线,判断两种模型预测准确性,多层感知模型的灵敏度,特异度,AUC性能指标都要高于Logistic回归模型,如图5多层感知器(MLP)模型和Logistic 回归模型算法比较图[11]。

模型灵敏度特异度AUC性能指标MLP模型0.9150.8460.913Logistic模型0.8340.7620.869

图5 多层感知器(MLP)模型和Logistic 回归模型算法比较图

为了避免出现“过拟合”现象,会将多层感知模型和Logistic回归模型相结合预测。先用Logistic回归模型对变量进行筛选,影响模型的预测准确性的因素很多,为了达到期望效果,通常采用多种数据挖掘技术相结合[15]。

2.2.2 决策树模型比较

ID3和CEAT都属于决策树模型。ID3进行连续拆分,直到找到同种类型病症的相同属性值,或者当达到预设的终止条件时,即可终止拆分。

回归树模型的工作流程与ID3相似,但它将每个分割节点上的数据平均值作为节点预测值。ID3衡量最优属性的标准是信息熵,而回归树模型衡量标准是均方差,均方差越大,预测糖尿病及其并发症的准确率越高。

2.2.3 卷积神经网络与经典神经网络模型对比

通过对比对支持向量机、决策树、BP神经网络和卷积神经网络模型的平均准确率,准确率由高到低依次为:卷积神经网络模型预测准确率88%,支持向量机预测模型准确率76%,BP神经网络模型预测准确率74%,决策树预测模型准确率68%[9]。从而得出卷积神经网络在糖尿病及其并发症预测应用中准确率高于其他三种预测模型,可以有效运用于临床糖尿病及其并发症预测。

表1 ID3和CRAT模型算法比较

3 深度学习模型在糖尿病及其并发症预测中的应用价值

通过研究发现深度学习模型应用于糖尿病及其并发症的预测是可行的。将深度学习模型应用于糖尿病及其并发症的预测中,有助于提高预测系统的准确率性,辅助医生进行临床判断,有助于患者的预防,可以延缓患者糖尿病发病周期等。其应用价值主要体现在以下几个方面。

3.1 提高预测灵敏度和准确率

深度学习模型下的糖尿病疾病的预测系统的灵敏度和预测准确率大大提高。良好的预测精度,为个体疾病预试验提供了新的方法,也为糖尿病高危风险评估、个体化预防和综合防控措施提供了有力的科学依据。通过提高糖尿病及其并发症预测系统的灵敏度,可以在诊治过程中实现更多的确定性和更少的浪费,有助于减少或延缓糖尿病慢性并发症的发生,改善糖尿病病人和其家庭的生活质量。糖尿病预测准确性的提高将为健康预测开辟新的领域[16]。

3.2 助力临床判断

深度学习技术提供了准确的糖尿病预测方法,有助于医生的临床判断。医生必须分析许多诊断糖尿病的因素,如病史、家族史和其他身体参数等,但传统诊断方法中专家的个人主观判断是重要的决定因素之一。由于医疗资源的短缺与糖尿病并发症症状的特殊性,即使每位医生都能及时参与每位病人的糖尿病诊断,仍然可能会导致一些病人被误判。因此,为了解决医疗资源不足的问题,减少人为干预,通过建立深度学习糖尿病预测模型,结合糖尿病专业知识与临床经验,更简易地整合人体饮食习惯、身体活动及各类症状,如口干、乏力、发热等多维数据预测患糖尿病的可能性,为医生提供了有效的评估方案,提高了医生判断的准确度。

3.3 预防、诊治和延缓发病周期

深度学习模型实现了糖尿病及其并发症的早期诊断,有助于对糖尿病高危患者的识别和预防性诊疗方法的制定。预测的信息可以作为一个警告信号,为病人以及医生采取足够的控制和预防措施[17]。糖尿病作为一个发病率很高的慢性非传染性疾病,预防非常重要。预防糖尿病能够大大的减少其并发症的发生。糖尿病本身的诊断和治疗是相对容易的,但各种糖尿病的急性或慢性并发症非常严重。这些并发症将对患者的生活、心理健康和经济产生重大影响,严重影响患者的生活质量,缩短患者的生命周期。此外,糖尿病是一种治愈率极低的慢性病,糖尿病及其症状出现时,可能已处于疾病中后期,治疗效果可能相对较差。最好的方法是做好糖尿病的预测,从根本上预防糖尿病及其并发症的出现。通过深度学习模型预测糖尿病及其并发症,为患者进行预防诊治,延缓糖尿病的发病周期,有效的病情控制,可以减少或延缓并发症的发生、发展,降低致残率[18],提高患者的生活质量,延长患者的寿命。

3.4 深度学习在糖尿病及其并发症预测中的应用前景

据统计,2000年全世界所有年龄组的糖尿病患病率为2.8%,2030年预估为4.4%,被诊断患有糖尿病的总人数预计将从2000年的1.71亿上升到2030年的3.66亿[19],人体长期维持高血糖可能引发多种疾病,如神经损伤、心脏病发作、肾衰竭和中风等。因此,糖尿病及其并发症的诊治将是未来医疗行业中的研究重点。

目前,计算机硬件技术和医学检测技术为深度学习预测糖尿病及其并发症提供了良好的基础条件。深度学习技术在糖尿病预测中的应用优势可在提取病症特征时,提高检测精准度。由此可见,深度学习技术在糖尿病及其并发症的预测诊治中有较好应用前景。相关研究表明,深度学习是预测糖尿病患者再入院的有效方法,与其他机器学习算法(如逻辑回归、朴素贝叶斯或随机森林)进行比较,深度学习算法预测糖尿病患者的再次住院率更为精准[21],深度学习模型具有良好的预测精度与综合增益,有望实现医学健康预测的突破。随着深度学习技术的不断成熟和完善,深度学习模型可为糖尿病及其并发病症甚至其他疾病在预测方面提供更好的帮助。

猜你喜欢

决策树卷积准确率
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
一种针对不均衡数据集的SVM决策树算法
从滤波器理解卷积
决策树和随机森林方法在管理决策中的应用
高速公路车牌识别标识站准确率验证法
基于傅里叶域卷积表示的目标跟踪算法
基于决策树的出租车乘客出行目的识别