APP下载

基于长短时记忆的1型糖尿病患者运动模式下的血糖预测

2022-03-22刘昱鑫常利利李嘉旭山西大学复杂系统研究所太原00006山西大学疾病防控的数学技术与大数据分析山西省重点实验室路易斯维尔大学数学系澳大利亚联邦科学与工业研究院通讯作者mailyuleisxueducn

山西医科大学学报 2022年2期
关键词:血糖值低血糖准确率

刘昱鑫,郁 磊,常利利,李嘉旭,张 晴(山西大学复杂系统研究所,太原 00006;山西大学疾病防控的数学技术与大数据分析山西省重点实验室;路易斯维尔大学数学系;澳大利亚联邦科学与工业研究院;通讯作者,E-mail:yulei@sxu.edu.cn)

糖尿病是一种常见的慢性疾病[1]。国际糖尿病联盟发布的第9版糖尿病地图显示,目前有4.63亿成人患有糖尿病[2],中国糖尿病患者人数更是高居世界第一[3,4]。实现糖尿病患者的有效控糖,将患者的血糖(blood glucose, BG)长期维持在正常水平(3.9~10 mmol/L)[5],必须实现血糖的精准预测以及高血糖(>10 mmol/L)和低血糖(<3.9 mmol/L)的预测预警[6,7],以便患者可以积极主动采取相应措施避免高、低血糖的发生,将血糖异常波动带来的危害降至最低。

现阶段关于血糖预测的研究已有很多。例如,Zecchin等[8]基于人工神经网络的方法结合膳食信息来提升血糖预测精度。Wang等[9]利用历史血糖值,胰岛素剂量和膳食摄入量的时间序列,用卡尔曼滤波方法构建了血糖预测模型。除进餐、胰岛素等因素外,运动也是影响患者血糖变化的关键性因素[10,11]。Li等[12]基于卷积循环神经网络,构建了运动模式下的血糖预测模型。Zarkogianni等[13]基于模糊神经网络,构建了运动模式下的血糖预测模型。Romero-Ugalde等[14]提出了一个将运动信息、碳水化合物和胰岛素作为外源性输入的自回归模型来预测血糖。这类模型一定程度上提升了血糖预测的准确性,但在血糖的长期预测上存在一定的劣势,而长短时记忆(long short-term memory, LSTM)络可以很好地改善这一问题,其特有的单元结构不仅在处理非线性数据与时间序列等问题上具有很强的表达性,还可以解决序列的“长期依赖”问题。Aliberti等[15]与Mirshekarian等[16]基于LSTM构建了无运动场景下的血糖预测模型,其预测精度较其他传统模型有更好的表现。但基于LSTM网络的血糖预测模型在运动模式下表现如何还需要做进一步研究。为此,本文基于LSTM网络[17,18],构建了1型糖尿病(type 1 diabetes mellitus, T1DM)患者运动模式下的血糖预测模型,将其预测结果与支持向量回归(support vector regression, SVR)、循环神经网络(recurrent neural network, RNN)进行对比,旨在研究该模型在运动模式下的性能。另外,饮食与运动数据的获取、计算相对困难,为了研究模型是否具有较强适应性,进一步分析了不同输入特征对模型预测精度的影响,以及仅使用历史血糖值作为模型输入时高、低血糖的预测准确性情况。

1 资料与方法

1.1 实验方案

该研究共设置7组实验,利用UVa/Padova 1型糖尿病血糖代谢仿真器(type 1 diabetes metabolic simulator, T1DMS)模拟了30名T1DM受试者(10名成年人,10名青少年,10名儿童)在各组实验下的血糖数据。成年及青少年三餐初始进餐量(转化为碳水化合物)为50,75,50 g,儿童三餐初始进餐量(转化为碳水化合物)为40,60,40 g,所有受试者三餐初始进餐时间均为8:00、12:00、19:00。实验模仿日常生活场景,为初始进餐时间和初始进餐量加以随机偏差,各组实验随机偏差均符合标准正态分布。对不同受试者,设置不同的胰岛素大剂量及日常基础输注率。各组实验均设置了不同的运动时间及运动时长,其详情见表1。

表1 各组实验的运动时间及运动时长

每位受试者在每组实验下的模拟实验时长为1 440 min,每5 min对血糖数据做一次记录。血糖数据共包含5个特征参数,分别为:血糖值(BG)、进餐量(CHO)、大剂量(Bolus)、胰岛素基础输注率(Basal)、运动(xVmx)。运动强度默认为中等强度。为了模型有足够的泛化性能,我们将数据集划分为训练集(80%)和测试集(20%),在训练集中采用5折交叉验证,使用前向验证(Walk forward validation)的方法进行评估。

1.2 模型介绍

LSTM网络在机器翻译、天气预测、音频处理等领域具有广泛的应用。该模型考虑了时间序列的连续性特征,能够有效解决神经网络梯度下降过程中梯度消失的问题。其单元结构见图1。

LSTM单元工作原理可由如下公式描述:

LSTM遗忘门:

ft=σ(Wf[ht-1,xt]+bf)

(1)

LSTM输入门:

it=σ(Wi[ht-1,xt]+bi)

(2)

图1 LSTM单元结构Figure 1 The structure of LSTM cell

(3)

(4)

LSTM输出门:

ot=σ(Wo[ht-1,xt]+bo)

(5)

ht=ot⊙tanh(Ct)

(6)

2 结果

2.1 模型评估

均方根误差(root-mean-square error, RMSE)被广泛用于血糖预测模型精准程度的评价,本文选用其作为血糖预测性能评价指标。其计算方法为:

(7)

将患者膳食、运动、胰岛素的信息一起作为模型输入,分别使用SVR、RNN和LSTM的方法进行血糖预测,使用RMSE作为模型评价指标。LSTM与SVR,RNN在预测时长为15,30,45,60 min时的RMSE见表2。

经对比,LSTM算法在不同预测时长下均具有更小的预测偏差。这表明,LSTM算法不仅在无运动场景的血糖预测中有很好的性能,在运动模式下,也同样表现突出。

表2 各模型在不同预测时长下RMSE对比

2.2 不同输入特征下模型预测性能分析

时序数据共包含BG,CHO,Bolus,Basal,xVmx 5个特征。为判断减少特征输入是否依然可以保证血糖预测精度,本文从4种组合来研究不同输入特征对于未来1 h内血糖预测偏差的影响:①血糖(BG);②血糖+膳食(BG,CHO);③血糖+膳食+运动(BG,CHO,xVmx);④血糖+膳食+胰岛素+运动(BG,CHO,Bolus,Basal,xVmx)。

以30 min的输入序列时长为例,上述4组不同输入特征下的血糖预测误差折线图见图2。

图2 不同输入特征下未来1 h内血糖预测的RMSEFigure 2 Comparison of RMSE of glucose prediction with respect to different input features in one hour

从图2中可以看出,随着预测时长增大,各组特征的血糖预测性能均呈现下降趋势。在预测时长小于20 min的范围内,不同输入特征下的血糖预测性能略有差距,但差距不显著;在预测时长为5 min时,一维输入的血糖预测性能可能更高;在预测时长为20~60 min时,随着输入特征维度的增加,血糖预测性能有明显提升。由此表明,对于血糖的短期预测,是否考虑运动等额外信息,对血糖预测模型的精度无显著影响。

2.3 高、低血糖预测准确率分析

RMSE仅能反映预测值与实际值之间偏差的整体情况,不能反映模型中高、低血糖事件的误报、漏报情况,模型输入的血糖序列长度也会影响模型预测性能。在20 min的预测范围内,仅使用历史血糖值作为输入,模型高血糖事件与低血糖事件的预测情况还需做进一步研究。

本文以模型准确预测到高、低血糖事件发生的百分比作为模型的血糖预测效果的衡量标准。在血糖预测中,若真实血糖值与预测血糖值均低于3.9 mmol/L,记为准确预测到低血糖发生;若真实血糖值与预测血糖值均高于10 mmol/L,记为准确预测到高血糖发生。分别以20~50 min的历史血糖值作为模型输入,预测患者未来1 h内的高、低血糖预测准确率,结果见图3、图4。在保证90%高血糖预测准确率的前提下,预测时长为20 min时,模型输入序列时长需达到25 min;在保证90%低血糖预测准确率的前提下,预测时长为20 min时,模型输入序列时长需达到20 min。即在输入序列时长达到25 min的前提下,模型未来20 min内的高、低血糖事件预测准确率至少可保证在90%以上(高血糖预测准确率为94.12%;低血糖预测准确率为90.59%)。

图3 不同输入序列时长下未来1 h内的高血糖预测准确率Figure 3 Accuracy of predicting hyperglycemia under different input lengths in one hour

图4 不同输入序列时长下未来1 h内的低血糖预测准确率Figure 4 Accuracy of predicting hypoglycemia under different input lengths in one hour

2.4 克拉克误差网络分析

克拉克误差网络分析(error grid analysis, EGA)是一种具有临床意义的方法,专门用于评估各种监测系统产生的血糖值的准确性。EGA图分为A、B、C、D、E 5个不同的区域,表示5种不同程度的血糖估计的确定性与不确定性。其各区域含义如下:①A区:在临床上具有准确性,预测血糖值与真实值偏离不超过20%,或真实值小于3.9 mmol/L时,预测值也小于3.9 mmol/L。②B区:预测血糖值与真实值偏离超过20%,但其误差是良性的。③C区:表示造成血糖水平的过度矫正,可能导致高血糖、低血糖的发生。④D区:未预测到危险情况的发生,真实值不在血糖正常水平范围内,但预测值属于正常水平范围。⑤E区:错误处理区域,在该区域内血糖预测值与真实值相反,造成相应的治疗决定与应当采取的正确治疗方案背离。

以25 min的输入序列时长为例展开分析,仅考虑BG的一维特征输入下,不同预测时长的EGA各区域占比见表3。

由表3可知,当预测时长为5 min时,A区域占比为100%,血糖预测效果最佳,EGA见图5A;当预测时长为10 min,15 min,20 min时,A区域占比依然保持高水平,A、B区域总占比高达100%,血糖预测效果理想,EGA见图5B-D。表明在无通知进餐、运动与胰岛素的前提下,20 min内的血糖预测已能够达到高精确水平。

表3 不同预测时长下EGA各区域占比 (%)

A区:临床具有准确性;B区:良性误差;C区:过度矫正;D区:未检测到异常;E区:错误处理图5 不同预测时长下的克拉克误差网络分析Figure 5 Clarke EGA for different prediction horizon

3 讨论

UVa/Padova T1DMS是一种针对T1DM的葡萄糖-胰岛素系统仿真平台,被美国食品及药物管理局批准,可以在T1DM的临床前测试中替代动物实验[19]。该研究所使用的数据均来自于UVa/Padova T1DMS。

本文提出了基于LSTM网络[20]的T1DM患者运动模式下的血糖预测模型,并与传统血糖预测模型(SVR,RNN)进行对比分析。SVR在大多数回归任务上均有很好的预测性能,但由于其无法捕捉时序数据中的连续性特征,在处理血糖数据上的表现相对较差;RNN考虑了数据的时间关系,但面对长序列,会出现梯度消失的现象,难以捕捉长期时间关联,导致对血糖的长期预测效果不理想;LSTM在各个预测时长上的预测误差均小于SVR和RNN,在运动模式下的血糖预测中,表现突出。

从患者角度而言,众多数据的高频采样与记录十分繁琐,在现实生活中进餐量和运动量转换为模型可用输入数据的可操作性低。具体原因包括:①对于CHO,患者进餐种类繁多,日常记录餐饮量并根据不同食物换算碳水化合物含量的过程较复杂;②对于xVmx,不同的运动时长与运动强度,以及运动项目等对患者血糖影响程度均有不同,不同患者间也存在生理性差异,患者自身很难衡量。目前有关运动的血糖研究中,运动信息的获取多来源于可穿戴设备,但在患者自身血糖管理中可实现性不高。从糖尿病患者现实生活场景的血糖管理需求出发,模型输入特征需要尽可能简单。故本文对不同输入特征下模型的预测误差进行对比,结果表明,在运动模式下,无需将运动、膳食等信息作为外源性输入,仅使用历史血糖值作为模型输入,也可以实现血糖的短期预测,当模型输入序列时长达到25 min时,未来20 min内高、低血糖预测的准确率高于90%。这里有小于10%的误判,经过克拉克误差网络分析[21],这部分错误率可分为两种情况:①预测值与真实值偏差不大;②即使预测值与真实值偏差较大,但错误属于良性误判,在临床上不会造成对患者的伤害。总体来说,20 min预测时长内的预测精度较为理想。

目前对于运动模式下的血糖预测,仅使用历史血糖值作为模型输入,可以保证未来至少20 min内的血糖预测效果,可以为患者提供一定时间采取相应的措施来预防未来可能会发生的高血糖或低血糖事件。本研究为糖尿病患者的血糖精准预测及调控提供了科学依据和理论支撑,使得患者对于自身短期血糖水平的调控更加便捷。但对于中长期血糖预测,加入膳食、运动、胰岛素等外源性因素,可以明显提升血糖预测精度,仅使用历史血糖值进行血糖预测,可能会造成较大的误差。

猜你喜欢

血糖值低血糖准确率
您对低血糖的这些看法 原来都是错的
CGMS产品显示值与指尖血糖值测定结果的相关性研究
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
运动及饮食治疗对糖尿病患者血糖值的影响
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
测血糖到底用哪滴血
血糖值尖峰诱发多种可怕疾病
糖友,当心低血糖突袭