APP下载

基于相对熵的睡眠呼吸暂停低通气综合征的自动诊断

2018-12-06贾子锐李佳黄晶晶陈力奋杨琳张天宇

中国眼耳鼻喉科杂志 2018年6期
关键词:概率分布气流通气

贾子锐 李佳 黄晶晶 陈力奋 杨琳 张天宇

睡眠呼吸暂停低通气综合征(sleep apnea hypopnea syndrome, SAHS)是由上呼吸道完全阻塞(睡眠呼吸暂停事件)或部分阻塞(低通气事件)重复发作组成的。其中,呼吸暂停事件是指睡眠时口、鼻气流停止达10 s以上;低通气事件是指呼吸气流降低达正常呼吸气流的50%以上,且动脉血氧饱和度(artery oxygen saturation, SaO2)降低达4%以上。SAHS通常会造成白天嗜睡、疲劳、注意力不集中、易发生交通事故、情绪低落及记忆力下降[1]。如果SAHS不及时治疗,会导致高血压、心血管疾病、中风、心力衰竭、猝死等[2]。近年来,SAHS引起了越来越多的重视,然而还是有80%的中度以上SAHS没有被诊断出来[3]。因此,准确诊断SAHS很重要。

目前,多导睡眠图(polysomnography,PSG)仍然是诊断SAHS的“金标准”[4](本文使用的参考标准PSG,型号为Embla N7000,美国Natus公司)。它需要同时记录和研究许多信号,例如心电图、呼吸气流、SaO2等。PSG临床诊断SAHS是基于人工干预手动校正PSG分析的结果[5],具体操作程序是在PSG生成的脑电图、SaO2、打鼾等数据图上人工标记出各事件所在时间点,然后返回给机器。机器记录的信号由在睡眠医学领域有经验的专家分析,生成最终报告。人工干预是最耗时的过程,最有经验的护士也至少需要90 min(一般需要90~120 min)标出1例患者一整晚的所有事件。临床诊断SAHS的严重性是通过计算呼吸暂停低通气指数(apnea hypopnea index,AHI)[6],其反映了睡觉时每小时发生睡眠呼吸暂停或低通气(sleep apnea-hypopnea,SAH)事件的次数。AHI的计算公式定义为:

nSAH=nA+nH(1)

其中A,nA表示呼吸暂停事件及其次数,H,nH表示低通气事件及其次数;t表示总睡眠时间。在最终的医师报告中,SAHS根据AHI值可分为3级:5≤AHI<15为轻度,15≤AHI<30为中度,AHI≥30为重度。

随着对睡眠医学领域兴趣的增加,计算机分析技术的发展,以及为克服PSG软件分析的缺陷,近年来很多研究着重于使用较少种类的信号数据来诊断SAHS,如使用SaO2[7]、呼吸气流[8-10]、心电图[11]、脑电图[12]或者不同数据的组合[13]等。这些方法基于不同通道的数据研究SAHS的诊断,分别研究识别SAH事件[14]、呼吸暂停事件的分类[15]。

呼吸气流的波形直接受呼吸事件发生的影响[16]。其波形在正常呼吸时有清晰、明显的振荡,当发生呼吸暂停事件时其幅值接近于0,发生低通气事件时幅值明显下降。因此,从单通道呼吸气流信号中提取的信息通过强度分析可以用于SAHS的检测。基于呼吸气流单通道信号研究SAHS病情的方法有频谱分析[8]、包络检波器[1]、非线性方法[9]、Hilbert-Huang分解[10]等。

相对熵方法能够衡量2个概率分布或者群体之间的差异性。它将2个信息集合之间的差异描述为一个正实数,可用于发现系统中存在的异常行为。随着研究的深入,相对熵逐渐被应用于各个领域,如用于测量非指数随机数据[17],预测蛋白质三维结构[18],以及检测GPS故障的用户完整性[19]等。本文基于患者一整晚单通道呼吸气流数据,利用相对熵方法进行处理,以识别呼吸暂停事件和低通气事件,从而实现SAHS的自动诊断。

1 资料

本文选择112例患者的呼吸气流数据,数据来源于复旦大学附属眼耳鼻喉科医院睡眠疾病研究室。其中75例患者作为训练样本,37例患者作为测试样本以验证方法的有效性。呼吸障碍的主要风险因素包括肥胖、性别和年龄[20]。因此随机选择数据样本,包括不同性别、不同年龄等,以使研究结论具有普适性。各样本的特征分布见表1,原始的气流数据见图1。

表1 训练样本及测试样本特征

注:“-”示无此项

图1. 原始气流数据

2 方法与结果

2.1 呼吸气流中的相对熵 在信息论中,KL散度(Kullback-Leibler divergence)又称相对熵(relative entropy,RE),是描述2个概率分布非对称性差异的一种方法。1951年,KL散度最初由Solomon Kullback和Richard Leibler提出,用来描述2种分布的直接增益。这一方法记录在Kullback的历史性著作InformationTheoryandStatistics中[21]。

设p(x)和q(x)是x取值的2个概率的概率分布,则p对q的相对熵定义为[22]:

其物理意义为,使用基于q的编码来编码真实分布为p的样本所需要的额外比特数(信息量)。从定义上来看,相对熵可以度量2个随机变量的距离,但是从表达式可以看出,它是不具有对称性的,并不是严格意义上的“距离”。相对熵值总是≥0,仅当p=q时,相对熵值才等于0。而且当2个分布差异增大时,每条讯息需要更多的信息量,则相对熵值也会增大。

基于呼吸气流信号的特点,如果将相对熵公式中的p(x)表示为10 s内气流的概率分布(10 s的选取与定义中的界定一致),q(x)表示所研究样本区间内气流的概率分布,则相对熵表示每10 s内同一气流值对应的2个分布之间信息量的差异。如果相对熵值突然增大,说明该10 s内气流出现明显的变化。以某一患者临床上得到的2 500 s内的数据为例,则该样本中第1个10 s时间段内以及样本总体的概率分布分别如图2A、2B所示。

某患者的临床报告及用相对熵处理呼吸气流数据的结果如图3所示。

图2. 呼吸气流数据的概率分布 A.第1个10 s的概率分布; B.样本总体的概率分布

图3. 临床报告及相对熵处理结果

从图3可知,直接应用相对熵并不能识别出SAH事件。

2.2 调整后的相对熵 由相对熵的定义可知,当2个分布差异很大时,会出现极大值。但是不仅发生SAH时会出现相对熵的极大值,当呼吸气流出现极大值时也会出现相对熵的极大值(如睡眠姿势发生改变时)。为了区分这2种情况,引进局部极差(local range,LR)对相对熵结果进行调整,定义Tn=tn+1-tn:

图4. 局部极差的时域图像

调整后的相对熵(adjusted relative entropy,ARE)表示为:

可知,当LR→0时,ARE→∞,可以表示SAH事件;当LR增大时,ARE减小,可以表示正常呼吸运动或改变睡眠姿势等情况。RE与LR的关系及对应的ARE与LR的分布关系分别如图5A、5B所示。

由此可知,可以用ARE区分出SAH事件(图6)。

图5. 引入局部极差调整相对熵 A.RE和LR的分布关系;B. ARE和LR的分布关系

图6. 临床报告及ARE处理结果

由图6可知, 结果中出现极大值的部分与PSG报告数据中出现SAH事件的时刻点几乎一致,可将ARE结果中出现极大值的部分视为SAH事件。由此说明基于ARE研究SAHS问题是有效的。

2.3 基于ARE自动诊断SAHS 为定量识别呼吸暂停与低通气事件,定义以下3个阈值:Ta,Tb,Tc。Ta用于判断出现多个连续峰值时的计数问题,若2个相邻峰之间的值均>Ta,则视为1次事件;若出现低于Ta的值,则视为2次事件。Tb是区分正常呼吸与呼吸障碍的临界值,Tc是区分呼吸暂停与低通气的临界值。图7具体解释了各阈值的含义。

图7. 识别低通气和呼吸暂停事件的阈值定义

对训练样本中75例患者分别进行处理并与临床报告中的数据进行对比,利用误差分析和软件SPSS相关性分析,可得到不同阈值下整体的相关系数以及平均误差。其中Ta分别取值30,40,50。

1)识别SAH事件。分别取Tb= 5,10,15,20,…,100,将计数结果与临床报告中SAH事件的次数进行对比,其相关性和误差结果如图8所示。

2)识别低通气事件。分别取Tc= 5,10,15,20,…,100,将计数结果与临床报告中低通气事件的次数进行对比,其相关性和误差结果如图9所示。

图8. 识别SAH事件的分析结果

图9. 识别低通气事件的分析结果

由结果可知,在本测试样本集中,最优的阈值选取为:Ta= 30,Tb= 35,Tc= 55。

临床上,医师判断SAHS病情时大多数依据AHI的值。阈值分析可获得SAH的次数。若实现自动诊断SAHS病情,根据公式(2),还需计算总睡眠时间,可利用脑电图的数据分析得到。美国睡眠医学会(American Academy of Sleep Medicine,AASM)睡眠分期(成年人)为:W期(清醒状态)、N1(non-rapid eye movement,NREM)期睡眠、N2期睡眠、N3期睡眠、R期睡眠。则总睡眠时间可通过公式(6)计算,

Total sleep time=N1+N2+N3+R (6)

如以某例患者数据为例,可得其睡眠结构如图10所示。

图10. 患者的睡眠结构图

计算可得其总睡眠时间为588.5 min(约9.8 h),临床报告中数据为577.1 min(约9.6 h)。并利用该方法计算所有测试样本中患者的睡眠数据,可得其平均误差为1.04%。因此利用这种方法计算总睡眠时间是合理的。

用37例患者的测试样本验证SAHS自动诊断的可行性,并根据临床标准对病情严重性进行分类,其结果如表2所示。

表2 ARE自动诊断结果与临床报告比较

可知基于ARE的自动诊断分类结果与临床报告基本一致。

3 讨论

基于ARE自动诊断SAHS病情是可行的。本研究基于ARE方法实现SAHS自动诊断需要约20 min/人,而传统PSG分析需要90~120 min/人,明显缩短了计算时间,提高了效率,对于睡眠疾病的临床诊断有一定的意义。

研究过程中参照的标准是PSG的临床分析结果,还需进一步讨论临床分析的人工误差对结果正确性的影响程度。此外,呼吸暂停事件可进一步分类为中枢型、混合型、阻塞型,可以进一步讨论本文的研究思路是否适用于这一分类。为正确评估本文方法的实际功能,验证时要增加更多的患者样本,引入更多样化的情况,并使用标准数据库;对验证流程的标准化也应该进行评估,使研究结果更具有临床意义。

猜你喜欢

概率分布气流通气
气流的威力
离散型概率分布的ORB图像特征点误匹配剔除算法
不通气的鼻孔
实用无创机械通气技术进修班招生简介
关于概率分布函数定义的辨析
基于概率分布的PPP项目风险承担支出测算
固体运载火箭变轨发动机喷管气流分离研究
飞片下的空气形成的“超强高速气流刀”
基于停留时间分布的气流床气化炉通用网络模型
通气汤联合艾灸防治妇产科术后腹胀40例