基于K均值的阻塞性睡眠呼吸暂停低通气综合症诊断
2010-11-07陈伟伟大连理工大学信息与通信工程学院116024
陈伟伟 大连理工大学信息与通信工程学院 116024
基于K均值的阻塞性睡眠呼吸暂停低通气综合症诊断
陈伟伟 大连理工大学信息与通信工程学院 116024
引言
阻塞性睡眠呼吸暂停低通气综合症[1](Obstructive Sleep Apnea Hypopnea Syndrome, OSAHS)是一种具有严重危害及潜在危险的高发性疾病,由于睡眠时发生低氧及高碳酸血症,最终引起全身多系统、多器官的渐进性危害。OSAHS最显著地临床表现就是睡眠打鼾,表现为鼾声时高时低,并可以完全中断,严重患者可以憋醒。多导睡眠图(Polysomnography, PSG)是公认的监测OSAHS的金标准。通过监测患者在安静入睡的状态下的连续6~8小时的脑电图、心电图、肌电图、血氧饱和度、鼾声、呼吸动度、腿动等十多项指标的改变诊断OSAHS, PSG[2]以AHI为标准对OSAHS病情程度评判。呼吸暂停指数(Apnea Hypopnea Index ,AHI)指数,也称为呼吸紊乱指数,是指每小时呼吸暂停加上低通气的次数。呼吸暂停是指睡眠过程中口鼻呼吸气流完全停止10秒以上;低通气是指睡眠过程中呼吸气流强度(幅度)较基础水平降低50%以上,并伴有血氧饱和度较基础水平下降大于等于4%。因为PSG监测价钱偏高而且需要检测者在医院的检查室中进行整晚大约8个小时的监测。调查显示,大约93%的女性和82%的男性患者没有得到诊断,原因就在于目前尚未找到一种简捷,方便,低费用的检测方法来实现OSAHS的筛查。
鼾声检测主要针对患者的鼾声特性进行研究与判断,鼾声的获取只需一组无接触式的麦克风和数据记录装置。目前多数研究者主要从鼾声的时域和频域参数着手。时域参数多数以单位时间内的鼾声数,鼾声持续时间和间隔,间断鼾声数,最后以鼾声数和间断鼾声数为指标进行判断[3]。基于鼾声检测的OSAHS诊断研究在国内外均尚属起步阶段。而且研究涉及广大人民的身体健康问题,研究意义重大。本文主要应用端点检测的方法模拟呼吸暂停低通气指数,并基于K均值分类的方法实现OSAHS的诊断。
1 鼾声端点检测
鼾声实际上也是一种声音。通过鼾声检测患者有病无病,可以广义的看作为语音检测、识别问题。不过,相对于常见的语音识别问题,鼾声检测从某种意义来说更简单。因为它只需要检测两个状态,即患者“有”或者“没有”患病。因此语音信号处理中的理论、方法是研究该问题的主要研究方法。
现阶段实验用的鼾声数据多数是与PSG检测同时录制的。由麦克风采集到的鼾声经低通滤波和A/D转换后得到鼾声数字信号。鼾声数据一般较长,基于音频信号的短时性分析技术首先将鼾声信号分帧和预加重。端点检测[4]的目的就是区分鼾声段和静音段,有效地计算鼾声片段的时间间隔,并可以将真正的鼾声数据分离出进行后续的处理。因为背景噪声的不稳定性依据固定阈值进行端点检测的正确率往往受限制,本文采用基于短时能量的自适应端点检测,并将鼾声最短持续时间作为判断条件加入来提高正确率。
1.1 端点检测
将鼾声信号分帧处理,因为鼾声的时变性相对于语音信号的时变性较弱,本文取分帧帧长为128ms,帧移取64ms。应用COOLEDIT软件观察鼾声数据发现鼾声的持续时间一般大于0.6s,故在端点检测时将鼾声的最短持续时间大于0.6s作为区分鼾声的初始条件。这样可以把持续时间稍长的噪音片段隔离掉,保证有效地提取真正的鼾声数据。
第i帧的短时能量表示为:
其中len表示帧长。因为鼾声数据的开端往往是以静音开始的,本文将预读入的5帧鼾声数据的平均能量值为参考设置初始的阈值,自适应的过程表示为:
其中LT和HT为经验数据,EL为低阈值,EH为高阈值,E为每帧能量值。自适应的端点检测算法能够根据实时的噪声变化调整门限。
1.2 鼾声事件的处理
经过端点检测后得到每个鼾声的开始时间和结束时间。鼾声的持续时间定义为一次鼾声的开始时间到结束时间,间隔时间定义为本次鼾声的结束时间到下次鼾声的开始时间。
观察所有鼾声的得出如下结论:98. 5%正常鼾声的间隔时间的分布在1.4s到4.0s。而有的鼾声因为个人呼吸频率的不同,往往吸气和呼气的间隔时间相对他人的时间较长,一个完整鼾声的中间就会出现小间隔。而这个间隔时间往往较小,所以我们对端点检测后的数据做以下处理:将间隔时间小于0.1s的两个鼾声归并成一个鼾声,完成鼾声事件的整合。临床上的呼吸暂停是指睡眠过程中口鼻呼吸气流完全停止10s以上,又因为打鼾者打鼾有时并不是连续的而是存在间断时间,所以我们将间隔时间大于10s小于60s的鼾声事件定义为呼吸暂停。
2 基于K均值的OSAHS诊断
临床上规定每晚7小时睡眠中,呼吸暂停反复发作30次以上或AHI大于等于5次/小时以上为患有OSAHS。根据AHI指数的定义将整晚发生呼吸暂停的次数取平均数并以一定的阈值做判断的方法没有考虑到个体差异带来的影响。因为人与人的呼吸道是不同的,打鼾的频率也往往会有差异,有的人本身打鼾的频率就比较低,间隔时间也就比较长,对诊断的结果就会产生影响。为了减小因个体差异带来的影响首先应用K均值分类的方法对鼾声间隔时间分为两类,并以两类中心点的差值和发生暂停的次数为诊断依据。
2.1 K均值分类原理
K均值聚类算法[5]是将给定的数据集合分成确定的若干组。定义k个中心点,每组一个,由于不同的初始中心位置产生不同的聚类结果,所以选取适当中心点是聚类的关键。 通过使它们之间的距离尽可能大,使给定的所有数据点结合到离它最近的中心点的聚类中。 当所有的数据点都分配到中心点的范围内后,初始的聚类形成。通过先前阶段的聚类中心重新计算k个新中心点,再将给定的数据重新分配到离它最近的新中心点。不断进行循环,由循环的结果得知, k个中心点逐步地改变直到它们的位置不再变化为止,即聚类中心不再移动.则标准函数的最小值函数的定义为:
式中:为聚类组的数量,为第i个聚类的均值向量;z为得分向量;为聚类中的第i个聚类。K均值算法的具体步骤是:
1)为每个聚类确定一个初始的聚类中心,这样k个聚类存在k个聚类中心;
2)将样本集中的每一个样本按照最小距离原则分配到k个聚类中某一个;
3)使用每个聚类中的所有样本的均值作为新的聚类中心;
4)如果聚类中心有变化则重复2),3)步直到聚类中心不再变化为止;
5)最后得到的k个聚类中心就是聚类的结果。
2.2 OSAHS诊断
本文对鼾声中存在的两类间隔时间的定义如下:第一类,若间隔时间小于10s定义为正常的鼾声间隔时间;第二类,若间隔时间大于10s小于60s定义为发生呼吸暂停的鼾声间隔时间。首先确定K均值分类方法的初始中心点的取值,分别统计第一类间隔时间和第二类间隔时间的平均值作为初始中心点。
OSAHS诊断的依据:
1)当只存在第一类的鼾声间隔时间:即没有发生呼吸暂停的,诊断未患OSAHS。
2)当间隔时间中既包含第一类鼾声间隔时间又包含第二类鼾声间隔时间:若两中心点的距离小于10s,则诊断为未患有OSAHS;若中心点的距离大于30s,则诊断为患有OSAHS,而且可以确定为比较严重的阻塞暂停;若中心点的距离大于10s小于30s则计算第二类间隔时间每小时的平均发生次数。
3 实验结果与分析
本文实验用的鼾声数据是由大连医科大学提供。表1是对端点检测方法的评估。截取不同人的大约12~28分钟的数据段统计鼾声总数,并与两个不同人耳听到的鼾声总数做对比,正确率在86%以上。不同的人耳听到的鼾声个数也会存在一定的误差。
表2 K均值分类方法的评估Tab2. Evaluation of the K means
表3 预测AHI指数Tab3. Predicted AHI
表1 端点检测方法的评估Tab1. Evaluation of the endpoint detection
表2中编号为5和7的鼾声分别取于同一OSAHS患者的患病段和不患病段,对比发现患者患病时和不患病时的间隔时间存在很大的差异。2号数据是明显的打鼾频率较慢,若只采用暂停次数做判断就会误判为OSAHS,基于新算法正确判断为正常的鼾声。
表3中数据不同于表1和表2的数据,为整晚约7个小时的鼾声。AHI指数范围从2.6~72不等,包含了未患病的,中轻度OSAHS患者和重度OSAHS患者,预测AHI和实际AHI存在一定的差值。差值的存在可能是因为背景噪声的影响,但不影响OSAHS的筛查。
4 结 论
通过仿真实验得到以下结论:分析鼾声的间隔时间来诊断OSAHS确实是行之有效的方法,而基于K均值的鼾声间隔时间分类减小了因不同人的打鼾的频率造成的分析误差。预测AHI指数基本能够体现患病的程度,实现OSAHS的筛查。
[1]殷善开, 易红良, 曹振宇. 阻塞性睡眠呼吸暂停低通气综合症[M]. 北京: 科学技术文献出版社.2006.
[2]齐志勇, 张治平, 呼和牧仁等.多导睡眠仪(PSG)在阻塞性睡眠呼吸暂停低通气综合征中的临床应用价值[J]. 当代医学. 2007(118).
[3]Yeh Liang Hsu, Ming Chou Chen, Chih Ming Cheng, et al. Development of a portable device for home monitoring of snoring[C].2005 IEEE International Conference on Systems, Man and Cybernetics, Hilton Waikoloa Village, Hawaii, USA , October, 2005.
[4]鲍长春. 数字语音编码原理[M]. 西安:西安电子科技大学出版社. 2007.
[5]边肇庆, 张学工. 模式识别[M]. 北京:清华大学出版社. 2000.
Snore Detection for Obstructive Sleep Apnea Hypopnea Syndrome Diagnosis
Chen Weiwei School of Information and Communication Engineering, Dalian University of Technology, Dalian 116024,China
阻塞性睡眠呼吸暂停低通气综合症最常见的症状是睡眠打鼾,本文依据语音信号处理的方法对鼾声信号分析,实现对阻塞性睡眠低通气综合症的筛查,以减小多导睡眠监测的检查负荷。基于短时能量的自适应端点检测记录鼾声的间隔时间,并以K均值的方法对鼾声间隔时间分两类,以两类中心点的距离和发生暂停的次数为依据实现OSAHS的诊断。本文算法旨在减小个体差异对判断结果的影响。
呼吸暂停;低通气;多导睡眠图;鼾声;K均值
Snore is the typical symptom of the obstructive sleep apnea hypopnea syndrome. Based on the method of speech signal process realized the cheap and portable method of screening OSAHS, where reduce the load of PSG. Based on the adaptive short-time energy endpoint detection record the time of interval of snores, and the method of K mean classified the time of internal to two types, the distance between the center and the occurrence of sleep apnea to diagnosis OSAHS. The new method is designed to reduce the individual differences in judging the results.
OSAHS; AHI; PSG; snore; K means
TN912 文献标识码:A
10.3969/j.issn.1001-8972.2010.22.092
陈伟伟(1986-)女,山东泰安人,大连理工大学信息与通信工程院硕士研究生,研究方向为语言信号处理。·