基于自适应向量机检测睡眠呼吸暂停综合征的最优特征组合筛选
2019-05-28王新康刘磊王量弘
王新康 刘磊 王量弘
[摘要] 基于自适应向量机监测睡眠呼吸暂停综合征(SAS)时可提取出的特征参数较多,筛选这些特征参数中与SAS相关度较大的组合,可以有效降低算法的计算量,具有重要的实践意义。本文基于V2导联心电信号,首先对ECG信号进行去噪和R波提取,得到心率变异性信号(HRV)和心电呼吸导出信号,并从中提取出时域频域特征共22组,利用特征参数与SAS的相关系数对特征参数筛选后进行支持向量机(SVM)分类。对比22组特征参数与筛选后的15组特征参数分类结果,准确率降低不足0.5%,但计算复杂度大大降低,可作为对临床长时间心电图检测的扩展,减少对专业医护人员的依赖,具有良好的经济性和普及性。
[关键词] 睡眠呼吸暂停综合征;相关系数;支持向量机
[中图分类号] R563.8 [文献标识码] A [文章编号] 1673-7210(2019)04(c)-0165-04
Screening best combination of features based on adaptive vector machine for detecting sleep apnea syndrome
WANG Xinkang1 LIU Lei2 WANG Lianghong2 FAN Minghui2
1.Department of ECG Diagnosis, Fujian Provincial Hospital, Fujian Province, Fuzhou 350001, China; 2.College of Physics and Information Engineering, Fuzhou University, Fujian Province, Fuzhou 350108, China
[Abstract] There are so much characteristic parameters can be extracted based on adaptive vector machine for detecting sleep apnea syndrome. It has important significance which is selected the characteristic parameters to reduce the amounts of calculation applied in sleep apnea syndrome. This study adopted the electrocardiogram signals from limb guided lead-Ⅱ and then denoised the signal interference and detected the R-wave to get the heart rate variability data and ECG-derived respiratory data. Analysis these two data that we can obtain the twenty-two features in time domain and frequency domain, moreover, using support vector machines algorithm to classify the sleep apnea syndrome feature parameters. Compared the twenty-two features with optimal fifteen feature parameters we proposed, the amounts of calculation are decrease obviously without decay the classification accuracy. It can be used as an extension of clinical long time electrocardiogram detection because it can reduce the dependence on health care professional. Therefore, it has good economy and popularity.
[Key words] Sleep apnea syndrome; Correlation coefficient; Support vector machines
隨着社会的不断进步,人们的生活节奏越来越快,生活质量不断提高,睡眠问题也日益受到人们的重视。以睡眠呼吸暂停综合征(SAS)为代表睡眠呼吸障碍类疾病正在不断地威胁着人类健康。据统计,全球睡眠呼吸紊乱的患病率男性约为4%,女性约为2%,65岁以上的老年人患病率在20%~40%[1]。它发生在夜间睡眠过程中,患者往往伴随有白日困倦、头疼、高血压或心脏病等疾病[2]。
SAS具体是指每晚7 h的睡眠时间中出现超过30次呼吸暂停,且每次暂停的时间超过10 s,或者每小时呼吸暂停的次数大于5[3]。随着近年来便携式心电采集设备的广泛应用,ECG信号获取极为简便,随着心电呼吸导出(EDR)信号[4]和心率变异性信号[5]提取算法日趋完善,统计这两种信号特征参数检测睡眠呼吸暂停综合征准确度已经越来越高[6]。与此同时带来的问题是特征参数越来越多,计算量越来越大,严重制约了算法的实时性。为解决这一问题,本文将筛选出与SAS相关性较大的特征参数进行疾病检测,可以在几乎不影响检测准确度的基础上大大降低计算量,提高计算速度,改善便携式检测设备的实用性。
1 资料与方法
1.1 数据库
本文采用Physionet的Apnea数据库[7],该数据库是通过心电信号检测睡眠呼吸暂停综合征的权威数据库,信号采样率为100 Hz[8]。数据库有35组训练集数据和35组测试集数据,每条数据都有V2导联的7~10 h的ECG信号。每组数据包含有一个ECG信号、一个R波信号以及一个注释文件。其中,注释文件由专家根据此时的呼吸信号和血氧信号对着1 min进行判定,这分钟内呼吸暂停被标记为“Apnea”,若无则标记为“normal”[9]。 图1所示为训练集A01的部分心电图。
1.2 ECG去噪
ECG信号是一种微弱的电信号,由于外界噪声和采集设备电路噪声的存在,心电信号会受噪声影响。由于噪声的存在,ECG信号真实的特征波形信息被掩盖,其自动化检测往往会被干扰。ECG信号噪声的主要来源有以下3个方面[10]:①工频干扰,主要是由电力系统以及用电设备造成的50 Hz噪声及其谐波干扰。工频干扰掩盖了ECG信号中的某些细微变化,难以识别和诊断心电疾病。②肌电干扰,主要是由人体肌肉震颤而引起的干扰噪声。肌电干扰的频率范围较广,一般为5~2000 Hz。肌电干扰会在ECG信号上产生不规则的毛刺,影响心电图检测。③基线漂移,主要由人体呼吸和采集设备引起,其频率范围在0.05 Hz到几赫兹之间。基线漂移使得ECG信号上下波动,造成信号形变,对极值点的检测干扰较大。
本文采用小波分解算法,由于噪声和特征波信号分布频率范围不同,利用小波变换对含有噪声的ECG信号进行分解,使得噪声和有用信号分离到不同的尺度上[11],见表1。由于信号经过小波变换分解后,工频干扰和肌电干扰主要集中分布在前三层的小波系数中,有用信号对应的小波系数的幅值较大,而噪声干扰所对应的小波系数的幅值一般较小,则可以利用某一阈值使得有用信号的小波系数保留下来,幅值较小的小波系数被置零,就可以滤除工频干扰和肌电干扰[12]。而基线偏移噪声频率很低,且其能量主要集中在1 Hz以下,主要分布在表1中的第6层近似系数中,将其置零,重构即可去除基线漂移[13]。
1.3 R波提取
ECG波形中R波信号幅度最大,斜率最大。本文通过对其进行小波变换三层分解,分解得到高频系数的模极大值,去除孤立的伪极值点,检测得到的模极大值对的过零点就是R波波峰的位置[14]。为了减少R波波峰的漏检和误检,本文采用以下两种方法:
①人体心脏在每次收缩后将会出现一段“不应期”,即这段时间不会产生新的QRS波群,时间约为200 ms[15]。所以,在检测R波时,每检测到一个R波需跳过这200 ms不应期,直接检测下一个R波,这样在提高检测效率同时,也减少了因噪声产生的R波误检。
②在R波的检测过程中,有时会出现R波幅度或斜率偏小的情况,这就可能造成R波漏检。取前5个R-R间期的平均值为基准,如果1.6倍时间内未检测到R波,将原降低50%进行回溯检测,进一步避免漏检。
图2所示为R波检测仿真结果,R波峰位置用圆圈表示。仿真结果表明,基于小波变换的R波检测算法R波定位准确,可以用于下一步的特征参数提取。
1.4 特征参数提取与筛选
睡眠呼吸暂停综合征患者再出现呼吸暂停的过程中,会出现心率减慢,甚至心动过缓现象;而患者在突然憋醒过程中,会出现心率突然加快,甚至心动过快的征状。反复出现的迷走神经与交感神经调节的改变,会导致患者出现较为严重的自主神经系统功能紊乱,自主神经损害导致交感神经和迷走神经张力的变化又是心律失常发生的基础[16]。心率变异性是目前公认的判断自主神经功能活动的重要的定量指标[17]。
除此之外,睡眠呼吸暂停综合征的临床检测中呼吸信号具有着重要的应用,但是呼吸信号的采集需要专业的设备,相对比较麻烦。阻塞性睡眠呼吸暂停和潮气量的变化在心源性呼吸信号中清晰可见。使用心电图信号处理得到的信号与原始呼吸信号具有很大的相关性,有着显著的临床应用价值。
本文通过将ECG数据按1 min分割,每条取前370 min用于特征参数提取,去除掉噪声干扰较大的第一分钟数据。目前,常用特征参数包括由心率变异性信号(HRV)提取的20个时域频域参数和2个由心电呼吸导出信号(EDR)提取的时域频域信号[18]。见表2。
由于每个特征与类别的相关系数不同,不同的特征数量也会影响支持向量机的学习性能,所以需要采用一种成熟的特征选取技术获得最佳的一组特征来对机器进行训练。本文使用Weka的Correlation Attribute Eval计算每种特征与疾病的相关系数[19],表2所示加粗的参数表示对检测结果影响较大,是本文最终选取的特征组合。
1.5 SVM分類
传统分类器以经验风险最小化为目的,往往会导致过学习问题,使得分类器的泛化能力下降,而SVM分类器在考虑经验风险的同时也考虑了置信风险,追求结构风险最小化,能够有效提高泛化能力,使得到的分类模型更具有实际意义,能较好地解决小样本、非线性、高维数和局部极小点等问题[20]。因此,本文将使用MATLAB软件的SVM分类器对前文提取的心率变异性和心电呼吸导出信号的时域频域特征参数进行睡眠呼吸暂停综合征检测模型训练,将35组训练集数据进行对比研究,验证睡眠呼吸暂停综合征检测算法的精确度,并比较全部特征集合与筛选相关度较大的特征集合在分类时的表现。
2 结果
对于算法的分类结果,往往采用准确率(Acc)、灵敏度(Se)、特异性(Sp)等3个指标来评价。
其中,TP为真阳性(true positives)、TN为真阴性(true negatives)、FP为假阳性(false positives)和FN为假阴性(false negatives)。
训练过程采用交叉验证法,即每次采用34组数据作为训练集,1组数据作为测试集,将此过程循环35次,最终得到的数据作为本次实验的结果,这里给出两组不同特征参数集合下训练集A1~A10的检测结果,见表3,Acc1为所有特征参数进行SVM分类的检测结果,Acc2为筛选出的特征参数进行SVM分类的检测结果。可以看出,全部22组特征参数进行SVM分类时的检测准确度为89.97%,筛选后的15组特征参数检测准确度为89.50%,准确度下降了0.47%,但在计算中少用到7组特征参数,计算量大大降低,给快速检测睡眠呼吸暂停综合征提供了依据。
3 小结
本文提出相关性筛选特征参数的方法,将从单导心电信号用于睡眠呼吸暂停综合征检测的22组特征参数中筛选出15组与SAS相关性大于0.1的特征参数。相比于全部的特征参数用于SVM分类,筛选出的特征参数集合在SVM分类时检测准确率下降不足0.5%,但计算量大大降低,是在临床广为应用的长时间动态心电图检测的基础上所附加的新功能,有很高的敏感性和特异性,无需添加新仪器,也无需睡眠监测技术人员,对被测试人员的影响性小,有良好的经济性和普及性。
[参考文献]
[1] Hiestand DM,Britz P,Goldman M,et al. Prevalence of symptoms and risk of sleep apnea in the US population:Results from the national sleep foundation sleep in America [J]. Chest,2006,130(3):780-786.
[2] Finkel KJ,Searleman AC,Tymkew H,et al. Prevalence of undiagnosed obstructive sleep apnea among adult surgical patients in an academic medical center[J]. Sleep Med,2009,10:753-758.
[3] 孙薇.睡眠呼吸暂停综合征的监测与治疗关键算法研究[D].广州:南方医科大学,2014.
[4] 余晓敏,涂岳文,黄超,等.基于心电信号的睡眠呼吸暂停综合征检测算法[J].生物医学工程学杂志,2013,30(5):999-1002.
[5] 吴宪文.基于单导心电检测睡眠呼吸暂停综合症[D].南京:东南大学,2010.
[6] de Chazal P,Heneghan C,Sheridan E,et al. Automatic classification of sleep apnea epochs using the electrocardiogram [J]. Comput Cardiol,2000,27:745-748.
[7] MIT-BIH Arrhythmia Database[EB/OL].(2016-06-16). http://www.physionet.org/physiobank/database/mitdb/
[8] Penzel T,Moody GB,Mark RG,et al. The apnea-ECG database [J]. Computers in Cardiology,2000(27):255-258.
[9] Moody GB,Mark RG,Goldberger A,et al. Stimulating rapid research advances via focused competition:the computers in cardiology challenge [J]. Computers in Cardiology,2000(27):207-210.
[10] 毋斌.基于小波变换的心电信号阈值去噪[J].山西科技,2018,33(1):77-79.
[11] 郑敏敏,高小榕,谢海鹤.心电信号小波去噪的改进算法研究[J].中国生物医学工程学报,2017,36(1):114-118.
[12] 王春雨.基于小波变换的ECG信号分析研究与硬件实现[D].福建:福州大学,2017.
[13] Hu X,Xiao Z,Zhang N. Removal of baseline wander from ECG signal based on a statistical weighted moving average filter [J]. J Zhejiang Univ Sci,2011,12(5):397-403.
[14] 張清丽,苏士美,王猛.基于改进小波变换的QRS特征提取算法研究[J].郑州大学学报:理学版,2017,49(4):100-103.
[15] 李忠杰.临床心脏不应期检测[J].心电学杂志,2007(1):52-55.
[16] 林璨璨,刘梅颜.动态心电图初筛睡眠呼吸暂停综合征进展[J].中华医学杂志,2017,97(1):76-78.
[17] 刘双艳.睡眠呼吸暂停病人HRV和PRV的相关性研究[D].济南:山东大学,2017.
[18] Cai H, Chen Y, Han J,et al. Study on feature selection methods for depression detection using three-electrode EEG data [J]. Interdiscip Sci, 2018,10(3):558-565.
[19] de Chazal P,Heneghan C,Sheridan E,et al. Automated processing of the single-lead electrocardiogram for the detection of obstructive sleep apnoea [J]. IEEE Trans Biomed Eng,2003,50(6):686-696.
[20] 拓守恒.基于QPSO训练的SVM核函数集成学习研究[J].系统仿真技术,2010,6(3):202-208,240.
(收稿日期:2018-07-26 本文编辑:苏 畅)