基于外耳道气压的喉部健康状态特征分析
2019-06-26王鲁豫欧阳缮马荣华张晨华
王鲁豫, 欧阳缮, 马荣华, 张晨华
(桂林电子科技大学 信息与通信学院,广西 桂林 541004)
目前,喉咙肿痛作为常见并发症,可能隐藏巨大的安全隐患,因此喉咙健康的检测成为医学健康重要的检测之一。因喉部器官位于人体口腔深处,生理结构复杂,目前对喉部器官检测主要有食道镜、喉镜检测方法[1],CT扫描,活性检查等方法。其中食道镜、喉镜检测是最常用最简单的检查方法[2],可借助医用器械直观地检测患者的喉部,但因喉镜、食道镜尺寸太大,且人体有咽反射的本能反应,患者无法很好配合医生的检查,约有1.5%~8.6%的患者不能使用食道镜、喉镜插管,否则会增加喉部损伤,严重的会威胁到生命。同时对于儿童患者,因发育特点难以观察到喉部状况[3]。而CT扫描即利用射线超声波等对人体部位做断面扫描,这种检测方法可以不受制于生理结构任意方位检测,但是CT会产生电离辐射,辐射剂量比较大,孕妇不宜使用,而且难以发现密度变化小的早期病变,活动及金属容易产生伪影,导致医生无法诊断,特别是小孩儿容易躁动,需要给予镇静。活性检查即细胞活性检测方法,需要从喉部器官上直接截取组织,提取活性细胞进行细胞培养观察,给患者增加疼痛,且检测周期长。
本系统从喉部气压与外耳道气压的关联性,通过喉部吞咽引发外耳道气压的变化,从而判断喉部健康的状况,设计了基于外耳道气压检测喉部健康状态软硬件系统,并对外耳道气压信号进行分析处理和特征提取,最后在Weka平台下学习、分类[4]。最终实现了以准确率94.444 4%成功对17例输入实例进行分类。以非侵入式方法对喉部健康状况进行准确判断。
1 可行性研究
人体的耳鼻喉彼此相通,咽鼓管在正常情况下是闭合的,当吞咽或打哈欠时,咽鼓管作为沟通鼓室与咽喉的管道,借助咽肌收缩而开放,空气由咽口经咽鼓管进入鼓室,平衡外耳道和鼓室内气压,以维持鼓膜正常位置和自由震动功能[5]。因此喉部发挥吞咽作用时,内部气压与鼓室、外耳道气压产生了一定的关联性。从采集的外耳道气压信号来看,通过外耳道气压测试喉部吞咽信号是可行的。图1、2分别为喉部健康(吞咽舒畅)和喉部不健康(吞咽困难)的外耳道气压信号波形。
图1 健康喉部吞咽时的外耳道气压信号波形
图2 不健康喉部吞咽时的外耳道气压信号波形
2 外耳道气压信号采集系统设计
根据外耳道与喉部健康的关联性,为判断喉部健康,须采集吞咽时外耳道气压的信号,本系统设计了外耳道气压数据采集装置。该装置主要完成外耳道内气压数据的采集,以及将采集到的数据进行传输等功能。硬件装置中微处理器选用的是ST公司的STM32F103VET6超低功耗32位单片机,支持超小型封装,3个12位模数转换器,节能模式拥有3个级别。因外耳道气压变化微弱,探测空间狭小,故气压传感器选用的是ST公司的LPS22HBTR高精度气压传感器,是目前世界最小的压力传感器。该传感器能够以24位分辨率测量260~1260 hPa的压力,压力输出数据速率为75 Hz。该系统整体结构框图如图3所示。
图3 外耳道气压信号分析喉部健康状态系统结构框图
在外耳道气压数据采集系统中,高精度气压传感器LPS22HBTR通信接口有SPI和I2C 2种方式。SPI传输方式是由Motorola公司推出的通信协议,一般有3根信号线,包括SCK(时钟)、STB(片选)以及DATA(数据信号)。I2C是由飞利浦公司提出的通信协议,其通过2根信号传输线实现了双工的同步数据传输,一根串行时钟线(SCL)和一根串行数据线(SDA)。I2C总线相比SPI总线的读写时序比较统一化,设备间的通信也有严格的通信协议要求,所以在本系统中,气压传感器与微控制器采用的通信方式为I2C。微控制器与蓝牙模块之间采用UART通信方式。
在外耳道气压采集系统中,系统软件设计包括蓝牙模块和传感器的初始化以及通信方式的选择。各模块软件工作流程如图4所示。初始化工作完成后,由STM32F103VET6控制器控制气压数据的采集以及发送过程。若发现传感器初始化后无数据产生,则控制器会重新对传感器进行初始化,再通过蓝牙模块将采集到的气压数据发送给计算机。
图4 气压采集系统软件运行流程
采集方法为将气压传感器置入被采集者外耳道中,并使用PVC软性的泡面耳塞密闭外耳道,启动外耳道气压信号采集装置,待状态平稳后,让被采集者做吞咽动作并保持口鼻紧闭,同时记录气压变化数据。
在外耳道气压信号采集过程中,应注意4点:1)在采集外耳道气压信号前,被采集者应保持平稳心率;2)在采集过程中,被采集者尽量保持头部稳定;3)多次采集时,应保持一定的时间间隔,减少前后信号的影响;4)为了能够清晰采集到吞咽时的外耳道气压信号,应保持双耳有较好的密封性,并保持口鼻紧闭。
根据喉部健康和感冒等引起的喉部不健康特征,利用所设计的硬件系统,成功采集了喉部吞咽时的外耳道气压信号信息,各采集了100组数据。
3 特征分析
采集的100组数据分别为喉部健康吞咽时和喉部不健康(喉部发生微小形变,也就是不同程度的肿痛)吞咽时的外耳道气压信号,对其进行时频分析。
一般情况下,对平稳信号分析时所采用的信号分析方法是比较基础的傅里叶变换,但是对于非平稳信号,不同频率成分出现的先后在傅里叶变换中呈现不出具体信息,傅里叶变换只能获取总信号中的频率,却无法分析出各个频率信号出现的时间点。为了能够分析出信号的局部化问题,观察不同时刻的频谱特性,在傅里叶变换的基础上增加了可滑动的“窗”,这个“窗”一旦固定下来就不会变化。图5为信号短时傅立叶变换三维图,图6为信号短时傅立叶变换二维图。
图5 信号的短时傅里叶变换(三维)
图6 信号的短时傅里叶变换(二维)
对于不同健康状况下吞咽动作引起的外耳道气压信号,短时傅里叶有局限性,想要观察到清晰的频谱图,需要选择更合适的窗函数。
相较于傅里叶变换,小波分析的强大在于无论是时域还是频域,它都有更好的局部化性质[6]。对于外耳道微弱的气压变化,能够得到很好的频率分辨效果。
图7 小波包分解示意图(3层)
利用小波的这种特性,可将外耳道气压信号S分解到3层空间共8个频段。图7中Sij表示第i尺度的第j(j=0,1,2,,2i-1)个小波包子空间,其中在第1层分解中S10和S11分别为S的低频和高频部分,继而再对上层的低频部分S10和高频部分S11进行分解形成第2层。
此外,小波包变换的特征提取相比于小波基的优势在于小波包分解拥有更强大的时频分辨能力。通过对信号频带的多级划分,相比小波分析,小波包分析对高频部分更细的划分,并且能够自适应地根据信号选择相应的频带,大大地提高了时频分辨率。
因此小波包分解的频域分析方法,能够提取外耳道气压原始信号中更加细微的时频局域信息特征,可以更细微地感受到不同类的外耳道气压信号的差别,识别的精细度很高,所以分类的结果更加准确,从而判断喉部的健康状况。根据实验样本显示,健康状况不同的外耳道气压信号在不同频带内的能量是不一样的,根据这一特点,特征分析方法采用基于小波包分解的频带能量的特征提取。
外耳道气压信号最高频率为37.5 Hz,将气压信号用小波包分解到3层空间,所以频带宽度为1/23×fs=4.687 5 Hz。小波包系数-频带范围如表1所示。选取小波包分解的方式对外耳道气压信号进行特征值提取,对得到的结果进行分析讨论。
表1 小波包系数-频带
图8 小波包分解(健康喉部)
图9 小波包分解(不健康喉部)
通过实验得到图8健康喉部的小波包分解和图9不健康喉部的小波包分解,从外耳道气压波形图对比可知,在采集频率相同的情况下,不健康喉部的外耳道气压波形相比健康喉部的外耳道气压波形的波峰波谷间过渡比较缓慢,而且伴随着上下波动,气压信号的波形峰值点与波形低谷点的绝对差值较小,而健康喉部的外耳道气压波形波峰波谷间过渡较迅速,没有过多的上下反复波动,波峰与波谷的绝对差值比较大,整体变化浮动比较大。可以判断出其差异的原因,主要在于在喉部不适的情况下,喉部杓会厌肌和甲状会厌肌等相关肌肉神经组织会使会厌活动度降低,阻碍了吞咽功能,继而相比健康的喉部,不健康状态喉部在平衡喉部和耳内气压时不畅,因此出现了外耳道气压波形的波峰波谷间过渡迟缓且反复的情况。
通过比较可发现,健康咽喉和不健康咽喉所呈现的外耳道气压信号的小波包对应的8个频段的频谱中,不同喉部健康状态的频段峰值不同,分布不相同,能量谱均值差距较大。健康喉部的外耳道气压经小波包特征分析后,能量集中在高频频段S36、S37和低频S30、S31、S32。而健康喉部的外耳道气压频带的能量分布在S30、S32、S34。小波包对应的8个频段能量谱值能够反映不同咽喉健康状态的特征分布,从而能够咽喉健康状态分类提供依据。因此,采用的是将外耳道气压信号的小波包三阶深度的8个能量谱均值序列作为特征向量,然后通过特征向量进行下一分类步骤。
4 基于机器学习的喉部特征的分类与识别
通过由于人体咽喉部位的健康状况所引起的外耳道气压信息特征的不同,运用机器学习的方法,智能地识别和筛选出的健康和非健康实验数据。分类平台采用的是WEKA平台下的机器学习[7]。
机器学习是为了让计算机能够自动地学习算法,这些算法是从已经拥有的海量数据中挖掘出来,并且从中发现隐藏的特殊关系、规律和有用的知识,再对未知的数据进行预测。数据挖掘在应用领域当中最重要的方法就是分类方法,它是通过对采集样本的数据预处理,继而过滤属性不相关的信息,与此同时,标记一个数据类别的属性,训练采集样本的数据就是从标记中而来,最后选用相关算法对数据挖掘以及输出结果。分类方法有很多种,一般常见的有:决策树分类,朴素贝叶斯分类,基于关联的分类方法,粗糙集,K-最临近法等[8]。决策树相对来说计算量不大,运算速度快,天然的可解读性以及非常容易转化生成规则,而且拥有可以处理连续型也可以处理离散型属性的优势,所以采用决策树方法来对数据进行分类。
C4.5算法是基于ID3算法发展改进的[9],重新修改了选择属性的标准,加入了2个新概念,一个是分割信息量(split information),另一个是信息增益率(information gain ratio)。
熵的表达式:
(1)
信息增益表达式:
Gain(SA,A)=Entropy(SA)-
(2)
(3)
SplitInformation(S,A)=
(4)
信息增益率表达式:
(5)
即:
GainRatio(SA,A)=
(6)
在进行对数据分类前,要将所有的外耳道气压数据都经过小波包分解处理,生成多个实例。Weka对ARFF格式的文件有着非常好的支持,ARFF存储数据有着特殊的方式,主要包含3个部分:文件头信息,注释行以及实例数据。将实例以ARFF格式存储并导入Weka。
通过使用C4.5算法对该数据样本处理建立模型。从结果中可知,分类实例总数为201个,正确分类实例200,比例为99.502 5%。错误学习分类的实例1个,比例为0.497 5%。从混淆矩阵中可看出,有100个健康实例正确学习分类,101个不健康实例中有1个实例被分类到健康实例,100个不健康实例被正确分类。再通过实验采集获得18个实例,包含8个健康实例和10个不健康实例,进行分类与回归。最终结果如图11所示。
图10 C4.5算法处理结果
图11 分类结果
从分类结果混合矩阵可看出,主对角线上的数值很大,而非主对角线上的数值很小,甚至为零。正确分类的实例有17个,比例高达94.444 4%。8个健康实例都被正确归类,而10个不健康实例中,有9个被正确归类,还有一个被错误归类到健康类中。分类总用时0.01 s,Kappa统计为0.888 9,平均绝对误差0.059 9,均方根误差0.233 2,ROC面积为0.95。
5 结束语
基于外耳道气压的喉部健康状态分析方法,利用喉部吞咽与外耳道气压的关联性,设计了通过外耳道气压信号诊断人体喉部健康状况的诊断系统。相比传统的喉镜检测方法更加方便,并设计出相应的硬件和软件,通过实例验证了系统的性能。此外通过机器学习的方法,对人体喉部是否健康的数据进行分类识别,取得了良好的分辨效果,为实现自动化的诊断系统打下基础。