基于X线的成人OSA计算机辅助诊断综述
2021-05-14武文杰宋文爱高雪梅杨吉江黄丽萍
武文杰,宋文爱,高雪梅,杨吉江,王 青,黄丽萍,雷 毅
1.中北大学 软件学院,太原030000
2.北京大学口腔医院 正畸科,北京100089
3.清华大学 自动化系,北京100089
阻塞性睡眠呼吸暂停综合征是一种上呼吸道反复出现部分或完全衰竭的一类疾病,大多数的阻塞性睡眠呼吸暂停都与不同程度的头颅骨骼变化有关,包括上颌骨和下颌骨之间的距离变化以及舌骨的尾侧移位等[1-4]。夜间睡眠期间呼吸暂停或者呼吸时较低的通气量都会阻碍或减少流入体内的空气体积[5],导致躯体缺氧。该疾病轻则影响患者的夜间睡眠质量[6],重则会诱发其他种类疾病,影响身体健康。阻塞性睡眠呼吸暂停的症状主要包括白天过度嗜睡[7]、出现神经认知障碍,以及导致糖尿病、高血压、增加心血管疾病发病率,甚至出现全因死亡等[8-11],部分患者还出现听力下降或有中耳功能障碍等[12]。在30 岁至60 岁的中青年群体中,男性和女性的阻塞性睡眠呼吸暂停综合征的患病率分别为4%和2%;随着年龄的增长,老年群体(大于60 岁)中的患病率也相应地增加:其中男性为28%~67%,女性为20%~54%[13]。在儿童中的阻塞性睡眠呼吸暂停综合征也不罕见,严重的阻塞性睡眠呼吸暂停综合征与小孩的学习能力不足、注意力缺陷或多动症等问题明显相关,也和小孩遗尿现象有着一定的关系[14]。由于阻塞性睡眠呼吸暂停综合征居高不下的发病率,导致该疾病具有很大的潜在风险,而且发病缘由尚不明确,只能早发现早治疗。因此,如何高效快捷地检测诊断阻塞性睡眠呼吸暂停综合征成为了目前学者研究的主要方向。
目前,阻塞性睡眠呼吸暂停的主要检测手段是利用多导睡眠监测和X 线片的颅骨测量等方法[15]。根据阻塞性睡眠呼吸暂停低通气综合征诊治指南[16],利用多导睡眠监测法对阻塞性睡眠呼吸暂停综合征进行诊断评估,依据呼吸暂停-低通气指数(Apnea-Hypopnea Index,AHI)可将OSA严重程度可以分为四类,如表1。多导睡眠监测是目前诊断阻塞性睡眠呼吸暂停的唯一标准,因此,对OSA患者进行多导睡眠监测是绝对有必要的,但是它的实用性非常有限、成本高昂而且耗时长,因此仍需寻找一种新的诊断方式来弥补多导睡眠监测的不足。
表1 OSA严重程度与呼吸暂停次数关系表
利用X 射线技术诊断阻塞性睡眠呼吸暂停是目前临床医学检查中的另一项重要的诊断方式,其主要是凭借X 线的强穿透性、摄影效应、荧光效应等特点。当X射线穿过肌体之后,因为肌体内的各器官组织对X射线的吸收存在着一定的差异,此外,人体各组织器官的密度及厚度也是存在差别的,所以它可以形成不同的对比度图像。在过去的十年间,头影侧位测量片被用来评估OSA患者的骨骼,以及在较小的程度上评估面部和上气道的软组织解剖状况。尽管颅面侧位X 线片是在受试者日间清醒且直立的状态下拍摄的,这相对于在夜间进行诊断的多导睡眠监测有明显的局限性,但是基于颅面侧位X 线片的诊断方式相对简单且成本较低,此外,侧位头影测量参数与阻塞性睡眠呼吸暂停诊断标准的相关性也在大量研究中得到了认证[17-19],因此X 射线成为了评估阻塞性睡眠呼吸暂停严重程度的有效工具。
人工智能的问世,使得仅基于X线片数据进行辅助诊断的系统有了实现的可能,患者仅需拍摄颅面侧位片,系统根据所得图片即可对疾病做出诊断,这种诊断方式有着易推广、易实施的特点,具有良好的应用前景。该方式可以有效地推广向基层,还可以进一步提升诊断识别的能力,对缓解医疗资源不足的问题有着重要意义。
1 相关领域的研究现状
阻塞性睡眠呼吸暂停综合征(Obstructive Sleep Apnea Syndrome,OSAS)患者主要表现症状为夜间睡眠期间上呼吸道反复出现阻塞,若要对阻塞性睡眠呼吸暂停做出精确的诊断,首先需要制定一个严格的评估标准,Lee等人[20]研究发现,不同种族之间的平均年龄和身体质量指数相似。但是中国患者的OSA 症状更为严重。因为中国人的头颅骨骼局限性更大一些,其中包括较短的颅底、上颌骨和下颌骨长度。由于种族之间存在着的差异,在研究中国OSA患者时,建立我国本民族本地区无鼾症即正常人群的侧位颅面X 线头影测量参考值是非常有必要的。刘月华等人[21]通过选择北京地区的100 名健康的在校大学生,对他们进行了侧位颅面X线数据测量和统计分析。Chang等人[15]对参与者进行了多导睡眠检测和头部侧位扫描,通过对颅面X 线片、年龄、身体质量指数以及颈围等数据记录分析,发现颅面侧位X线片测量是评价中国OSA患者的一种有效的临床诊断工具,而且OSA 患者也需要同时测量骨骼结构以及软组织结构,这样才能得到最佳的诊断结果。
众所周知,肥胖也是诱发阻塞性睡眠呼吸暂停综合征中最常见的因素之一。它对睡眠呼吸障碍的影响似乎也超越了其他的已经被确定的容易诱导睡眠呼吸障碍的因素,比如遗传、上呼吸道异常或者是颅面表型。在Sutherland 等人[22]的研究中,他们证实对于比白种人的骨骼限制更大的亚洲人来说,肥胖是加剧阻塞性睡眠呼吸暂停病情的一个非常重要的原因。
随着人工智能的发展,越来越多的机器学习以及深度学习模型运用在阻塞性睡眠呼吸暂停诊疗中,Marcos等人[23]对149 名参加测试的患者进行了研究分析,通过对他们进行夜间多导睡眠监测和血氧饱和度检测,得到对阻塞性睡眠呼吸暂停的首次分析结果。继而对检测结果进行特征提取,并将提取的特征做归一化处理。然后将所得数据传入支持向量机(Support Vector Machine,SVM)中作为其输入数据,最终得到OSA 的诊断结果。研究者发现该算法诊断阻塞性睡眠呼吸暂停的灵敏度为84.44%、特异性为93.33%。Ho[24]提出了一种全新的方法,其方法思想是利用卷积神经网络和单通道鼻压力信号进行实时呼吸暂停或呼吸不足事件的检测。将179个多导睡眠监测记录作为研究的数据集,其中训练集数量为50,验证集数量为25,测试集数量为104。根据逐段的分析,该方法显示的结果对诊断OSA有很大的帮助,其中灵敏度为81.1%,特异性为98.5%以及准确度为96.6%,为诊断分析OSA 提出了一种有效的深度学习解决方案,并为深度学习应用于诊断OSA打下了良好的基础。
2 阻塞性睡眠呼吸暂停的辅助诊断
目前,阻塞性睡眠呼吸暂停的诊断主要是依靠医生对受试者进行人工的多导睡眠监测,由于多导睡眠监测的医疗费用高昂、诊断分析耗时长以及对医师的专业水平要求较高等局限性,利用机器辅助诊断分析越来越受到人们的重视。阻塞性睡眠呼吸暂停人工智能辅助诊断的方式大致可以分为两种:(1)基于传统方式诊断;(2)基于深度学习方式诊断。
2.1 传统方式
2.1.1 基于关键点
由于深度学习领域的发展,早期传统诊断方法的使用已逐渐减少。由于基于关键点的传统诊断方式主要是研究颅面骨骼或软组织异常程度与阻塞性睡眠呼吸暂停之间的相关性,所以该诊断方式在医学上的解释性高,因此该诊断方式依旧具有很大的研究价值。
早在20 世纪80 年代末,研究者就开始利用颅面侧位片中关键点之间的差异,来诊断阻塞性睡眠呼吸暂停综合征。Deberry-Borowiecki等[25]分析了30位OSA患者和12个年龄及性别相似的健康受试者的颅面侧位X线片。统计结果表明,OSA患者的测量数据在五个方面与健康组不同。这也证实了基于颅面关键点研究的可行性。
Banabilh等人[26]使用MorphoStudio软件分析颅面侧位X线片中的27个标志点。计算平均阻塞性睡眠呼吸暂停和平均二维控制气道构型,并进行t 检验和有限元分析,其中通过有限元分析可以使两组(OSA与非OSA组)间关键点测量数据的差异以图形化展示,尺寸和形状的变化使结果更明显。研究结果显示,OSA组的测量数据在多方面与健康组存在明显差异。
Ryu等[27]利用Pearson二元相关分析、判别函数分析以及交叉验证等,对140名参与者进行颅面侧位成像和多导睡眠监测评估。在侧位头颅造影上总共进行了29次测量(24 个距离和5 个角度)。对颅面测量和多导睡眠图参数进行分析,分离出9 个与OSA 相关的变量,结果表明:头颅侧位X射线可用于评估颅面及软组织畸形与OSA严重程度的关系。
Gungor等[28]使用头颅测量分析程序(Dolphin Imaging Cephalometric and Tracing Software)测量分析了16 名OSA患者和16名健康受试者的颅面情况,并通过Mann-Whitney U检验分析了25个测量参数在OSA患者和健康受试者间的区别,发现两组数据在几个颅面测量参数中存在显著差异。
Hoekema等[29]使用颅面侧位X线片测量技术,对比分析了31 名男性OSA 患者与37 名健康男性受试者的颅面形态,并确定了16 个颅面测量数据,利用student t检验分析了OSA 患者组与健康组测量数据之间的差异,通过多元回归分析评估所选测量数据的预测值,得到了一个优秀的筛选OSA的模型,如表2。
表2 关键点模型
综上所述,容易发现,(如图1)基于关键点诊断方式对阻塞性睡眠呼吸暂停诊断的步骤大致如下:
(1)对受试者做头颅侧位X 射线检查,图像主要区域包括颅面骨骼以及软组织。
(2)设计算法,提取X 线片中的相关特征点并做记录,测量计算相关特征点间的距离或角度。
(3)最终将提取数据与非OSA数据进行对比分析,得出评估结果。
图1 传统方式对OSA诊断步骤
阻塞性睡眠呼吸暂停基于关键点的诊断方式,需要对每一个受试者的颅面侧位X线片进行测量,为了提取更好的特征表示,其主要特点是使用的关键点都是专业医师手工设计的,往往成本高且耗时长,这也成为了该诊断方式的主要缺陷。基于关键点的传统诊断方法基本上还是利用的比较浅层的特征,然后使用设计好的算法对空间位置关系进行建模,而深度学习方法将二者合为一体,这样的优势是便于设计和优化。
2.1.2 基于传统机器学习
近几年,深度学习掩盖了经典机器学习的风采,成为了解决人工智能类型问题的首选技术,原因是深度学习在各方面任务中出色的表现,其中包括但不限于自然语言和视觉处理等。然而,传统的机器学习与高性能的深度学习相比并不是一无是处的,例如使用线性回归和支持向量机同样可以得出好结果。
Marcos 等人[23]对149 名参加测试的患者进行了研究,由于血氧测量数据存在不准确性,因此对患者进行夜间多导睡眠监测以及对患者血氧饱和度(SaO2)检测记录做了光谱分析,以量化健康组与OSA 组之间的差异。继而对检测结果特征提取及归一化处理。将所得数据传入给予优化的支持向量机中作为其输入数据,最终得到很好的OSA检测结果。但是其研究也存在着一些局限性,首先Marcos的研究数据集规模很小,对测试集的优化需要更大的数据集作为支撑;其次对血氧饱和度信号做光谱分析,虽然OSA 组和非OSA 组的血氧饱和度信号有着明显区别,但是SaO2 信号可能受到噪声的干扰。
由于多导睡眠监测需要受试者进行整夜的睡眠检测,这意味着耗时长且成本相对较高,而且与白种人相比,在年龄和身体质量指数相似时,中国OSA患者的症状更为严重,Ting等[30]验证了一个基于专家的特征提取与自动特征选择决策树相结合的诊断系统,用于诊断中国台湾地区的中度及重度阻塞性睡眠呼吸暂停综合征患者。并与反向逐步多变量逻辑回归模型、决策树等算法进行了比较,发现其提出的算法诊断准确率为96.9%,是所有评估比较的算法里效果最好的。但研究数据集是由诊所患者组成的,使其诊断OSA 的患病率高达73%,这与中国人的OSA患病率严重不符,因此该研究的结果并不能代表全体中国人。
Hajipour等[31]研究人员利用受试者白天清醒时的气管呼吸音以及夜间多导睡眠检查数据,利用不同的特征提取方式提取特征,评估比较了随机森林(Random Forest,RF)和正则化逻辑回归(Logistic Regression,LR)两种机器学习算法对阻塞性睡眠呼吸暂停的诊断结果。研究表明,在诊断阻塞性睡眠呼吸暂停综合征时这两种机器学习算法都各有优势,随机森林方法精度较高,因此是医学诊断的首选方式;但如果数据集过大时,正则化逻辑回归方式可以更快地得出诊断结果,并且准确性也满足诊断需求。
Lee 等[32]为了寻找耗时较短的算法,分析比较了支持向量机和模糊支持向量机(Fuzzy Support Vector Machine,FSVM)两种算法的性能。数据集为32例睡眠呼吸暂停患者的多导睡眠监测记录以及使用Pan 和Tompkins算法提取的心跳信号,通过将模糊支持向量机的模糊隶属函数参数n由1 上调为500,虽然最大分类准确率与支持向量机同为93.23%,但FSVM 的学习时间较SVM 减少了一万余倍,为筛选OSA 开创了一个高效的模糊支持向量机算法。如表3。
表3 传统机器学习模型
在基于传统机器学习的方法中,使用的分类器主要是SVM、决策树或随机森林等,相对深度学习方法,传统机器学习方式的可解释性更强,在理论分析上更有优势。
2.2 深度学习方式
基于深度学习的诊断方式自2012 年Krizhevsky[33]提出后,便成为了研究的热门,Ibragimov[34]首次研究了深度卷积神经网络(Deep Convolution Neural Network,DCNN)在全自动定量颅骨测量中的应用。深度卷积神经网络是人工智能机器学习中的一部分,它是一种深度学习体系结构,用于自主学习图像的局部特征,并进行分类[35-36]。因此,利用深度学习来分析诊断OSA将会渐渐取代原始的机器学习以及特征点提取方式。
卷积神经网络(Convolutional Neural Network,CNN)是一类包含卷积计算且具有深度结构的前馈式神经网络,是深度学习代表算法之一,经常被用来处理图像。卷积神经网络通常由几种不同类型的层组合而成,其中有数据输入层、卷积层、激活函数、池化层、全连接层等。卷积神经网络通过卷积层中的卷积核进行特征提取;经过池化层省略掉图像中相邻像素间的相似值,其原理是减少待处理的数据量,得以提高计算效率;其次利用激活函数实现梯度下降;最后通过全连接层实现结果的输出。另一方面,卷积神经网络具有很强的容错能力,并且在训练和优化方面也有很大的优势。
2.2.1 诊断成人OSA的深度学习方案
目前,诊断分析阻塞性睡眠呼吸暂停综合征的深度学习方式大部分是以血氧饱和度信号、多导睡眠图作为研究数据集,基于颅面侧位X射线诊断阻塞性睡眠呼吸暂停综合征的深度学习诊断还很少见。Ho[24]使用多导睡眠监测记录及预处理后的鼻压力传感器信号作为数据集,多导睡眠监测记录分为训练集、模型验证集、独立测试集。根据验证集测试得到最优参数组合,将测试集传入CNN 模型进行分类,取得了很好的筛选结果。值得一提的是,CNN模型是全自动的,并没有手动设计特征提取;并且可以进行实时监测。另一方面,该研究并不支持睡眠呼吸暂停的多分类,只能精确地检测到呼吸暂停低通气事件;此外由于鼻压力信号较为微弱的特殊性,这将影响到后期的检测结果,这些问题使得该研究也存在着一些局限性。
Vaquerizo-Villar等[37]将746位受试者经过预处理的夜间血氧饱和度信号作为数据集,利用卷积神经网络来自动估计小孩睡眠呼吸暂停低通气综合征(Sleep Apnea-Hypopnea Syndrome,SAHS)的严重程度,其使用的卷积神经网络模型由λ个CNN 块组成,每块又由包含16 个滤波器及内核为6 的卷积层、整流线性单元(ReLU)层及系数为2的池化层合并组成。最终通过深度学习技术证明了从血氧饱和度信号中提取的信息有助于评估儿童SAHS 的严重程度。虽然该研究在敏感性、特异性等方面有卓越的表现,但是数据集中非SAHS 的受试者数量居多,这将影响到CNN 评估结果;另一方面,并没有利用常规的血氧饱和度信号作为数据集与该研究诊断结果进行比较。
Kim[38]对测试者进行了整夜的多导睡眠监测,在受试者睡眠期间记录他们的呼吸声,通过频谱减法、滤波法进行信号预处理并提取出音频特征,使用了三种分类模型来执行筛选OSA的任务。其中Simple Logistics模型的性能表现最好,深度神经网络模型由于数据集小而表现欠佳。在之前的许多研究中都只是将诊断结果进行二分类,而该研究实现了OSA 的四分类,这是少见的;而样本数量与特征提取方面限制了深度神经网络模型的性能,因此拥有大规模数据集将会使得深度神经网络预测模型表现更好。
Haidar[39]的研究从100名受试者的鼻气流信号中提取了24 480 个样本作为数据集,提出了一种基于CNN的解决方案,使用Back Propagation 算法和Adam 优化器对模型优化训练,与有优秀表现的SVM 模型进行了比较。结果显示,卷积神经网络模型不仅不需要人工设计特征提取,而且测试精确率等数据也优于SVM。但该研究也存在着一些局限性,新设计的CNN 模型只能对睡眠呼吸暂停和呼吸不足事件做二分类,并不能做到呼吸不足严重程度的细分类;另外样本数量较少的问题也影响到该模型的表现。
为了提高分类器的性能,Li[40]在研究中,提出了一种使用单导联心电图信号作为数据集的基于深度神经网络(DNN)和隐马尔可夫模型(HMM)的OSA 检测方法,使用逻辑回归层的监督模式和newton 方法对模型进行了优化,利用无监督机器学习算法通过稀疏自动编码器对DNN 模型进行建模,并将HMM 与DNN 相融合以至于提高模型的性能。结果表明,该模型的敏感性为88.9%,在不漏诊方面相对之前的研究表现十分出色,这在临床实践中尤为重要;但遗憾的是,虽然该研究筛选OSA 患者的准确率很高,但也没有实现OSA 严重程度的多分类。
2.2.2 基于X线片诊断其他疾病
现阶段,基于X线片的诊断技术大多被运用在胸肺等部位疾病中,2019年底出现的一种新型冠状病毒疾病(COVID-19)在全世界蔓延,Al-antari[41]提出一种基于YOLO预测器的深度学习诊断系统,通过数据的平衡与随机缩放扩充策略来微调优化深度学习模型。YOLO预测器有着可以同时检索潜在疾病并预测患病概率的优势,这较其他方法有着显著的优势。虽然COVID-19与其他肺部疾病有较高的相似度,极易造成误诊,但是通过五次测试结果分析发现,该辅助诊断系统正确筛选COVID-19的准确率为96.31%,有效地从其他肺部疾病中筛选出了COVID-19。
Chen[42]为了使用X 射线诊断儿童急性下呼吸道感染,提出了一种深度学习方案。其训练了基于YOLOv3架构的模型以自动切分肺部视野,并分析比较了一对一、一对多以及基于深度学习的卷积神经网络三种方案,在CNN模型中,利用基于残差学习ResNet方案解决了降级问题,并使用逐个元素添加连接前层的手段,使得模型更薄且更为紧密,但是由于样本数量较少的问题,研究者只能通过五次重复交叉的方式对模型进行训练。然而最终得出的最优方案为一对一模型,其准确率为92.47%。虽然CNN 模型的表现欠佳,但也为诊断儿童急性下呼吸道感染疾病提出了一个可行的深度学习方案。
为了建立一种基于深度学习的检测心力衰竭的研究方案,Matsumoto[43]使用美国国立卫生研究院的638例胸部X线片作为数据集,建立深度学习模型得到74%的诊断准确率。为了提高准确率,研究者将数据重新标记去除噪声,利用数据扩充与迁移学习技术弥补数据集小的缺陷,并且避免了由数据集小造成过拟合的现象,最终得出诊断心力衰竭准确率为82%的优秀结果。但另一方面,该研究数据集较小的问题还是对诊断准确率造成了不小的影响,提升样本数量会使得研究结果更佳;并且该研究只能通过识别由心力衰竭造成的“心脏肥大或充血”来筛选该疾病,而除了心力衰竭也有别的疾病症状与之相似,所以这也是该研究的一个局限性。
在另一项判断骨骼生长潜力的研究中,Chen[44]提出了一种基于X 射线的深度学习解决方案。该方法首先利用深度卷积神经网络对手骨X 线片进行自动特征提取,利用支持向量机对所提取的特征再次进行分类,并评测了该模型与传统特征提取再分类的性能,发现该系统具有更高的准确率。因此基于深度神经网络的特征提取方式较传统的人工特征提取方式有很大的优势,可以提取到更多有用的特征。另一方面,虽然该方法拥有更好的性能,但是人们只能关注到系统的输入以及输出,至于内部过程及原理是完全不了解的。
通过总结X 射线以及阻塞性睡眠呼吸暂停的深度学习相关研究,基于颅面侧位片的OSA 诊断系统的分析检测过程大致分为以下四个步骤:
(1)对所有测试者(其中包括非OSA 群体)进行侧位头颅X线检查,并通过多导睡眠监测记录所有测试者的呼吸暂停低通气指数(非OSA、轻度、中度、重度)。
(2)保留属于重度OSA 的患者信息和非OSA 者的信息,并将数据集中的部分无用数据清除,如年龄小于20岁的测试者还处在生长发育阶段,其骨骼尚未发育完全,考虑其骨骼可能会继续生长发育的因素,将其信息清除,不做考虑。
(3)为了减少后期的训练时间,考虑将数据集中的X 线片进行裁剪,来减小X 线片的大小,以至缩短计算机的训练时长。分组大致为:A组原始图像;B组将原始的X线片进行裁剪。
(4)最后,将数据集中75%的数据设为训练集;25%的数据设为测试集。通过对不同组进行训练、测试,继而对比A、B两组,分析不同组之间在耗时长短、准确度等方面的优势与劣势,如图2所示。
图2 深度学习诊断步骤
2.3 小结
关键点诊断方式是传统诊断方式中的一种,通过分析颅面侧位X线片中相关的特征点来诊断阻塞性睡眠呼吸暂停综合征,其有着价格低廉、解释性较高等优点。但是关键点的提取十分依赖专业知识以及特定的分类器,而特定的分类算法又依赖于大量的训练以及调试工作,因此基于关键点的诊断方式泛化能力及鲁棒性较差。
而基于机器学习的传统诊断方式,技术相对成熟,效率高,但是任意一种机器学习算法都有各自的优缺点,比如决策树由于无约束,可能出现过拟合的现象;支持向量机在图像处理中又不利于处理较大的数据集。
对于深度学习方式,该方式主要是依靠大量的数据样本作为基础,虽然对数据的准确度要求很高,但是对数据的测试结果更准确、更高效,并且由于深度学习独特的特征提取技术,使得其泛化能力极高。但是也不能忽视深度学习对数据集和计算机设备的严苛要求,以及训练所需的时间更长等缺点,如表4。
3 存在的挑战
回顾之前的相关研究,Bhatt[45]发现深度学习虽然可以为不同的医学研究(如图像分类、组织分类、癌细胞特征、检测和分割)得出乐观的结果。但深度学习模型主要取决于系统的功能和针对研究课题的数据获取,这将会使系统变得更为复杂,对研究所需数据的准确性要求也非常高[46],而且标记过程仍然需要专业的知识作为基础。基于颅面侧位片的成人OSA深度学习辅助诊断系统,训练模型的数据集不仅需要大量的颅面侧位X 线片,同时需要与之一一对应的AHI 诊断结果,以明确OSA 严重程度。而AHI 诊断结果又将依赖于多导睡眠监测,实现基于深度学习方法的系统成本将会很高,所以成本因素仍然是面临的一个不可忽视的挑战。模型如何利用较少的样本进行有效的学习是十分重要的,比如利用少量的逻辑知识替代大规模的数据堆积,将深度学习与知识图谱、逻辑推理等理论相互结合,以至在有限的数据集中训练出优秀的深度学习模型。
此外,深度学习主要依靠随机梯度法来训练深度卷积神经网络,该方式不能同时运行在多个计算机之间。而且利用CPU 来训练传统的深度卷积神经网络模型,将面临着耗时长的问题,用单个处理器训练如此大的数据集也是一项非常有挑战性的任务。因此,需要使用Adam 等自适应优化算法来对深度学习模型进行优化,以至提高学习效率减少训练时间,另一方面,计算机硬件与软件的设计都是必须的,只有性能更好的硬、软件设备和优秀的算法,才能使得训练耗时长的问题得以解决。
深度学习虽然可以发现事物之间存在的关联性,并建立起来一一对应的映射关系,但是深度学习并不能解释其中的因果关系,即与医师进行分析诊断不同的是,虽然它的筛选结果十分优秀,但没有办法为已处理图像做出有利的医学解释,这也是一项具有挑战性的任务。因此在未来的工作中,对模型内部事务运作原理的探究是非常有必要的。并改进模型算法,在系统给出辅助诊断结果的同时,也给出相应的医学解释。
表4 不同诊断方式的优缺点
4 结论
本文的研究中,主要分析了传统方式和深度学习方式在诊断阻塞性睡眠呼吸暂停中的应用。也是阻塞性睡眠呼吸暂停综合征人工智能诊断系统实现的重点研究方向。传统方式主要分为两类,一类为基于关键点的传统方式来OSA,关键点分析诊断主要是人工设计特征提取器进行特征提取,进而通过和标准值对比得出最终的诊断结果;另一类为机器学习方式主要是利用传统的机器学习算法如:支持向量机、决策树等,与多导睡眠监测结果相结合,再对阻塞性睡眠呼吸暂停做出最终诊断结果。
深度学习使用神经网络技术来生成“程序”,这种技术只会将结果与图像之间建立一个一对一的映射关系,它对执行任务的底层原理是不知所以然的。虽然深度学习已经成为图像分析处理领域的一个重要的组成部分。但传统的机器学习方法并没有完全被深度学习所取代,而且传统的机器学习仍然可以对一些特定的问题作出很好的分析。虽然人们设计的基于传统机器学习的分类器在处理相关问题时没有深度学习那么优秀,但是它可以保证很好的可理解性。深度学习可以通过强大的处理能力给出很好的结果,但仍然需要大量的绝对准确的数据集作为基础,并且对硬件的要求远远高于传统的机器学习。
阻塞性睡眠呼吸暂停综合征人工智能诊断系统的开发还面临着诸多的难点和挑战,深度学习自动化诊断必然是目前研究的主要方向之一,深度学习技术的客观性,以及更少的劳动力需求,更快的效率和更高的准确率等优势,必将为诊断阻塞性睡眠呼吸暂停综合征带来更好的前景和未来。