APP下载

基于一维卷积神经网络的儿童睡眠分期

2021-09-25吴云肖许志飞

工程科学学报 2021年9期
关键词:单通道卷积神经网络

许 力,吴云肖,肖 冰,许志飞,张 远✉

1) 西南大学电子信息工程学院,重庆 400715 2) 国家儿童医学中心,首都医科大学附属北京儿童医院,儿童耳鼻咽喉头颈外科疾病北京市重点实验室,北京 100045 3) 民航总医院呼吸内科,北京 100123 4) 国家儿童医学中心,首都医科大学附属北京儿童医院呼吸科,北京100045

对于儿童来说,高质量睡眠有助于儿童的智力发育,与儿童的认知功能、学习和注意力密切相关[1]. 儿童若不能够获得足够而良好的睡眠,会影响智力发育,造成情绪、行为、注意力等方面的问题[2]. 儿童睡眠障碍一般发生在2~12岁的儿童身上,儿童睡眠障碍表现为在睡眠过程中出现的各种影响睡眠的异常表现[3]. 它可以由身体某系统的功能失调引起,也可由疾病引起,能直接影响儿童的睡眠结构、睡眠质量及睡眠后复原程度[4].

为标准化睡眠分期结果,1968年,Rechtschaffen[7]等提出了睡眠分期准则(Rechtschaffen and Kales rule),又称 R&K 准则. R&K 准则根据2路脑电、2路眼电和1路肌电信号将睡眠分为7个阶段,分别为觉醒期(Wake)、睡眠I期(Stage 1,S1)、II期(Stage 2,S2)、III期(Stage 3, S3)、IV 期(Stage 4, S4)、快速眼动期(REM)和体动期(Movement time, MT)[8]. 2007年,美国睡眠医学学会(American Academy of Sleep Medicine, AASM)在R&K准则的基础上对睡眠分期标准进行了调整,提出了AASM准则[9]. 目前AASM准则已更新至2020版. AASM准则将R&K准则中的S3和S4期合并为慢波睡眠期(NREM III期),将睡眠阶段重新定义为觉醒期(Wake, W期)、非快速眼动期(NREM, N 期)和快速眼动期(REM, R 期). 其中NREM被划分为 NREM I期(N1)、NREM II期(N2)和 NREM III期(N3).

对于睡眠的研究离不开脑电信号(Electroencephalograph, EEG)分析. 脑电信号频率分为四个主要频带[10]:δ(1~3 Hz)、θ(4~7 Hz)、α(8~13 Hz)、β(14~30 Hz). 除这四种主要频带以外,人们在觉醒并专注于某一事时,会被检测出一种较 β 波的频率更高的 γ波(30~80 Hz). 同时,人们在睡眠时还可能出现其他一些波形较为特殊的脑电波,如:σ波、λ波、K复合波、μ波等. 脑电信号在不同时刻会表现出不同的频率分量,波形的变化会受测试者自身状态影响,因此极度不稳定并且随机.

美国睡眠研究会睡眠及其相关事件判读手册[11]中对儿童睡眠分期判读规则为:如果全部NREM睡眠记录帧没有可识别的睡眠梭形波、K复合波或0.5~2.0 Hz的高振幅慢波活动,判读所有记录帧为N期(NREM);如果某些NREM睡眠记录帧含有睡眠梭形波或K复合波,这些帧判读为 N2期(NREM 2). 剩余的 NREM睡眠记录帧,如果慢波活动小于记录帧的20%,判读为N期;如果NREM睡眠记录帧慢波活动大于20%,判读为 N3期(NREM 3). 剩余的记录帧,如果不存在K复合波或睡眠梭形波,判读为N期(NREM).成人PSG设备的EEG、EOG和颏EMG电极的放置适用于儿童,但由于儿童头型较小,所以颏EMG电极间距离通常需要从2 cm减小到1 cm,EOG电极距眼睛的距离通常需从1 cm减小到0.5 cm.

由于PSG需要专门的睡眠监测室及专业技术人员分析结果,且费用比较昂贵,技术要求高,在临床儿童患者中实施存在一定难度,对疑似的儿童患者无法大规模筛查,且患儿依从性不高、配合度差. 而使用单通道EEG可以降低睡眠监测的难度,为便携式可穿戴设备的开发提供基础.

目前已有的自动睡眠分期方法大多是利用单通道或多通道脑电信号,针对成年人的自动睡眠分期规则,而适用于儿童的自动睡眠分期方法很少. 由于儿童与成人的EEG存在差异,如儿童的后部优势节律(Posterior dominant rhythm,PDR)在不同年龄稍有不同,儿童N1期会有睡前超同步(HH)和弥散或枕部优势高波幅节律性3~5 Hz活动,这个是成人没有的,所以很多利用机器学习等方法用于成人的自动睡眠分期方法不适用于儿童,因此需要对已有方法进行改进或提出更适用于儿童脑电特征的自动睡眠分期方法.

本文针对睡眠分期这一问题,提出了一种基于单通道脑电信号的端到端一维CNN(1D-CNN)模型,从而克服了手工提取特征受到先验知识的限制;数据集包含14位3到10岁健康受试者,从而保证了模型对儿童睡眠分期的有效性.

12岁生日那天,楚艳拿着自己积攒已久的零花钱买了一本《中国世界时装之苑》杂志,这是中国上世纪80年代第一本铜版纸彩色印刷的时装杂志。刚一翻开,那些世界级时装大师的作品就映入眼帘,独特新颖的设计,超强气场的模特,精美充满质感的礼服,给年幼的楚艳带来了极大的震撼。当时楚艳就暗下决心,长大后一定要成为一名服装设计师,亲手做出美丽的服装。后来,楚艳如愿考入北京服装学院,能够近距离地触碰梦想的影子,在身边人看来,这仿佛是天注定的。

1 儿童和成人睡眠分期的相关工作

目前,睡眠分期依然是由睡眠分析技师采用AASM准则对多导睡眠图进行人工分期,但是由于多导睡眠图的数据量非常大,同时由于技师本身的主观因素限制,所以这是一项既耗费时间又难以保持客观性的睡眠分期行为. 随着近几年人工智能的发展,越来越多的自动化技术被应用到了医学影像和医学信号领域.

Dong等[12]提出了一种实用的方法来解决使用单通道脑电图(EEG)进行睡眠阶段分类的局限性. 作者利用整流神经网络检测分层特征,利用长短时记忆(LSTM)网络进行序列数据学习,优化单通道记录的分类性能. 在探索了替代电极放置后,作者发现了一个舒适的放置于前额的单通道脑电电极位置,并表明它可以与其他电极集成,同时记录眼电图(EOG). 通过对62人(494 h睡眠)的数据进行评估,证明该分析算法比现有的顶点或枕部电极放置方法的性能更好.

Supratak等[13]提出了DeepSleepNet模型,该模型利用卷积神经网络提取时间不变特征,并利用双向长短期记忆自动学习脑电图分期间的睡眠转换规律. 作者采用了两步训练算法来训练模型,使用来自两个公共睡眠数据集的不同单通道EEGs(F4-EOG(左)、Fpz-Cz和 Pz-Oz)评估该模型,结果表明,与最先进的方法相比,该模型在两个数据集上取得了相似的总体精度和f1 score. 这表明,在不改变模型架构和训练算法的情况下,该模型可以自动从不同数据集的原始单通道脑电图中学习睡眠阶段评分的特征,实现自动睡眠分期. 与之类似,针对帧和序列进行设计的模型还有SeqSleepNet[14]、SleepEEGNet[15]、CCRRSleepNet[16],它们共同关注了睡眠分期的独立性与连续性.

Dehkordi等[17]分析了从脉搏血氧仪光体积描记图(PPG)中提取的心率变异性的标准特征,以识别不同的睡眠阶段. 作者使用多导睡眠图和Phone OximeterTM记录了146名儿童的整晚的PPG信号.根据多导睡眠图,将记录分为1 min,并标记为Wake,non-REM和REM. 对于每个时段,估计了心率变异性的六个标准时域和频域特征. 作者分别训练了两个支持向量机分类器,以对从睡眠时期中W期和NREM期进行分类. 觉醒和睡眠的分类精度为77%,REM和NREM的分类精度为80%.

基于家庭的儿童睡眠监测是一个急需解决的问题. 由于EEG是了解睡眠的重要标准,所以监测单通道EEG信号是识别睡眠障碍最有前途的方法. 该方法不需要在用户身上附加大量的传感器,更适合儿童的睡眠监测,使得数据更能反应睡眠习惯. 目前的研究大多从脑电中提取各种特征作为神经网络的训练样本,将深度学习模型作为进一步特征融合和筛选的工具,没有充分展现深度学习的优势. 因此,为了适应当前需求,本文提出了一种基于单通道脑电的儿童睡眠分期算法.

2 研究方法

卷 积神 经 网 络 (Convolutional neural networks,CNN)是一种深度神经网络. 深度学习已在诸如视觉识别,语音识别和自然语言处理等各种问题上取得了很好的成绩. 在不同类型的深度神经网络中,关于卷积神经网络的研究最为广泛[18]. 图1显示了CNN的层次结构及应用.

图1 CNN 的层次结构及应用Fig.1 CNN architecture and applications

2.1 数据扩容

对于儿童睡眠数据少的情况,可采用重叠的方法对数据集进行扩充,规则如下:如果受试者的两个连续时期具有相同的睡眠阶段,则使用滑动窗口进行重叠,将重叠时间设置为25 s,重叠后新帧(Epoch)的睡眠阶段标签未更改,如图2所示.相反,如果两个连续的epoch是不同的睡眠阶段,则不会进行重叠.

图2 数据集重叠Fig.2 Datasets overlapping

由于EEG是低频信号,其频率主要集中在0.5~40 Hz[19],因此使用了二阶巴特沃斯滤波对原始EEG数据进行了预处理,消除高频噪声和直流成分. 因为儿童慢波活动通常为高波幅(100~400 μV),所以不对脑电数据的振幅进行限制.

需要注意的是,由于5个睡眠分期的epoch数量不相同且分布不相同,所以数据集会失去平衡性,进而影响机器学习算法的性能. 因此,本研究采用了以下策略来调整每个睡眠分期的epoch数量:

(1)统计数据集中每个睡眠分期的epoch数量,以其中最小数量的类型的epoch数量作为阈值,每种类型的epoch只保留阈值数,其余的epoch被丢弃.

(2)将平衡后的数据集按W、N1、N2、N3、R的顺序重新排列.

2.2 1D-CNN 模型与算法

本研究将Alexnet[20]进行改进,利用单通道脑电信号(C4-M1通道),将1D卷积核替换了2D卷积核,并在1D-CNN中添加了批量归一化层(Batch normalization layer),而卷积核的大小保持不变.1D-CNN模型的示意图如图3所示,该模型由5个卷积层,3个池化层和3个完全连接的层组成.

图3 1D-CNN 模型Fig.3 1D-CNN model

由于1D-CNN的输入是30 s为一个epoch的数据,即1×3840一维时间序列,因此在模型中使用了1D卷积核. 一维卷积运算过程定义为:

第一和第二卷积层分别使用大小为1×22和1×5的大卷积核,而第三到第五卷积层使用大小为1×3的小卷积核. 在第一,第二和第五卷积层之后,本研究利用大小为1×3的maxpooling层来减少特征图的尺寸. 将最后一个最大池化层的生成的特征图展平为一维向量. 该向量被送到全连接层以进行二进制分类,并获得最终的识别结果. 本研究选择ReLU(整流线性单位)作为激活函数,其定义如下:

批处理归一化层位于第一卷积层之后,该层可以归一化特征激活,从而减少内部协变量偏移.批处理规范化定义如下:

式中,B代表包含m个样本的小批量,μB和分别代表B的均值和方差. λ是数值稳定性的常数,γ和β分别是训练过程中计算出的比例和移位参数,有关详细信息,请参见文献[21].

2.3 睡眠分期系统

针对现实需求,以PyQt为基础,设计开发了睡眠分期系统,方便医生的使用,如图4所示,该图展示了一段时长为60 s的多导睡眠图,图中展示了前8个通道的生物电信号,即2个眼电通道与6个脑电通道,并用颜色区分了不同的睡眠分期,可以看到,该60 s由一个N2期的后半部分、一个完整的W期和一个N1期的开始部分组成.

图4 睡眠分析系统原型Fig.4 Prototype of the sleep analysis system

3 实验过程

3.1 数据集

本研究中使用的数据集来自首都医科大学附属北京儿童医院,数据集包括来自14位受试者的PSG记录. 每位受试者至少记录6条EEG通道,2条EOG通道. 原始数据集epoch数量为14383,重叠、平衡后的epoch数量为30195.

3.2 实验环境

数据预处理和功能提取部分是在PyCharm 2020.1.2环境中在具有 64 GB RAM 的 AMD Ryzen7-3700x@3.60 GHz上实现的. 深度学习实验是在NVIDIA GeForce RTX 2080 Ti上利用 tensorflow 框架在Python环境中进行的.

3.3 实验参数

数据预处利用kaiming初始化器[22]初始化1DCNN中的权重参数,这可以提高模型的收敛速度.使用Adam优化器[23]以0.00001学习率进行参数优化. 批处理大小为256个. 在此研究中使用了交叉熵损失函数,其定义为:

式中,En是基本的交叉熵损失函数,N是训练样本的数量,yk和pk分别表示样本的真实标签和预测标签.

为了防止过度拟合问题,本研究使用了dropout和L2正则化方法. Dropout可以在训练过程中以指定的概率随机断开层的各个单元[24]. L2正则化是在损失函数之后添加正则项以降低网络复杂性. 具有L2正则化项的交叉熵损失函数定义为:

表1 超参数表Table 1 Model hyperparameters

在这项研究中,准确率、精确度、召回率、F1得分和Kappa系数(K)用于评估性能.

3.4 实验结果

本研究是在成人自动睡眠分期的研究基础上,通过改进将1D-CNN结构用于儿童自动睡眠分期,训练集包括从14位健康受试者中分出的30195个epoch,使用了14折交叉验证实验,在每一折中,利用1位受试者的数据作为测试集,剩下的13位受试者作为训练集,这个实验需要重复14次以保证所有的数据都被使用到. 本研究的准确率为85.57%. 表2各项评价指标的结果. 在训练和预测的速度上,本研究所用时间均远小于DeepSleepNet,约为其 1/5.

表2 实验结果Table 2 Experimental results

由于训练时用到了防止过拟合的L2正则化和dropout,而验证的时候没有用到正则化和dropout,为了防止出现过拟合,将参数设置的较大,因此出现验证准确率大于训练准确率的情况.准确率和损失如图5和6所示. 图7显示了1DCNN模型通过本实验数据获得的归一化混淆矩阵,其中数字代表分类正确或错误的样本. 通过混淆矩阵可以看出,Wake、N2、N3和REM期睡眠的分类性能很好. 对于N1期睡眠,存在将N1期睡眠误分类为Wake、N2和REM期睡眠的情况,因此以后的工作应重点研究N1期睡眠的准确性.

图5 训练和验证准确率Fig.5 Training and validation accuracy

图6 训练和验证损失Fig.6 Training and validation loss

图7 混淆矩阵Fig.7 Confusion matrix

4 结论

本研究对Alexnet进行改进,提出了一种基于有标签单通道脑电图的睡眠分期1D-CNN模型.由于1D-CNN是一个端到端的学习模型,即将特征提取器和分类器集成到一个算法中. 端到端学习方法可以克服手动特征提取的局限性,从而提高睡眠分期准确率. 该模型用于儿童睡眠分期,对未来利用机器学习方法辅助临床儿童睡眠分期,设计了研究方案,为进一步研究儿童睡眠障碍奠定了基础. 总体而言,对于基于带有睡眠阶段标记的单通道EEG的自动睡眠分期,本文介绍的1DCNN模型可以实现针对于儿童的自动睡眠分期.在未来的工作中,仍需要研究更适合于儿童的睡眠分期策略,在基于更大数据量的基础上,进行进一步的实验. 在大样本数据集下,研究可以选择更多的睡眠相关特征进行测试,并进一步增加一维神经网络的规模,最大程度地发挥深度卷积神经网络的能力.

猜你喜欢

单通道卷积神经网络
基于联合聚类分析的单通道腹部心电信号的胎心率提取
基于3D-Winograd的快速卷积算法设计及FPGA实现
神经网络抑制无线通信干扰探究
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
基于扩频码周期性的单通道直扩通信半盲分离抗干扰算法
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
采用6.25mm×6.25mm×1.8mm LGA封装的双通道2.5A、单通道5A超薄微型模块稳压器