APP下载

基于复合特征参数的睡眠分期算法设计与仿真

2022-08-06曹荻秋何美霖

实验室研究与探索 2022年4期
关键词:电信号特征参数节律

冯 维, 曹荻秋, 吕 耿, 何美霖, 应 娜

(杭州电子科技大学通信工程学院,杭州 310018)

0 引 言

睡眠质量不仅与个人身体健康息息相关,同时还与多种疾病及其发病征兆密切相关[1]。人处在不同睡眠状态时,脑电波的成分有着显著差异。由此进行的睡眠时期分期,使得人们可以从科学的角度对人体的睡眠状况进行分析,这对临床医学诊断有着极大的参考价值。同时也为人脑相关疾病的深入研究提供了基础。

脑电图(Electroencephalogram,EEG)是通过探针等仪器记录人体头皮各个方位的生物电位综合得来的图像,可以反映人体大脑的当前状态[2]。Rechtschaffen和Kales 提出,观察和分析脑电图,眼电图和肌电图,可以将非快速眼动期划分为4 个时期,简称睡眠1 ~4 期。结合Nathaniel Kleitmanti提出的分期标准,将此标准称为R&K分期标准[3],让定量分析睡眠状况成为一种可能。由于人工进行手动分类效率低下且错误率高,人们开始寻找自动实现睡眠分期的方法[4]。

早期使用的脑电信号分析方法一般直接从时域提取信号波形特征。Kayikcioglu 等[5]使用自回归(Autorgressive,AR)模型来提取脑电信号的4 种节律波的AR系数,根据节律波的组成来区分不同睡眠时期。同时考虑EEG信号的时域和频域特征,设计出时频分析法,例如小波变换。Azim等[6]用离散小波变换提取了EEG信号在不同睡眠期的时域、频域特征,结果表明其在特征提取方面有较好的性能。本次实验选取了AR系数,能量特征,样本熵和信源熵4 个特征参数进行复合,与单一AR 系数相比能更好地实现脑电信号的自动睡眠分期。

1 数据描述

本次实验数据来自于MIT-BIH 公开数据库中的人体睡眠数据。这些数据从年龄在25 ~101 岁的健康受试者身上采集,且受试者在采集期间没有服用任何药物,其中包含脑电图,眼电图(EOG)和肌电图(EMG)信号,且所有实验数据均已通过伦理检测。如图1 所示,所有的EEG数据都是通过国际10-20 电极分布系统采集[7]。本次实验采用的是图1 所示的Fpz-Cz(Fpz:额极中线点;Cz:中央中线点)通道脑电信号。该数据库中EEG信号的采样频率为100 Hz,所有的数据都已经由专业人员根据R&K 分期标准进行了睡眠期标注。

图1 国际10-20电极分布系统

图2为Fpz-Cz 通道原始脑电信号波形图。研究表明,Fpz-Cz通道脑电信号,在睡眠分期中有着较好效果[8]。因此本次实验从多个通道数据中选取Fpz-Cz导联的单通道脑电信号进行后续研究。由于EEG信号采集过程中,会受到设备、肌肉活动和眼球活动等因素的影响,产生噪声和伪迹。在本实验中,使用0.5~30 Hz的带通滤波器滤除干扰噪声和伪迹。本实验选取数据库中16 个样本,共计时长100 h 的睡眠数据。为更好地提取不同时期睡眠特征,将连续的EEG信号分为若干片段,长度30 s,无重叠,并对每个EEG片段进行分析处理。

图2 Fpz-Cz通道原始脑电信号

2 睡眠分期识别算法

本实验算法主要包括数据预处理、特征提取、支持向量机分类3 部分。算法步骤说明如图3 所示。在数据预处理阶段将原始脑电数据分片,并提取每个片段的4 种节律波。在特征提取阶段利用不同的特征提取算法提取特征参数,并将特征参数复合作为特征向量。使用支持向量机实现睡眠自动分期。

图3 睡眠分期识别算法步骤说明

2.1 数据预处理

数据预处理阶段,对所获取的脑电信号数据进行分片处理,将长时间的脑电信号分成小周期。在R&K分期标准的基础上,实验将睡眠周期划分为4 个时期:清醒期(W),非快速眼动1 期(NREM12),非快速眼动2 期(NREM34),快速眼动期(REM)。不同时期的脑电信号最大区别在于所含的节律波成分和比例不同。国内外研究学者普遍认为EEG 信号主要由4 种节律波组成,即:δ 波(0.5 ~4 Hz)、θ 波(4 ~8 Hz)、α 波(8 ~13 Hz)和β波(14 ~30 Hz)[9]。根据4 种节律波所处的频段不同,选择带通滤波器,将一个小周期的4种节律波提取出来。

2.2 特征提取算法

本实验采用时频域分析方法提取脑电信号中的AR系数和能量特征,采用非线性动力学分析方法提取样本熵和信源熵,并将4 个特征参数复合作为特征向量来区分不同睡眠阶段。

2.2.1 AR系数

AR模型即自回归模型,在时域可以表述为线性预测问题。在AR 模型中,给定信号的每个样本x(1),x(2),…,x(n)可以用该信号的前p个样本的线性加权和来预测:

式中:ai为AR 模型系数;p为AR 模型阶数;ep(n)为前向预测误差,即预测值与实际值的差值。与之相对应的反向预测误差

用Levinson-Durbin递推算法[10]可得:

式中:app为递推过程中阶次为p时AR 模型的第p个系数;Ep为p阶前向预测误差和反向预测功率之和;kp=app为反射系数;api为递推过程中阶次为p时AR 模型的第i个系数。

式(4)中Ep也可通过直接计算前向预测误差和反向预测误差功率和得到

式中,N为脑电信号长度。

进一步将式(3)中的ep(n)和bp(n)代入式(6),并,可得:

本实验使用Burg法[11]对AR系数进行估计,主要步骤如下。

步骤1初始化,设AR 模型阶数为p。p=0 时,前后向预测误差e0(n)、b0(n)及前后向预测误差之和E0可根据式求得:

步骤2当阶数为1 即p=1 时,由于kp=app,所以可以根据式(7)计算反射系数k1。将k1和步骤1 中求得的E0带入式(4)可求得E1。

步骤3将步骤2 中求得的k1,结合步骤1 中所得初始值e0(n)和b0(n)代入式(3)可求出e1(n)和b1(n)。

步骤4当阶数为2 即p=2 时,与步骤2 一样,可继续利用式(7)和(4)计算出a22和E2,进一步代入式(5)计算出AR系数a21。

对p=2,3,…,重复步骤2 ~4,直至求出所有阶次的AR系数。

AR模型的阶数是AR模型构建中一个重要参数。选择的阶数过低,会导致拟合效果不好;阶数过高,会增加计算量和计算复杂度。根据多次实验,本次课题最终选取AR模型阶数为27。

2.2.2 能量特征

脑电信号节律性明显,各睡眠阶段所含能量不同。因此选择各节律波的能量Ei与总能量Etotal比值作为特征,用于区分不同睡眠阶段。对于δ、θ、α 和β 这4种节律波,其能量特征

式中:p(ω)为脑电信号频谱;bi和ai分别为第i类节律波频域上下界。

总能量特征Etotal为4 种节律波能量特征之和

2.2.3 样本熵

样本熵算法[12]主要步骤如下:

步骤1脑电信号为时间长度为N的序列:u(1),u(2),…,u(N)。

步骤2将序列组成一个m维矢量Xm(i),Xm(2),…,Xm(N-m):

式中,i=1,2,…,N-m。

步骤3定义矢量间距离d[Xm(i),Xm(j)]为两者相应元素的最大差值:

式中:k=0 ~m-1;i,j=1 ~N-m,i≠j。

步骤4给定阈值r(r>0),对于每一个i(i≤Nm),统计距离d[Xm(i),Xm(j)]小于阈值r的数目Nm(i)和此数目与距离总数N-m-1 的比值为

步骤5计算所有i的平均值,记为

步骤6增加维数为m+1,构造m+1 维矢量,重复步骤2 ~5,得到Bm+1(r)。由此可知,该段脑电信号的样本熵为

在参数选取中,根据文献[13]中相关研究,取N=3 000,m=2,r=0.2SD(SD 为实验数据X(i)的标准差)。

2.2.4 信源熵

信源熵用于描述信号的不确定度,在概念上易于理解,且计算公式简单,目前广泛应用于生物医学工程。

若脑电信号X的可能取值范围R={x1,…,xn},xi的出现概率为p(xi),则信源熵

2.2.5 特征参数归一化

对上述计算得出的4 种特征参数进行Z-score 归一化处理,可以在一定程度上消除特征间尺度和单位差异影响,以改善支持向量机(Support Vector

Machine,SVM)的预测效果[14]。对参数进行归一化处理:

所以,2019年的走向,如果看完市场所有的主流策略,投资者一定会觉得不知所措。为了更加精准的判断市场拐点,经过近二十年的经验教训的总结,我们建立了“技道分析”的研究框架,即将赔率和胜率、趋势与价值等维度相结合进行多因素分析,试图找到符合A股市场运行规律的一套分析方法。下面仅以技道分析框架下的几个维度来探讨一下A股策略。

式中:μ为原始数据均值;δ 为原始数据标准差。经过归一化处理的数据,均值为0,标准差为1。

特征参数提取完毕后,需要进行支持向量机分类。

2.3 支持向量机分类

SVM是一种常用的分类算法。支持向量机既可以处理线性分类问题,也可以处理非线性分类问题。当数据在原空间非线性可分时,SVM 通过核函数将数据映射到高维空间,在高维空间中构造出进行分类的超平面,将原空间上的非线性数据分开[15-16]。

本实验选取径向基核函数[17]作为核函数进行分类:

3 实验结果与分析

本实验选取MIT-BIH 数据库中16 个样本,随机提取相同数量的各阶段睡眠时期片段。将数据中的8 000 个片段作为训练集输入SVM 分类器进行训练,再将剩余4 000 个作为测试集(分10 组,每组100 个)对分类器进行测试,再将测试结果与人工专家分期结果进行对比。

表1、2 分别为基于AR系数和基于复合特征参数的训练集测试结果,每行为该时期的识别结果。表中:AC为正确率;R为召回率(Recall);P为精度;F1分数(F1-score)为精度和召回率的调和平均数;Kappa为检验一致性的Kappa 系数。由仿真结果可见,基于复合特征参数的方法无论是在W期,NREM12 期,NREM34期,还是REM 期,其识别正确率、召回率、精度和F1-score都要优于基于AR 系数的方法。基于复合特征参数的方法总体正确率提高了4.69%,Kappa 系数提高了6.25%。

表3、4 分别为基于AR系数和基于复合特征参数的测试集分期结果,每行为该时期的识别结果。每个睡眠阶段选用10 份100 个样本进行测试,最终得出平均结果。复合特征参数的测试结果都要优于基于AR系数的方法,其总体正确率提高了5.63%,Kappa系数提高了7.50%。

表1 基于AR系数的训练集分期结果

表2 基于复合特征参数的训练集分期结果

表3 基于AR系数的测试集分期结果

图4为一个8 h样本的自动分期结果与人工专家分期结果的对比图。图中横坐标为睡眠片段数目,纵坐标为睡眠阶段。由图中可见,本文方法的分期结果,与人工专家分期结果吻合度较高。

表4 基于复合特征参数的测试集分期结果

图4 人工分析与自动分析分期结果的对比

4 结 语

本文提出了一种结合能量特征,AR 系数,样本熵和信源熵的复合特征值睡眠分期算法,并通过Matlab软件对所提出算法进行了仿真分析。仿真结果表明,与传统方法相比,提出的方法具有更好的分类性能。通过该实验,学生可以将信号处理、机器学习,Matlab编程等理论知识应用到解决实际生物医疗方面的问题,极大地培养了学生的动手能力和解决问题的能力。

猜你喜欢

电信号特征参数节律
基于联合聚类分析的单通道腹部心电信号的胎心率提取
空间里的时间:微重力等环境下的生物节律研究
冕洞特征参数与地磁暴强度及发生时间统计
基于交通特征参数预测的高速公路新型车检器布设方案研究
基于Code Composer Studio3.3完成对心电信号的去噪
基于随机森林的航天器电信号多分类识别方法
基于PSO-VMD的齿轮特征参数提取方法研究
基于视频的车辆特征参数算法研究
运用节律跳绳,提高跳绳教学质量
基于生物电信号的驾驶疲劳检测方法