基于KIV模型的脑电识别方法①

2022-11-07陈玲钰韦小平张释文

计算机系统应用 2022年10期

刘宏,陈玲钰,韦小平,张释文,张锦,2

1(湖南师范大学信息科学与工程学院,长沙 410081)

2(长沙理工大学计算机与通信工程学院,长沙 410114)

人的大脑是复杂而高效的.多年来,人们一直试图模拟大脑的功能和运行机制来执行复杂的信号处理功能.人工神经网络是从大脑神经系统中衍生出来的一种模型,被广泛应用于模式识别领域.脑电图(EEG)是研究大脑活动最常用的信号之一,不同场景下脑电信号的识别,则被用于诊断各种脑相关的疾病,如癫痫[1-3]、抑郁症[4]、阿兹海默症[5]等,同时在认知[6-8]、记忆和情绪[9-11]等相关脑活动的研究方面也显示出巨大的潜力.因此,借助人工神经网络来对脑电信号进行识别,对脑疾病的诊断,大脑相关活动的功能和机制的研究具有重要的意义.

在众多人工神经网络模型中,传统的人工神经网络模型依靠研究者手动提取原始数据的特征,来引导模型识别准确率的提高; 以深度学习为代表的人工神经网络模型将传统模型中的原始数据特征提取和分类两步融为一步,在训练数据足够的情况下能获得更好的识别效果.

但是,研究一种有效的脑电信号特征提取方法本身比较费时费力,且对于一些中小型脑电数据集而言,可能存在特征提取方法有效,却由于训练样本数量不够导致的识别效果不够理想的情况.因此,探求一种新的人工神经网络模型对脑电信号进行识别,具有重要的研究前景和价值.

针对脑电信号的识别问题,本文研究了一种重要性可能被忽略的海马神经回路模型—KIV 模型.KIV模型是K 系列模型的最高级别模型.K 系列模型包括K0、KI、KII、KIII、KIV 模型,从低到高层次逐步实现了从细胞水平到大脑半球的模拟.其中,基于嗅觉神经系统的解剖结构,KIII 模型模拟了嗅觉神经系统,包括其主要结构,如球周细胞(periglomerular cell,PG)、嗅球(olfactory bulb,OB)、前嗅核(anterior olfactory nucleus,AON)和梨状皮质(prepyriform cell,PC),能够模拟嗅觉信息的传递过程.KIII 模型表现出良好的模式识别能力,只需少量迭代次数就可记忆不同的模式.目前的研究已经将KIII 模型应用于图像识别[12,13],语音识别[14],文本分类[15],脑电识别[16]等方面,并获得了良好的识别结果.KIV 模型包含3 个KIII 模型和一个KII 模型,分别模拟了大脑中的感觉皮层(sensory cortices)、海马(hippocampus)、中线前脑(midline forebrain)和杏仁核(amygdala),描述了行动、规划和空间定位功能的选择.在模拟的火星环境中[17,18],作为机器人的控制系统,3 个KIII 模型分别接收感觉信息(包括视觉、听觉、触觉等)、方位信息和内部感受信息,使得KIV 模型能够模拟大脑在导航时的记忆功能,对环境信息的输入做出迅速、准确的学习和反应.

基于KIII 模型的功能和特性,本文扩展了KIV 模型在脑电识别领域的应用.癫痫脑电和情感脑电信号的识别一直是脑电识别领域的研究热点,分别对癫痫发作的诊断治疗和与情绪相关的大脑活动的研究具有重要意义.本文介绍了KIV 模型的结构和原理,分析了KIV 模型的动力学行为,并针对癫痫脑电和情感脑电的识别问题,使用KIV 模型进行探索和研究.

1 KIV 模型及分析

1.1 KIV 模型

KIV 模型由Kozma 等人提出[19],模拟了感觉皮层-海马的神经回路,描述了大脑的非线性动力学,以非周期时空振荡形式对感觉信息进行编码,能够模拟原始脊椎动物前脑在简单意向行为中的作用.KIV 模型的构建具有较强的生理学基础.从模型搭建依据来看,构建模型所需的参数是通过分析从感觉皮层和大脑边缘结构的多个电极同时记录的脑电图得到的[20]; 从结构上来讲,KIV 模型模拟了原始脊椎动物前脑中的关键结构,包括感觉皮层、海马、中线前脑和杏仁核.

K 系列模型基于神经团理论而建立,神经团理论[21]是指相似的神经元组成的细胞团具有相似的功能和一致的特性.K0 模型模拟了兴奋性和抑制性的细胞团的活动,是K 系列模型最基本的组成单元.通过耦合多个兴奋性或抑制性细胞团的K0 模型,可以形成KIe(兴奋性)或 KIi(抑制性)模型,如图1.KII 模型由两个KI 模型侧向连接而成(如图2),模拟了兴奋性和抑制性细胞团的相互作用,它们可以在伽马范围内的窄带频率上表现出极限环周期振荡.KI、KII 模型也是K系列模型的基本组成模块.KIII 模型由几组KI、KII模型通过前向连接、延迟性反馈连接等方式构成,可模拟生物细胞层的动态神经活动,如嗅觉的产生过程.KIV 模型由3 组KIII 和1 组KII 模型相互作用而成,它模拟了低等动物的外部感觉神经系统,颞叶中的海马回路和内部感觉系统,能够实现各种类型的动态神经活动.总体而言,K 系列模型以共享的、非周期波形的形式显示出了空间相干性,并在时间序列上表现出振幅调制模式[12],K 系列模型的层次结构关系[22]如图3所示.

图1 KI 模型拓扑结构图

图2 KII 模型拓扑结构图

图3 K 系列模型层次结构关系

由神经团理论和生理学基础,K 系列模型所有细胞团的脉冲状态变化可以用式(1)-式(3)来描述:

其中,a和b是基于生理实验确定的反映输入快慢的速率常数,Xi(t)、Xj(t)是第i、j个神经团在时间t的脉冲密度,Wij代表第j个神经团到第i个神经团的突触连接权重.在脉冲信号传递的过程中,树突将接收到的轴突脉冲转换成波,该波随后被轴突转换回脉冲.假设脉冲到波的传递函数是线性的,而波到脉冲的传递函数是非线性的,该非线性的S 型输入/输出函数用Q(Xi(t),q)来描述.这里,q表示Sigmoid 函数的最大渐近线.Ii(t)表示第i个神经团接收的外部输入,N表示同一细胞层中相同细胞团的数量.

本文研究的是模拟了大脑边缘系统的KIV 模型,不包括中线前脑,其组成结构如图4 所示.完整的KIV 模型结构详见文献[19].边缘系统的KIV 模型由2 个KIII 模型和1 个KII 模型组成,分别模拟感觉皮层、海马区和杏仁核.其中,感觉皮层包括球周细胞(periglomerular,PG)、嗅球层(olfactory bulb,OB)、前嗅核(anterior olfactory nucleus,AON)、梨状皮质(prepyriform cortex,PC),海马区包括齿状回(dentate gyrus,DG)和海马切片(hippocampal sections,CA1-CA3).DG、PG 为KI 模型,CA1、CA2、CA3、OB、AON、PC、AMY 为KII 模型.

图4 KIV 模型结构图

根据KIV 模型的结构,本文给出了KIV 模型的拓扑结构图,如图5 所示.图中各细胞层中的E1、E2 代表兴奋性神经元,I1、I2 代表抑制性神经元,D1-D7 表示延迟反馈连接.根据图5 和文献[23]的参数,本文在Matlab 上对KIV 模型进行建模实现.

1.2 KIV 模型动力学特性分析

KIV 模型中每个神经团细胞的动力学方程通过Runge-Kutta 方法求解,在迭代过程中产生了各个神经元节点的状态变量数值解以及一阶微分值(t=0 时刻所有神经元状态变量及其一阶微分值均为0).因此,可通过仿真输入的方法对KIV 模型的动力学特性进行分析.

1.2.1 无外加刺激时典型神经元节点的响应

无论何时,KIV 模型中PG 层和AON 层都分别接收外周噪声和中间噪声,即图5 中的peripheral noise和central noise,该噪声用均值为0 的高斯分布来模拟.噪声的引入不但不会破坏KIV 模型的稳定性,反而会使模型随时保持一种激活的状态,消除模型对初值和参数的敏感性,从而提高模型的鲁棒性.这也是KIV模型和一般的人工神经网络模型不同之处之一.

图5 KIV 模型拓扑结构

首先,研究在没有外加输入刺激、只有内部噪声的情况下,KIV 模型中典型神经元节点的动力学行为.设置总时长为1 200 s,分别选取每一层中的兴奋性输入神经元E1 和OB 层的抑制性神经元I1,其响应图如图6 所示.图中,横轴表示仿真输入的时间,单位为s;纵轴表示神经元节点对输入刺激的响应幅值,单位为mV.

从图6 可以看到,在没有外加刺激、只有外周噪声和中间噪声的情况下,整个KIV 模型处于一种低水平的静息状态.

图6 无外加刺激时KIV 模型中典型神经元的响应

1.2.2 有外加刺激时典型神经元节点的响应

接下来,研究有外加刺激时,KIV 模型PG 层和OB层中输入和输出节点的响应.在300 s 时,给予KIV 模型幅值为1 mV 的输入刺激,并在900 s 时撤去刺激,刺激持续时间为600 s,其响应如图7 所示.

图7 有外加刺激时KIV 模型中典型神经元的响应

可以看到,在加入刺激后,PG1 节点在300-900 s之间出现了阶跃响应,900 s 后PG 层对外周噪声更加敏感,主要表现为PG1 节点在900 s 后的幅值比300 s前的幅值要大.而OB 层的E1 节点和I1 节点在300-900 s 之间也产生一定的阶跃现象,并表现出等幅振荡,且撤去刺激后OB 层的输入输出节点仍然表现出高活跃状态.

1.2.3 无/有外加刺激时的相图

KIV 模型中一共有30 种节点,要描述整个系统在空间中的轨迹显然是不可能的,因此只能通过系统中部分节点状态变量之间形成的轨迹,即系统的相图,来间接地对整个系统的空间轨迹进行分析.本节从细胞层的角度对KIV 模型的动力学行为进行分析,通过选取OB 层、AON 层、CA3 层和AMY 层中的输入和输出节点,刺激时间及强度同第1.2.2 节,分别研究这4 对节点在无/有外加刺激时的响应,其相图分别如图8、图9 所示,其中,横纵坐标分别表示该层E1、I1 节点在不同时刻的响应幅值.

从图8 和图9 可以看到,CA3 层和AMY 层一直处于收敛状态,加入刺激前,OB 层和AON 层处于一个复杂的非收敛状态,但大多数时间内处于有界区域; 加入刺激后,OB 层和AON 层轨迹迅速收敛,且在OB 层的E1-I1 节点相图中出现了稳定的极限环.整个KIV模型从局部稳定进入了全局稳定的状态.

图8 无外加刺激时KIV 模型的相图

图9 有外加刺激时KIV 模型的相图

1.2.4 输入不同强度刺激时的M1-G1 相图

从第1.2.3 节可以得知,当外加恒定输入时,KIV 模型会对外加刺激形成稳定的极限环.接下来,本文研究当输入不同强度刺激时E1-I1 节点相图的变化.同样设置在300 s 时,给KIV 模型输入持续时间为600 s的刺激,刺激幅值分别为1 mV、2 mV、3 mV、4 mV.不同强度刺激下的E1-I1 节点相图依次如图10 所示,其中,红色部分表示300-900 s 之间E1-I1 节点的轨迹.

从图10 中可以看到,对于不同强度的输入刺激,E1-I1 相图中形成的系统轨迹是不同的,即不同的刺激能使KIV 模型形成不同的稳定极限环.

图10 不同强度刺激下的M1-G1 相图

对应到实际的应用情景(如脑电识别)中,当KIV模型接收了脑电信号,系统的时空模式会迅速转换到对应的局部吸引子(即极限环)中.对于不同模式的脑电信号,KIV 模型可以通过系统表现出的极限环对其不同的时空模式进行区分,并通过KIV 模型的学习算法,调整输入层对应节点间的连接权值对目标模式进行记忆和识别.即KIV 模型具有一定的脑电识别潜力,后续的研究可将KIV 模型应用于脑电信号识别.

2 基于KIV 模型的脑电识别

2.1 癫痫脑电识别

癫痫是一种由脑部神经元阵发性异常放电引起的慢性神经系统疾病,也是全球最常见的神经系统疾病之一.癫痫的发作人群不分年龄和性别,发作时可导致短暂的大脑功能失调,如意识丧失,运动、知觉、情绪或精神功能的混乱等.癫痫反复发作会对患者的精神与认知功能造成持续性的负面影响,严重时甚至危及生命.

临床上对癫痫发作的监测通常是通过检测癫痫发作期间或发作前不久所特有的棘波或尖波[24]等实时脑电波形,来分析并诊断患者是否发作.目前,基于EEG的癫痫发作自动检测技术获得了越来越多的研究者的关注.

癫痫发作自动检测[25]是指在连续脑电监测过程中,当患者癫痫发作时,系统以尽可能短的延迟识别发作的开始,并描述持续时间,它包括4 个步骤: 信号采集、信号预处理、特征提取、分类模型学习与评估,其核心是对癫痫波的检测与识别.基于KIV 模型的动力学特性,本节使用KIV 模型对癫痫脑电信号进行识别研究.

2.1.1 数据集介绍

本节所用的数据集是公开的Bonn 脑电数据集.它采集的是5 个受试者在不同状态下的原始脑电信号,这5 个子数据集分别被命名为I、II、III、IV、V,数据集的详细描述见表1.每一个子数据集中包含100 导联信号,每一导联信号包含4 097 个数据点.信号的采样频率是173.61 Hz,每一导联信号的采样持续时间为23.6 s.

表1 BONN 数据集描述

脑电信号属于时变信号,复杂的特征提取过程不是必须的.因此,本文在识别脑电信号时,对原始脑电信号不做特征提取,只进行维度上的切分预处理.本节中,首先对这5 个子数据集进行分割处理,主要包含两部分: (1)将通道数对半分割,分别分为1 段、2 段、4 段,对应的子样本分别有100 通道、50 通道、25 通道; (2)将每一通道上的数据点分别分为30 段、40 段、50 段、60 段,相应的每一段的数据点即序列长度分别为136、102、81、68.因此,每个子数据集分割后的样本有12 种规模,相应的产生了12 组实验.

2.1.2 实验过程

KIV 模型学习和识别脑电信号的过程见图11,详细如下.

图11 实验过程流程图

(1)训练: 将处理后的数据输入到多通道KIV 模型中,通过提取每一通道中OB 层脑电信号的方差,来计算训练集中当前样本的聚类中心,在此过程中不断更新OB 层输入神经元间的连接权重和模型的Hebbian学习参数.得到训练集所有样本的聚类中心后,通过分别取平均值得到每一类脑电数据的聚类中心,并固定输入层神经元间的连接权重和Hebbian 学习参数.

(2)测试: 输入测试集进行测试.同样提取OB 层中每一通道脑电信号的方差,以计算当前测试样本的聚类中心,并利用欧式距离与每一类脑电信号的聚类中心进行对比,根据最小值得到当前样本的识别结果.测试集中所有样本的识别结果得出后,根据测试集中正确识别样本个数与样本总个数得出最终的识别准确率.

2.1.3 实验结果及分析

在实验中,不同的训练集和测试集的比例可能会对识别结果造成一定的影响.因此,本节设计了3 组实验,其训练集的比例分别为60%、70%和80%,然后按照第3.1.2 节的实验流程进行实验,得到的实验结果如图12-图14 所示.

图12 训练集比例为60%时的识别结果

图12-图14 分别表明,当通道数为25 时,不管将同一通道上的数据点分为多少段,不同序列长度样本的识别准确率均能达到81%以上.而随着样本通道数的增加,输入KIV 模型的脑电信号趋于完整,模型的识别准确率越高.当通道数为50 时,识别准确率最为稳定,为98%左右; 当通道数为100 时,随着样本数的增加,识别准确率最高可达99.50%.

比较图12-图14,对于相同通道数和序列长度的子样本,当训练集比例分别为60%、70%、80% 时,KIV 模型的识别准确率有一定的提升.本节的实验结果表明,KIV 模型具有较强的对不同模式的学习与分类能力,即只需学习60%的数据,且只需学习一次,就能准确地识别癫痫脑电信号.

图13 训练集比例为70%时的识别结果

图14 训练集比例为80%时的识别结果

将本节的实验结果与已有的模型识别结果进行对比,见表2.可以看到,与已有模型需复杂特征提取过程的实验结果相比,KIV 模型在BONN 数据集的五分类任务上的识别准确率最高,为99.50%,即,KIV 模型在BONN 数据集上的识别能力优于现有方法.

表2 多种模型在BONN 上的识别准确率对比

2.2 情感脑电识别

情感是人类日常生活中的基础,在认知、交流、决策中扮演着重要的角色,情感的实时评估和调节可以改善人们的生活.近年来,情感识别已成为认知科学、计算机科学、心理学等诸多领域的研究热点.情感识别方法[26]大致上可以分为两类,一种是基于非生理信号,例如面部表情、身体姿势和语音信号等,另一种是基于生理信号,如脑电图、肌电图(EMG)和心电图(ECG)等.与非生理信号相比,生理信号不受外界环境和主观意志的影响,对情感状态的估计具有可重复性和客观性.其中,脑电信号,由于是从大脑皮层直接采集的,有利于反映人的情感状态,成为了研究大脑面对刺激时产生情绪反应的首选载体.

情感分为很多类,研究者认为,情感是有维度的,目前广泛应用的二维模型是效价度(valence)和激活度(arousal)组成的激活度－效价空间[30],如图15 所示,水平轴表示效价维,评价情感的积极和消极程度,数值越大情感越积极; 垂直轴表示激活维度,描述情感的激烈程度,数值越大情感越激烈.

图15 激活度-效价情感空间

然而,不同于癫痫脑电识别中癫痫波的检测,情感评价本身具有一定的主观性,因而准确识别一段脑电信号中蕴含的情感具有更大的挑战性.

2.2.1 数据集介绍

本节使用的数据集为公开的GAMEEMO 数据集[31],它采集的是受试者在视听刺激下的原始脑电信号,包含4 种情感: funny、horror、boring、calm,分别在激活度－效价空间的不同象限.GAMEEMO 脑电信号的采样通道数为14,每一通道上有38 252 个数据点.根据数据集的情感评价结果,本文选取了不产生重复情感的子数据集.

同对BONN 数据集的处理方法,本节对GAMEEMO数据集中每一通道上的数据点进行切分预处理,将38 252 个数据点分别切分为100 段、150 段、200 段、250 段,相应的每一段信号的序列长度分别为380、255、190、153,由此产生了4 组实验.

2.2.2 实验结果及分析

根据KIV 模型的识别原理及过程,本节得到的实验结果如表3 所示.KIV 模型在GAMEEMO 数据集上的平均识别准确率为88.80%.其中,对于序列长度为380 的子样本,训练集的比例为70%时,识别效果最好,为90.83%.其混淆矩阵如图16 所示,KIV 模型对4 种情绪的识别准确率分别为86.67%、100%、96.67%、80.00%,其中horror 最高,calm 最低,这是由于horror情绪较为激烈易于识别,而calm 时脑电波形较为平缓,相对难以识别.

表3 KIV 在GAMEEMO 不同训练集比例上的识别结果 (%)

图16 第2 组实验结果混淆矩阵

将本节的实验结果与已有模型的识别结果进行对比,见表4.可以看到,本文采用GAMEEMO 数据集全部14 个通道的脑电信号,对比同样的14 通道脑电信号分类任务,KIV 模型的识别准确率相比文献[31]和文献[32]分别高19%和14%左右; 对比四分类任务,KIV 模型也表现出不错的识别性能,识别准确率最高为90.83%.整体而言,本节设置的情感脑电信号识别任务难度最高,但是相比于经典的分类器KNN、SVM、Bi-LSTM等,KIV 模型仍表现出优于已有方法的识别性能.

表4 多种模型在GAMEEMO 上的识别准确率对比

3 结论与展望

本文分析了KIV 模型的动力学特性,发现KIV 模型能在输入刺激后,从局部收敛状态迅速进入全局收敛状态,并表现出对刺激的高度敏感性.根据相图中KIV 模型针对不同输入模式形成了不同的稳定极限环,本文拓展了KIV 模型在脑电识别分类方面的应用,在癫痫脑电识别和情感脑电识别中分别获得了99.50%和90.83%的识别准确率.与现有模型提取脑电特征之后的识别结果进行对比,本文的实验结果为脑电识别提供了新的思路和方法.

KIV 模型是一种优秀的大脑半球仿生模型,对比一般的深度学习模型,具有较好的脑电信号识别能力.未来的工作可将KIV 模型应用于模式识别的更多方面,这对探索和研究KIV 模型的模式识别能力具有重要的意义.