基于P300的脑机接口的数学模型与算法研究
2014-12-30林亚静
摘 要:文章针对BCI Competition 2003的Data set IIb竞赛数据,取得了一个很高的字符分类识别准确率,文章突出在数据预处理阶段中,通过很多次程序验证比较不同频带域的测试准确率,得出了一个最佳的频带范围,用于原始数据的滤波过程。
关键词:脑机接口;P300;预处理;特征提取;分类算法
1 引言
脑机接口(BCI)是一个系统,允许用户与环境的沟通,只有通过大脑活动,而无需使用肌肉输出通道。它涉及了神经科学,信号检测,信号处理,模式识别等多种领域。要建立大脑和外界设备之间的联系,首先要测量大脑活动,然后进行处理分析信号数据,再进行机器学习(训练分类模型)实行分类,进而实现用户的意图。P300电位是当视觉受到外界特殊刺激时脑电信号出现一个波峰,其峰值大约出现在相关事件发生后的300ms。其优势特点是被试验之前不需要进行训练即可成功诱发出来。因此P300电位是脑-机接口常用的一种信号。文中所用数据是BCI Competition 2003的Data set IIb离线数据集。大致处理过程可以描述为:原始信号数据→预处理→特征选择与提取→选择并训练分类模型→分类结果→测试分类算法效果→根据效果调整分类模型→得出理想的分类结果。
2 处理数据的算法步骤
2.1 单次样本提取:因为P300电位一般出现在刺激后的300ms左右,所以通过分类精度验证后,本文截取从每次闪烁开始后100ms到700ms长度的数据作为一个单次样本,这样将训练集的前30个Trial的数据组成一个30×12×15×144×64维的原始特征空间。
2.2 数据预处理:由于采集到的原始数据中一般会含有眼电,肌肉以及外界干扰等因素(如测量仪器或环境干扰等)的噪音信号,以及P300电位的低频特性,所以需要对原始数据进行预处理,本文主要涉及数据精度的转化以及低通滤波。论文突出在打破了前人已有经验的限制,将P300电位的频带范围更加精确化,更是体现了P300电位的低频特征,文章选择采用Matlab自带的信号处理工具箱设计了一个合适的滤波器,以带通替代低通设计了10阶Butterworth(IIR)带通滤波器,带宽为0.05Hz~7.5Hz。不同频带域对应的实验准确率如表1。其中10阶可以通俗理解为过滤次数,一般来說过滤次数越多滤波效果就越好,但是同时也加重了程序运行负担,因此选择适当的滤波阶数也是很关键的一步。
表1
2.3 特征选择与提取:首先对电极进行筛选,因为并不是所有电极都能明显体现P300特征,所以需要把那些P300特征比较明显的电极筛选出来。通过多次准确率比较论文选择了22个导联(用Ne表示)作为特征电极,对应编号为:11,13,14,18,19,20,34,47,51-64。比较准确率时采用随机增加通道,能提高准确率的通道保留,反之舍弃的方法。其次,为了提高训练模型的速度,需要对特征空间进行降维处理,本文尝试过两种降维方式,一是将相邻6个采样点的平均值作为一个特征点,二是每隔6个采样点取一个特征点,事实证明后者的程序简单而且准确率并高于前者,所以采用后者的方法将预处理后的数据降维。再关于试验重复次数求平均,至此每个Trial只剩24个特征点(用Ne表示)。并将其特征电极与特征点结合考虑作为每个Trial的特征向量。这样将得到前30个训练数据的特征空间为(30·12)×(Ne·Nt)即为360×528维的特征空间。
2.4 规范化特征空间:就是将特征空间向量投射到特定的小范围内,如-1.0~1.0或0.0~1.0。文章采用向量单位化的方法将其投射到0.0~1.0范围内。规范化可以消除数值型属性因为大小不一而带来的特征分类偏差。这个过程对于提高脑机接口信息传递效率很重要。
2.5 训练分类模型:将特征提取得到的已知目标字符的数据作为训练集,利用C-SVC(C-支持向量分类)选择线性核函数u'*v对其进行训练,其中样本特征是属于二分类样本集,分别用-1和1标记两种样本类别。
3 分类结果
将训练出的分类器应用于等量的未知目标字符的测试数据集,推断出所选择的字符。并计算分类准确率:Accuracy=■×100%。论文通过上述算法得到的最高准确率达90.00%。相应不同重复次数文章分别测试了对应准确率,见图1。
图1
4 结束语
文中选择了22个通道数据进行处理得到了很好的分类效果,但是否这22个特征电极就适用任何群体的实验数据,本文并未明确给出。但至少文中所用的通道及其筛选方法可以为相关研究者提供参考。论文关于P300电位的低频特性到底低到什么程度也只是对文中所用数据作了验证,是不是普遍结论还有待这方面的研究者进一步探讨。总之本文所用的处理算法对提高整个BCI系统的总体数据传输率起了积极作用。
参考文献
[1]程明,高上凯,张琳.基于脑电信号的脑-计算机接口[J].北京生物医学工程,2000,19(2):113-118.
[2]杨立才,李佰敏,李光林,等.脑-机接口技术综述[J].电子学报,2005.
[3]Lin Zhonglin,Zhang Changshui.Enhancing classification by perceptual characteristic for the P300 speller paradigm [A].In :Proceedings of the 2nd International IEEE EMBS Conference on Neural Engineering,Arlington : IEEE EMBS,2005,574 -576.
作者简介:林亚静(1985,11-),女,汉,陕西西安人,研究方向:信息理论与应用,硕士学历。