脑-机接口操控效果差异及其预测研究综述
2019-01-21郑玉甫许敏鹏
郑玉甫 许敏鹏,* 明 东,
1(天津大学精密仪器与光电子工程学院,天津 300072)2(天津大学医学工程与转化医学研究院,天津 300072)
引言
脑-机接口(brain-computer interface, BCI)是一种不依赖于通常外围神经和肌肉组成大脑输出通路的对外交互控制系统[1],被认为是21世纪脑与神经科学研究中的前沿与热点之一。近年来,BCI技术在信息传输速率和分类精度上取得了显著的进展,并且随着研究的深入,系统性能也在不断地提升。然而,BCI的发展仍然面临着重大挑战,即用户控制表现存在很大差异,这既包括被试间的差异,同时还包括被试在不同状态下的自身差异,严重降低了BCI系统的可靠性[2]。
目前典型的BCI系统有:基于运动想象的脑机接口(motor imagery BCI, MI-BCI)[3];基于P300的脑机接口(P300-BCI)[4];基于稳态视觉诱发电位的脑机接口(steady-state visual evoked potential BCI, SSVEP-BCI)[5]等。尽管BCI系统很有发展前景,但由于鲁棒性低,几乎没有在实验室外大规模使用。众所周知,有效的脑-机交互包括:大脑负责生成编码意图的神经活动信息;BCI系统将大脑神经活动转换为控制设备的指令[6]。因此,分析其原因主要来自两个方面,一方面与被试相关,另一方面则与系统(包括配置环境)有关。对此,Jeunet等也提出了相似的看法,他们认为BCI系统的可靠性,一方面与分类算法有关,且被广泛研究;而另一方面围绕被试特征(认知和性格等)以及心理状态的研究则较少[7]。因此,在不考虑系统和环境的影响下,本研究只关注由被试自身因素导致的BCI控制表现差异,并在此基础上提出通过实现对被试BCI操控能力的预测来减少BCI控制表现差异。
近年来,越来越多的研究围绕BCI操控能力的预测,其中包括被试水平的预测和试次水平的预测两个方面。被试水平的预测可以实现潜在的“BCI盲”筛选[8-9],对表现不佳的被试进行训练指导[10-11],避免耗时且令人沮丧的训练过程,从而在一定程度上减少被试间的差异;试次水平的预测则可实现对大脑状态的监测,有利于被试适时调整最佳的心理和生理状态[12],减少被试内部控制表现的差异,从而提高BCI系统的可靠性。
本研究首先介绍了什么是BCI盲;接着详细阐述了引起BCI控制表现差异的原因,在这里我们假定系统(配置环境)一致,仅关注被试自身的个体特征、大脑结构以及生理和心理状态对控制表现的影响;然后重点论述了MI-BCI、P300-BCI、SSVEP-BCI操控能力预测在国内外的研究现状;最后对其研究前景进行了展望。
1 BCI盲
在早期BCI研究中,为了更好地操控BCI系统,研究被试往往需要接受密集的训练。过去几年里,随着机器学习算法不断完善,同时一些性能优良硬件的投入和系统结构的优化已促使BCI技术近十年的高速发展,一定程度上缩短了训练进程并提高了信息传输速率。虽然这些应用显著地提升了单个被试BCI的控制表现,但是被试之间的控制表现差异仍是一个不容忽视的问题。据报道,大约有15%~30%的被试不能够成功地操作BCI系统对外界设备进行控制,这些人被称为“BCI盲”[8-9],理解和解决BCI盲问题是BCI技术走向大规模市场应用的必要前提。
随着BCI实验研究的增加,证明了BCI盲确实存在,并且在不同的BCI模态下均观察到这种现象[13-14]。例如,在MI-BCI中,Blankertz 等基于80名被试的研究发现,其中30 名(37.5%)无法取得高于70%的分类正确率[15]。在早年Guger等研究中显示,甚至有48.7%的被试在初次使用MI-BCI系统的时候取得的分类正确率低于70%[16];之后Guger等还研究了100名被试在P300-BCI的控制表现,结果显示,27.2%的被试不能使用行/列范式的BCI系统[4];在2012年Guger等又基于53名被试进行了SSVEP-BCI控制表现研究,他们发现,仅有3.8%被试的正确率低于80%,且没有被试的正确率低于60%[17],这表明了BCI盲现象在不同的控制系统下程度有所不同。目前对于BCI盲没有统一的区分依据,Kübler等提出为实现对BCI系统的成功控制,被试需要达到的最低分类正确率为70%[18],即认为正确率低于70%的被试是BCI盲。根据这个定义,有研究指出,在P300和SSVEP系统下有着相对较低的BCI盲率[19]。
2 引起控制表现差异的原因
大多数研究致力于描述一个人控制BCI的程度,而控制能力的大小和个体特征之间的联系却很少被探究。最近的一项研究中探究了被试的个性特征、认知水平与BCI控制表现的关系,结果发现,被试的空间能力大小影响MI-BCI控制表现[20],类似地,也有研究表明,被试的视觉运动协调能力与BCI控制表现相关[21]。早前Randolph等提出了被试的年龄和平均每天花在手臂运动上的时间与运动想象产生的μ节律调节能力紧密相关[22],之后他们进一步发现,超过25岁、懂乐器的女性被试能更好地调节μ节律,在MI-BCI系统中会有更好的控制表现[23]。Volosyak等也提出了年龄是BCI发展中必须要考虑的因素,他们通过比较两组不同的年龄群(19~27岁,66~70岁)被试在SSVEP-BCI系统中的控制表现,发现老年组的信息传输速率明显地低于青年组[24-25]。 此外,Sprague等人还提出,被试的工作记忆、智力水平也会引起不同程度的被试间控制表现差异[26]。
随着磁共振脑成像技术的发展,MI在近年得到了较多的关注。研究表明,即使对于相同的心理活动或者相同的任务,不同被试的脑电所表征的神经活动水平也体现着很大差异。这是由于每个个体都有其独特的大脑皮层褶皱模式,且功能区与皮层沟回上特异位置之间的关系也有不同。Kasahara等探究了BCI的控制表现与被试大脑灰质体积的关系,他们发现控制表现越好的被试,其辅助运动区、辅助体感觉区和背前运动皮层的灰质体积越大[27]。此外,Halder等通过分析运动想象表现好与差被试的大脑结构数据,发现深层白质结构(如胼胝体、扣带和上额-枕束)的结构完整性和髓鞘形成质量,与被试的BCI控制表现呈正相关[28];他们还进一步基于fMRI技术比较了被试在运动想象和运动观察时的大脑功能激活差异,发现MI-BCI控制表现好的被试在运动观察任务中大脑辅助运动区和右额中回体现出更强的激活[29],这表明不论脑解剖结构上的缺陷还是脑功能性的障碍均会引起BCI控制表现差异。在另外一项研究中,张涛等基于功能和结构磁共振成像技术研究了额顶注意网络对MI-BCI控制表现的影响,从结构磁共振成像数据得到的皮质厚度(cortical thickness, CT)以及从功能磁共振成像数据中得到度中心度(degree centrality,DC)和特征向量中心度(eigenvector centrality,EC),结果显示右腹侧内叶沟的度中心度,左顶下小叶的特征向量中心度和皮层厚度,右背外侧前额叶的皮质厚度均与MI-BCI的控制表现显著相关[30]。
在心理状态方面,动机对BCI控制表现的影响至关重要[31],Kleih等提出被试诱发的P300幅值和参与BCI控制的积极性有关,他们发现被高度激励的被试能够更快地实现使用BCI进行沟通[32]。除了动机之外,疲劳、沮丧和注意力状态等其他心理因素也会影响BCI控制表现[33],比如 Hammer等发现,BCI控制表现越好的被试注意力集中的程度越高[21]。
近年来,有研究指出,大脑的静息态活动反应其潜在的处理能力,即被试的任务表现与之前大脑的初始状态有关。Maeder等发现在运动想象提示前1 s内感觉运动节律(sensorimotor rhythm, SMR)幅度较高的试次中被试往往会有相对好的分类表现[34]。Grosse-Wentrup等探究了与运动想象相关脑区之间的连接模式,发现运动想象在gamma频段会减少前额区和感觉运动区的联系[35],继而进一步研究了gamma振荡和SMR的关系,并发现被试在运动想象过程中SMR的调制与额区和枕区gamma振荡的能量正相关,但与中央顶区gamma振荡能量负相关[36-37]。这一发现表明,被试不同脑区的gamma振荡能量大小也会导致BCI控制表现的差异;Ahn等进一步探究了gamma振荡和BCI控制表现的关系,也得到了类似的结论,即前额叶脑区的gamma振荡活动与BCI控制表现高度正相关[38]。
以上研究表明,被试者的个性特征、大脑结构、心理和生理状态等因素均会引起不同程度的控制表现差异。但值得注意的是,个体特征和大脑结构在很长的时间内不会发生变化。因此,被试内差异的研究大多集中在心理和生理状态上,被试进行在线测试时控制表现可能会出现波动,这是因为心理和生理状态会随着时间的变化而变化,这种变化甚至可能在几秒内就会出现。
3 脑机接口操控能力预测研究现状
理论上,引起BCI控制表现差异的因素均可作为BCI操控能力的预测指标,比如,Halder等发现深层白质结构与被试的BCI控制表现相关,因而他们提出大脑结构特征可以预测BCI操控能力,研究结果发现,大脑白质的微结构特征对MI-BCI控制表现有着很强的预测能力,预测正确率高达93.75%[27]。近年来,对BCI操控能力的预测受到了越来越多研究人员的关注,并进行了大量实践研究,根据BCI系统的种类大致可以分为以下3个方面。
3.1 MI-BCI操控能力预测
通过运动想象自主地控制SMR的调节,这种能力被认为是操控MI-BCI的基础,为了实现对MI-BCI系统的控制,被试往往需要训练来学习如何正确地调节SMR。目前越来越多的研究指出,大脑的静息状态可以预测被试的任务表现, Blankertz等利用C3、C4两导信号的两分钟睁眼静息数据的平均功率谱密度预测MI-BCI下被试的表现,基于80名被试的数据显示BCI表现与提出的SMR预测器之间的相关系数为0.53[39]。在另外一项研究中,Ahn等基于52名被试中研究了表现好的被试与BCI盲之间神经生理差异,发现了BCI盲在睁眼静息态下的theta频带能量较高,而alpha频带能量较低,研究表明,这些静息态指标能够预测被试的BCI操控能力且预测效果优于Blankertz提出的SMR预测器[40]。除了考虑静息态脑电功率谱的频带能量信息,Bamdadian等研究提出了一种来自任务开始提示前脑电节律的新系数,该系数通过计算在不同脑区的具体节律的脑电功率得到,与之前的预测因子相比,这个系数除了频谱信息之外,还能从大脑中获取空间信息[41]。之后,张锐等系统验证了以静息态脑电谱熵为指标预测被试的MI-BCI控制表现的性能,并将之与以上研究中提出的SMR指标[39]和ATR(alpha-theta ratio)指标[40]做了系统对比,结果发现,静息态谱熵指标取得了最佳的预测表现[42],这是由于谱熵代表了功率谱密度的复杂度,能够捕获被试静息态脑电功率谱的整体信息。
除了以上提到的生理预测器外,Hammer等研究了心理参数诸如注意力、个性或动机等是否能预测MI-BCI的控制表现[43],随后提出了2个有意义的心理预测指标,分别是视觉-运动协调能力和注意力集中能力[21]。Jeunet等也提出了基于心理测量问卷评分的MI-BCI性能预测模型[44]。Darvishi等研究了简单反应时间(simple reaction time, SRT)测试用于预测MI-BCI的性能,结果表明,SRT和MI-BCI性能之间存在显著的负相关关系,他们认为反应时间较短的人在接收到快速更新的感官反馈时,能够更好地调整他们的运动想象表现。因此,SRT可以作为MI-BCI性能的一个简单可靠的预测器[45]。
此外,一些研究还探究了脑机接口操控能力在试次水平上的预测,试次水平上的预测可以减少被试内部控制表现的差异。Grosse-Wentrup等研究了单轮实验内每次 MI-BCI 控制任务间的表现差异(即在一轮实验内被试的 MI-BCI 控制表现随时间轴的变化情况),发现起源于额-顶网络的高频段gamma振荡可以预测下次MI-BCI控制表现的成败[46]。Maeder等发现,在运动想象提示前1 s内SMR幅度较高的试次中会有相对好的分类表现[34]。另外,其他脑成像技术也可用于预测MI-BCI操控能力,Fazli等研究了刺激之前的近红外光谱活动可以预测BCI控制表现的波动,基于近红外光谱的预测器可以生成新的、更稳定的基于脑电的BCI分类器,能显著地提高分类效果,同时最小化被试内部控制表现波动,从而提高BCI性能的总体稳定性[47]。
3.2 P300-BCI操控能力预测
当前研究试图通过优化视觉呈现范式[48]、特征提取方式[49]以及分类算法[50]来提高P300-BCI系统的速度和准确性,尽管在优化P300-BCI系统性能方面取得了进展,但无论健康被试还是病人的控制表现均存在很大的差异。
BCI的初衷主要是用于那些由于疾病或意外事故等因素造成部分或者全部运动能力、交流能力丧失的人群,修复或替代这些丧失的能力,从而提高他们的生活质量。在一项对肌萎缩性脊髓侧索硬化症(Amyotrophic Lateral Sclerosis,ALS)患者使用BCI交流情况的研究中发现,最有效的方式是采用P300-BCI交流[51]。因此,很多对基于P300-BCI操控能力预测的研究围绕病人展开,Joseph等探究了20名ALS病人与其P300-BCI表现高度相关的脑电特征,发现了能成功地预测P300-BCI表现的特征,分别是幅值均方根、某些导联的ERP负波以及theta频带能量等,这些预测指标对确定P300适合的用户及评估在线表现具有重要意义[52]。Halder等提出,在实验开始前记录听觉oddball范式的脑电数据可以预测ALS病人操控BCI的能力,发现听觉任务诱发的N2和P2与表现有着很强的关联,并指出N2幅值是比P300更强的预测器[53],并且在40名健康被试人群中验证了利用听觉oldball的方式进行预测也是成功的[54]。
以上研究表明,脑电的频域和时域特征均能够预测P300-BCI控制表现,而其他生理因素也会影响P300-BCI的控制表现,比如心率变异性同样也可以预测BCI操控能力[55]。此外,Sprague等还研究了工作记忆和P300-BCI表现的关系,结果表明,工作记忆和智力水平都是BCI表现的重要预测器,工作记忆等心理因素可能有助于解释BCI表现的个体差异[26]。
3.3 SSVEP-BCI操控能力预测
在BCI走向大规模市场应用之前,有必要探究BCI人口统计学特征,这样有助于为每个用户确定最佳的BCI系统。研究探讨了BCI的表现与个人偏好以及年龄、性别等因素之间的相关性,结果表明,大多数被试都能够在复杂的环境中使用SSVEP-BCI系统,其中年轻女性被试表现最佳[56]。已有文献研究静息态脑电的某种度量和被试BCI的表现之间的关系,Fernandez-Vargas 等指出,被试间的静息态基线测量(特定频带的功率谱密度)可以预测被试的BCI表现[57]。张杨松等首次从脑网络的角度来探究静息态脑电活动与SSVEP之间的关系,发现了静息态网络属性与SSVEP幅度之间存在显著性的相关关系,同时发现这些网络属性同样也可用于SSVEP-BCI的被试表现的预测[58]。
综上所述,以生理指标来预测BCI操控能力的研究较多,研究验证了静息态脑电度量指标预测BCI控制表现的可行性。这标志着一个重大进步,因为他将大脑的休息状态和大脑功能表现联系起来,为今后BCI控制表现的研究提供了新的思路。除了静息态脑电指标,其他任务(比如听觉oldball、反应时间测试)中的测量指标也可以作为控制表现的预测器。而BCI操控能力的心理预测器的研究则较少,他们多采用调查问卷的方式[44, 59-60],主观性较强且进行BCI任务的同时难以实现对心理状态的监测。
4 展望
总之,实现脑机接口操控能力的预测,对于更好地理解BCI盲现象以及解决BCI控制表现差异具有重大意义,但目前为止BCI操控能力预测器还未在BCI实验中广泛使用[61]。为了使BCI更好地走向大规模市场应用,BCI操控能力的预测仍需进一步探究,在目前研究的基础上,主要从以下几个方面对BCI操控能力预测的未来发展进行展望。第一,研究是否可以在不同的BCI系统中得到一致的操控能力预测指标;第二,对BCI操控能力预测的研究往往基于特定被试人群,考虑到未来BCI受益人群主要为病人,当前在健康被试中得到的预测指标是否能够预测病人的BCI操控能力;第三,目前基于试次水平预测的研究较少,未来应同时探究被试水平和试次水平的预测指标,并分析比较他们的区别与联系;第四,据悉,没有研究综合来自解剖、心理、神经生理发现的各种参数,由于不同类型的变量可以提供相应的信息,他们的综合有望产生更准确的预测器。