用于冥想神经反馈系统的脑电图数据挖掘研究
2018-04-11周昌乐
徐 昊,黄 敏,2,周昌乐*
(1.厦门大学 信息科学与技术学院,福建省类脑计算技术及应用重点实验室,2.厦门大学人文学院,福建 厦门 361005)
现代社会繁荣发展,人们内心却越来越焦虑、失落和幸福感下降,各类心理和精神疾病呈上升趋势[1],此现象的一种可能原因是人们缺少对自我内心的关注,缺乏自我调节能力和技巧.“乐易心法”是厦门大学周昌乐教授经过深入研究并改造中华传统心法而创建的适合现代人的科学禅修方法,由易道洗心秘法、临济宗门禅法和圣学传统心法三部分融会贯通而得[2],其实践部分包括打坐冥想等内容.科学合理地修习乐易心法能够提升心理素质,完善心理品质,提高心理能力.冥想能够改变脑电图(electroencephalograph,EEG)特征[3-4],乐易心法的修行效果已得到众多学员的主观肯定及神经科学实证[5].
神经反馈(neurofeedback,NFB)是一种神经治疗方法,可用于多动症、抑郁症等精神障碍的治疗[6].其治疗思路为:医生根据经验及健康人的EEG特征值,为病人设置其EEG特征的目标值,NFB系统采集并计算其EEG特征,病人根据系统的反馈信息进行大脑自我调节,使其EEG特征与目标值趋于一致.准确识别EEG模式是NFB系统的关键,生物信息数据挖掘是数据挖掘和机器学习的重要前沿方向[7],该领域许多算法能够对生物信息进行模式识别和分类,可用于NFB系统.
将中华传统心法中的冥想与NFB结合起来,研发有利于人们身心健康的智能应用是一个有价值又充满挑战的课题.市场上已出现冥想主题的NFB系统[8-11],但这些系统引导用户做的事情与以“禅悟”为目标的禅修在修行方式和水平检验方面有根本区别,禅修要求修行者“以心观心”,其禅悟水平必须由禅修导师“以心验心”[12],已有系统皆不具备.因此,符合传统禅修目标和方式、针对初学者群体的冥想NFB系统还需要深入研究.
本研究采集乐易心法七日禅学员冥想EEG信号,选用6个波段能量、6个波段能量比和3种不同类别的EEG现代分析方法作为EEG特征,以禅修学员水平作为分类目标,对数据采用个性化校准方案,测试了随机森林(random forest,RF)、支持向量机(support vector machine,SVM)、k近邻(k-nearest neighbor,kNN)、贝叶斯网络(BayesNet)等多种分类和回归算法的准确率性能.
1 实验方法
1.1 禅修过程及实验对象
乐易心法七日禅为时长7 d的封闭式禅修训练,由乐易心法创始人周昌乐教授亲自参与组织、指导和管理,主要内容包括开示、打坐冥想、参公案、行禅、众人讨论和请益等环节,禅修期间所有被试统一活动,统一作息,不使用手机、互联网,不接触外界信息.
选取20名乐易心法七日禅修行结业36 h内的学员作为实验被试,8女12男,年龄在20岁到48岁之间,平均年龄(35.4±8.3)岁.其中拥有博士学位者2人、硕士学位者6人、本科学历者10人、大专学历者1人和初中学历者1人.所有被试身体健康、无精神病或大脑创伤史、无宗教背景、无禅修经验,有一定的乐易心法入门知识,右利手,自愿参加实验并签署同意书.
1.2 实验步骤及数据采集
实验在安静房间内进行,温度和光线适中,EEG采集步骤如图1所示.
图1 实验流程图Fig.1 The flowchart of experiment
1) 15 min静虑冥想:被试按照禅修静虑方法冥想,该步骤无提示材料,目的是消除杂念并安静下来,此步骤获取的数据在后文中被称作“基准数据”.
2) 8 min专注冥想:先呈现2 min动画和文字提示供被试把握专注要点,再进行6 min专注冥想,专注提示材料如图2(a)所示.
图2 3类冥想提示材料Fig.2 Instructions of 3 types of meditation
3) 8 min正念冥想:先呈现2 min动画和文字提示供被试把握正念要点,再进行6 min正念冥想,正念提示材料如图2(b)所示.
4) 8 min坐忘冥想:先呈现2 min动画和文字提示供被试把握坐忘要点,再进行6 min坐忘冥想,坐忘提示材料如图2(c)所示.
被试的禅修水平由禅修导师周昌乐教授根据被试7 d中的禅修表现、领悟水平、悟性高低等因素进行综合评分(采用10分制),7分及以上视作高分,评分分布见表1,高分学员占20%,低分学员占80%.
表1 禅修水平得分分布表
数据采集使用Emotiv Epoc便携式脑电仪,采样频率128 Hz,左右乳突为参考电极[13].已有研究表明大脑前额叶是与冥想关联程度最大的脑区[14],本研究关注前额叶F3电极,将F4电极数据作备用,电极位置如图3所示.
图3 电极位置Fig.3 Electrode positions
2 数据处理
2.1 预处理
预处理包括数据分段、滤波、数据挑选3个步骤.
1) 数据分段:根据实验过程的时间轴对EEG进行阶段划分,并将原始EEG以10 s为长度进行分段.
2) 滤波:对分段后的EEG数据分别进行δ(0.5~4 Hz)、θ(4~8 Hz)、α(8~13 Hz)、β(13~30 Hz)和γ(30~50 Hz)带通滤波,再对滤波后的数据分别进行快速傅里叶变换,求出这5个频段的能量.
3) 数据挑选:将能量过高和大幅震荡视为异常,不予选取.针对每名被试,从第一步骤“静虑冥想”数据中随机采样12段合格数据(12×10 s=120 s);从第二步骤“专注冥想”随机采样20段合格数据(20×10 s=200 s);从第三步骤“正念冥想”随机采样20段合格数据(20×10 s=200 s);从第四步骤“坐忘冥想”随机采样20段合格数据(20×10 s=200 s).有4名被试(3个5分,1个4分)的数据因异常而被抛弃,最终共16名被试的1 152个样本用于后续研究.
2.2 特征计算
为了尽可能利用和发挥数据挖掘研究方式的优点和潜力,本研究选用6个波段能量、6个波段能量比和3种不同类别的EEG现代分析方法作为EEG特征,将每个样本处理成15维特征向量:δ波能量(Eδ)、θ波能量(Eθ)、α波能量(Eα)、β波能量(Eβ)、γ波能量(Eγ)、总能量、Eα/Eθ、Eβ/Eθ、Eγ/Eθ、Eβ/Eα、Eγ/Eα、Eγ/Eβ、C0复杂度[15]、盒维数[16-17]、信息熵[18].
2.2.1C0复杂度
C0复杂度是一种适用于EEG这样的非平稳、非线性连续信号的复杂度指标,计算量较小,易于推广到高维,在实际应用中效果较好[15],能够识别癫痫发作和衡量睡眠程度.它的直观想法是将数据分为规则和非规则两部分,C0复杂度定义为信号非规则部分的能量与信号总能量的比值.
设f(k)(k=0,1,2,…,N-1)是一个长度为N的时间序列,
设FN(j)的均方值为
记
定义C0复杂度为
2.2.2盒维数
盒维数(又称闵可夫斯基维数[17])是分形维数的一种,用于表征复杂对象的分形特性[14].分形S的盒维数被定义为
其中,格子边长为ε,N(ε)表示覆盖分形S最少所需的格子数.通过格子的逐步精化,统计覆盖分形S所需的格子数目的变化,从而计算出盒维数.
本研究利用相空间重构和经典的Takens时间嵌入定理[19],将EEG信号嵌入二维平面构成二维轨迹,令该二维轨迹的盒维数代表该段EEG信号的盒维数.
2.2.3信息熵
信息熵研究的是一段信号的不确定程度,反映信号分布的均匀度,信息熵方法在过去十几年中被越来越多地证明可以有效地分析复杂的EEG信号[5,15,20],经典信息熵的数学定义为
H(X)=-∑iP(xi)log2P(xi),
其中,X是符号xi组成的集合,P(xi)是符号xi出现的概率.
3 数据挖掘及结果
数据挖掘是从大量数据中获取隐含有用信息的技术,可划分为分类、回归、聚类、关联规则、特征选择等.为了找到禅修分类性能较好的算法,本研究使用开源机器学习和数据挖掘软件Weka[21],尝试了回归分析和多分类算法,包括RF、随机树(random tree,RT)、C4.8决策树(J48)、局部决策树(partial decision tree,PART)[22]、SVM、BayesNet、多层感知机 (multilayer perceptron,MP)、kNN,将15维EEG特征和禅修评分作为输入,并尝试对每位被试的数据进行个性化校准,以解决个体差异问题,提高分类准确率.
回归分析将禅修评分视作数值型数据,对评分进行拟合.这相当于直接构造一个打分模型,将高维特征映射为一个数值型得分.采用10折交叉验证,结果以相关系数的形式给出,相关系数越高意味着拟合结果与测试集越接近.
多分类将禅修导师打分视作离散型数据,2分至8分共7类,采用10折交叉验证.
进一步地,考虑到准确识别出高水平学员的EEG特征是问题关键,对低分样例进行详细划分和挖掘的意义不大,因此将高分样例(分数≥7,前25%)作为正例,其余样例作为反例进行二分类,采用10折交叉验证未经校准过程的数据挖掘实验结果,如表2所示.
表2 未经校准过程的数据挖掘结果
Tab.2 Data mining result without calibration
数据挖掘方法相关系数(回归分析)准确率(多分类)/%准确率(二分类)/%专注正念坐忘专注正念坐忘专注正念坐忘RF0.6070.6340.86268.470.980.682.781.193.7RT0.3400.3880.69554.760.666.679.977.691.2J4861.664.376.379.678.590.0PART57.263.470.978.679.590.9SVM0.5200.5040.74561.962.564.779.679.886.2BayesNet45.048.666.677.076.785.3MP0.5460.3590.35759.153.865.676.777.084.6kNN(k=1)0.3600.3400.65254.152.261.378.379.287.5kNN(k=5)0.4780.4820.74055.959.063.178.978.986.2
EEG的个体差异往往很大,它既与被试生理差异有关,又和被试当时的意念状态、情绪、思维、性格等心理因素有关.本研究尝试利用静虑冥想的基准数据对每名被试进行个性化校准,假设被试静虑时的EEG包含该被试的个体特征,在其进行专注、正念和坐忘任务时的EEG既包含特定冥想任务特征,也包含相同的个体特征,两者相减就能够得到表征特定冥想任务的EEG特征.
本研究针对相对校准和绝对校准两种情况进行数据挖掘,结果分别如表3和表4所示.
为了更精确衡量绝对校准方案对二分类问题准确率的提升作用,本研究进一步对比了绝对校准前后RF、SVM和BayesNet算法的准确率,查准率-查全率曲线面积和受试者工作特征曲线下面积[23],结果如表5所示.由表5可知,绝对校准后分类效果均有改善.
4 讨 论
本研究专门针对乐易心法打坐冥想流程设计实验,被试皆为乐易心法七日禅学员,采集到的EEG数据对乐易心法冥想具有较高参考价值,比一般的正念冥想研究[3,4,11,24]和类似“开心禅”和“禅定花园”等应用更具中华传统文化内涵,也更具前沿性和难度.乐易心法禅修按中华传统禅修方式进行,所有禅修者与导师一起封闭培训,这样的禅修班难以大批量复制,使得本研究被试数量较少.Hashemi等[11]研究人员对600多名各个年龄段的被试进行了研究,发现了EEG特征在年龄上的变化规律.但该研究采用的冥想为“呼吸计数法”,只是让用户通过冥想来放松心情,无禅修和禅悟的内容.相比于MeditAid系统[10]利用双耳节奏神经相关效应(binaural beats neurocorrelate)通过播放音频激发特定α波的做法,本研究尝试将NFB技术与传统禅修方式融合,被试的禅修水平由禅修导师评估,能够更好地为禅修者服务.本研究广泛利用了多种EEG指标和分析方法,分类准确性能够随着数据集的增大有更好的表现.
表3 相对校准后数据挖掘结果
Tab.3 Data mining result with relative calibration
数据挖掘方法相关系数(回归分析)准确率(多分类)/%准确率(二分类)/%专注正念坐忘专注正念坐忘专注正念坐忘RF0.6920.7410.86966.671.380.987.288.194.7RT0.3970.4980.73758.161.966.980.380.391.2J4856.664.175.683.884.489.4PART57.868.471.681.384.191.3SVM0.6580.6400.78361.657.866.381.985.993.1BayesNet61.358.870.682.591.993.4MP0.4160.4620.51163.855.970.078.885.393.1kNN(k=1)0.4420.5010.76557.253.164.478.181.693.1kNN(k=5)0.5820.6000.79261.359.468.481.086.691.9
表4 绝对校准后数据挖掘结果
采用本研究提出的个性化校准方案后,多个回归和分类算法结果均有大幅度提升,这可能与将“静虑”作为基准数据有关.乐易心法中的静虑要求禅修者去除杂念,平静内心,是一种禅修语境下“更纯粹”的意念状态.本研究假设静虑时的EEG包含被试个体差异特征成分,在个性化校准时减去静虑特征值就能抵消个体差异和无关信息,从而突出反映后续冥想阶段的特征,提高分类算法的准确率.绝对校准后RF算法对二分类问题的准确率均高于93%,证明了NFB系统能够较好地识别冥想好坏状态,帮助使用者及时纠正错误.
受限于被试人数和实验时间,本研究实际的被试数只有16人,高分人数只有4人,在训练和测试时虽然使用10折交叉验证,但每个学员的样例均以高概率参与了训练,因此本研究的实验条件很接近测试集,即训练集的情况.
表5 绝对校准前后二分类准确率结果
Tab.5 Accuracy result without/with absolute calibration
冥想类别方法准确率/%曲线面积查准率-查全率工作特性专注RF82.7→93.10.891→0.9680.865→0.962BayesNet77.0→88.40.715→0.9450.654→0.928SVM79.6→85.00.689→0.7630.612→0.700正念RF81.1→93.80.886→0.9820.862→0.979BayesNet76.7→87.20.713→0.9430.611→0.930SVM79.8→82.80.691→0.7330.603→0.665坐忘RF93.7→96.90.972→0.9970.971→0.997BayesNet85.3→96.60.854→0.9930.822→0.993SVM86.2→90.30.781→0.8490.726→0.831
注:校准前结果→校准后结果.
考察各个算法给出的分类模型后发现,模型用到的特征数量一般在5个以上,直接使用主成分分析对15维数据进行降维后给出的数据维度是7,这说明想要达到较好的识别准确度,算法必须同时利用多个特征.但主成分分析重构线性空间后新坐标系的可解读性和可分析性变差,不利于对EEG结果进行解读和分析,因此本研究不采用主成分分析进行维度压缩.由于人的注意力和意念控制能力有限,若NFB系统反馈的参数过多,很容易令使用者顾此失彼,达不到训练效果.优秀的NFB系统既要能准确识别目标状态,又要为使用者反馈精简有效的特征调整指令,因此后续研究应着眼于特征降维.另外,将禅修导师判断学员水平的一些依据纳入NFB系统也许是个可行办法.
5 结 论
本研究采集和研究了乐易心法七日禅学员打坐冥想的EEG数据,采用数据挖掘的研究思路和方法,使用15维EEG特征和禅修导师评分作为数据集,以禅修学员水平作为分类目标,对数据采用个性化校准方案,测试了RF、SVM、kNN、BayesNet等多种分类和回归算法的准确率.实验结果表明,本研究提出的15维EEG特征和个性化校准方案可以有效地解决EEG研究中的个体差异问题,提高冥想水平分类准确率,为更智能的冥想NFB系统研发提供了支持,也为相关研究领域提供了一种解决EEG个体差异问题的思路.
参考文献:
[1]余国良,董妍.我国心理健康研究的现状、热点与发展趋势[J].教育研究,2012,33(6):97-102.
[2]周昌乐.博学切问[M].厦门:厦门大学出版社,2015:209-212.
[3]TANG Y Y,HOLZEL K,POSNER M.The neuroscience of mindfulness meditation[J].Nature Reviews Neuroscience,2015,16(4):213-225.
[4]ZHOU R L,LIU L.Eight-week mindfulness training enhances left frontal EEG asymmetry during emotional challenge:a randomized controlled trial[J].Mindfulness,2017,1(8):181-189.
[5]赵建强,周昌乐.短期禅修效果的脑电图多尺度排列熵分析[J].厦门大学学报(自然科学版),2016,55(3):420-425.
[6]EVANS R J.Handbook of neurofeedback[M].Binghamton:The Haworth Medical Press,2007:3-10.
[7]吴金华,张艳秋,唐毅.数据挖掘在生物信息学中的应用文献计量学视角[J].生物信息学,2016,14(4):249-253.
[8]LIU Y S,SOURINA O,HOU X Y.Neurofeedback games to improve cognitive abilities[C]∥2014 International Conference on Cyberworlds.Santander:IEEE,2014:161-168.
[9]BRANDMEYER T,DELORME A.Meditation and neurofeedback[J].Frontiers in Psychology,2013,4(1):688670.
[10]SAS C,CHOPRA R.Medit aid:a wearable adaptive neurofeedback-based system for training mindfulness state[J].Pers Ubiquit Comput,2015,7(19):1169-1182.
[11]HASHEMI A,PINO J L,MOFFAT G,et al.Characterizing population EEG dynamics throughout adulthood[J].eNeuro,2016,3(6):1-13
[12]周昌乐.从当代脑科学看禅定状态达成的可能性及其意义[J].杭州师范大学学报(社会科学版),2015(3):17-23.
[13]Emotiv Inc.Emotiv epoc & testbenchTMspecifications[EB/OL].[2017-10-07].https:∥www.emotiv.com/files/Emotiv-EPOC-Product-Sheet-2014.pdf.
[14]FELL J,AXMACHER N,HAUPT S.From alpha to gamma:electrophysiological correlates of meditation-related states of consciousness[J].Medical Hypotheses,2010,75(2):218-224.
[15]汪云九.神经信息学神经系统的理论和模型[M].北京:高等教育出版社,2006:403-407.
[16]佩特根,于尔根斯,绍柏.混沌与分形[M].田逢喜,译.北京:国防工业出版社,2008:300-305.
[17]WEISSTEIN W E.Minkowski-bouligand dimension[EB/OL].[2017-12-18].http:∥mathworld.wolfram.com/Minkowski-BouligandDimension.html.
[18]SHANNON C.A mathematical theory of communication[J].Bell Systems Technical Journal,1948,3(27):379-423.
[19]TAKENS F.Detecting strange attractors in turbulence[C]∥Dynamical Systems and Turbulence.Heidelberg:Springer,1981:366-381.
[20]李颖洁,邱意弘,朱贻盛.脑电信号分析方法及其应用[M].北京:科学出版社,2009:1-3.
[21]FRANK E,HALL A M,WITTEN H I.The WEKA workbench[M].San Francisco:Morgan Kaufmann,2016:1-8.
[22]FRANK E,WITTEN H I.Generating accurate rule sets without global optimization[C]∥ICML′98 Proceedings of the Fifteenth International Conference on Machine Learning.San Francisco:Morgan Kaufmann,1998:144-151.
[23]周志华.机器学习[M].北京:清华大学出版社,2016:30-35.
[24]CHIESA A,CALATI R,SERRETTI A.Does mindfulness training improve cognitive abilities? A systematic review of neuropsychological findings[J].Clinical Psychology Review,2011,31(3):449-464.