基于共空间模式和支持向量机算法的食物偏好脑电分类研究
2022-10-19李春雨綦宏志郭晓艺
李春雨 何 峰 綦宏志 郭晓艺 陈 龙 明 东
1(天津大学医学工程与转化医学研究院,天津 300072)2(天津大学精密仪器与光电子工程学院, 天津 300072)
引言
食物是自然界中一种独特的存在,具有奖赏和享乐属性[1],是人类赖以生存的基础,对人类而言至关重要。 个体对不同食物的喜好程度存在差异,经过较长时间的积累,喜好差异逐渐趋于稳定并表现出个性化,即食物偏好[2],一定程度上反映了个体未来的饮食倾向[3]。 事件相关电位技术(event related potential, ERP)作为探究认知心理学的常见工具,近年来得到了广泛的研究和应用[4-5]。 通常来说,美味可口的食物不仅让人心情愉悦,而且会在大脑中诱发出不同于一般食物的信号,促使大脑做出更进一步的选择,这些信号的产生可能与大脑的注意选择[6]、奖赏[7]和抑制控制[8]等功能有关。研究食物相关的脑电,更有利于了解大脑对食物的选择。
2019年,Nachie 等[9]发现,在观察食物图片时,食物偏好与大脑振荡节律存在关联。 与不喜欢的食物刺激相比,喜爱食物的视觉刺激表现出β 频带(13 ~25 Hz)的事件相关去同步化(event-related desynchronization,ERD)。 这一发现表明,个体的食物偏好与进食相关的大脑振荡活动相关。 2020年,Anoushiravan 等[10]研究了催眠提示对食物偏好的调控作用,并记录食物偏好改变前后的ERP 信号,希望通过催眠提示增加对蔬菜和水果的渴望,以诱导个体对低热量食物的偏好。 与催眠前相比,经过催眠引导后受试者对低热量食物图片的选择有所增加,ERP 波形上高热量食物和低热量食物之间的P1幅值差异被抵消,低热量食物引起的晚期正电位(late positive potential, LPP)幅值有所增加,表明脑电信号随着食物偏好的改变而改变。
尽管食物偏好与脑电信号的研究不少,但对于食物偏好脑电的分类研究尚少。 如果能将不同食物偏好所诱发的脑电信号进行特征提取并分类,那么利用脑电信号对食物偏好分类就会成为可能。以往的食物评价推荐系统大多数以问卷、量表等作为计算依据,是人的一种主观选择。 这种主观选择的局限性在于,人的精神状态易受多因素的干扰,如周围环境、生理状态等。 对于某些特殊人群,如不愿表达的厌食症患者来说,了解其食物偏好帮助改善其生活质量极为重要。 脑电作为一种电生理信号,更具客观性,据此,本研究研究不同食物偏好的脑电信号差异,并对采集到的两类脑电信号进行分类识别,期望根据脑电信号建立一种食物偏好的分类识别方法,为肥胖干预、厌食治疗或食物推荐等提供一定的指导和帮助。
1 材料与方法
1.1 实验参与者
实验共招募了20 名健康在校大学生参与实验,有2 名受试者因有效实验数据过少而被排除,最终收集到18 名受试者的脑电数据(5 女,13 男),年龄(24.05±1.00)岁。 受试者均为右利手,视力为正常视力或经过矫正后的视力,无心理障碍和神经疾病史。 本次实验通过了本校伦理委员会的审查,所有受试者在实验前均认真阅读了注意事项并签署了知情同意书。
1.2 实验设计
有研究指出,在饥饿状态下,个体对食物刺激的注意力得到增强[11],更有利于食物喜好的区分,故本实验时间段安排在11:00 ~12:00,所有受试者均要求实验开始前4 h 除了水,禁止进食其他食物。受试者到达实验室后,需要先对5 类常见食物(寿司、蛋糕、汉堡、披萨、火锅)进行1 ~10 的量表评分,每项的得分要求不同于其他项。 根据受试者的评分,挑选出分数最高者和最低者作为受试者喜爱程度高和喜爱程度低的食物。
实验采用经典的oddball 范式[12],靶刺激与非靶刺激的比例为1 ∶4,并用伪随机控制靶刺激不连续出现。 为了诱发得到不同的ERP 信号,每名受试者分别参加2 组oddball 实验完成脑电采集任务,其中一组实验的靶刺激与非靶刺激为喜爱程度高食物图片和汽车图片,另一组实验的靶刺激与非靶刺激为喜爱程度低食物图片和汽车图片,2 组不同靶刺激实验的先后顺序在受试者中进行了平衡。 在oddball 范式中,每个试次由500 ~700 ms 的十字注视中心、800 ms 的图片刺激和500 ms 的空白组成。为了提高受试者注意力,实验要求受试者看到靶刺激时立即进行按键反应,实验范式如图1 所示。
图1 实验范式设计(20%靶刺激,80%非靶刺激)Fig.1 Design of oddball task in this experiment(20%target stimuli, 80%non-target stimuli).
在一组oddball 实验中,每一类靶刺激均由13张不同的图片组成,每张出现4 次,实验时长约10 min,一组实验可收集到52 个试次的脑电数据,2组实验共收集到104 个单试次脑电数据。 实验中的图片为全彩图片,在亮度、对比度、尺寸和分辨率等图片相关属性上没有显著差异。 显示器采用1 920像素× 1 080 像素分辨率,60 Hz 刷新率的设置,受试者距离屏幕距离约60 cm,视角约为7° × 7° 。
1.3 脑电采集与统计分析
脑电采集设备使用美国商业设备Neuroscan,电极阵列参照国际10/20 电极系统进行布置。 采集脑电时候使用CZ 和CPZ 中间点位作为参考,接地电极位于前额,采样率设置为1 000 Hz,电极阻抗均在20 kΩ 以下。 随后使用Matlab R2014a 软件进行离线数据处理,脑电数据降采样到200 Hz,重参考到两侧乳突,进行0.1 ~30 Hz 带通滤波和50 Hz 陷波处理,提取刺激前200 ms 到刺激后800 ms 为一个试次数据,取前200 ms 平均值作为基线。 通过独立成分分析(independent component analysis, ICA)去掉眼电伪迹[13],同时剔除幅值过大的试次,每名受试者剔除的数据不超过总试次的5%。
有研究表明,食物刺激在顶区有较强的脑电响应[14],因此本研究选取枕区P3、PZ 和P4 导联进行研究,选择P1, P2, P3, LPP 作为脑电感兴趣成分。除了LPP 取平均值外,其他成分均取局部峰值,所选成分的具体时间窗和幅值定义如表1 所示。 在SPSS Statistics 22 软件环境下,使用配对t检验分析方法对两类食物刺激下各成分的幅值大小进行统计学分析。
表1 ERP 成分的选择Tab.1 Selection of time window and amplitude for each ERP component
1.4 特征提取
在脑电信号的特征提取上,共空间模式(common spatial pattern, CSP)常用于脑电信号的分类处理[15],例如左右手运动想象信号,并取得较好的分类效果。 本研究选取共空间模式作为特征提取方法。 共空间模式作为一种2 分类算法,其基本原理是利用矩阵的对角化,求解一组最优空间滤波器,将原始信号经过该滤波器进行投影,使两类信号的方差差异最大,得到具有较高区分度的特征向量。
对于收集到的2 类脑电数据H和L,设其样本个数分别为n1、n2。
首先,分别计算每一类脑电数据的平均协方差矩阵:
式中,trace( )表示计算矩阵的迹。
接着计算2 类信号的协方差矩阵之和R:
对矩阵R进行特征值分解,求解白化矩阵P:
式中,U是矩阵Λ的特征向量矩阵,Λ是对应的特征值构成的对角阵,且特征值为降序排列。
随后使用白化矩阵P对R1和R2进行变换,得到矩阵S1和S2:
对矩阵S1和S2进行特征值分解,可求解特征向量B:
式中,两矩阵分解得到的对角矩阵满足Λ1+Λ2=I。 由于两类矩阵的特征值相加总和为1,当S1有最大特征值时,另一个类别S2有最小的特征值,因此可以利用此特点解决分类问题,最后计算得到空间滤波器W:
本研究实验下的单试次脑电数据矩阵为xe×t,e代表导联数,t代表数据点数。 对空间滤波器矩阵W来说,显著的特征信息主要集中在头部和尾部[16],故取前m行和后m行( 2m≤e)作为特征提取矩阵W2m×e。 对于每一个原始数据xe×t,通过空间滤波器W2m×e进行投影,得到矩阵Z2m×t:
定义特征向量F为1×2m的向量:
式中,c =1,2,3,…,2m,zc表示矩阵Z2m×t的第c行,var( )表示计算方差。
1.5 分类识别
在小样本的2 分类问题上,支持向量机(support vector machines, SVM)拥有较好的表现,故本研究选取支持向量机作为特征提取后的分类识别算法[17]。 为了验证数据的可分性,本研究采用“留一法”对脑电数据进行交叉验证。 其中,“留一法”中的“一”,并非一般意义上的单试次数据,而是一簇数据。 理想状态下,每名受试者拥有两类脑电数据,由喜爱程度高的食物和喜爱程度低的食物诱发得到,而每一类的脑电数据由13 张同一类的图片,每张出现4 次诱发得到。 将一张图片出现4 次得到的实验数据称为一簇,相当于每名受试者有26 簇数据,每一簇数据里包含4 个单试次ERP 信号。 两类标签分别使用1 和-1 进行标记。
在分类识别阶段,将脑电数据分为训练集和测试集后,利用训练集求解空间滤波器W并训练分类器M,再将测试数据通过训练数据计算得到的空间滤波器W投影,提取特征,送入训练好的分类器M进行预测。 训练集的具体提取过程为:随机在每一簇中抽取s(s=1,2,3,4)个样本,取0 ~800 ms 的ERP 数据,将抽取出来的数据当做新数据集,在该数据集上进行分类识别,并使用“留一簇法”进行交叉验证。 记highi和lowi分别为第i个样本通过分类模型后两类标签的决策值,使用决策值加权求和的方法求该簇的总识别标签label:
这样做的好处在于能更充分地利用标签决策值的权重,减少随机预测的发生。 实际上,两类标签决策值之和相等情况极少出现,若出现该种情况,则将该簇预测标签记为0,表示识别结果错误,其余情况下取加权和较大者为该簇的标签识别结果。 将簇预测结果与真实标签对比计算正确率,得到该次抽取下26 簇脑电的分类正确率。 每种抽取方法下,重复抽取50 次计算分类识别正确率,取50次平均的结果。 使用配对t检验分析方法对CSP +SVM 和SVM 分类得到的正确率进行统计学分析。
2 结果
2.1 ERP 结果
图2 显示的是18 名受试者在P3、PZ 和P4 电极上的平均ERP 波形,表2 显示的是ERP 各成分的幅值结果。 配对t检验结果表明,不同喜爱程度的食物刺激引起的脑电响应在晚期成分P3 振幅上存在显著性差异(P=0.033),而P1、P2 和LPP 的幅值差异无统计学意义。
结合图2 和表2 结果,从平均振幅上看,受试喜爱程度高食物图片所诱发的P3 幅值较大(16.74±5.85)μV,比喜爱程度低食物图片诱发的P3 幅值(14.67±4.37)μV 显著升高。 可以看到,食物偏好的脑电响应差异主要表现为内源性差异,即体现在与神经认知加工相关的P3 成分上,表明大脑在受到喜爱程度高的食物刺激时,反应更为强烈,P3 幅值的显著性差异初步证明了食物偏好在脑电反应上存在差异。 P1 作为ERP 早期成分,主要与外界刺激直接相关,同时也是一种外源性成分,近年来在食物相关认知领域也受到广泛关注[14]。 P1 虽在两类刺激上无统计学意义,但平均振幅差异较大,喜爱程度高食物的P1 振幅(3.44±3.51 )μV 大于喜爱程度低食物的P1 振幅(1.16±2.59)μV。 这一差异表明个体受到喜爱食物的刺激时,有强烈的早期反应,P1 的这些差异可能与食物的渴望、奖赏机制存在关联[18-19]。
图2 P3, PZ 和P4 电极的平均ERP 波形Fig.2 The grand average ERP of region of interest (P3, PZ and P4)
表2 ERP 各成分幅值结果比较Tab.2 Experimental result of ERP component
图3 为P1,P2,P3 成分达到峰值时候的平均脑地形图。 相比于其他区域,食物视觉刺激下的脑电响应主要集中在顶区和枕区,ERP 各成分信号在枕区都表现出较大值,表现出一定的空间特征。 在枕区的多数电极上,喜爱程度高的食物诱发的P1 和P3 更大,P2 则无明显差异,这说明大脑在接收到食物图片刺激后,于枕区有一个早期和晚期的神经加工差异。
图3 P1,P2,P3 脑地形图Fig.3 Scalp topographical maps of the peaks of P1, P2 and P3
2.2 相关分析结果
图4 为喜爱程度高、低食物的得分差异与P3 幅值差异之间的皮尔森相关系数r,此时取的P3 峰值为全脑P3 峰值的平均值。 从结果上看,食物评价得分差与P3 幅值差之间存在正相关(r=0.59,P=0.011),个体对食物喜爱程度评分差越大,两种刺激诱发的P3 幅值差异也越大,说明个体对食物的喜好评分与P3 幅值存在正相关。 该散点图的结果从另一个角度证明了食物偏好与脑电之间存在关联。
图4 食物偏好得分差与P3 幅值差的相关性Fig.4 Scatterplots representing correlations betweentheP3differencesandfood scores differences
2.3 分类识别结果
18 名受试者CSP +SVM 分类和SVM 分类的平均正确率变化如图5 所示,表3 为具体的分类结果。当s=1 时,相当于进行单试次分类,CSP+SVM 分类正确率为72.84%±12.99%,SVM 分类正确率为61.39%±8.43%,单试次脑电2 分类的正确率较低,这是因为单试次脑电的背景噪音非常大,极易受到多种因素的干扰,其包含的信息大部分是无意义的,在这种条件下难以进行信号的区分,两者分类效果稍强于随机水平。 随着s的增大,信息量有所提升,CSP+SVM 和SVM 分类的平均正确率均单调上升,且CSP +SVM 分类结果一直优于直接进行SVM 分类的结果。 当s=4 时,两种方法的分类正确率达到最高,CSP +SVM 分类的正确率达到了93.16%±8.93%,SVM 单独分类正确率达到了79.49%±11.82%。
图5 CSP +SVM 和SVM 分类结果对比(*表示P<0.05,**表示P<0.001)Fig.5 Comparison of classification results between CSP+SVM and SVM(*: P<0.05,**: P<0.001)
表3 CSP+SVM 和SVM 分类的平均正确率Tab.3 Classification result of CSP+SVM and SVM
对比两种分类方法的结果发现,经过CSP 特征提取后的脑电数据在s=1 时分类效果就已经强于直接SVM 分类的结果,且随着每一簇挑选样本数量s的提高,CSP +SVM 的平均正确率逐步提高,标准差逐渐变小。 在4 种s条件下,CSP+SVM 的分类效果均优于直接SVM 分类,具有统计学意义。 结合表3 的结果从标准差的角度上看,虽然s=1 时CSP +SVM 标准差大于SVM,但在s >1 情况下,CSP +SVM 标准差均小于SVM,说明各受试者正确率分布更为集中,CSP+SVM 方法有更好的适用性。 以上结果表明,CSP 特征提取方法有效提高了食物偏好脑电的分类正确率,CSP 与SVM 相结合的方法可对食物偏好脑电进行有效的分类。
3 讨论
本研究通过oddball 实验对比了18 名健康受试者在面对喜爱程度高和喜爱程度低食物时所诱发的ERP 波形差异,并进行了分类识别研究。 结果表明:喜爱程度高的食物会诱发更大的P1 和P3 幅值,CSP+SVM 分类算法在融合4 个ERP 决策值情况下取得了93.16%的平均分类正确率。 P1 作为ERP 的早期响应,一般在刺激后约80 ~160 ms 内达到峰值,与刺激物理属性相关。 本研究实验中的刺激类型为视觉刺激,且刺激素材为常见食物,受试者一般能在极短的时间内分辨出所呈现的图片刺激为何种食物。 本研究研究发现,喜爱程度越高的食物诱发了更大的P1 幅值,P1 振幅的差异表明,个体对食物的喜好差异在受到食物刺激后较快地体现在P1 成分上,表明P1 可能与食物的早期选择相关。 Qiu 等人[20]研究消费者对不同口味捆绑促销酸奶束的脑电响应中,发现喜爱程度高的捆绑促销酸奶束诱发出更大的P1 振幅,与本研究一致。 这种反应变化出现得极早,受情绪等其他认知加工的影响较少,是大脑自动加工外界信息的体现,P1 这一特征或许可作为食物早期选择的标志。 P3 作为晚期成分的代表,一般于刺激后300 ~500 ms 内达到峰值,是一种内源性成分[21]。 多数实验均证明P3 与高级神经认知加工相关,相比于ERP 的其他成分,更能反映个体的心理认知变化。 本研究研究发现,喜爱程度越高的食物,诱发的P3 幅值越大,这与现实中个体受到极其喜爱食物刺激时,情绪激动、心理反应强烈的现象吻合。 P1 和P3 这两个成分从早期和晚期两个角度体现了食物偏好的不同,可能是个体食物偏好差异的重要特征,将是未来食物推荐、健康干预相关研究的方向。
此外,CSP+SVM 的脑电分类结果表明了不同喜爱程度食物诱发的脑电信号在该种方法下具有较好的可分性,较高的分类正确率既说明了食物偏好脑电存在一定差异,也说明了脑电作为新的食物分析工具的可能,表明脑电在食物喜好倾向预测上具有很大的应用潜力,本研究提出的CSP +SVM 分类方法可为未来的食物偏好研究提供一定的借鉴和参考意义。 从分类结果来看,分类准确率仍有很大的上升空间,如何更准确地解读受试者诱发的食物相关的脑电信号,仍是未来的研究热点。
同时,本研究仍然存在一定的局限性。 首先,食物刺激素材在部分受试者中并非具有真正意义上的显著喜好差异,所选的两类食物刺激不能代表每一位受试者的普遍喜好差异,两类食物刺激的结果具有局限性。 其次,对于ERP 成分与食物喜好程度的关系尚处于初步探究阶段,本研究主要讨论了常见的P1、P2、P3 和LPP 幅值,未对潜伏期及其他指标进行更细致的深入研究,食物偏好的脑电特征具有局限性。 最后,分类识别结果目前处于离线阶段,缺乏进一步的验证性实验,下一步研究计划为进行在线实验,验证该方法的有效性。
4 结论
本研究使用事件相关电位技术探究不同食物偏好脑电的信号差异,证明了健康个体食物偏好与脑电存在关联,主要表现为喜爱程度高的食物刺激可引起更大的P3 幅值,研究结果表明脑电信号可作为一种新的食物偏好的分析工具。 同时使用CSP+SVM 方法完成了两类食物刺激脑电信号的分类识别,达到了93.16%±8.93%的分类正确率,取得了较好的分类结果。 本研究的分类识别方法可为健康饮食干预、食物推荐、厌食症辅助治疗等提供新的解决思路。