隐秘信息的脑电检测
2019-06-25官金安段亚峰徐世行李东阁印想彭翰林潘先攀
官金安, 段亚峰, 徐世行, 李东阁,印想, 彭翰林, 潘先攀
(1中南民族大学 生物医学工程学院,认知科学国家民委重点实验室,武汉430074;2中南民族大学 医学信息分析及肿瘤诊疗湖北省重点实验室,武汉430074)
认知脑电位反应了大脑的信息认知处理过程,不因受试者外在表现而改变,此特征可用来对受试者的真实隐秘信息进行揭示[1].本文设计了一个心理生理学实验,在蕴藏受试者真实名字和陌生名字的系列刺激中,观察受试者在无意识状态下接触到真实名字的脑电反应,并通过脑电分类出受试者的真实名字.该实验方案可应用于刑侦场景,辅助相关人员寻找潜在逃犯;或进行拓展,将真实名字更换为受试者关注的对象,在制作成心理测验软件,检测受试对象最在意的应用场景等.
学者对基于脑电的心理真实信息揭示的研究表明,个体应对视觉刺激时,与自我相关程度高的刺激,较与自我相关程度低的刺激,所诱发的事件相关电位(ERP)更加突出[2-4];但上述研究仅探讨了隐秘信息揭示存在的事件相关电位现象,却未进行分类[5-7].
为拓展上述模式,本文设计了猜测受试者真实名字的实验模式,并进行实时分类.通过对5名健康受试者的脑电信号分别进行小波去噪提取特征,采用支持向量机对不同特征信号进行训练和分类,探讨了不同试次数叠加及小波分解层数对分类正确率的影响.
1 实验模式及数据获取
1.1 实验模式
本实验基于oddball模式进行改进,实验前准备7幅带有名字字符的图片,其中1幅包含受试者自身名字的图片,其他6幅包含受试者不熟悉的陌生名字(在互联网中随机记录下的名字).每个试次在屏幕上同一位置依次随机显示7幅图片.其中每幅图片显示时间为500 ms,消失时间为500 ms,消失期间显示一张底色为白色的空白图片.在每个试次结束时给予受试者2 s休息时间,在休息时间内允许被试眨眼休息,非休息时间内告诫被试尽量不要眨眼,避免眨眼带来强烈的眼电干扰.每个试次均对脑电信号进行采集,记录时长为7s.
针对刺激图片可分为两类刺激:陌生名字刺激(自我相关程度低)和自身名字刺激(自我相关程度高).刺激图片如图1所示,图片大小为326*267像素,底色为白色,字符颜色为黑色,电脑屏幕设置为黑色背景.名字1为受试者自身的名字,名字2为6个陌生名字,一组实验包含18个试次,每个试次中7张图片出现的顺序随机打乱.实验中要求受试者注意力保持高度集中,认真观看不同的刺激图片,以研究当受试者面对陌生名字刺激时,无意中看到自己名字的脑电反应.
图1 两类不同的刺激示意图Fig.1 Two different kinds of stimulus pictures
1.2 数据获取
本实验采用八通道脑电采集装置记录数据,采样频率为1000 Hz,采集了5名健康受试者在上述实验模式下的脑电信号,即每幅图片单个通道采样点数为1000点,单个试次共记录7000点.数据的存储格式为:通道数X通道采样点数X实验试次数.采集的脑电信号易受到工频信号及被试自身的肌电等噪声干扰,为了提高脑电信号信噪比,对脑电信号进行了预处理,包括:去基线、小波去噪及归一化.
2 研究方法
2.1 特征提取
各种干扰信号及自发脑电信号易将事件相关电位信号淹没在噪声中,须予以去除.本文采用小波分解进行低通滤波,由于db4小波与ERP脑电信号波形相似,故采用db4小波作为母小波进行小波分解[8].数据采样率为1000 Hz,信号最大分解频率为500 Hz.例如将脑电信号f(t)划分为f(t)=An+Dn+…+D1个频段,Dn是每个频段的细节信号(高频信号),An是对应的近似信号(低频信号)[9,10].分别对脑电信号按4, 5, 6, 7层进行小波分解,并提取对应最低频段信号A4, A5, A6, A7作为特征信号,其对应频段分别为0~31, 0~16, 0~8, 0~4 Hz.
为了观察小波去噪效果,以6层分解为例,对单试次中两类信号各自进行小波分解,提取第6层信号并进行对比,结果如图2所示.图2为取某被试单试次中两类信号,进行小波去噪前后对比,其中own-source代表自己的名字原始信号,own-wd代表自己的名字利用小波去噪后的滤波信号,同理strange-source代表陌生名字原始信号,strange-wd代表滤波信号.由图2可知,对比滤波前后,利用小波分解后的第6层信号,可滤除不必要的高频信号噪声,还原出信噪比较高的脑电信号.
实验中将第一类刺激(与自我相关程度高,即自己的名字)作为靶刺激,第二类刺激(自我相关程度低,即陌生的名字)作为非靶刺激.图3是100个试次叠加平均后,将7个名字特征波形绘制在一起,own代表自己的名字诱发的波形,strange1~ strange6分别代表其他6个陌生名字诱发的波形. 由图3可知:在300~600 ms内,自己的名字诱发的波形幅值大于陌生名字诱发的波形幅值,且其他6个陌生名字诱发的波形基本相似.因此,选取每幅图片刺激后的300~600 ms时域信号作为分类器的特征向量.
2.2 分类方法
离线分类时采用模式识别中经典的支持向量机(SVM)算法.运用libsvm工具包,选用带有松弛变量的C-SVM模型,核函数选用RBF函数,通过网格搜索对参数C和γ进行寻优(C=[2-10,2-9,…,29,210],γ=[2-10,2-9,…,29,210]).先选取总样本数的4/5为训练集,剩下的1/5为测试集;再对训练集使用五折交叉验证,找出最优分类器模型;最后用该模型来对测试集数据进行测试[11].
图2 小波去噪信号前后对比Fig.2 Signal comparison before and after wavelet denoising
图3 PO3通道下7个名字特征对比Fig.3 PO3 channel, features of seven names
3 结果和分析
实验共采集了5名受试者共450个试次数据,剔除因基线漂移过大波形严重失真的试次,最后得到360个有效试次数据.
实验仅采用了单通道数据作为特征信号,在叠加4试次下对7通道各自进行分类,研究了不同小波分解频段对分类正确率的影响,如图4所示. 由图4可知:A4频段信号在各通道分类效果上表现最佳,其中PO3, Oz, PO4分类正确率达92%以上;A3频段信号分类效果最差,A4达到最佳,随着分解层数增加,由A4到A7分类效果逐渐下降.
图4 叠加4试次下各通道不同小波分解层数的分类正确率Fig.4 Classification accuracy of different wavelet decomposition layers for each channel under 4 superposition
图4中当分解层数过低时,分类效果较差,表明引入的高频噪声严重污染了ERP信号;而分解层数过高时,频率带选取变窄,易将特征信号滤除,造成特征丢失.A4频段信号分类效果最佳,意味着信号的特征集中分布在0~31Hz. PO3, Oz, PO4相较于其他通道分类效果较好,由于它们分布在大脑枕部及枕颞部,而大脑的初级视皮层及运动感知区域集中在此区域,与先前的研究相符[12,13].
鉴于PO3,Oz, PO4通道在分解4层后分类效果较佳,研究不同试次数叠加对分类效果的影响,结果如图5所示. 由图5可知:随着叠加试次数增加,分类正确率逐步提升;进行4次叠加平均后,PO3, Oz, PO4通道分类正确率达92%;当进行5次叠加平均后,分类效果则非常显著;当叠加次数达8次,PO3,Oz, PO4通道能够完全分类成功.
图5 不同试次叠加下的PO3通道A4信号分类正确率Fig.5 Classification accuracy of PO3 channel A4 signal under superposition of different samples
4 结语
根据心理学关于自我相关程度的研究,设计了猜测受试者真实名字的实验,发现自身名字诱发的波形较陌生的名字幅值更大.在该实验模式下,采集了5名被试脑电信号,利用小波分解提取第4层低频信号,用SVM进行分类,5个试次叠加平均后,PO3, Oz, PO4通道分类正确率可达97%.说明基于脑电的隐秘信息的检测可行,可广泛应用于刑侦等领域.