APP下载

基于眼动和脑电的疲劳特征的性别差异

2023-05-08徐军莉

电脑知识与技术 2023年9期

徐军莉

关键词:性别差异性; 眼动和脑电信号; 驾驶疲劳; 疲劳特征;性别识别

0 引言

疲劳驾驶是引发车祸的主要因素之一[1]。因此,为了降低因疲劳引发的交通事故,很多研究者通过各种方法对驾驶疲劳进行检测[2-3],其中眼动特征和脑电特征都是疲劳检测的有效手段。牛清宁等人[4]采用眨眼频率、Perclos(Percentage of Eyelid Closure)、注视方向和注视时间作为疲劳特征进行检测。刘志强等人[5]采用Perclos、眼睛焦点的位置作为疲劳特征。Hu, J等人[6]用脑电信号的熵特征进行了疲劳检测。此外,也有研究者结合眼动信号和脑电信号两者的优势,将眼动特征和脑电特征进行融合作为混合疲劳特征。姚娟娟等人[7]基于前额单通道的脑电信号和脑电信号中的眼电信号特征来检测疲劳状态,其疲劳识别率达到了93.10%。Chi Zhang等人[8]采用脑电图、肌电图和眼图信号,利用各种熵的峰值来检测驾驶员的疲劳,准确率为96.5%~99.5%。本文作者将脑电特征与眼动的扫视长度作为融合特征进行疲劳检测,检测率也可达92.32%[9]。这些研究都表明眼动和脑电的混合疲劳特征能有效对驾驶疲劳进行检测。

驾驶疲劳是一个复杂的生理现象,在相同的驾驶环境下,男女驾驶员产生疲劳的过程会有所不同。据何扬研究发现,女性驾驶员的疲劳状态随着驾驶时间延长而缓慢增加;男性驾驶员可能在驾驶过程中保持长时间的兴奋状态,但是当他们感到疲劳时,疲劳感会来得急剧而强烈[10]。由于男女驾驶员产生疲劳的过程存在差异,那么这种差异性是否会导致采用的疲劳特征也存在性别差异呢?目前这方面的研究较少。目前,只有以脑电信号为研究内容,研究脑电信号中是否存在性别差异性的相关研究。例如有研究者发现相同模式下采集的脑电信号具有显著的男女性别差异。VOLF等人[11]在研究男女脑电图时发现,在脑电功率和左右半球的一致性反应上是存在性别差异的。徐桂芝等人[12]利用静息状态脑电信号为工具,分析男性和女性在功能性脑网络特征上的差异性,结果显示在聚集系数、最短路径、度和全局效能上男女特征均存在较大的差异性。穆振东等人[13]也指出在驾驶过程中,采用脑电特征进行检测,在识别率上、聚集系数和度特征上,均显示出男性和女性之间是有显著性差异的。那么对于其他常用的疲劳检测信号特征,例如眼动特征、脑电与眼动的混合特征等,它们是否也會存在显著性别差异?如果这些疲劳特征存在显著性别差异,是否可以将其作为性别特征建立模型进行男女驾驶员性别鉴别呢?

为了验证这些问题,本文分别采用了4个眼动特征、3个脑电特征以及4个眼动与脑电的混合特征来进行疲劳检测。先从这11个特征中筛选出检测稳定的疲劳特征,然后分析这些疲劳特征是否存在显著性别差异;如果存在具有显著性别差异的特征,则以这些特征建立模型对男女驾驶员进行性别识别,分析其识别效果。

1 疲劳驾驶实验

1.1 实验模式

实验中选取了30名年龄在19~21岁的在校大学生(男生20名、女生10名)作为受试者。受试者坐在一间屏蔽室中,通过实物方向盘操控前方电脑中的模拟驾驶过程。整个实验分为清醒驾驶和疲劳驾驶2个阶段进行,实验时间选择下午。受试者试驾5分钟后,实验员开始采集受试者的眼动和脑电数据。采集时间为60分钟。将实验开始采集数据后的10分钟的数据定义为清醒状态数据,实验结束前10分钟数据定义为疲劳状态数据。实验过程中,具体实验平台、设备以及脑电电极分布如图1所示。

受试者戴着脑电设备和眼动设备来同步采集脑电和眼动信号。眼球追踪仪负责采集眼动信号,配套的D-lab软件则负责对眼动信号进行预处理,D-lab软件的采样频率设置为25 Hz;Neuroscan公司的32导联脑电电极帽负责获取受试者的脑电信号,scan4.3软件负责收集脑电信号并对脑电信号进行预处理,电极帽采样频率为1 000 Hz。

采集30例实验者的数据后,由于采集到的实验样本中有部分样本数据存在一定缺失值,本文只采用了16例受试者的样本数据(其中男女各8名),共320个样本。其中240个作为训练样本,80个作为测试样本。这16例样本数据将用于疲劳检测模型和性别识别模型。

1.2 疲劳特征的选取

对于眼动数据,本文选取了清醒状态和疲劳状态有明显差异性的4个疲劳特征,分别为眼睑闭合的百分比Perclos,扫视长度s_len,瞳孔面积e_area及眨眼时间均值t_zy。对于脑电数据,参考MU Zhendong等人[14]采用的疲劳特征,本文利用小波熵函数提取受试者脑电疲劳特征,然后分别抽取Fp1、Fp2两个电极的脑电疲劳特征(简称2导)和T5、TP7、TP8、FP1四个电极的脑电疲劳特征(简称4导)。此外,根据作者前期的研究结果[9],本文将从脑电极中的10个电极(CP4、TP8、T5、P3、Pz、P4、T6、O1、Oz、O2)(简称10导)上提取的脑电特征作为疲劳特征。作者前期研究发现,采用10导作为疲劳特征进行疲劳检测效果比2导、4导更好,因此,本文采用眼动特征和10导的混合特征,分别为perclos+10 导(简称p_10)、s_len+10 导(简称s_len_10) ,e_area+10导(简称e_area_10) 及t_zy+10导(简称t_zy_10) 。具体选取的疲劳特征如表1所示。

2 方法

为了分析在驾驶环境下基于眼动和脑电的疲劳特征是否存在显著性别差异性,本文采用KNN(KNearestNeighbor) 分类算法,分别采用眼动特征、脑电特征以及眼动与脑电的混合特征来进行疲劳检测。首先分析疲劳检测中这些疲劳特征是否存在显著性别差异。如果存在部分疲劳特征有显著性别差异,则将它们指定为性别识别特征;再采用KNN算法建立基于性别识别特征的性别识别模型,对男女驾驶员进行性别识别。具体实现流程如图2所示。

在建立检测模型时,本文都采用了KNN 算法。KNN法是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。KNN算法的核心思想是:如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。KNN分类算法包括以下4个步骤:

①准备数据,对数据进行预处理。

②计算测试样本点到其他每个样本点的距离。

③对每个距离进行排序,然后选择出距离最小的K个点。

④对K 个点所属的类别进行比较,根据少数服从多数的原则,将测试样本点归入在K 个点中占比最高的那一类。

其中点距离常采用的是欧式距离,欧式距离的计算公式为:

而K 值的选取则通过交叉验证,从选取一个较小的K 值开始,不断增加K 的值,然后计算验证集合的方差,最终找到一个比较合适的K 值。

3 结果分析

3.1 比较不同疲劳检测模型对男生和女生检测的稳定性

为了判断疲劳检测模型对所有男生(女生)的检测率变化程度,本文采用了变异系数指标(变异系数=标准差/均值)。如果变异系数小,则检测模型具有较高稳定性;反之,则模型具有较低稳定性。一般情况下,在进行数据统计分析时,如果变异系数小于0.1,说明一组数据具有弱变异性。本文计算出男生和女生采用不同疲劳检测模型的检测率变异系数,结果如表2所示。

从表2中可以看出,对于男生来说,当疲劳特征分别为e_area,s_len_10,t_zy_10时建立的检测模型,其检测率的变异系数小于0.1,则检测模型对男生的检测率相对来说较为稳定。而对于女生而言,当疲劳特征分别为10导,s_len_10,e_area_10时建立的检测模型,其检测率的变异系数小于0.1,则检测模型对女生的检测率相对来说较为稳定。

3.2 不同疲劳特征的性别差异性比较

在考虑模型稳定性的基础上,图3列出了分别基于e_area、s_len_10、t_zy_10、10 导、e_area_10 疲劳特征的检测模型对男生和女生的检测率均值。

从图3可以看出,男生和女生相同的是:除了采用e_area特征的检测模型检测率低于70%外,采用其他4个疲劳特征建立的模型检测率都较高。并且女生的平均检测率普遍大于男生的平均检测率。这是由于在驾驶过程中,男性驾驶员的抗疲劳能力要强于女性驾驶员,女性驾驶员的疲劳状态随着驾驶时间延长而缓慢增加,疲劳特征较明显;男性驾驶员则能在驾驶过程保持长的兴奋状态,疲劳特征不明显。为了判断这5个疲劳特征是否具有显著的性别差异,本文将基于这5个疲劳特征的模型进行检测的男生组和女生组检测率两组数据进行T检验。当采用e_area_10作为疲劳特征时,男生和女生的检测率两组数T 检验的p值为0.039<0.05,表明男生和女生组检测率存在显著差异;而采用其他疲劳特征时,T 检验的p 值都大于0.05,由此判断,e_area_10特征是存在顯著性别差异的,而其他疲劳特征都不存在显著性别差异。

3.3 以e_area_10 为特征建立性别识别模型进行性别识别

由于e_area_10特征是存在显著性别差异的,因此,本文将e_area_10作为性别识别特征,采用KNN算法建立基于e_area_10的性别检测模型。通过该检测模型来识别样本数据的性别。实验样本数据为16例受试者的样本数据(其中男女各8名),共320个样本。其中240个作为训练样本,80个作为测试样本。为了评估模型的预测性能,获取KNN模型的最佳k 参数,本文采用了5折交叉验证。不同k 值对应的模型检测率结果如图4所示。从图4可以看出,当k=3时,模型的识别率最高,为85.13%。这表明基于e_area_10 的性别检测模型能有效识别受试者的性别。

性别识别技术主要包括通过说话人的声音特征、人脸特征、步态特征等来进行性别识别。这些技术研究成果也较丰富。刘遵雄和马汝成提出使用特征脸和最小二乘支持向量机分类器相结合的人脸性别分类方法,分类准确率为94.75%[16]。张德等人则采用局部熵描述子对步态运动历史图像进行信息提取,利用该特征在CASIA B 步态数据库上进行性别分类实验[17]。邱晨等人通过提取多音频特征,使用支持向量机对音频信号进行分类来识别性别,该方法的识别率也可以达到96.1%以上[18]。其中人脸作为性别识别技术的主要特征,研究者对它的研究也是非常多,研究者为了提高基于人脸特征的性别模型的识别率,在模型中尝试了很多分类器,包括KNN、SVM、BP和Ada⁃Boost等。本文将通过e_area_10特征进行性别识别的结果与以往研究者以人脸为特征,采用单个分类算法进行性别识别的结果进行对比,比较结果如表3所示。从表3可以看出,本文采用KNN算法,以e_area_10为特征的识别结果与人脸识别中采用SVM算法的识别结果类似,说明取得了较好的识别效果。

4 结论

为了研究疲劳检测采用的疲劳特征是否存在性别差异以及是否能使用这些具有性别差异性的疲劳特征进行性别识别,本文利用具有性别差异性的e_area_10特征作为性别识别特征,采用KNN算法建立了基于e_area_10的性别检测模型对驾驶员进行性别鉴别。本文得出的主要结论包括:

1) 采用了眼动特征、脑电特征以及眼动与脑电的混合特征来进行疲劳检测,分析出只有混合特征e_area_10存在显著性别差异,其他特征都不存在显著性别差异。

2) 建立了基于e_area_10的性别识别模型对男女驾驶员进行性别识别。当k 取3时,识别模型的识别准确率最高,为85.13%。说明基于e_area_10的性别识别模型能有效识别男女。为了验证这个结论是否在样本数更多的情况下也成立,后期笔者将进一步加大实验样本来验证本文实验结论。

同时,这一结论也存在一些不足之处。由于实验是在模拟驾驶环境下进行的,受测试样本数量等实验条件的限制,测试结果与实际情况存在一定的偏差。为了进一步提高模型的识别精度,本文作者将进一步采用其他分类算法对模型进行改进。