基于正则极限学习机的驾驶员疲劳状态分类方法
2020-12-01李冰陈龙
李冰 陈龙
摘 要:为避免接触式疲劳检测方法给驾驶员带来干扰,解决单一信号源对于反映疲劳程度可靠性低的问题,实现对疲劳状态高精度、高速度的检测,提出一种基于正则极限学习机的驾驶员疲劳状态分类方法。该方法通过多普勒雷达模块采集驾驶员生理信号,包括呼吸信号和心跳信号,作为神经网络输入数据。通过多源信息结合的方式提高疲劳状态检测可靠性。设计正则极限学习机(RELM)模型对数据集进行训练。实验结果显示,基于RELM算法模型检测驾驶员疲劳状态的准确率达92%。RELM算法可实现对训练数据的快速计算和学习,同时通过特征变换消除个体差异,实现对驾驶员疲劳状态较高的检测率。
关键词:疲劳驾驶状态分类;多普勒雷达;多源信息;正则极限学习机
DOI:10. 11907/rjdk. 201209
中图分类号:TP301文献标识码:A 文章编号:1672-7800(2020)010-0121-04
Abstract:In order to effectively solve the problems of interference caused by the contact fatigue detection method to the driver and the low reliability of a single signal source to reflect the fatigue level, and to achieve high-precision and high-speed detection of fatigue status,this paper proposes a driver fatigue classification method based on regularized extreme learning machine. This method uses the Doppler radar module to collect the drivers physiological signals, including breathing signals and heartbeat signals, as input data of the neural network.In this paper, the reliability of fatigue state detection is improved by combining multiple sources of information.A regular extreme learning machine (RELM) is designed to train the dataset. The experimental results show that the accuracy of detecting the fatigue state of the driver based on the RELM algorithm model reaches 92%. The RELM algorithm can realize fast calculation and learning of training data, and at the same time, the method of eliminating individual differences through feature transformation can achieve a higher detection rate of driver fatigue.
Key Words: fatigue driving; Doppler radar;multi-source information; RELM
0 引言
近年来,随着汽车等交通工具的普及,交通事故发生率越来越高。其中驾驶员疲劳驾驶是引发交通事故的主因。疲劳驾驶指驾驶在长时间连续驾车后,生理机能进入失调状态,从而影响正常驾驶[1]。目前对于疲劳驾驶的检测方法多为单一信号检测,常用检测方法主要包括:①基于驾驶员生理信号的检测。该方法主要通过检测不同疲劳状态下人体脑电信号、心电信号或呼吸信号等出现的变化,判别驾驶员疲劳状态。该方法需在驾驶员体表安装相应检测装置,这会影响驾驶员安全驾驶,可行性较低;②基于驾驶员面部表情特征的检测,该方法通过视频监测驾驶员面部表情特征,如眨眼、打哈欠等动作,并运用图像处理等方法提取分析数据以判断驾驶员疲劳状态。该方法受驾驶员佩戴口罩、眼镜等行为的影响较大,疲劳检测准确度会随之降低。针对目前疲劳驾驶检测方法存在的问题,本文采用多源信息结合的方式,将多种检测方法的优势结合到一起,提高疲劳驾驶检测可行性和准确性。具体思路是通过一种车载装置实现驾驶员生理信号非接触式检测,采用摄像头采集与生理信号同步的驾驶员面部视频信号,通过专家评判方法对视频信号进行疲劳等级评判,进而确定同步的生理信号疲劳等级,并设计神经网络算法模型提取生理信号特征,进行疲劳等级分类,确定驾驶员疲劳状态。该方法在实现驾驶员生理信号非接触采集的同时,增加驾驶员面部表情特征分析,并通过神经网络充分提取生理信号特征,可大幅提高疲劳检测科学性和准确性。
本文首先介绍基于多普勒雷达的驾驶员生理信号采集平台[2],通过該平台可实现驾驶员生理信号非接触式采集,克服传统接触式采集生理信号对驾驶员造成的干扰。本文将疲劳等级划分为4类,分别是清醒状态、I级疲劳(轻度疲劳)状态、II级疲劳(中度疲劳)状态和III疲劳(重度疲劳)状态[3],采用神经网络算法对数据进行特征提取及模型训练。由于普通的神经网络模型网络结构复杂,计算量普遍较大,无法满足本文对数据快速计算的需求,因此构建RELM(正则化极限学习机)网络模型以实现对驾驶员疲劳状态高精度、高速度检测。
1 基于多普勒雷达的非接触式生理信号采集平台
本文实验平台是以微波多普勒雷达探测器探头传感器HB100模块[4]为核心的生理信号采集平台。如图1所示,该平台主要由模拟驾驶器及模拟驾驶环境重现系统、监控系统、多普勒雷达系统3部分构成。多普勒雷达系统以微波多普勒雷达探测器探头传感器HB100模块为核心,用于采集驾驶员生理信号。雷达信号包括人体呼吸信号、心跳信号等生理信号及噪声信号。生理信号需从雷达信号中分离出来。
生理信号采集实验平台搭建完成并通过调试后,需安排实验人员进行生理信号采集。获得由雷达信号和视频信号组成的数据集。本文采用面部专家评分方法[5]对视频信号进行分类,分类标准如表1所示。将疲劳等级划分为4个等级,分别是清醒状态、I级疲劳状态、II级疲劳状态、III级疲劳状态。
制定疲劳等级划分标准后,采用面部专家评分方法对信号进行疲劳等级分类,再提取雷达信号特征。信号幅值和周期可准确表达正弦信号特征。因此,利用滤波器将生理信号滤波分离,得到呼吸信号和心跳信号,并通过离散傅里叶变化得到其频谱特性图,分别提取呼吸信号与心跳信号幅值及周期。
大量数据表明,对于呼吸信号,在不同疲劳状态下呼吸幅值和呼吸周期均有较明显变化;而对于心跳信号,在不同疲劳状态下,心率有较明显变化,但由于心跳信号幅值非常小,对于不同疲劳状态下几乎没有变化。因此,本实验忽略心跳信号幅值,只保留呼吸信号幅值[BA]、呼吸信号周期[BT]以及心跳信号周期[HT]3个特征。确定特征值之后,需整合所有特征值数据,建立驾驶员生理信号数据集,将其命名为DOPS(Drivers Original Physiological Signal)数据集。
2 模型构建与实验
极限学习机(Extreme Learning Machine,ELM)是黄光斌教授[6]提出的一种求解单隐层神经网络算法。ELM算法针对反向传播算法计算复杂性进行改进,以达到提升学习效率和简化参数迭代的目的。
2.1 极限学习机算法模型
极限学习机采用单层前馈神经网络(Single Layer Feedforward Neuron Network,SLFN)结构[7]。极限学习机网络结构由输入层、单隐藏层以及输出层3部分组成。网络结构如图2所示。
ELM网络模型突出优势是对反向传播算法[8]的改进,具体方法是随机设定隐藏层输入节点权重,并且在网络训练过程中无需更新,学习过程只涉及隐藏层输出层权值。对于ELM神经网络(见图2),输入样本总数为[m],输入数据为[X],网络输出为[O],隐藏层激活项为[H],隐藏层输入权重矩阵为[ω],隐藏层输出权重矩阵为[β],激活函数为Sigmoid函数,[b]为阈值。激活项[H]计算方程为:
单隐含层神经网络学习目标是使输出误差最小,即让模型适当拟合目标输出,可表示为:
其中,[n]表示特征值数量,[m]表示样本总数。[T]为期望输出矩阵。则存在[β]、[ω]、[b],使得:
通常情况下,隐藏层神经元个数远小于训练集样本数量,此时矩阵[H]不可逆。要求解隐藏层输出矩阵[β],只能求解使损失函数最小解[β]。
其中,[H?]为隐含层激活项[H]的Moore-Penrose广义逆,简称伪逆[9]。[H?]的求解方法为:
传统极限学习机存在不适定问题[10],即当输入矩阵[X]不是列满秩或某些列之间存在很强的线性关系。出现这种情况时,会导致[XTX]的行列式结果为0,此时,计算[XTX-1]时将产生很大误差。因此在式(6)中添加一个正则化项解决该问题 ,于是式(5)转换为:
其中,[I]为单位矩阵,[C]为正则化系数[11]。通过正则化处理,可得到正则化极限学习机(Regularized Extreme Learning Machine,RELM)模型,实现快速稳定的网络输出。
通常情况下,网络输出没有经过归一化处理。本文网络目标输出由0和1组成,所以对网络输出作归一化处理,有利于分析输出结果,最终通过神经网络模型对数据进行分类。本文使用Softmax函数对输出数据作归一化处理[12],其表达式为:
其中[m]为网络输出个数,[i]为整数,[i∈][1,m]。经过Softmax函数处理后的网络输出数据具有两个性质:①各个输出为非负数;②所有输出之和为1。Softmax函数按照这两条性质对在负无穷到正无穷上的网络输出结果进行转换。
2.2 实验结果及分析
本文通过多普勒雷达采集驾驶员生理信息,并建立DOPS数据集。设计正则化极限学习机算法模型对DOPS数据集进行训练。
2.2.1 检测模型评判标准
在多分类问题中,准确率(accuracy)、精确率(precision)、召回率(recall)是判断模型好坏的重要依据[13]。准确率指分类正确的样本数与总样本数的比值,精确率指正确的样本在检索得到的样本中所占比例,召回率指检索样本比率[14]。本文数据集输入数据是一维数据,且只包含3个特征值,将数据输入到网络中时,不存在无法检测的情况,这说明在本文实验中准确率和精确率可视为同一数据,并且召回率可被忽略。因此,本文对模型评判标准只通过准确率判定,其计算公式为:
其中,[Numcorrect]表示网络输出中预测正确的样本数量,[Numtotal]表示样本总数。为了方便分析网络对不同类别的预测效果,计算每个类别预测准确率,公式为:
其中,[s]表示类别索引,[s]的取值为0、1、2和3。
2.2.2 基于DOPS数据集的实验
本次实验中,使用RELM模型对DOPS数据集进行訓练。对于RELM模型,隐藏层输入权重矩阵初始化采用Python中numpy包中随机初始化类,具体是numpy.random.random([row,col])。本数据集特征值数量为3个,即[col=3];隐藏层神经元数量为500个,即[row=500],正则化系数[C]设置为[C=le5]。为了训练出更加可靠稳定的网络模型,本文采用自助法与简单交叉验证法相结合的数据分配和训练方法。
本文实验结果分为两部分,分别是网络输出效果图和相关准确率参数对比。网络输出效果和相关参数对比表分别如图3和表2所示。
图3包括4个小部分,每部分代表1个疲劳等级,每张画布展示的是该疲劳等级测试样本在RELM网络的输出结果。每个画布横坐标表示疲劳等级,取值为0、1、2、3;纵坐标表示每个疲劳等级相应的输出概率。每个样本均对应4个输出,即4个点。用[T]表示4个输出,则[T]为:
其中,[ηs]为该疲劳等级的概率,[ηs]越大,说明该输入样本对应于该疲劳等级的概率越大。即当[ηs]最大时,[ηs]对应的疲劳等级是输入样本对应的疲劳等级。
结合图3和表2可以看出,基于RELM算法模型的精确度达到92%,对于清醒状态和III级疲劳状态的精确度达到98%和96%。说明RELM对于这两个状态的预测精确度很高。在训练时间方面,RELM模型训练网络时间很少,从原理上讲,它只是进行了1次正规方程计算[15]。对于计算机来说,计算正规方程的时间可忽略不计。在各疲劳等级预测精确度方面,RELM对清醒状态和III级疲劳状态的精确度相对较高,对I级疲劳状态和II级疲劳状态的精确度相对较差。该特点从侧面反映驾驶员不同疲劳状态的生理信号变化很小,不同疲劳等级之间的差异更是微小。这是影响网络精确度的重要因素,也是该实验不足之处。
3 结语
本文基于正则化极限学习机的非接触式疲劳驾驶检测方法,采用非接触式采集驾驶员生理信号的方法,通过多源信息相结合的方式,设计RELM算法模型训练数据,得到用于驾驶员疲劳状态检测的算法模型。基于RELM算法模型对驾驶员疲劳状态检测的精确度达到92%,实现了高精度和高速度的驾驶员疲劳状态检测。本文用于网络训练的所有数据均来源于多普勒雷达模块采集的人体生理信号,因此其信号准确性直接影响了本文实验结果。通过实验发现,多普勒雷达采集的生理信号受周围噪声影响很大,容易导致心跳信号无法被分离出来。因此,若在硬件方面提升信号抗干扰性和精度,实验结果将大幅提升。另外,本文用于算法训练的样本特征值只有3个,不足以全面反映人体疲劳状态,特征值有待进一步扩充。
参考文献:
[1] 李都厚,刘群,袁伟,等. 疲劳驾驶与交通事故关系[J]. 交通运输工程学报,2010,10(2):104-109.
[2] CHEN L,YANG X,WU J,et al. Non-contact physiological signal monitoring system based on Doppler radar[J]. IEICE Electronics Express, 2017, 14(3):1-9.
[3] 姜朝曦,冯琼琳,钱宗亮. 一种对于疲劳驾驶的评估及预警方法[J]. 自动化与仪器仪表, 2015(4):74-78.
[4] 康培华. 基于ZigBee技术的智能路灯监测系统设计[D]. 哈尔滨: 哈尔滨理工大学,2016.
[5] 程耀,余友泰. 基于专家评判思维方式的综合评判方法[J]. 农业机械学报,1992(1):3-6.
[6] HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: Theory and applications[J]. Neurocomputing, 2006, 70(1-3):489-501.
[7] HUANG G B,ZHU Q Y,SIEW C K. Extreme learning machine: a new learning scheme of feedforward neural networks[C]. 2004 IEEE International Joint Conference onNeural Networks,2004:985-990.
[8] OOYEN A V,NIENHUIS B. Improving the convergence of the back-propagation algorithm[J]. Neural Networks, 1992, 5(3):465-471.
[9] PETKOVI M D, STANIMIROVI P, TASI? M B,et al. Effective partitioning method for computing weighted Moore-Penrose inverse[J]. Computers & Mathematics with Applications,2008,55(8):1720-1734.
[10] 金其年, 侯宗義. 非线性不适定问题的Tikhonov正则化的参数选取方法[J]. 数学年刊:A辑, 1997(4):483-490.
[11] ZHAI G, ZHANG W, YANG X, et al. Efficient deblocking with coefficient regularization, Shape-Adaptive filtering, and quantization constraint[J]. IEEE Transactions on Multimedia,2008,10(5):735-745.
[12] 梁家政, 薛质. 网络数据归一化处理研究[J]. 信息安全与通信保密, 2010(7):47-48,51.
[13] KUBREA E,WIECZORKOWSKA A A,SKRZYPIEC M. Influence of feature sets on precision, recall, and accuracy of identification of musical instruments in audio recordings[C]. International Symposium on Methodologies for Intelligent Systems,2014:204-213.
[14] 郭祥云,胡敏,王文胜,等. 基于深度学习的非结构环境下海参实时识别算法[J]. 北京信息科技大学学报(自然科学版), 2019(3):27-31.
[15] XING Z, CAO J, ZENG Y. The solution to the normal equation associated with a variational inequality[J]. Journal of Shaanxi Normal University, 2000, 28(1):40-41.
(责任编辑:江 艳)