分心驾驶监测技术研究进展
2022-03-17姚保峰蔡绍峰
郭 城,姚保峰,蔡绍峰
(蚌埠学院 计算机与信息工程学院,安徽 蚌埠 233000)
欧盟发布的一项数据显示,交通事故已经超过战争成为仅次于疾病的第二大致死因素。对引发交通事故的原因进行分析,我们可以发现导致交通事故的因素有两类,一类为外部因素,如路况、车况、天气因素等;另一类为驾驶员自身的主客观因素,如酒驾、毒驾、开车不专心、过度疲劳等。在这两类因素中,后者是主要的因素,因为有超过一半的事故是驾驶员分心造成的。如果有一种方法能够监测驾驶员是否存在分心驾驶的行为并作出预警,那么交通事故也一定会明显下降。将现代技术手段应用于驾驶员驾驶状态监测,将成为保障驾乘人员人身和财产安全的重要手段。
1 何谓分心驾驶
分心驾驶是一种非常危险并极易造成车毁人亡的危险行为,被多个国家列为引发交通事故的常见因素。随着各种新颖有趣的车载多媒体设备的应用与更新,分心驾驶问题越来越严重,因此,研究驾驶员分心驾驶行为监测技术,并对驾驶员及时进行提醒很有必要。
学术界迄今尚无一致的分心驾驶定义。当前学术界一般采用澳大利亚道委会提出的定义,即将分心驾驶定义为在排除酒精、疲劳、药物等因素的情况下,驾驶员自主或非自主地把注意力从驾驶任务上转移到能够造成驾驶技能及预判能力降低的非驾驶任务上。换言之,分心驾驶是驾驶员在主客观因素作用下进入的一种不集中注意力的状态。根据分心产生的原因,通常将分心驾驶行为分为三种,一种是因驾驶员的非驾驶动作,如将手从方向盘上移开造成的分心,被称为操作分心,最典型的表现是开车打电话等;一种是驾驶员的视线偏离或离开汽车的前进方向的分心,被称为视觉分心,这种分心会导致驾驶员反应时间变长和车辆偏离正常行驶路线,最典型的表现为开车看手机、调节车载多媒体设备等动作;一种是驾驶员的思维判断能力不能完全集中在操控汽车行驶主任务的分心,被称为认知分心,这种分心会导致驾驶员的注意力下降,大脑判断能力迟钝,降低驾驶人员对车辆周围情况的监测能力,最典型的表现是驾驶员开车时说话、思考其他问题等。值得注意的是,这三种分心在日常驾驶中并不是单独出现的,很多时候是成对出现的,如驾驶中的打电话行为,手拿话机会致操作分心,讲话时会占用大脑的一部分思维资源而造成认知分心。
2 分心驾驶监测技术
如前所述,当驾驶员进入分心状态后,会出现足以影响驾乘人员人身安全的注意力转移状态,其本质是驾驶员将部分或者全部注意力分散到驾驶的次任务上,进而影响驾驶的主任务动作,并由此产生一些驾驶员外在的生理表现和车辆行驶轨迹变化。据此可知,分心驾驶的监测应围绕驾驶员外在生理表现和车辆行驶轨迹变化的监测进行。这些外在的表现可以分为驾驶员生理信号的特征表现、驾驶员的外在特征表现、车辆行驶特征表现等。根据这些外在的特征表现,分心驾驶监测技术分为直接监测和间接监测。
2.1 间接监测
间接监测是指运用多种传感器对车辆的行驶状态特征进行监测,而不是直接进行驾驶员状态数据的获取,如监测车辆行驶时的速度、轨迹、加速度、相对位置和司机在方向盘上的抓握力等,以此来判定驾驶员的状态。驾驶员操控汽车的动作行为会直接反映在汽车的行驶状态上,如果驾驶员出现分心的话其操控行为会导致汽车行驶状态的改变,通过监测这些改变就能够判断出驾驶员当时所处的状态。文献[1]通过驾驶模拟器进行认知分心对车辆操控影响实验,结果表明方向盘转动角变化的频率与认知分心程度为正相关;油门开度,制动踏板位置均值和方差,加速度标准差等参数在驾驶员处于认知分心状态时均变大,导致跟车稳定性降低。
间接监测的优点是可以在不接触驾驶员的情况下进行监测,对驾驶员驾驶汽车不产生影响。同时这种监测方式所需要的传感器一般较为常见,可以有效控制监测成本。但这种方法也存在一定不足,主要是受车辆状况、司机操作习惯等因素的影响较大,监测结果的准确性还有待进一步提升。另外,目前在间接监测方法研究中采集的样本数据不够丰富,研究方法有待改进。
2.2 直接监测
直接监测是指利用多种传感器,或者运用AI算法直接获取驾驶员本人状态数据的监测。现阶段的直接监测技术主要围绕驾驶员生理参数、视觉特征和机器视觉特征等方面进行。
2.2.1 基于驾驶员生理参数的监测技术
这类监测技术需要使用专门的设备来监测驾驶员心电信号、脑电波信号、肌电信号、大脑皮层激活信号等生理参数,然后提取参数中的特征进行统计分析并与正常状态下的驾驶参数进行对比分析,进而得出驾驶员是否处在分心状态的结论。例如,赵国朕在驾驶模拟器上提取了驾驶员在认知分心状态下和正常驾驶状态下的脑电信号,通过研究分析得出从脑顶叶采集的信号中Beta波与Alpha波的比值能够很好地区分出正常驾驶与认知分心驾驶状态的结论,并利用机器学习算法搭建了能够对认知造成的分心驾驶进行识别的模型,其准确率高达80%以上[2]。此种方法一般采取接触式的方式进行驾驶员生理参数的获取,所以稳定性和准确性都比较高。但此种方法也存在着一些不足,一是所需的采集设备一般较大且价格不菲,经济性不高;二是现阶段对于这种方法的研究大多采用的是模拟器数据,实车数据较少;三是接触性采集设备工作时可能会影响到正常驾驶。
2.2.2 基于驾驶员视觉特征的监测技术
视觉是人们获取周围环境信息最为重要的方式之一,特别是对于司机这一特定人群来说获取道路、车况等信息的唯一方式就是眼睛。据研究,驾驶员在驾驶汽车时视觉信息源提供的信息量占据了所有信息量的80%[3]。闭眼、眨眼、扫视、注视等眼部动作统称为眼动行为,根据这些行为研究人员又设定了相应的眼动参数。例如,扫视的左右摆幅大小以及时长、注视的持续时间、瞳孔面积的占比、眼睑闭合时间、眨眼次数等。周扬等提出了一种能判定认知分心的模型,他们运用随机森林算法分析了模拟驾驶器上采集来的驾驶员眨眼时间、注视时长两个指标,通过模拟驾驶试验得出随着认知分心的增强,眨眼时长会增加、注视时长会减少,模型的平均识别率为83.69%的结论[4]。对驾驶员眼动特征的追踪、获取、判定是基于视觉特征监测技术的核心要素,此种方法通常通过眼动仪来获取驾驶人的眼动特征数据,对分心驾驶的判别率较高。但此种方式也存在着以下几个方面的问题:一是鲁棒性不高,如驾驶员戴墨镜的情况下就无法对眼动特征进行监测获取;二是因眼动特征较多,运用此种方法去判别分心的指标尚不统一,且各种指标的阈值也未确定;三是当前研究多利用人工干预的方法让驾驶员进入分心状态,然后再进行数据的获取,这种强制分心模式下的数据难免会与真实驾驶状态下的分心过程存在差异。
2.2.3 基于机器视觉特征的监测技术
机器视觉特征监测技术是指根据摄像头拍摄的驾驶员图像信息,运用图像处理算法,来判定驾驶员的状态是否处于分心之中的监测技术。这种方法一般分为两个过程块,一个是训练过程块,另一个是测试过程块。训练过程块中先是对摄像头采集的图像数据进行滤波、去除噪声等的预处理,随后提取图像的特征,最后把提取到的特征运用SVM、K-means等聚类算法进行分类识别训练。测试过程块是利用训练好的模型,在测试集上进行测试得出最终结果。卜庆志等在研究中首先对获取的图像进行预处理(去噪、增强、归一化),随后利用梯度直方图(HOG)和支持向量机(SVM)构建了一种驾驶员行为监测算法,进行驾驶员行为监测[5]。
近年来在AI图像处理领域又出现了一道新的曙光——深度学习,图像处理领域卷积神经网络算法的精度和鲁棒性不断提高,这为基于机器视觉特征的驾驶员分心监测技术带来了新的方向。陈军等提出了一种改进型的CNN分心监测模型,先用轻型CNN网络进行原始图像筛查,再用VGG进行精确识别,准确率达到93.3%[6]。Baheti等在研究中不仅关注卷积神经网络的精确度,同时还关注了网络在存储和速度方面的效率问题,他们利用谷歌公司提出的深度可分离卷积核,构建了名为MobileVGG的一种新体系结构,其模型仅有2.2M的参数,在AUC和Statefarm数据集上分别达到了95.24%和99.75%的精度,而计算复杂度和内存需求却更低[7]。Moslemi在研究中考虑了时间维度信息,使用3D卷积神经网络与光流法来改善驾驶员分心监测,分别在光流输入和RGB输入上训练了两个3D网络,判断驾驶员的分心状态[8]。
因深度学习算法在分心监测领域有着更高的鲁棒性和准确性,所以机器视觉特征的监测技术主要研究方向在深度学习。但现阶段使用深度学习进行分心监测的算法还存在着一些问题:①现阶段用于训练模型的数据集都只包含了特定的一些分心动作,而在真实环境中驾驶员分心驾驶的行为多种多样,这就导致出现开放集识别的问题;②模型设计出来后需要大量的训练,其过程较为繁杂;③模型运行时占用的机器运行资源较多,而在汽车上的机器多为资源受限的嵌入式设备,难以在真实环境中应用;④大部分研究仍停留在使用传统的CNN结构上,这种结构只能分析静态的单张图片,而驾驶员的分心行为是一个动态变化的过程,大部分模型无法使用输入模型的前后信息进行分心监测,这会导致漏检、错检的问题。
3 总结与展望
分心驾驶一直是导致交通事故发生的主要原因之一,随着车内多媒体设备的多样化,分心驾驶现象有逐渐增多的趋势。国内外针对驾驶员分心行为监测的主要方法有两类,虽然这两类方法都有各自的优势,但也各有局限性,监测的精度和鲁棒性都有待提高。
从本文研究可以得到以下结论:在不同的监测技术中,用于识别分心的参数及其阈值尚未统一,驾驶员的分心程度还需划分,国内外尚未形成一套科学的评价体系为分心驾驶的监测与预警,为运用自动驾驶技术自动接管分心中的驾驶员等提供参考。同时也可以发现以下趋势:①分心驾驶的研究应该从预防、监测、解除三个方面同时进行,而现阶段研究较多关注监测,对分心的预防和解除的研究将是今后的重要方向。②现阶段各种监测技术的准确性、鲁棒性和监测模型效率还有进一步提高的潜力,可以更多采用多证据源信息融合监测法,如融合车辆的行驶状态特征和驾驶员的眼动特征、融合机器视觉特征与车辆行驶状态特征等进行监测。③机器视觉监测研究将是今后研究的热门领域,一是要关注对现有模型的剪枝、压缩和提高训练效率,使其能部署在车内的嵌入式设备中;二是要考虑利用输入模型数据的上下文信息综合判断分心的状态,目前出现了针对分心驾驶监测的3D结构CNN网络,但其网络参数规模相比原有CNN的规模庞大许多,而且3D卷积神经网络只能处理固定时长的视频,忽略了时间维度结构的问题,还有较大发展空间。④现有监测技术中多缺少针对实车驾驶数据的分析,训练神经网络模型的分心驾驶数据集仍需加强。