西部地区道路交通安全风险预警模型研究及应用
2022-11-17洪东
洪 东
(广西交通职业技术学院,广西 南宁 530023)
0 引言
目前我国经济正处于高速发展的时期,经济的发展,带动了交通的繁荣。然而交通安全问题给人民群众的生活带来严重的影响。2020年我国公安部下发了道路交通事故预防“减量控大”的工作方案和提出道路交通事故预防工作部署。根据公安部的这一重大工作部署,广西要求各地市把道路交通事故预防“减量控大”的工作作为交通管理工作的重中之重加以落实。
近年来,南宁市的交通安全形势也并不容乐观。2018年南宁市发生涉及货运、客运车辆事故共826起,死亡人数283人。2019年,共发生道路交通事故3 383起,死亡636人,受伤3 515人,直接财产损失1 675万余元,总体来看,事故量呈上升态势。交通事故频发引起全社会的极大关注,人民群众对交通安全治理的呼声越来越大。
因此,本文运用大数据技术及逻辑回归算法,对道路运输企业(南宁区域)相关数据进行分析,围绕交警、运管部门的管理需要,结合道路运输企业的利益诉求,分析西部地区道路崎岖、山路多弯、桥隧比高等外在因素,提出道路运输交通安全预警这一迫切需求,即构建一个覆盖运输企业交通安全因素的预警模型,对风险进行预测,保障企业运输安全;再建立风险预警机制,全力以赴抓好企业隐患源头治理,扎实推进“减量控大”工作,降低风险、减少事故。
1 道路交通安全风险预警模型构建思路
1.1 模型指标因素分析
根据当前现状及存在问题,结合南宁市道路条件及运输环境特点,根据道路交通风险源分类,调研分析已有事故数据,再收集和验证对比数据,发现影响交通安全的风险主要有驾驶人员、运输车辆、道路缺陷、环境因素和组织管理这5个方面。因此,重点对这些方面因素进行研究。
1.2 模型数据采集处理
依托广西壮族自治区交通运输厅、南宁市交警支队及其管辖的运输企业资源优势,整合公安部公安交通管理大数据分析研判平台、公安部公安交通管理“六合一”平台等相关数据信息,并从各地市交警部门、道路运输发展中心、公路发展中心、交通运输信息管理中心等单位采集道路运输企业、驾驶人员、运输车辆、道路情况和交通安全事故等相关数据信息,同时提取互联网的接口数据,进行基础数据采集、处理、筛选和研究。
1.3 模型构建方法过程
综合运用专家评议法、主观评价法及相关文献资料,分类建立一阶与二阶指标体系。通过层次分析法(AHP)及灰色系统理论,确定指标权重值。结合交通运输行业特点,根据灰色预测模型、逻辑回归算法、极大似然估计法以及梯度下降法,最终搭建出道路交通安全风险预警模型。
2 道路交通安全风险预警模型构建步骤
2.1 建指标、赋权重
通过专家评议法、主观因素评价法及相关文献资料,结合交通风险源分类内容,构建包含人、车、路、环境、管理五个方面的道路运输企业交通安全风险评估指标,分类建立一级指标5项,二级指标27项。通过层次分析法(AHP)及灰色系统理论,融合大数据对数据进行处理后的分析结果,确定指标权重值,将定性指标变为定量指标。指标内容与权重系数如表1所示。
表1 道路运输企业交通安全风险评估指标体系表
2.2 分等级、构函数
根据评价指标体系,运用评价灰类和大数据技术,将风险分为高风险(f1)、较高风险(f2)、一般风险(f3)、较低风险(f4)和低风险(f5)5个等级,借鉴白化权函数并构造5个风险分类函数,采用“5、4、3、2、1”定量数字代表“好、较好、一般、较差、差”5 个等级评价。5个风险等级函数如下:
2.3 建模型、优参数
结合交通运输行业特点,根据灰色预测模型、逻辑回归算法、极大似然估计法以及梯度下降法,搭建出交通安全风险预警模型。
(1)建立逻辑回归预测模型。以驾驶人员、运输载体、道路条件、环境因素和组织管理这5个因素为X值,结合分析为Y,综合结合线性回归函数sigmoid函数,运用Python的Numpy 和 Matplotlib 库完成双函数的程序编写、绘制及结果预测,构建出逻辑回归预测模型如式(1)所示:
(1)
(2)逻辑回归预测模型学习。根据逻辑回归预测模型的取样训练,采用最大似然估计法(MLE)和似然函数,运用Python完成损失函数图像绘制,通过取对数构建出损失函数模型如式(2)和图1所示:
(2)
图1 模型算法推演过程示意图
(3)模型优化获取最佳参数值。根据损失函数的结果,结合样本数据进行分析,采用梯度下降算法对取样数据进行迭代来求出其最佳的参数值。如图2所示。
图2 模型优化流程图
3 道路交通安全风险预警模型训练及验证
3.1 模型训练
基于Hadoop环境,将分别采集的事故数据、违法数据、车辆数据和企业数据等信息,经过大数据处理和指标权重评分后,通过预警模型计算风险向量作为特征值。现提取2018—2019年南宁市5家企业数据进行计算,得出120组数据进行模型训练。
在Python环境下应用逻辑回归算法进行训练,5类因素指标体系样本数据分布情况如图3所示。
在Python环境下训练,单因素影响目标变量分布情况如图4所示。
图3 5类因素指标体系样本数据分布图
图4 单因素影响目标变量分布图
3.2 模型验证
根据训练结果,将5家企业2018年20组(9~12月)数据和2019年60组(1~12月)数据,使用模型进行预测检验,结果显示,预测正确率达100%。
在Python环境下测试,绘制预测结果图情况如图5所示。
图5 训练预测结果图
提取广西某运输企业2019年的12组数据,使用Python 将数据导入模型进行预测。预测结果的正确率为91.7%,结果分布如图6所示。
4 道路交通安全风险预警模型应用成效
4.1 道路运输企业安全风险预警成效
2019年模型测试运行后,完成南宁市5家道路运输企业安全风险预警综合评价,在2020年8月底成功预警两家高风险企业,企业通过整改,9月份的事故数量同比降低23%;完成南宁市5家企业800人的交通安全行为预警,其中驾驶员行为低风险520人、较低风险200人、一般风险80人、较高风险零人、高风险零人,预警提醒范围达到93.8%。
图6 5类因素指标体系和预测结果图
4.2 预警整改机制成效
交警部门通过模型预警发现两家企业存在环境因素下车辆夜间行驶比例过高的问题,立即进行排查。在排查中发现,其运营时间存在安全隐患,及时通知企业进行了整改。由此形成预警、整改、调研、回访的风险预警整改机制。
4.3 模型服务成效
交警部门根据预警模型中出现高风险预警的指标,对相关企业进行详细排查,总结出排查重点,对排查重点进行安全调研,形成整改方案,让模型服务“减量控大”总目标 ,提升民生服务质量。
5 结语
本文通过驾驶人员、运输载体、道路缺陷、环境因素和组织管理这5个因素对南宁市道路运输企业安全风险等级开展调研、收集和分析工作,运用大数据技术将道路运输企业安全风险的定性指标转变成定量指标,将安全风险的二级指标体系实现模块管理,预测模型具有可通用性,采用灰色评价法,结合逻辑回归模型,可实现道路运输安全风险预测。本次研究涉及的范围、技术、算法及模型都很有限,采集的数据类型、范围和特征还不够全面,预测模型的试点工作开展覆盖面也不够广泛,后期需进一步优化指标、模型和算法,继续构建一个能普遍应用于西南地区其他城市的交通安全风险预警模型。