基于Logistic回归模型的行车安全评价研究
2019-09-10檀亚宁刘宏玉金泽明
檀亚宁 刘宏玉 金泽明
摘 要 随着车联网技术的发展,车辆行驶的许多指标监测更为精确,因此产生的行车数据也日益增多,交通运输大数据时代也已经来临。如何利用数据挖掘技术判别行车安全状况成为当前运输行业研究的热点问题。本文对所给数据进行数据预处理操作,结合数据得出行车里程、平均行车速度、急加速和急减速情况,其次进一步挖掘每辆运输车辆的不良驾驶行为得到的不良驾驶行为数据,利用逻辑回归模型求解出每类不良驾驶行为影响因素对应的权值并且利用灰色关联分析评价每辆车对应的安全状况,建立了基于逻辑回归模型和灰色关联分析的行车安全评价模型。
关键词 数据挖掘;行车安全;KNN:逻辑回归模型;灰色关联;评价模型
引言
随着我国经济高速增长,道路运输行业持续发展,车联网技术的大规模应用,对应产生的行车状况数据呈大幅增长趋势。利用逻辑回归模型计算出各个影响因素的权值并将计算得到的权值结合灰色关联分析法构建行车安全评价模型。行车安全评价模型可以有效的评价车辆在行驶过程中的安全状况
1 数据预处理
①去除异常值,在给出的数据出现了部分的异常值,主要包括速度突变过大、经纬度数据异常和转向不合理,本文将类似异常值都进行了删除,保证行车数据的合理性。
②填补缺失值,对于数据中部分车辆出现数据缺失的情况,本文根据数据集中记录的取值分布情况采用KNN预测缺失值方法对缺失值进行填补。
2 行车数据分析与提取
通过所给数据,本文挖掘每辆运输车辆的不良驾驶行为,主要包括疲劳驾驶、急加速、急减速、怠速预热、超长怠速、熄火滑行、超速、急变道等。
3 安全评价模型
3.1 逻辑回归模型
本文采用客观权重逻辑回归模型[1]来确定影响因素的权重系数。不良驾驶行为对于安全评价模型的影响有怠速情况、疲劳驾驶、加速度突变、超速、急变道这五种指标。
经过选取测评指标、指标正向化处理、指标归一化处理,利用梯度上升法[2],对处理过后的指标变量的计算,可以得到在导致不良驾驶行为的因素中,疲劳驾驶占比最大,达到0.27,驾驶者的怠速情况占比相对较小,只有0.13,其他影响因素的权重情况如下表1所示。
3.2 逻辑回归模型和灰色关联分析的行车安全评价模型
经过选取最优值[3]、确定特征矩阵、数据无量纲化、求差值序列、计算关联系数[4]、求解关联度等步骤。我们对导致不良驾驶行为的影响因素进行等权关联计算和加权关联计算[5]得到部分车辆的相关结果如下表2所示。
根据上表,我们划分安全等级,为安全性高,不易发生交通事故,为安全性中等,可能会发生交通事故,为安全性低,极易发生交通事故。得到测评对象4车在安全行驶,可以继续安全行驶,测评对象2车极易发生交通事故,需要立即靠边停车调整行驶状态,疲劳驾驶应进行休息,超速行驶应按照规定速度行驶等等。1、3、5车安全性中等,但是其驾驶者同样也要提高警惕,以防交通事故的发生。
4 总结
从评价结果来看,大部分的车辆驾驶者的交通安全意识处于一般或低水平,因此在平常驾驶中有一定的发生交通事故的风险。大部分驾驶员在驾车过程中总存在不同程度的驾驶失当及危险行为。针对这一现象,本文建议在驾驶证的考取上应该严格把关,交通管理部门应加强对车辆驾驶者安全意识的培养以提高其驾驶安全程度,加强对交通运输的管理,积极宣传安全驾驶规范,严格执行交通法规,降低交通事故的发生率。
参考文献
[1] 王进,郭靖,王卫东,方理刚.权重线性组合与逻辑回归模型在滑坡易发性区划中的应用与比较[J].中南大学学报(自然科学版),2012,43(5):1932-1939.
[2] 熊笑.基于梯度上升決策回归树的网约出租车需求动态预测[D].华中科技大学,2017.-09-23.
[3] Sy Han Chiou,Rebecca A.Betensky,Raji Balasubramanian. The missing indicator approach for censored covariates subject to limit of detection in logistic regression models[J]. Annals of Epidemiology,2019.
[4] 马萍.灰色系统GM(1,1)模型的改进及灰色统计模型研究[D].吉林大学,2007.
[5] 史青春,王平心.基于合作博弈的供应链伙伴绩效灰色综合评价方法[J].软科学,2010,24(1):56-59.