APP下载

基于决策树的非机动车闯红灯行为研究

2019-12-10高航

物流科技 2019年11期
关键词:决策树

高航

摘要:为了研究非机动车骑行者的闯红灯行为及其重要影响因素。采用录像拍摄获取红灯期间到达的非机动车骑行者在交叉口的穿越行为数据,对骑行者在信号交叉口红灯期间穿越行为的分类(即冒险主义行为、机会主义行为和守法行为)进行调整和更具体的描述,运用数据挖掘决策树方法中的CHAID算法对非机动车闯红灯行为数据进行分类并构建决策树模型。结果表明,1344个骑行者中有60%以上实施了闯红灯行为,骑行者的视觉搜索行为和交叉口其他骑行者的数量是影响闯红灯行为的重要因素。

关键词:闯红灯行为;非机动车;决策树;信号交叉口

中图分类号:U491.4文献标识码:A

0引言

中国是非机动车大国,由于非机动车具备健康、经济、环保等特点,早已成为我国重要的交通出行方式之一。与此同时,非机动车也是城市道路交通中受伤和死亡风险最高的类别之一。据我国2013年至2017年的交通事故统计,有关非机动车的城市道路交通事故发生5万余起,造成直接财产损失1.11亿元。如此高的交通事故发生率也侧面凸显了研究信号交叉口非机动性违规行为的重要性。事故分析表明,闯红灯是非机动性骑行者中最典型的违规行为之一,也是导致交通事故发生的主要原因之一。由于我国大部分非机动车骑行者法律、交通安全意识相对薄弱,导致非机动车的闯红灯行为较为普遍,为我国城市交通带来一些问题与隐患。基于此,结合我国当前交通现状,研究非机动车的闯红灯行为是十分必要的。

Pai将骑行者的交叉口通过行为分为三种不同的方式:冒险、机会主义和守法,并建立了一个混合logit模型,分析三种不同方式的穿越行为。发现红灯时长、交叉口类型等因素显著增加了骑行者发生危险行为的可能性。Wu对北京的交叉口进行调查研究发现,56%的非机动车发生闯红灯行为,年龄是预测骑行者闯红灯的重要因素,同时从众心理也会影响骑行者面临红灯时的决策。Huang确定了具有代表性的行为特征(速度、交叉口间隙或滞后接受行为和群体骑行行为)来研究骑行者在信号交叉口的行为。Yu嗵过二元logit模型。分析了性别、非机动车类型、转弯车辆数量等相关因素对有或无倒计时信号装置的信号交叉口电动车骑行者闯红灯行为及提前启动行为的影响。Jahangiri A应用混合效应的广义回归分析发现,其他骑行者的移动和存在是影响闯红灯概率的重要因素。Huan用生存分析方法估计电动自行车在信号交叉口等待时间的模型。引入Cox比例危险模型,将反映个人特征和交通状况的变量定义为协变量,用以描述内外部因素的影响。Zhang通过logistic回归分析和方差分析结果表明,遮阳板在晴天和阴天对降低闯红灯概率均有显著效果,并且遮阳板在晴天的效果大于阴天。評估哪些是闯红灯行为自行车手最常见的行为和人口特征,哪些是他们在信号交叉口的行为,有助于制定更好的政策和制定适当的干预措施,以促使自行车手尊重红灯信号,并且减少因其造成的交通事故的数量。现有研究中,很少有对骑行者的视觉搜索行为进行相关探讨。因此本文在前人研究的基础上,结合我国交通现状,运用CHAID决策树方法探索闯红灯违规行为与骑行者的个人特征、穿越行为等变量之间的关系,期望可以更好地解释上述变量如何在非机动车中普遍存在的闯红灯现象中发挥作用。

1调查设计与实施

1.1数据收集

本文主要采取录像拍摄收集相关样本,通过在信号交叉口进行实地视频拍摄,再对视频回放提取所需要的数据。

为便于采集非机动车的穿越行为数据,在选择交叉口调查时会遵守以下几点原则:(1)调查地点应是典型信号控制四路交叉口;

(2)调查地点需要有较大的非机动车流量,确保收集的样本量充足;(3)为了能清晰获取全部所需数据,调查地点应具备良好的拍摄条件,方便摆放相机三脚架。根据上述原则,本文最终选取上海市隆昌路与长阳路交叉口、周家嘴路与双阳路交叉口和图们路与控江路交叉日进行实地调研。

1.2数据处理

1.2.1闯红灯行为

为了更清楚地描述骑行者在红灯期间到达交叉口的穿越行为,本文采用如下分类,清晰刻画三种不同类型的穿越行为:(1)冒险主义行为:红灯期间到达交叉口,没有等待就直接闯红灯;(2)机会主义行为:最初在红灯期间等待,一段时间后仍在红灯期间穿越交叉口;(3)守法行为:红灯期间全程停车等待,直到绿灯期间才穿越交叉口。在回放录像统计数据时,对变量的描述为0=守法行为;1=机会主义行为;2=冒险主义行为。

1.2.2个人特征

个人特征数据包括骑行者的性别、年龄和非机动车类型,各变量的解释如下:

记录非机动车骑行者的个人特征数据时,将被观察到的骑行者的性别记录为:1=男性;2=女性。由于数据是在调查地点实地拍摄获得,因此骑行者年龄是通过观察与估计来评估的。为便于感知,将年龄分为三个类别:1=0-30岁;2=31-50岁;3=50岁以上。对于非机动车的类型,将其分为电动自行车与人力自行车,变量解释为:1=电动自行车;2=人力自行车。

1.2.3群体规模

群体规模指的是其他骑行者在交叉口等待的情况,即当骑行者红灯期间到达交叉口时,有其他骑行者已经在等待的过程中了。该变量的解释为:0=没有其他骑行者;1=存在1-4名骑行者;2=存在5名以上骑行者。

1.2.4视觉搜索行为

由于本文采用的是录像拍摄获取相关数据,无法观察到骑行眼球的相应运动,所以将会通过观察采集的录像中骑行者在到达十字路口时的头部转动来评估骑行者的视觉搜索行为(0=无头部转动;1=头向一个方向转动;2=头部向两个方向转动)。在实际评估时,会对某些特殊情况进行相应处理,如有时骑行者头部转动,是因结伴出行而观察其他同行者,因此该情况会被判定为“0”。

1.3数据分析

对收集并处理得到数据进行卡方统计分析,采用卡方检验来检验不同类型闯红灯行为与个人特征、群体规模和视觉搜索策略之间的关系。

并且为了进一步分析收集的变量的作用,采取决策树方法来分析不同闯红灯行为的发生。决策树是一种从无秩序、无规则的数据中推理出一套分类规则,对样本数据进行分类的方法。对决策树内部的节点进行属性值的比较,并根据不同属性值判断从该节点向下分,在决策树的叶节点得到结论。在决策树中,目标变量(即闯红灯行为)也被称为根节点并且包含整个样本,如图1所示。在分裂过程中,根据选择的目标变量识别最佳的分类方向,将父节点分裂成子节点,最后形成一个完整的树。决策树有助于更好地识别分组并预测结局,从而支持决策过程和风险因素分析。由于决策树的非参数性和易于解释的特点,决策树在许多领域得到了广泛的应用。在本文中使用决策树方法来分析骑行者的闯红灯行为,对于解释和预测骑行者在红灯期间到达交叉口后的穿越行为是有较大作用的。

决策树分析基于CHAID算法,它是一种以目标变量最优为依据,能够快速高效地挖掘数据的多元统计分析方法。CHAID算法主要根据卡方统计量寻找最佳分组变量和分割点。如果多个解释变量与目标变量间具有显著的关联性,那么CHAID算法会从中挑选出最关键的解释变量(P值最小)。该算法经过三个连续的阶段:合并、拆分和停止。当解释变量具有多个类别时,会对多个类别进行比较,将未显示出差异的类别合并在一起。当决策树达到一定规模时,需根据停止规则,阻止树的继续生长。采用SPSS软件进行决策树分析,通过CHAID算法建立了自行车闯红灯决策的分类树模型。

2结果分析

一共收集了1344名在红灯期间到达交叉口的非机动车骑行者的穿越行为数据,其中505名(37.6%)骑行者为守法行为,360名(26.8%)骑行者属于机会主义行为,479名(35.6%)骑行者被记录为冒险主义行为。

在所有样本中,有692名(51.5%)是男性,652名(48.5%)是女性,按性别划分的样本分布是均匀的。在年龄方面。收集了489名(36.4%)30岁以下的骑行者,547名(40.7%)骑行者的年龄在31-50岁之间,308名(22.9%)骑行者的年龄在50岁以上。

用卡方检验性别与闯红灯行为之间的关系,结果显示这两个变量之间存在关联,X2(2)=32.08,p<0.001。对性别进行分类比较后得出,男性冒险主义行为的倾向性更大(p<0.05),而女性更偏向于守法行为(p<0.05)。

对骑行者的年龄和闯红灯行为之间的关系进行卡方检验。结果显示两个变量之间存在关联,X2(4)=16.62,p<0.05。31-50岁的骑行者在红灯期间的交叉口进行冒险主义行为(p<0.05)的可能性大于其守法行为或机会主义行为(p<0.05)。年龄在50岁以上的老年骑行者,相比于其他两类行为,更倾向于在整个红灯期间停车等待,即守法行为(p<0.05)。

关于骑行者的车輛类型,卡方检验显示车辆类型与闯红灯行为之间无关联,x2(2)=0.21,p>0.05。

卡方检验显示视觉搜索行为与闯红灯行为之间有关联,x2(4)=255.42,p<0.001。对于实施守法行为的骑行者在交叉口等待时,很大程度上只关注绿灯,所以几乎不存在头部的转动,而对于机会主义行为的骑行者来说,由于要寻找闯红灯的时机。所以将更倾向于头部转动看向一侧或两侧。

群体规模与闯红灯行为之间也存在关联,x2(4)=103.85,p<0.001。当群体规模不小于5人时,骑行者更容易进行守法行为,而当周围没有其他人时,骑行者进行冒险主义行为的可能性更大。

如表1所示,为闯红灯行为分类下各变量的频率和x2值。

非机动车骑行者的闯红灯行为的决策树模型图如图2所示。

图中包括10个终端节点。节点0由37.6%的守法行为骑行者、26.8%的机会主义行为骑行者以及35.6%的冒险主义行为骑行者组成,第一个最佳分割的变量为视觉搜索行为。如果骑行者在交叉口头部转动了一个或两个方向,则其中21.6%的骑行者属于守法行为,将在整个红灯期间停止等待;37.7%的骑行者会等待一段时间后进行闯红灯行为;40.7%的骑行者则会不等待并直接闯红灯。相反,对于无头部转动的骑行者来说,存在61.7%的人属于守法行为;机会主义行为的骑行者仅占10.3%,28.0%的骑行者进行了冒险主义行为。不过节点1和节点2的纯度都不足够,所以还需继续分裂,直到所有的终端节点达到相应的纯度。结果显示,如果骑行者进行了视觉搜索行为且附近无其他骑行者,则他会很大程度进行冒险主义行为。

骑行者进行视觉搜索行为但附近有5人以上的其他骑行者时(节点5),他将更有可能等待到绿灯期间再穿越(54.1%)。同样的,如果骑车人没有进行视觉搜索行为且周围存在5人以上的骑行者(节点8),骑行者在整个红灯期间也更有可能停车。无论男性还是女性,在有左右的视觉搜索行为且独自一人在交叉口时,都会大概率的实施冒险主义行为(节点9和节点10),而当附近存在1-4.个骑行者时,男性仍会倾向于不等待直接闯红灯(42.6%),女性则有46.4%的比例会在等待一小段时间后闯红灯(节点12)。当骑行者无视觉搜索行为时,只有当性别为男性且周围无其他人的情况下,55.6%的骑行者会不停车直接闯红灯,其他情况如节点14、15和16,骑行者的红灯行为均大部分属于守法行为。

年龄和车辆类型两个变量没有在决策树中出现,因为CHAID算法在考虑这些变量时无法找到纯节点。

3结论

本文研究目的为进一步了解骑行者在信号交叉口的穿越行为,分析个人特征和行为特征与闯红灯行为的关系,运用CHAID决策树方法进一步了解每个解释变量在预测骑行者闯红灯时的重要性,得到以下结论:

(1)42.77%的男性骑行者在红灯期间倾向于不停车直接闯红灯,女性则大多倾向于守法行为;年龄在50岁以上的骑行者在红灯期间始终停车等待的可能性要比其他两种行为的可能性大得多(P<0.05)。

(2)等待的其他骑行者数量越少,被观察的骑行者闯红灯的可能性就越大。当骑行者独处时,他们往往会让自己处于更大的风险之中。

(3)当骑行者进行视觉搜索行为时,闯红灯的概率大大增加。当群体规模在5人以下时,男女骑行者大部分都选择闯红灯行为,尤其当男性骑行者在无其他人等待,且进行搜索行为时,闯红灯比例达到59.3%。

猜你喜欢

决策树
基于决策树和神经网络的高血压病危险因素研究
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
面向分布式数据流大数据分类的多变量决策树
基于改进决策树的故障诊断方法研究
决策树多元分类模型预测森林植被覆盖
基于决策树的出租车乘客出行目的识别
基于决策树的复杂电网多谐波源监管
基于模糊关联规则和决策树的图像自动标注
基于肺癌CT的决策树模型在肺癌诊断中的应用