灾害天气下高速公路风险评估的Logit模型改进*
2018-07-04李素兰张谢东李红伟
李素兰 张谢东 李红伟 孙 琳
(武汉理工大学交通学院1) 武汉 430063) (武汉市桥梁维修管理处2) 武汉 430015) (河海大学土木与交通学院3) 南京 210098) (武汉市交通科学研究所4( 武汉 430015)
0 引 言
天气是影响高速公路运行的重要因素.数据表明,雨雪天气交通事故比晴天多25%[1-2].我国是高速公路通车里程最多且灾害天气频发的国家,灾害天气下高速公路交通安全风险分析尤为重要.
风险评估方法包括专家调查法、故障树分析、事件树分析、数据包络分析法、层次分析法、模糊综合评判法、贝叶斯网络、Logit模型.专家调查法[3]简单直观,但调查时间较长,受专家主观影响较大.故障树分析[4]表达直观,逻辑性强,可用于定量、定性分析,缺点是复杂系统故障树的设计过程较复杂,且仅考虑正常和失效两种状态.事件树分析[5]能明确危险扩大的原因及危险发生概率,随着复杂系统失效因素的增加,产生大量的冗余分支.层次分析法[6]可靠性高、误差小,但很难处理因素众多的问题,评估结果主观性较强、且判断矩阵难以满足一致性要求.模糊综合评判法[7]适宜于评价因素多、结构层次多的系统,但不能解决评价指标间相关造成的评价信息重复问题.贝叶斯网络[8]能解决复杂问对于一些简单的问题,只是贝叶斯网络的建造偏复杂.基于Logit回归的风险评估模型[9-11]简单,自变量不需要满足正态分布,评估精度较高,是目前风险评估的主流方法.Logit模型使用时要求自变量相互独立;自变量数目不能太多.高速公路交通安全风险评估建模时自变量种类和数量较多,自变量之间存在相关关系.风险评估的因变量是风险等级,具有离散、非连续且存在逻辑大小顺序的特性,因此,选择累计Logit模型作为原始模型.
本文对累计Logit模型进行改进,利用主成分分析降低自变量数量,使得自变量之间相互独立,使新的自变量符合累计Logit回归模型的使用条件.
1 自变量降维与独立性处理
主成分分析将多个存在相关性的自变量化成少数互不相关的综合自变量,在一组变量中寻找方差,由原始变量线性组成新自变量[12]用不相关且数量较少的新变量包含绝大部分原始自变量的信息来处理原始自变量共线问题,,以满足Logit模型对自变量数量少和相互独立性的要求.主成分转换见式(1).
Fi=ai1X1+ai2X2+···+aipXp
(1)
式中:Fi为第i个主成分,i=1,2,…,m;a=(ai1,ai2,…,aip)为第i个特征根λi对应的特征向量,a为单位向量;Xj为原始变量,j=1,2,…,p,p为原始变量的数量.
研究者用累计方差贡献率选择主成分的数量,当前m个主成分的累计方差贡献率接近或大于80%时,主成分分析可实现保留绝大部分信息的自变量降维和独立的目的和[13].
2 主成分累计Logit风险评估建模
2.1 因变量与自变量的确定
本文数据来自沪宁高速无锡段的实测数据.为保证模型适用范围的广泛性,变量取值时,首先参考国家或地方政府的标准规范,当没有相关标准时,根据实测数据统计结果确定取值范围.
因变量为运行速度,为保证方法使用的广泛性,结合文献[14],将因变量分为四级,见表1.
表1 高速公路交通安全风险评估变量及取值
自变量包括天气、交通流与交通标志三类.
1) 天气 包括天气等级、天气持续时间和覆盖率.由于数据调查地点为江苏省境内,因此按照江苏省气象局发布的《气象灾害预警信号等级以及防御指南》确定天气等级的取值[15];根据灾害天气持续时间,将持续时间分为4个等级;雾天、雨雪结冰存在不能覆盖整条道路的情况,因此将覆盖率分为2个取值区间.
2) 交通流 包括流量、车型比例和车头时距.根据24 h交通流数据变化特征,将交通量分为3个等级;大型车比例集中在20%~50%,大型车比例带入速度与安全U形曲线,将大型车比例分为2个区间;根据车辆安全距离计算公式计算车头时距[16],将车头时距分为三个区间.
3) 交通标志 包括标志的清晰度和可视度.清晰度表示标志自身的文字、颜色等要素的清晰程度;可视度表示在能见度的影响下,看清交通标志信息的可视程度.按照影响程度,将清晰度和可视性分为三级.各变量取值见表1.
2.2 显著性检验
表2中指标变量的KMO测度值大于0.600,可以进行主成分分析;Bartlett统计量的显著性水平Sig.值小于0.05,表明球形假设被拒绝,变量之间并非独立,因此,样本适合做主成分分析.
表2 KMO和Bartlett的检验
2.3 自变量独立性及降维的实现
主成分可以解释原有自变量,见表3.由表3可知,当主成分数量为3个时,累计方差贡献率达到77.941%,信息被大部分保留,表明此时接近80%的原有变量信息被保留.所有的主成分个数为3,初始特征根:λ1=2.746,λ2=1.865,λ3=1.624,主成分贡献率:γ1=34.323,γ2=23.312,γ3=20.306.
表3 主成分分析的解释总方差
旋转后的因子载荷矩阵见表4.第一主成分是交通流,第二主成分是标志;灾害天气为第三主成分.交通量与车型比例正相关,与车头时距负相关;标志标线的清晰度和可视性两个变量正相关;灾害天气的等级和持续时间是最主要的两个变量,且负相关.
表4 主成分分析的特征向量矩阵
由特征向量矩阵得到主成分表达式分别为F1,F2,F3.
F1=-0.075x1+0.043x2-0.143x3-0.342x4-
0.318x5-0.345x6-0.003x7-0.007x8
(2)
F2=-0.032x1+0.076x2-0.147x3-0.029x4-
0.032x5+0.064x6+0.496x7+0.506x8
(3)
F3=0.501x1-0.524x2+0.199x3+0.052x4+
0.174x5-0.047x6-0.111x7-0.057x8
(4)
式中:Fj为第j个主成分,j=1,2,3,分别为交通流、标志和天气;xi为第i原始自变量,i=,1,2,…,8.
2.4 因变量逻辑有序的实现
表5为累计Logit的参数估计及检验值,由表5可见,模型参数的Sig值和拟合度的Sig值均小于0.05,建模完成.
表5 累计Logit的参数估计及检验值
回归统计得到累计概率模型见式(5)~(8).
p=(y≤1|F)=
(5)
p=(y≤2|F)=
(6)
p=(y≤3|F)=
(7)
p=(y≤4|F)=1
(8)
由累计概率模型推断出独立概率模型即可得到灾害天气条件下高速公路交通安全风险分析模型,如式(9)~(12).
p1=p(y=1|F)
(9)
p2=p(y=2)=P(y≤2|F)-P1(y=1|F)
(10)
p3=p(y=3)=P(y≤3|F)-P1(y=2|F)
(11)
p4=p(y=4)=1-P(y≤3|F)
(12)
累计Logit模型的参数估计的结果说明,天气因素对交通安全风险等级起主要影响作用,交通流对交通安全风险等级的影响比交通标志的影响的大.天气等级增大和交通流量增加后,交通安全风险等级也随着增大.这些数据展现的结果与真实情况相符,因此,本文提出的主成分累计Logit模型是有效的.
2.5 模型检验
对所建模型进行整体显著性检验、回归系数的显著性检验和拟合优度评价,验证模型有效性.
1) 对数似然比检验 当p值小于给定的显著性水平,认为第j个回归系数显著不为零,否则,认为第j个回归系数显著为零.Hosmer-Lemeshow检验结果见表6,认为模型从整体上看是显著的.
表6 累计Logit的对数似然比检验
2) Wald检验 参数估计及检验值见表5,Wald统计量的概率p值小于给定的显著性水平,拒绝原假设,认为整体模型显著,即回归系数估计正确.
3) 拟合优度检验 拟合优度检验的-2Loglikelihood,考克斯-斯奈尔(cox-Snell)R2统计量和内戈尔科(Nagelkerke)R2统计量见表7.由表7可知,cox-Snell统计量和Nagelkerke统计量的计算值解释了被解释变量60%以上的变动,模型的拟合优度比较高.
表7 累计Logit的拟合优度检验
3 模型分析
3.1 对比分析
利用宁沪高速无锡段采集的数据建立基于主成分分析的累计Logit模型. 用相同的数据,对比分析改进模型和累计Logit模型对灾害天气下高速公路风险评估的准确性.对比分析结果见表8.
1) 风险等级为I级时,评估精度最高;风险等级为II级、III级时评估精度居中,且二者相同;风险等级为Ⅳ时,评估精度最低.由于风险应急主要针对I,II,III级风险,所以本文建立的模型满足使用要求.
2) 累计Logit模型评估精度明显小于主成分累计Logit模型.主成分累计Logit模型系数显著为零,累计Logit模型显著性系数为0.12,说明灾害天气下,主成分累计Logit模型比累计Logit模型更适合做为高速公路风险评估模型.
表8 改进累计Logit方法的验证结果
3.2 相关性分析
通过相关性分析发现因素之间存在很强的相关性.车头时距与交通流量相关性最高,达到0.942;车头时距与大型车比例,标志清晰度与标志可视性相关性次之,分别为0.784和0.781;持续时间、交通量、与交通标志相关性系数小于0.5,不具有相关性.
由此可知,Logit模型评估精度确实受自变量相关性影响,当自变量相关时,可以利用主成分分析,将自变量降维、独立化后,再使用Logit模型.
3.3 可移植性分析
本文利用宁沪高速无锡段采集的数据建立模型,苏州段采集的数据验证模型的准确率,将132条数据带入改进的Logit模型,得到各风险等级的准确率,如表9所示.
Ⅳ级风险的评估错误是将风险级别极低的Ⅳ级风险评估为风险水品稍高的III级风险;III级风险的评估错误主要是将III级风险评估为Ⅱ级风险;II级风险的评估错误主要是将II级风险评估为I级风险;I级风险的评估错误主要是将I级风险评估为II级风险.由于高级别的风险应对措施对低级别的应对措施有效;I级风险发生概率较小,却评估精度较高,因此,本文建立的模型实用性满足要求.
表9 改进累计Logit方法的验证结果
4 结 论
1) “KMO检验”和“Bartlett球度检验”及自变量相关性分析论证了高速公路交通安全风险影响因素存在较强的相关性,不能直接使用Logit模型评估其风险等级,可以利用主成分分析将影响因素降维处理以满足Logit模型要求自变量相互独立的要求.
2) 主成分分析结果说明高速公路交通安全影响因素包括三个主成分,分别是天气、交通流、交通标志.天气因素对风险等级起主要影响作用,交通流对风险等级的影响比交通标志的影响的大.天气等级增大和交通流量增加后,交通安全风险等级也随着增大.
3) 交通量与车型比例正相关,与车头时距负相关;交通标志的清晰度和可视性正相关;灾害天气的变量中,灾害天气的等级和持续时间是最主要的两个变量,二者负相关.
4) 模型对各等级评估精度不同,风险等级越高,评估精度越高;模型存在将风险等级评估高一个级别的可能,由于风险应急主要针对Ⅰ、Ⅱ、Ⅲ级风险,高级别的风险应对措施对低级别的应对措施有效,所以本文建立的模型满足使用要求.
参考文献
[1] 雷海超.高速路“趴窝”有失公平效率[EB/OL].[2017-11-02].http://finance.jrj.com.cn/opinion/2012/05/06213613007515.shtml.
[2] 柳本民.灾害性天气下高速公路运行安全控制技术研究[D].上海:同济大学,2008.
[3] 吴坚,黄俊,李升连,等.基于专家调查法的公路隧道洞口失稳风险分析[J].地下空间与工程学报,2009,5(1):1407-1411.
[4] 杜洁.基于故障树技术的铁路信号设备故障诊断专家系统的实现方法研究[D].北京:北京交通大学,2009.
[5] 解家毕,孙东亚.事件树法原理及其在堤坝风险分析中的应用[J].中国水利水电科学研究院学报,2006,4(2):133-137.
[6] 李凤伟,杜修力,张明聚,等.改进的层次分析法在明挖地铁车站施工风险辨识中的应用[J].北京工业大学学报,2012,38(2):167-172.
[7] 蔡丰.基于模糊综合评价的工程项目进度管理研究[D].天津:天津大学,2007.
[8] 杨宇杰.事故树和贝叶斯网络用于溃坝风险分析的研究[D].大连:大连理工大学,2008.
[9] 刘建军.高速公路项目运营风险预警与控制研究[D].武汉:武汉理工大学,2010.
[10] YANG J S, SUN H Y, WANG L, et al. Vulnerability evaluation of the highway transportation system against meteorological disasters [J]. Procedia-Social and Behavioral Sciences, 2013,96(6):280-293.
[11] JACEK S. The simulation-fuzzy method of assessing the risk of air traffic accidents using the fuzzy risk matrix[J]. Safety Science, 2016,88:76-87.
[12] 徐铖铖,刘攀,王炜,等.恶劣天气下高速公路实时事故风险评估模型[J].吉林大学学报(工学版),2013,43(1):68-73.
[13] JUNG S, QIN X, NOYCE D A. Rainfall effect on single-vehicle crash severities using polychotomous response models [J]. Journal of Accident Analysis and Prevention, 2010,42(1):213-224.
[14] ZHENG Z D, LEE J, SAIFUZAMAN M, et al. Exploring association between perceived importance of travel/traffic information and travel behavior in natural disasters: a case study of the 2011 Brisbane floods [J]. Transportation Research Part C, 2015,51:243-259.
[15] 江苏省气象局.气象灾害预警信号等级以及防御指南[EB/OL].[2017-11-02].https://wenku.baidu.com/view/e3e0e68d6529647d272852f7.html.
[16] 陆键,张国强,马永锋,等.公路交通安全设计理论与方法[M].北京:科学出版社,2011.