基于人工免疫机制的营运货车运行风险评价研究
2021-02-27胡立伟何越人李耀平孟玲殷秀芬
胡立伟,何越人,李耀平,,孟玲,殷秀芬
(1.昆明理工大学,a.交通工程学院,b.津桥学院,理工学院,昆明650500;2.云南建投基础工程有限责任公司,昆明650500)
0 引言
随着货运大流量、车辆重载化发展,营运货车交通事故频发且损失惨重。2017年,营运车辆交通事故死亡率达7.97人⋅万车-1,是全国机动车交通事故万车死亡率平均水平的2.9倍。营运货车运行安全受到了极大挑战。
国内外学者对营运货车交通安全进行了大量研究。高建平等[1]基于交通事故及车速数据,分析货车对高速公路运行安全的影响。姜琪[2]研究发现,货车主要事故形态是追尾碰撞,基于货车制动特性构建了货车安全行车间距模型。尹心怡[3]通过G24高速公路货车事故数据,探究了货车事故分布特征,从高速公路出入口区域因素及交通流因素方面构建了货车运行安全评价模型。JOSE 等[4]分析不同类型卡车的安全性差异,结果证明,货车装载能力和事故概率之间呈负相关性,与交通事故死亡率间成倒U型曲线。PENG Yong等[5]利用有序逻辑回归模型分析影响驾驶人受伤严重性的因素,研究表明,货车右前方发生碰撞时驾驶人致命风险降低。目前,对于营运货车的风险性研究,大多基于道路交通事故历史数据分析事故特征及事故影响因素,未从动态实时的角度评价营运货车行驶风险性。
因此,本文利用营运车辆监控平台实时数据,运用人工免疫危险理论及改进的树突细胞算法,构建营运货车运行风险评价模型,以期为营运货车风险规避提供依据。
1 营运货车运行风险评价指标体系
数据来源于云南省公安厅交通警察总队提供的2010-2017年云南省货车交通事故数据、事故调查报告等,共5702 条。从驾驶人、营运货车、道路及自然环境、企业管理4个方面分析货车交通事故致因,统计风险因素发生频率,如表1所示。最终提取15个概率较大的营运货车运行风险因素作为风险要素层。
表1 营运货车运行风险因素导致货车交通事故发生频率统计表Table 1 Statistical table of frequency of truck traffic accidents caused by commercial truck driving risk factors
参照相关标准及文献,并考虑实际应用中数据采集及可靠性,确定指标层共11项,指标风险等级划分为4 个,用分数值标记,具体指标选取依据及划分标准如表2和表3所示。
2 基于树突细胞算法的营运货车运行风险评价模型的构建
2.1 模型构建可行性分析
将营运货车系统抽象为生物机体,运用人工免疫机制构建营运货车运行风险评价模型具有可行性,如表4所示。
2.2 信号映射
营运货车运行特征映射为人工免疫系统中的各类信号。抗原为一定时间段内车辆基本信息,可用货车风险评价指标值表示。未分化树突状细胞(iDC)表示检测器;半成熟树突状细胞(smDC)为货车处于风险运行状态;成熟树突状细胞(mDC)为货车处于安全运行状态。病原体相关分子模式(PAMP)信号为货车风险评价指标处于Ⅰ级、Ⅱ级;危险信号(DS)为货车风险评价指标处于Ⅲ级;安全信号(SS)为车辆风险评价指标处于Ⅳ级。协同刺激分子(csm)表示货车可能处于风险运行状态;半成熟树突状细胞因子(semi)、成熟树突状细胞因子(mat)分别表示货车所处状态的安全程度和危险程度。
人工免疫机制信号间融和处理采用加权和,即
表2 营运货车运行风险评价指标选取及划分依据Table 2 Selection and classification basis of driving risk evaluation index of commercial truck
表3 营运货车运行风险评价指标分级标准Table 3 Classification standard of commercial truck driving risk evaluation index
表4 模型构建可行性分析Table 4 Model construction feasibility analysis
式中:Ocsm、Osemi、Omat分别为输出信号csm、semi、mat 的信号浓度;Cp、Cd、Cs分别为输入信号PAMP、DS、SS的信号浓度,输入信号的浓度由风险指标在一定周期内发生的频数表示;wpc为PAMP和csm信号间的转换;wdc为DS和csm信号间的转换;wsc为SS和csm信号间的转换;wps为PAMP和semi信号间的转换;wds为DS和semi信号间的转换;wss为SS和semi信号间的转换;wpm为PAMP和mat信号间的转换;wdm为DS和mat信号间的转换;wsm为SS和mat信号间的转换。具体数据由免疫学家通过生物免疫实验得出,如表5所示。
表5 树突细胞算法信号转换权值矩阵Table 5 Dendritic cell algorithm signal conversion weight matrix
2.3 算法流程
传统人工免疫机制中树突细胞算法是离线分析系统,无法满足货车风险实时评价要求。本文改进算法,设定抗原判别阈值,当抗原被检测次数达到一定数量获得足够信息后立即输出以达到实时目的,弥补了普遍算法“非黑即白”的评价缺陷。图1为基于树突细胞算法的营运货车运行风险评价算法流程,具体步骤如下:
(1)信息收集阶段
在一定时间周期内采集的货车运行风险评价指标集合构成抗原向量。
(2)树突细胞算法检测阶段
初始化长度为l的抗原信号池,iDC 在生命周期内从抗原信号池中随机采样。根据抗原向量,生成不同的输入信号PAMP、DS、SS。根据式(1)~式(3)计算输出信号csm、semi、mat,并累加信号浓度。当累积的csm 达到迁移阈值,iDC 则脱离采样区域,进入分析阶段;若未达到阈值则返回抗原池继续采样。
(3)分析阶段
当半成熟树突状细胞因子累计信号浓度大于成熟树突状细胞因子累计信号浓度,iDCs 转化为smDC,代表细胞环境安全,提呈抗原环境值记0;当半成熟树突状细胞因子累计信号浓度小于成熟树突状细胞因子累计信号浓度,iDCs转化为mDC,代表细胞环境危险,提呈抗原环境值记1。记录iDC细胞采样抗原的判定次数和异常次数。若iDC细胞中存在抗原已达到预先设置的判别阈值,则计算该抗原的上下文环境成熟抗原值MCAV,并依据抗原异常阈值确定最终分类并输出,将该抗原从抗原池中移除;否则,返回抗原信号池。
MCAV 值反映抗原异常程度表征风险度值,即
式中:nmDC和nsmDC分别为成熟树突细胞和半成熟树突细胞的数量。正常抗原MCAV 值[0.0,0.5),异常抗原MCAV 值[0.5,1.0],MCAV 值越接近1.0,风险性越高。
3 模型应用分析
3.1 数据采集及预处理
通过云南省某运输集团营运车辆监控平台,随机抽取6 辆营运货车行驶数据(包括车速、卫星定位、驾驶员基本情况等)。货车行驶线路为昆石高速公路,全长约78 km,每辆车在该路段运行时长约1 h。采集24组货车运行数据。如表3所示,以30 s为周期预处理数据,数据周期内的货车运行风险评价指标等级分数集合构成一个抗原向量。
3.2 模型测试
从完成预处理的24 组数据中提取4 组数据约550条,用JAVA实现算法。
图1 基于人工免疫机制的营运货车运行风险评价流程图Fig.1 Flow chart of driving risk evaluation of commercial trucks based on artificial immune mechanism
根据经验值设定实验参数。30 s 为数据预处理周期,为使运行过程5 min内的数据产生关联性,设定抗原信号池长度为10。一个iDC 细胞采集多个抗原及信号,根据场景设定树突细胞种群数量为100。树突细胞生命周期设置为10,即iDC 采集10个抗原向量仍未大于迁移阈值,则该iDC 无效,返回重新初始化。迁移阈值范围一般是均匀分布的中心值±50%。据式(1)估算csm平均值为3.8,为保证算法随机性、精度和响应速度,允许单个DC细胞取5个抗原向量较合适,因此根据场景设迁移阈值为10~30。抗原判定阈值即是抗原的评判总次数,设为10。抗原异常阈值设为0.5,即该抗原被判别为异常的次数与判别总次数之比为50%时,该抗原被判别为异常,即货车运行中的风险点。
树突细胞算法抗原采样、迁移阈值都具有随机性,某次实验结果如图2所示。专家依据原始数据及风险评价指标结合实际经验判断车辆是否处于风险运行状态,以此评价结果为基础,比较模型与专家经验评价结果一致性。以准确率、误报率、漏报率作为检测指标,重复实验,检测指标值如图3所示。随着实验次数增多,在状态转换过渡区间,状态边界的抗原会互相干扰,出现微小程度的混乱,产生误判,导致模型准确率有所下降,但仍处于较高水平,准确率平均值稳定在90%以上。漏报率较低,算法漏报主要在算法设定阈值附近,将是下一步改进的重点。
图2 实验结果Fig.2 Experimental results
3.3 实例应用分析
采用模型检测中设定参数评价余下20组预处理数据,图4为部分评价结果。可知,货车运行风险值大多处于低风险运行状态。追踪货车运行风险异常值较大的时刻,发现同一时刻多项风险评价指标处于严重和较严重的异常状态,表明高风险的发生通常是多因素耦合的结果,如驾驶员在危险路段超速并有不良驾驶行为时存在风险性。
图3 模型平均准确率、误报率及漏报率Fig.3 Model average accuracy rate,false positive rate and false negative rate
为验证模型应用分析的合理性及有效性,运用模型计算并统计多辆货车运行于同一路段的风险值,定义车辆运行风险均值为路段行车风险系数。以昆石高速公路K25~K35 段为例,以500 m为路段单元计算路段行车风险系数,如图5所示。K27~K29、K30、K33~K35 段行车风险系数较高。据云南省公安厅交警总队提供的2012-2017年昆石高速公路交通事故数据,统计该区段亿车公里事故率如图5所示,K24、K28~K29、K33~K35 路段事故率较高,车辆运行风险性较大。结合路段实际资料分析,昆石高速下行方向K27~K31 段是连续长大下坡路段,存在坡度大于3%的较大纵坡段,货车在该路段易发生交通事故;K32~K35 路段属于“U 型”转弯路段,存在小半径圆曲线,营运货车行驶风险较大。通过对比昆石高速公路K20~K35 段交通事故数据和公路设计特征,模型判定的昆石高速车辆运行风险区域与交通事故黑点段一致率为72%,表明本文构建的风险评价模型具有合理性及有效性。
图4 货车运行风险评价结果Fig.4 Truck driving risk evaluation results
图5 昆石高速公路车辆运行风险Fig.5 Kunshi expressway vehicle driving risk
4 结论
本文运用人工免疫危险理论的信号处理机制及改进的树突细胞算法构建了基于树突细胞算法的营运货车运行风险评价模型,突破传统静态评价模型。研究表明,该模型能利用车辆监控平台海量数据实时评价营运货车运行风险性,模型具有合理性和有效性,且有较高的准确率及较低的误报率,可动态监管营运货车,提高其运输安全性。应用分析表明,风险指标集中任一风险因素的变化都会影响风险值,高风险的发生通常是多因素耦合的结果。