如何提升气象灾害风险预测准确性
2022-02-27四川省气象服务中心杨泓陈云强钟雪胡丹杨军成都信息工程大学卢军
文/图 四川省气象服务中心 杨泓 陈云强 钟雪 胡丹 杨军 成都信息工程大学 卢军
川西高原地理气象环境条件特殊,其所处四川省地跨青藏高原、横断山脉、云贵高原、秦巴山地、四川盆地等几大地貌单元,地势西高东低,由西北向东南倾斜,地形复杂多样;且因特殊的地理地质条件,具有极高山峰、低海拔冰川、深壑峡谷、湍急河流、高寒草原等地貌,海拔高差大,气候立体变化明显,季节和昼夜温差大,地质环境典型,地表生态脆弱,故而对公路交通事故影响明显,极具研究价值。
复杂地质、气象因素使川西高原高速公路建设技术要求高、运营管理难。四川省交通运输厅 供图
目前,国内关于高原地区交通事故与气象关系的研究较少,高原交通气象融合研究势在必行。通过将交通和气象进行充分融合,对智慧交通气象服务系统风险进行分析和研究,找出气象因素与公路交通事件等之间的内在联系,实现交通气象风险的分类、分级和精细化、网格化智能分析,能够为公路交通管理部门及公路使用者的预警监测、决策支撑提供方法和模型的科学基础。
研究思路方法
针对雨雪天气对公路交通事故的频率和严重程度的研究表明,降水和公路交通事故的频率之间存在正相关关系。但受不同地区交通流量及气象条件的差异影响,气象条件与交通事故之间的关系不总是线性的;也有一部分研究结果表明,两者间存在的关系,不仅与气象因素有关,还与地理因素、时间因素、空间因素存在较大关系。
西北工业大学学者靖连天在《非极端恶劣气象条件与高速公路交通事故之间的关系研究》中,分析了2010年至2012年西汉高速交通事故与气象条件之间的关系,研究方法采用了统计整个西汉高速区段内的交通事故与平均气象条件。
中国气象局武汉暴雨研究中心学者白永清、何明琼、刘静等在《高速公路交通事故与气象条件的关系研究》中指出,降水与高温天气对交通事故有明显的影响作用。但该文也指出,由于传统的常规气象站分布密度太低(G50汉宜高速长度约有280公里,仅建有6个常规气象观测站,气象观测站密度约为每45公里一个),严重影响了交通气象风险的模型精度与预测准确性。
汉宜高速公路沿线常规气象站的空间分布
基于上述分析可以看出,传统气象观测站的分布密度不够,且传统分析方法主要以整条公路沿线的气象要素平均值为主,研究局限性较大。在高速途经范围广,通达里程长,沿途海拔变化高,地理变化复杂,公路受地理条件、气象条件的影响巨大的背景下,“十里不同天”,气象条件可能完全不同。因此,采用整条公路平均气象要素来分析精度难以达到实际需求,甚至可能得出错误结论。基于高速公路精细化分段管理的现实,对整条高速公路进行气象要素下的交通事故分析,得出整条高速公路的平均交通事故发生率,对高速公路实际生产、运营指导作用不大。
基于四川省气象局与四川省交通运输厅路网监测与应急处置中心的工作基础,川西高原公路交通气象灾害风险智能网格化时空模型与预测机制研究首次将川西高原公路交通气象灾害与气象智能网格预报结合起来,采用美国哥伦比亚大学统计系罗晓华教授发明的i-score隐变量分析方法来确定主要的时空网格气象要素,基于支持向量机(SVM)的非对称样本空间回归方法,建立了公路网格级(5公里×5公里)的“气象要素—交通事故”模型,根据川西高原公路特有的地理复杂、气象多变特点,川西高原公路交通气象灾害风险智能网格化时空模型与预测机制,为高原地区交通气象融合的进一步研究打下基础。
主要研究任务
构建川西高原公路运行时空特征数据库
基于四川省交通运输厅路网监测与应急处置中心掌握的历史数据与观测检测方法,以全时段交通历史数据为基础,进行公路运行特征分类,分别从空间和时间两个维度,开展特征网格化分布分析,综合形成符合公路运行特征的时空分布数据库和分布图。通过对川西高原公路基础设施特征空间分布数据库和分布图、运行特征的时空分布数据库和分布图进行融合关联分析,形成公路综合运行特征时空分布数据库、分布图和关联数据库、关联图。
构建川西高原公路气象数据与交通灾害数据库
调查掌握川西高原公路交通主要的气象灾害隐患路段基本信息;收集近年来川西高原发生的主要交通事故资料,以及事故发生时附近交通气象站或者其他气象站的监测数据。在此基础上,掌握川西高原公路近年来交通事故数据,并收集与公路相关的交通气象数据。
建立公路交通事故与时空网格气象要素的关联模型
由于气象因素影响交通事故的作用机理复杂,因此利用交通事故资料和相应的气象监测数据进行多维度立体数据分析,基于i-score方法高维数据核心因素分析,并基于改进的支持向量机处理非对称样本空间的回归,从而计算川西高原公路交通事故与气象因素、时间、空间之间的相关关系。
四川日报 何海洋 摄
分析主要致灾时空网格气象要素、影响程度和灾害阈值
基于网格化大数据因素影响力分析方法,得出对川西高原地区安全行车影响较大的若干气象要素,从而得到影响川西高原地区安全行车的几种主要气象灾害类型、主要致灾气象因子、影响程度,并确定不同气象灾害的阈值。
研究高原地区交通气象网格化预警预报技术
利用交通气象站、区域气象站、探空站、气象卫星、多普勒雷达等气象探测资料及交通事故资料,特别是基于中国气象局推出的智能气象网格预报服务,研究基于智能网格预报的高原地区交通气象精细化预警预报技术,通过观测与预测的气象信息结合的预测模型,对交通事故发生概率预测预警。
重点技术研究
采集与整理高原公路网格化交通事故大数据
中国气象局“智能网格预报”产品
在大数据的采集与整理上,有两个难点,即网格化气象数据和网格化交通事故数据。2017年,中国气象局推出空间分辨率达“5公里×5公里”的智能气象网格预报服务(含历史数据服务),时间上实现了逐3小时发布未来10天的天气预报,解决了网格化气象数据提供的难点。对于网格化交通事故数据,主要通过分析整理历史数据、规范化采集数据,提供精确到1公里至5公里范围内的交通事故网格化数据。
网格化时空气象要素关联分析
影响川西高原公路气象的要素有很多,目前的气象预测研究还难以有效判断其关键核心因素。部分研究成果虽然给出了一些参考,例如地面温度、湿度、气压等,但这些要素具有很强的局限性,在不同的应用环境中,差异很大。为了简化分析难度,国内外以往的研究通常会以一段公路气象条件的平均值代替整条公路所有段的气象值。由于平均值不具有代表性,导致这种大尺度分析的效果很差,构建出的模型的拟合能力不理想。
通过网格化时空预报模型,在时空网格气象要素中,对于一条普通的公路,假设其网格密度为5公里;时间维度以3小时为刻度,统计观测节点前置48小时的数据;空间维度以5公里为刻度,统计观测节点前后左右50公里的数据;气象要素维度为气温、降水、降水相态、风、云量、相对湿度、能见度7种。经计算,密度为5公里的网格大小为44800维度。如果把观测节点拓展到前后72小时、方圆100公里,那么网格大小则为460800维度。针对如此高维度的数据,必须使用有效地降维方法,找到对交通气象事故影响最大的要素。
网格化时空预报模型
通过i-score方法,从近5万维甚至更多维数据中找到影响观测格点交通事故发生概率最重要的要素,从而避免了复杂的分析与建模。并从高维数据中选择一部分极小的子集,计算其i-score因子值,从物理意义明显的i-score因子值中,有效地分辨子集对系统输出的影响,并确定最主要的影响因子与因子集合,确定其权重。
提高交通事故与时空气象要素之间的数据分析回归精度
如何剔除其他因素的影响,建立不同气象灾害的阈值是一个技术难点。为增强支持向量机算法在这种状况下的回归性能,研究使用了分段支持向量机回归的方法。
公路交通迫切地需要应用先进的理论、技术和实验手段防灾减灾。四川省交通运输厅 供图
首先是针对地形变化特殊分段,对少数样本进行过抽样(通过增加分类中少数类样本的数量来实现样本均衡),使得抽样后的样本数目密度增加,从而提高其在整个回归中的敏感性。其中过抽样又分为随机重取样与集中重取样两种。随机重取样就是对少数类样本随机重复;集中重取样是对少数类样本选择性重复,只选择那些处于少数类与多数类边界之间的值进行重复。之后对于特殊地形区域,生成新的支持向量机回归模型进行单独的回归,从而提高这一区域的拟合效果。
采用支持向量机方法在非对称样本空间中的拟合作用示意图
执行情况评价
确定了交通事故与时空关联网格的关系
收集汇总了交通历史数据。分别针对雅西高速、雅康高速、国道318线和国道317线等研究样本公路,收集汇总公路基础数据和全时段交通历史数据,包括全路桥、隧、路面、海拔高度、附属设施等基础数据,全时段的全车型流量数据、公路阻断数据、交通事故数据、地质灾害数据等交通历史数据。
分析了交通运行特征分布。针对上述研究样本公路、以公路基础数据和历史数据为基础,开展公路交通运行特征分布分析。以公路基础数据为基础,分析公路基础设施特征分类,采取空间网格化方式,开展特征空间分布分析,形成公路基础设施特征空间分布数据库和分布图。以全时段交通历史数据为基础,进行公路运行特征分类分析。
分别从网格化空间和时间两个维度,开展特征分布分析,综合形成公路运行特征的时空分布数据库和分布图。对公路基础设施特征空间分布数据库和分布图、运行特征的时空分布数据库和分布图进行融合关联分析,形成公路综合运行特征时空分布数据库、分布图和关联数据库、关联图。
最后,通过对交通气象数据的全面分析,找出公路气象环境关键特征、各类特征的空间和时间分布情况。融合公路综合运行特征时空分布数据库、分布图和关联数据库、关联图和气象环境特征时空分布数据库、分布图进行关联性分析,形成“公路+气象”运行特征时空分布数据库、分布图和关联数据库、关联图。
确定了影响最大的时空气象要素
在川西高原公路气象预测中,由于各种要素之间高度相关,某些回归参数的估计值极不稳定,甚至出现有悖常理、难以解释的情形。为避免这种困扰,先采用i-score分析多个因子对目标产生作用权值,为了充分考虑四川省气象变化的特点,引入50公里范围内自动气象站的气象观测要素作为主成分的备选因素。经过基于i-score的多因子联合主成分分析后,根据分析结果,自动地保留几个主成分,而不至于导致原变量的信息的过多损失,同时也避免了主成分为自变量进行多重回归,不再出现共线性的困扰。
确定了每条公路致灾气象因子、气象灾害阈值
由于气象蝴蝶效应的影响,川西高原公路的气象变化不仅仅受限制于公路周边的气象条件,特别是四川是多山区域,气象变化更是“隔山如隔天”。在川西高原公路交通气象预测中,不仅需要考虑川西高原公路较近区域内(1公里至3公里范围)的气象变化对川西高原公路的影响情况,还根据大系统规律引入了川西高原公路周围30公里至50公里范围内的气象情况对川西高原公路气象影响因子,特别是考虑四川多山区域的山脉、河流、峡谷等特殊地形对附近川西高原公路气象的影响。
根据相关系数计算的结果,找出相关系数较大的几种气象要素,确定主要的交通气象灾害类型、致灾气象因子和影响程度,并确定灾害阈值。
建立了基于智能网格预报的高原地区交通气象精细化预警预报技术方法
利用四川省气象服务中心已掌握的全省自动气象站实时观测数据,结合川西高原公路气象监测站网观测数据,在整个川西高原公路气象预测中,加入扩展区域成分因素作为附加的主元素(主元素的选择以i-score自动分析结果为判断依据),从而综合应用四川省气象数据为川西高原公路气象预测提供支撑,提高预测分析的客观性、准确性。
多要素对交通事故的作用机理示意图
对川西高原公路的交通事故的影响要素,有地形地貌、气象要素、公路情况、时间因素等,这些要素对交通事故的作用机理如表1分析所示。
表1 交通事故的影响要素与公路交通的作用机理分析
川西高原公路交通气象灾害风险智能网格化时空模型与预测机制研究,将原有的单一时间维度、单一空间维度的分析提高到时空气象三维度网格中,通过三个不同量纲的数据混合分析,得出更加精确的预测模型。实现从整条高速公路的分析进化到网格化分析,以时空网格的关联关系反应公路自身特性,通过数据分析揭示气象、地理、公路之间的内在必然联系。对每一条公路的气象灾害风险提供了数据分析,就一条公路而言可定期分析并确定交通气象风险规律;就区域而言,可复制推广到区域内各条公路,定期形成区域(川西高原)全面的风险库(风险时空图);就四川省路网而言,可复制推广到各区域所有公路,定期形成全省风险库(风险时空图),并可以推广至全国路网。