APP下载

基于LSTM和先验知识的高速公路路面温度预报

2024-01-29熊国玉包云轩3王可心

应用气象学报 2024年1期
关键词:气象站时效准确率

熊国玉 祖 繁 包云轩3)* 王可心

1)(南京信息工程大学气象灾害预报预警和评估协同创新中心, 南京 210044) 2)(中国气象局交通气象重点开放实验室/南京气象科技创新研究院, 南京 210009) 3)(无锡学院江苏省物联网设备超融合应用与安全工程研究中心, 无锡 214105)

引 言

高速公路路面温度变化是交通气象条件的重要指标,是目前交通气象灾害研究的重要内容之一。路面高温易导致路面大面积损坏,对车辆和驾驶员产生负面影响[1],增加出现交通事故的风险。路面低温则易导致沥青路面开裂[2],在特定天气条件下可能出现路面白霜、结冰、积雪等,减小路面摩擦系数,加长车辆制动距离,易引发交通事故,严重影响交通安全和运输效率[3]。因此,准确预报路面温度,及时进行路面状况预警,提醒相关人员采取防御措施,对保障人民生命财产安全具有重要意义。

目前,路面温度预报方法主要有3种:理论模型法、数值模拟法和统计分析法[4-5]。理论模型法基于地表能量平衡、热量收支和水分收支等原理建立路面温度变化机理模型[6-8],模型利用气象和地理环境要素对地表温度变化进行数学物理建模,通过解决计算问题预测未来温度变化。然而,由于该类模型依赖于经验假设而非严格求解偏微分方程,其结果可能与实际存在差距。数值模拟法则将计算域划分为元素,并在各元素上求解热传导的偏微分方程[8-9],该方法对计算资源和模型输入要求较高,限制了其广泛应用。统计分析法通常基于与路面温度变化相关变量的统计关系,开发数学关系模型,而非求解传热偏微分方程[10],该方法的优点在于模型简单、参数和数据易于获取、便于应用,学者们多采用统计分析法构建路面温度预报模型[4]。

统计分析模型主要包括线性回归模型[11-12]和非线性回归模型[12]。线性回归模型简单,预报准确性有待提升,因此人们引入了正弦函数模型[13]、自回归求和滑动平均模型[14]、GIS技术[15-16]等,研发了多种非线性回归模型,有效提高了预报准确性。近年随着人工智能技术的快速发展,人们将机器学习方法应用于路面温度预报。与传统统计分析模型相比,机器学习算法可选择更为复杂的函数对原始数据进行处理。1997年首次将反向传播神经网络(back- propagation neual network,BPNN)应用于路面温度预报[17],此后采用人工神经网络[18]、BP神经网络[19]、支持向量机[20]、随机森林[21]、梯度提升回归树[22]等方法进行路面温度预报,取得显著效果。目前,机器学习算法在路面温度预报中通常使用交通气象站观测数据建模。而近年将先验知识融入机器学习模型已成为提升预报性能的重要方法之一[23],如路面温度受传热理论和热量平衡方程的影响,与辐射、潜热、感热等因素密切相关[4],同时呈现明显的日变化[24]和季节变化[25]。将这些先验知识融入机器学习模型有望显著提升路面温度预报性能。此外,目前的机器学习算法应用于路面温度预报主要集中在未来1个时次的单步预报,较少涉及多步预报。多步预报有助于更好地捕捉序列变化的趋势和周期性,更贴近交通气象短时临近预警的需求。

据此,本文以2019—2022年南京市4个高速公路交通气象站观测数据为基础,结合ERA5-land再分析数据引入物理机制先验知识,通过特征工程技术考虑路面温度的日变化、季节变化以及温度变化趋势,建立结合先验知识的长短时记忆网络(long-short-term memeory network,LSTM)多步路面温度预报模型,预报未来3 h逐10 min的路面温度。同时,将已建立的模型应用于其他5个交通气象站,探讨模型的适用性,从而应对因新建或设备维护导致历史数据样本量较少的交通气象站路面温度预报问题。研究结果有望为高速公路路面温度产品的精细化气象服务和高低温灾害预警提供技术支持。

1 数据与方法

1.1 数 据

1.1.1 交通气象站观测数据

本研究所使用的交通气象站数据均来源于江苏省高速公路交通气象监测系统,观测要素包括气温、路面温度、10 cm路基温度、相对湿度、风向、风速、能见度以及降水量。选取南京市绕城高速公路(编号G2503)沿线9个交通气象站,包括马群站(M9126)、六合南站(M9293)、横梁站(M9513)、老山站(M9516)、高旺桥北站(M9518)、东善桥站(M9520)、上坊站(M9521)、北象山隧道北站(M9522)和陈桥枢纽站(M9526)(图1)。其中,M9518、M9520、M9522和M9526 4个站用于建立和验证模型, 2019—2021年数据作为训练数据集,2022年数据作为验证数据集。其他5个站则以2022年数据进行模型适用性检验。此外,本研究使用中国国家基础地理信息中心研发的30 m分辨率全球土地覆盖数据(GlobeLand30数据)[26],将1 km半径内人造下垫面占比高于45%的交通气象站定义为城市气象站,低于20%的交通气象站定义为乡村气象站,介于20%和45%之间的交通气象站定义为城郊气象站[27],用于研究不同下垫面背景对模型效果和适用性影响。根据该分类方法,M9126、M9521和M9522 3站为城市气象站,M9293、M9518和M9520 3站为城郊气象站,M9513、M9516和M9526 3站为乡村气象站。为保证数据的科学性和有效性,对所有数据进行10 min平均处理,并进行阈值控制、异常值剔除、缺失数据插补等质量控制。

图1 南京市绕城高速公路交通气象站地理位置分布

本文插图中所涉及的行政区域界线基于审图号为GS(2019)1822号标准地图制作,底图无修改。

1.1.2 再分析数据

本研究采用ERA5-land再分析数据,选取与路面温度变化密切相关的8个物理变量,包括裸土蒸发量、地表反射率、地表土壤温度、地表潜热通量、地表净太阳辐射、地表净热辐射、地表显热通量和地表总蒸发量。该数据通过重新运行ERA5再分析模型中的陆地组分生成[28],空间分辨率为0.1°×0.1°(约9 km)[29]。采用线性插值方法将ERA5-land小时分辨率数据插值为10 min分辨率数据[30],并采用最邻近点法空间匹配再分析数据与交通气象站数据[31]。

1.2 LSTM模型设计

LSTM模型是1997年提出的一种改进型时间递归循环神经网络(recurrent neural network,RNN)[32]。与传统RNN相比,LSTM模型有效解决了RNN中存在的长期依赖问题,并一定程度上缓解了训练长序列时出现的梯度消失问题[33]。

本研究建立的LSTM路面温度预报模型包括输入层、LSTM层、全连接层和输出层。为了避免过拟合,模型引入随机丢弃层(dropout),并采用tanh函数作为激活函数。在测试中发现多层LSTM模型性能提升有限,计算效率却显著降低。因此,本研究选择采用单层LSTM模型。进一步采用网格搜索法,认为当验证集误差和训练集误差趋于稳定且二者接近时,模型结果最优[34]。通过试验,确定最佳超参数:隐藏层数为1,隐藏层神经元数量为64,丢弃率为0.01,训练批次大小为128,迭代次数为500。

目前,多步预报主要采用直接法、递归多步预报法、直接递归混合多步预报法和多输入多输出预报法4种模型策略[35]。本研究为了提高预报精度和模型效率,采用多输入多输出预报法。模型的训练和预报均基于滚动窗口的原则进行有监督学习[35]。考虑到路面温度的短时预报需求,本研究选择未来3 h的路面温度作为预报目标。通过测试,确定最优输入步长为6 h。

1.3 模型方案设计

在深度学习领域中,数据和特征工程占据相当重要的地位。经过特征工程处理后的数据决定了数据挖掘的潜力上限,而模型的作用则在于最大程度地利用这些数据[35]。本研究通过引入与路面温度变化密切相关的再分析物理量,结合对原始数据集的理解,人工构建时间序列特征,以期使模型达到最佳性能。经过测试,主要构建以下4种时间序列特征:①时间特征拆解,将原始时间变量拆分为月、日和小时变量;②时间序列趋势特征,引入10 min、1 h、3 h及6 h的路面温度变化量;③时间序列聚合特征,引入最近24 h路面温度平均值及标准差;④周期性时间特征,采用独热编码形式,定义09:00—12:00(北京时,下同)为路面温度上升时段,13:00—16:00为路面温度最大值时段,17:00—次日04:00为路面温度下降时段,05:00—08:00为路面温度最小值时段。由于各个特征具有不同的量纲和单位,为了提高模型精度,所有数据均采取标准化处理,对风向以整数形式进行离散化处理[23]。

针对不同的输入变量组合,本研究设计5种模型方案,具体方案如表1所示。

表1 模型方案设定

1.4 模型评价指标

为了检验模型的预报效果,本文采用均方根误差、平均绝对偏差[36]、预报准确率[21,37]及TS评分[38]4个统计指标。其中预报准确率为预报值与观测值差值的绝对值不大于3 ℃的次数与观测总次数之比,该值越大表示预报效果越好。

2 结果与分析

2.1 模型预报能力评估

使用本文构建的模型对M9518、M9520、M95-22、M9526 4个交通气象站的路面温度进行模拟预报。每种方案下模型各运行5次,并取平均值作为最终统计结果。计算5种方案不同预报时效的模型评价指标(图2)。不同交通气象站的同一方案模型表现出相似的预报性能,但不同方案间存在较大差距。方案1模型表现最差;方案2模型预报效果略好于方案1,表明物理机制相关数据输入模型,效果优于观测数据;方案3和方案4在引入时间序列特征变量或物理机制相关变量后,模型预报性能均有一定提升,其中方案4的提升效果更为明显;方案5在引入时间序列特征变量和物理机制相关变量后,表现出最佳预报性能,其准确率为85%~99%,平均绝对偏差为0.54~1.81 ℃,均方根误差为0.74~2.98 ℃。这表明增加输入特征有助于全面考虑周围环境的影响[39],增强了LSTM模型的特征提取能力,从而实现更精确的路面温度预报。随着预报时效的延长,4个交通气象站的预报准确率下降,平均绝对偏差和均方根误差增加。预报时效小于60 min时,各方案间准确率差异不大。但当预报时效超过60 min时,各方案间的差异逐渐显现。方案1的预报准确率急剧下降,而方案5的下降速度最为缓慢。预报时效为1 h时,方案5相较于方案1,准确率提升8%~15%;预报时效为2 h时,准确率提升16%~27%;预报时效为3 h时,准确率提升22%~36%。表明随着预报时效的延长,方案5的效果提升最明显。

图2 4个交通气象站不同方案预报能力评估

为全面检验预报效果,以交通气象站M9522为例,对预报时效较短的1 h和较长的3 h两个时效进行深入分析。2022年交通气象站M9522路面温度在大部分时间为3~35 ℃,但最低可达-5 ℃,最高可达63 ℃。对于1 h时效的预报(图3),各方案间预报准确率相近,方案5表现最优,方案1最差。对于拟合斜率,方案5的拟合线斜率最高,为0.97,其他方案也在0.9以上。对于散点分布,方案5的散点分布相对集中,5种方案散点均呈现上宽下窄特点,即在路面温度低于35 ℃时,预报性能明显优于高于35 ℃的情况。这可能是因为样本主要分布在0~40 ℃范围内,而高于40 ℃的样本较少,导致模型在训练对高温情况的拟合不足,影响预报准确性。

图3 2022年交通气象站M9522 1 h预报时效5种方案模型预报效果及对比(a)方案1,(b)方案2,(c)方案3,(d)方案4,(e)方案5,(f)各方案预报能力评价指标对比(各指标均进行归一化处理)

对于3 h时效的预报,5种方案的预报效果较1 h时效的预报效果明显下降(图4)。对于散点分布,3 h时效的预报结果分布更为离散,且等值线上的点减少。方案1、方案2和方案3的模型散点分布呈S型趋势,即30 ℃以上的散点集中在等值线下方,预报值偏低,而10 ℃以下的散点集中在等值线上方,预报值偏高。这表明高温时预报温度偏低,低温时预报温度偏高,对实际路面温度预报应用存在较大局限性。方案3和方案4相较方案1的预报效果均有一定提升,尤其是方案4表现更优。这说明引入时间序列特征变量后,对于较长时效的预报效果提升明显。与前4种方案相比,方案5的预报效果最为优越,但当路面温度高于35 ℃时预报效果较差。

图4 同图3,但为3 h预报时效

2.2 路面极端高低温状况下模型预报能力评估

交通气象应用尤其关注路面极端高温和低温的预报效果。根据相关行业标准,路面温度高于55 ℃时为高温[40],低于0 ℃时为低温[41],这两种情况均对交通运行产生不利影响。鉴于此,本研究采用效果最佳的方案5模型,选取测试集中M9518、M9520、M9522、M9526 4个交通气象站高于55 ℃和低于0 ℃的极端温度样本进行评估(表2)。由表2可见,低温状况下模型表现出色,1~3 h时效内预报准确率均高于90%,TS评分也均高于0.4。而高温状况下各交通气象站的预报效果普遍较差。这是因为路面高温受多种因素影响且变化迅速[1]。除了交通气象站M9518外,其余交通气象站在1 h时效内的表现均相对较好,预报准确率在60%左右,TS评分在0.5以上。交通气象站M9518因为前期高温样本较少,导致模型对高温拟合不理想。同时还注意到,不同交通气象站的极端高低温预报效果存在明显差异,特别是乡村气象站M9526的预报效果明显优于其他城市气象站和城郊气象站。

表2 低温和高温路面状况下方案5准确率和TS评分

挑选测试集4个交通气象站24 h内路面温度出现小于0 ℃且无缺测数据(2022年2月21日)以及高于55 ℃且无缺测数据(2022年8月8日)的个例,评估模型在路面极端温度状况下的预报效果。

2022年2月21日凌晨4个交通气象站夜间路面温度持续降低,08:00达到最低且低于0 ℃。对于1 h时效,4个交通气象站路面极端低温的预报表现较好,预报准确率均达到97%以上,平均绝对偏差平均值约为0.7 ℃,均方根误差平均值约为0.88 ℃(表3)。随着预报时效的延长,预报效果均有所下降。3 h时效的预报准确率约为96%,平均绝对偏差约为1.2 ℃,均方根误差约为1.42 ℃,模型仍保持较好的预报效果。此外,模型可准确预报4个交通气象站的路面最低温度及其出现时间(图5)。而在当日路面温度出现最高值的11:00—14:00,预报出现明显偏差。随着预报时效的延长,这种偏差更加明显,但偏差多在3 ℃以内,总体预报结果仍较理想。

表3 路面极端低温和极端高温个例中方案5模型评估

2022年8月8日11:00—16:00 4个气象站的路面温度均高于55 ℃。路面极端高温情况下模型预报能力有所下降。对1 h时效,4个气象站的预报效果尚可。其中,交通气象站M9520和气象站M9522的预报准确率在88%以上,平均绝对偏差约为1 ℃,均方根误差不高于1.5 ℃(表3)。然而,对更长的预报时效,模型的预报效果明显下降。除交通气象站M9518外,其余3个交通气象站路面最高温度出现时间预报超前约为1 h且预报值偏低4 ℃(图6)。总体上,极端高温的预报存在一定挑战,但模型仍能提供有用的预报信息,对于交通管理和安全决策仍具有应用价值。

2.3 模型空间普适性验证

本研究利用已建立的4个交通气象站方案5模型对其他5个交通气象站进行路面温度预报,验证已建立模型的适用性,同时解决数据完整性较差的气象站路面温度预报和缺测路面温度的插补问题。

从预报效果看,模型预报能力有所下降,尤其在较长预报时效时表现更为显著(表4)。从模型选择看,下垫面类型对预报效果产生明显影响。具体而言,对于城市气象站(M9521、M9126),基于城郊气象站M9518、气象站M9520的模型预报效果最优。对1 h时效,预报准确率超过86%;对3 h时效,预报准确率超过68%。对于城郊气象站(M9293),应用城郊气象站M9520建立的模型预报效果最佳。对1 h时效,预报准确率为84%;对3 h时效,预报准确率为66%。对于乡村气象站(M9513、M9516),应用乡村气象站M9526建立的模型预报效果最佳。对1 h时效,预报准确率超过84%;对3 h 时效,预报准确率超过62%。这说明对于历史数据较短的交通气象站,可以通过迁移应用具有相似下垫面背景类型的交通气象站已建立的模型实现路面温度预报。

表4 模型迁移应用预报效果评估

3 结论与讨论

本文使用物理机制相关变量融合、引入时间序列特征等5种方案,建立多元多步LSTM路面温度预报模型,预报未来3 h逐10 min路面温度,并对不同方案下及路面极端高低温条件下的预报结果进行检验,并验证模型适用性,得到以下结论:

1) 加入时间序列特征和先验物理知识显著提升了LSTM模型的预报效果,尤其是同时引入两者后模型准确率达到85%~99%,且随着预报时效延长,提升越明显,准确率最高提升36%。表明增加先验知识有助于模型更全面考虑周围环境的影响,增强了LSTM模型的特征提取能力,模型能够从路面温度的历史变化及物理机制方面更深入、更贴近实际考虑路面温度变化,实现路面温度预报更精确。

2) 对于路面极端温度的预报,模型在低温预报方面表现出色,准确预报了路面低温极值及发生时间。模型的高温预报能力相对较弱,且随着预报时效延长,效果显著降低。对于路面最高温度的预报提前大约1 h,且预报偏低约4 ℃。这可能是由于路面极端高温样本相对较少,模型在训练过程中未能充分拟合。

3) 应用已建立的模型预报其他交通气象站的路面温度准确率超过62%,预报时效较短时预报效果较佳,准确率可达80%以上。乡村气象站的预报效果明显优于城市和城郊气象站,特别是预报时效延长时,优势更加显著。

4) 模型选择方面,交通气象站的下垫面类型对模型选择起关键作用,城郊气象站模型在城市气象站和城郊气象站的预报效果相对最优,乡村气象站模型在乡村气象站的预报效果相对最优。因此,推测只需选择1个城郊气象站模型和1个乡村气象站模型就能在很大程度上满足南京周边高速公路的路温预报需求,有助于有效解决数据质量较差的交通气象站路面温度预报和缺测路面温度的插补问题。

与以往研究相比,目前路面温度预报主要集中在高温或低温两个方向,而本研究旨在开发一种同时适用于高低温且能进行多步预报的模型,以扩展模型应用范围。但需要指出的是,该模型对路面温度的短时波动预报存在一定局限性,观测发现云量等因素对路面温度短时波动影响较大,未来研究需更细致地考虑这些影响因素,以实现对路面温度短时波动的准确预报。此外为改善极端高温预报效果,可以尝试通过增加高温样本量或提高模型对极端路面温度的敏感性进行改进。

猜你喜欢

气象站时效准确率
珠峰上架起世界最高气象站
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
心灵气象站
高速公路车牌识别标识站准确率验证法
J75钢的时效处理工艺
一种新型耐热合金GY200的长期时效组织与性能
环保执法如何把握对违法建设项目的追责时效?
自动气象站应该注意的一些防雷问题