APP下载

基于时空残差张量学习的城市路网交通数据修复

2023-10-17李金龙李若南吴攀于广婧许伦辉

计算机应用研究 2023年10期
关键词:智能交通高斯分布

李金龙 李若南 吴攀 于广婧 许伦辉

摘 要:针对城市道路网络环境下各种软/硬件故障导致的交通数据缺失问题,提出了一种基于时空残差张量学习(spatial-temporal residual tensor learning,ST-RTL)的交通数据修复方法。该方法通过构造带缺失值的三维交通张量以最大程度表征原始路网时空信息;并在高斯分布假设基础上,采用Gibbs采样完成对缺失数据的CANDECOMP/PARAFAC(CP)张量分解与低秩重构。考虑到张量修复过程产生的残差值,研究设计一种可动态迭代的双向残差优化结构以捕捉剩余时空依赖特性,实现对缺失交通数据的精准修复。采用公开的杭州地铁客流数据进行模型构建与验证。结果表明,当缺失率为10%~80%时,三种缺失场景(随机、聚类和混合缺失)对张量结构破坏存在较大差异,其中聚类缺失的破坏程度最大,此时,ST-RTL的评估指标MAPE、RMSE和MAE分别位于3.1071~7.0371、16.3779~58.4286、3.7434~8.0135;且随着缺失率遞增,ST-RTL模型各指标呈加速增加趋势。与HaLRTC、GAIN和BGCP等代表性基准模型相比,所建立的ST-RTL模型在可接受计算代价范围内具有更低的性能指标和更强的稳定性,能为智能交通系统提供高质量的基础数据。

关键词:智能交通; 数据修复; 张量学习; 高斯分布; 残差优化

中图分类号:U491.1+4 文献标志码:A 文章编号:1001-3695(2023)10-014-2972-06

doi:10.19734/j.issn.1001-3695.2023.03.0084

Traffic data imputation of urban road network based on

spatial-temporal residual tensor learning

Li Jinlong1, Li Ruonan2, Wu Pan3, Yu Guangjing1, Xu Lunhui1

(1.School of Civil Engineering & Transportation, South China University of Technology, Guangzhou 510641, China; 2.College of Computer Science & Technology, Harbin Institute of Technology (Shenzhen), Shenzhen Guangdong 518055, China; 3.College of Traffic & Transportation, Chongqing Jiaotong University, Chongqing 400074, China)

Abstract:To tackle the issue of traffic data loss due to various software/hardware failures in urban road network environments, this paper proposed a traffic data imputation method based on spatial-temporal residual tensor learning (ST-RTL). This method constructed a 3D traffic tensor with missing value to characterize original spatiotemporal attributes of road network maxi-mally. Then it adopted Gibbs sampling to perform a CANDECOMP/PARAFAC (CP) tensor decomposition and low-rank reconstruction of missing traffic data based on the assumption of Gaussian distribution. Considering the residual value produced by the tensor repair process, the study designed a bidirectional residual optimization structure with dynamic iterations to capture the residual spatiotemporal dependencies to enable the accurate repair of the missing traffic data. The experiments took a publicly available Hangzhou metro passenger flow for model construction and validation. The results indicate that when the missing rates are 10%~80%, the three missing scenarios (random, cluster and hybrid missing) have large differences on tensor structure damage, among which cluster missing has the greatest destruction and the evaluation indexes MAPE, RMSE and MAE of ST-RTL lied in 3.1071~7.0371, 16.3779~58.4286 and 3.7434~8.0135; and each indicator of ST-RTL model shows an accelerated increasing trend as the missing rate rises. Compared with the representative baseline models such as HaLRTC, GAIN and BGCP, the ST-RTL exhibits lower performance metrics and stronger stability in the acceptable computational costs, which can provide high-quality basic data for intelligent transportation systems.

Key words:intelligent transportation; data imputation; tensor learning; Gaussian distribution; residual optimization

0 引言

随着城市智能交通系统(intelligent transportation system,ITS)所依赖的基础运行设施逐渐完善,采用传感器技术、通信技术及数据存储技术等收集到的交通数据日益纷繁复杂,也极易导致因突发天气、设备老化或传输中断等软/硬件故障而发生交通数据异常或丢失[1]。例如,交叉口/区域/路网等不同尺度范围内的自适应交通信号控制系统需要稳定且高质量的交通值(如流量、密度和速度)来进行实时数据分析,以生成高效的控制指令与管理策略。如果存在缺失值,这不仅严重影响控制系统的正常运转,甚至还加重城市路網的交通拥堵。因此,为了更好地开展交通数据的分类、回归预测、控制优化与管理等基础性工作,研究有必要对处在各种复杂缺失状况下的交通数据进行高精度修复[2]。

精准的交通数据修复需要采用有效的算法与策略,通过充分挖掘路网异构多源数据间客观的时空依赖关系,从而建立起符合自然演化规律的数据修复模型[3]。为此,国内外研究学者从理论分析与实际应用角度出发,采用各种方法建立了大量的交通数据修复模型。目前,主流修复算法分为插值类、预测类与统计类方法[1]。其中,早期的插值类方法,如历史差值、样条差值和回归差值等,在填补向量形式的缺失交通数据时取得了不错的修复效果。然而,面对大规模缺失数据时,插值类算法因相对简单的修复原理而失效。通过大量使用智能算法从交通数据中有效提取空间与时间特征,一些预测类方法在数据修复任务中取得了较高的修复精度。如Cui等人[4]设计了带修复单元的SBU-LSTM循环结构以自动填补缺失交通值。Xu等人[5]开发了一个新颖的深度学习框架GE-GAN以有效完成修复任务。尽管越来越多的研究使用预测算法修复缺失数据,但该类方法的不可解释性和高计算成本严重制约了此类研究的进展[6]。统计类方法已被成功应用于数据修复领域并取得了较好的结果,如矩阵分解算法通过数据降维与近似重构在缺失交通值填补方面取得了大量的理论突破与应用先例(如BPCA、PPCA、FPCA和KPPCA)。但考虑到现阶段ITS中多源交通数据复杂的时空依赖关系,简单的二维矩阵结构已无法充分表征具有高维特性的交通序列。因此,部分学者采用三维张量结构来表示复杂路网环境下的多源时空交通序列,并通过低秩近似的方式完成对张量的分解与重构。例如,Liu等人[7]提出了一个无分解结构的高精度低秩张量完成(HaLRTC)算法估计缺失值;随后,Ran等人[8]将其应用于交通数据修复。Chen等人[9]将贝叶斯矩阵分解扩展至更高阶的贝叶斯高斯CANDECOMP/PARAFAC (BGCP)张量分解形式。通过学习时空交通数据潜在统计模式,该模型在大规模交通数据修复任务中取得了良好的效果。此外,Chen等人[10]还提出了一个低秩自回归张量完成(LATC)算法,因同时考虑了交通数据的全局相关性与局部相关性,该算法的修复精度与稳定性更高。

尽管上述研究证实这些算法在交通数据修复任务上的优势,但它们却很少涉及对大规模缺失数据的处理,且极少部分研究的修复结果仍然缺乏有效性;同时,对于模型修复后大量存在的误差值,相关工作明显缺乏深入分析与后续处理,进而阻碍了模型性能的提升。考虑到现阶段修复方法存在的局限性,为进一步提高缺少交通数据修复精度,本文构建一种基于时空残差张量学习(spatial-temporal residual tensor learning,ST-RTL)的大规模交通数据修复模型。该模型在高斯分布假设基础上,通过Gibbs采样完成对三阶张量的CP分解与低秩重构,基本实现对已观测数据的建模、缺失值生成及残差计算。然后,为进一步提取时空依赖特性,研究设计了一种新颖的双向残差优化结构,以动态迭代的方式不断减少修复值与真实值间的差值,逐步提高模型的修复性能。

1 修复问题描述

在城市路网G环境中,每个部署在特定区域内的传感器通过连续时段采样收集到大量向量形式的交通数据,所有传感器数据基于时空维形成一个三维交通张量集X∈Euclid Math TwoRApI×J×K。其中:I表示空间维的传感器数;J表示时间维的采集天数;K表示传感器每天以固定时间间隔采集到的交通数据量。如图1所示,张量X中单个元素xi,j,k代表第i个传感器在第j天获得的第k个交通值,其中i∈{1,2,3,…,I},j∈{1,2,3,…,J},k∈{1,2,3,…,K}。理论上,除人为干扰,数据缺失现象可以发生在张量X的任意位置且缺失率无法预估。为表征这种数据缺失情况,研究创建0-1掩码张量M∈Euclid Math TwoRApI×J×K,式(1)表示其元素划分标准。因此,路网实际采集的交通数据可表示为XΩ=X⊙M,其中Ω表示已观测数据的索引集;符号⊙表示张量间的Hadamard积。

考虑到路网G中复杂的时空依赖关系,相邻交通数据受传感器空间位置与时间周期性的相互影响,研究对已观测数据集XΩ∈Euclid Math TwoRApI×J×K进行时空建模以修复X中的缺失值。

2 基于ST-RTL的路网交通数据修复模型

2.1 模型架构

基于图1中时空数据展示与式(2)的预期目标,研究从模型优化角度出发提出了基于CP张量分解的ST-RTL修复模型,以完成对复杂缺失交通数据的精准修复。具体而言,图2展示了ST-RTL模型的修复过程,主要包括以下两部分:a)三阶CP张量分解完成缺失交通数据的低秩近似与基本重构;b)可迭代时空残差优化结构减少模型误差,实现路网缺失交通数据的精准修复。其中,2.2节(对应图2中的①)介绍了高阶CP张量分解原理与完成三阶缺失交通张量低秩重构的方法与过程;2.3节(对应图2中的②)提出了一种新颖的双向残差优化结构及其结合CP张量计算的具体应用。对于修复后的完整张量,研究在实验部分采用了多种性能指标和各种先进的基准模型综合对比和评判ST-RTL的修复效果。

2.2 高维低秩张量分解

2.2.1 CANDECOMP/PARAFAC (CP)张量分解

作为矩阵奇异值分解的高阶扩展版本,CP张量分解在信号处理、图像去噪及数据修复等各个方面取得了广泛应用。通常,该算法将高阶张量分解为有限个秩1张量和,然后通过最小二乘法或梯度下降法进行迭代计算和低秩还原。本研究利用CP分解作为基本工具以完成对缺失交通数据的精准修复。具体如式(2)所示,研究首先采用CP分解将X转换为R个秩为1的因子张量和,然后再对其数值优化问题求解。

2.2.2 低秩贝叶斯推断

对于上述三阶CP张量分解,研究采用贝叶斯方法近似求解各因子张量arbrcr。为方便描述,研究利用ur统一表示张量arbrcr且假设其向量u(d)r满足多元高斯分布:

其中:tr(·)为迹函数,表示方形矩阵主对角线上所有元素的和。实际上,被分解的张量X与其重构值存在绝对误差,研究假设观测向量xi∈XΩ满足独立高斯分布xi~N(i,τ-1ε),τε为精度参数,i为xi的CP分解重构值。由于τε值大小反映了交通数据的噪声程度,所以间接影响了CP分解的稳健性。但理论上该值无法确定,研究只能采用共轭τε~Gamma(ξ,ζ)先验对其进行估计,其中ζ和ξ分别为形状参数和速率参数。在高斯假设条件下,研究后续采用Gibbs采样算法[9]对所有模型参数和超参数进行估计并求其后验分布,最后通过次迭代计算交替更新完成贝叶斯推断和CP张量分解。

2.3 时空残差优化建模

与传统修复方法相比,上述低秩CP张量分解对简单缺失状况具有一定的修复效果。然而,现阶段大规模复杂缺失交通数据修复任务需要更为精准且稳定性更强的修复模型。考虑到实际修复过程中被忽视的计算残差,研究从模型优化角度出发设计了一个可高度模块化的双向时空残差优化结构。具体而言,该结构包含

3 实验与结果分析

3.1 实验数据与缺失情况描述

3.1.1 数据集描述

本研究选择公开可获取的杭州地铁客流交通数据集[9]验证ST-RTL模型的实际修复效果和可靠性。该数据集包含了杭州市80个地铁站在2019年1月1日至1月25日采集到的所有进站乘客流量,采样间隔为10 min,即每10 min记录站点客流的平均数量。依据城市地铁运行规律,地铁站在00:00~06:00时段暂停服务,因此,每个站点每天能收集108个数据值。根据时空属性和研究目标,本文将上述杭州交通时序按张量模式“传感器×天数×时间”重新转换为“80×25×108”的三阶张量形式。

3.1.2 复杂缺失张量构建

在城市路网环境中,各种硬件/软件故障导致交通数据缺失的方式和比率多样,传统研究倾向于构建单一模式下具有较低比率的缺失交通时序以完成修复任务。本研究在调查统计交通数据实际缺失状况后,设计了三种能模拟真实状况的修复场景:随机缺失(random missing,RM)、聚类缺失(cluster mis-sing,CM)和混合缺失(hybrid missing,HM)[11]。针对这三种模式,研究随机删除一定比率的数据点、数据块及其组合以满足理论研究对缺失率的设计要求,保证其从10%开始以间隔10%递增至90%,基本全尺度覆盖了所有可能的缺失情况。特别对于HM模式,研究通过同比率混合RM和CM模式下的缺失数据以形成HM模式下具有指定比率的缺失交通张量。

3.2 基本的实验设置

3.2.1 基准对比模型

研究引入具有代表性的基准模型进行修复性能对比,各个对比模型介绍如下:

a)HaLRTC[7]:高精度低秩张量完成。它在张量核范数最小化基础上,使用交替乘子法(ADMM)解决了多个约束间的依赖关系并对修复问题进行了有效求解。

b)GAIN[12]:生成对抗修复网络。它的生成器利用部分观测值输出完整的交通时序,并通过对抗网络逐步学习交通数据的真实分布以提高模型的修复精度。

c)BGCP[9]:贝叶斯高斯CP张量分解。它扩展贝叶斯概率矩阵分解至更高阶形式,然后通过马尔可夫链蒙特卡罗学习潜在低秩因子矩阵的时空依赖性以修复缺失交通值。

d)LRTC-TNN[13]:带截断核规范的低秩张量完成。它对缺失交通值实施基于截断核规范最小化的LRTC算法求解,且修复结果优于许多先进的基准模型。

e)LATC[10]:低秩自回归张量完成。它的低秩结构能有效表征三阶张量的全局一致性和变化趋势,所提出的自回归项能捕捉到交通数据的局部时间趋势。

所有基准模型均在相同实验条件下完成模型构建,模型参数预先经由反复调优确定。其中,对于HaLRTC,其RM、CM和HM场景下的学习率分别设置为10-4、10-4和10-5;对于GAIN,它的生成器与对抗器均为三层全连接神经网络且迭代次数设为1 000;对于BGCP,其RM、CM和HM模式下的CP秩分别设为110、80和40;对于LRTC-TNN,它在RM、CM和HM模式下的截断参数分别为0.3、0.05和0.05;对于LATC,设定它的模型学习率、截断参数和权衡系数分别为10-5、{5,10,15,20,30}和{1/10,1/5,1,5,10}。

3.2.2 模型评价指标

为了量化和比较ST-RTL与上述修复模型的性能,研究采用平均绝对百分比误差(mean absolute percentage error,MAPE)、均方根误差(root mean square error,RMSE)和平均绝对误差(mean absolute error,MAE)评估模型修复值与其真实值的差值。具体而言,三个评价指标的计算公式定义如下:

其中:Ω代表已被观测的交通值集合且|Ω|表示其模值;xi,j,k和i,j,k分别表示真实值及对应修复值。一般而言,MAPE、RMSE和MAE值越小,表明模型的修復性能越好[14~16]。

3.3 ST-RTL参数调优与模型评估

所有修复模型计算均在台式计算机(CPU(Intel Core i7-7700K @4.20 GHz主频,4个核心,56 GB内存和64位Windows 10操作系统)上进行,使用Python第三方库(如TensorFlow、NumPy和Pandas)与Python 3.6.7来搭建包括五种基准算法在内的所有城市地铁客流修复模型。针对RM、CM和HM场景,研究灵活调整包括张量秩在内的多个ST-RTL模型关键参数以期获得更好的修复性能。以张量秩为例,图3(a)~(c)分别展示了ST-RTL在RM、CM和HM场景下的不同张量秩R对修复性能的影响。理论上,模型设置的R值越大,张量分解与重构所包含的时空依赖信息越丰富,对应生成的缺失值越精确;实际上,ST-RTL的修复结果符合预定理论设想。据图3可知,RM、CM和HM场景下修复模型的RMSE、MAPE和MAE随着R值增加总体呈下降趋势,特别是后两个指标值的变化趋势更加显著。随着R值逐渐增大,ST-RTL的三个评价指标趋于稳定,这种现象表明过大的R无法产生等价值的增益,反而可能降低模型修复效率。同时,三种缺失场景在ST-RTL修复框架内产生了不同的计算效果,这可能与杭州地铁交通客流固有的极端时空属性有关。因此,基于对修复精度与计算效率的双重考虑,本研究设定ST-RTL模型在RM、CM和HM场景下的张量分解秩分别为15、30和20。

对于ST-RTL模型的其他实验参数,研究通过大量定量对比实验完成了模型参数调优。其中对于CP张量分解的迭代采样参数,在保证采样频率的情况下,研究设定为200,以最大限度减少算法复杂度;同时对于ST-RTL模型的残差迭代次数,研究经过多次测试并在综合考虑模型的修复精度和计算效率后设定其在RM、CM和HM场景下均为100。

在确定所有参数后,研究在图3(d)~(f)中展示了ST-RTL模型在RM、CM和HM场景及10%~90%缺失率组合下的最佳性能指标曲线。据曲线变化可知,随着缺失率递增,ST-RTL模型的RMSE、MAPE和MAE值变化总体符合理论上的增加趋势。当缺失率过高时,模型的修复性能急剧下降;特别当缺失率达到90%后,ST-RTL模型各性能指标同时骤升,这表明研究所建立的ST-RTL近乎失效。同时,ST-RTL对于有显著缺失差异的RM、CM和HM场景产生了不同的结果。如图3(d)~(f)所示,在低缺失率区间(<50%),ST-RTL对三种缺失场景产生了精确而有效的修复,具体表现为各缺失率之间的性能指标差异细微;而在高缺失率区间(>80%),三种场景因极端缺失而促使ST-RTL模型呈现出迥异的修复效果。其中,CM模式下的RMSE、MAPE和MAE值较其他场景具有更显著的变化,这表明CM对张量结构最具破坏性;相对而言,HM和RM模式下ST-RTL的修复性能依次减弱,这与其对数据集的结构破坏方式有关。因此,在路网环境中,对交通数据的采集、传输与存储应避免出现CM场景下的极端情况。

3.4 实验结果分析与对比

为证实ST-RTL模型修复性能,表1~3列出其与五种先进基准模型对各种不完整张量修复后的性能指标。考虑到图3中ST-RTL对缺失率超过80%的修复任务产生的糟糕结果,本节模型分析与对比舍弃此极端情况,仅涉及10%~80%的缺失率。具体对不同缺失情况,各模型展现出差异十分显著的实验结果,而本文的ST-RTL在绝大多数情况下均获得了最佳的修复精度。其中,在RM模式下,生成模型GAIN的评价指标RMSE、MAPE和MAE在所有缺失率范围内均远大于其他模型,这可能与其对地铁客流设置过于理想的模型假设有关;同为LRTC类算法,早期的HaLRTC在交通数据修复领域展现了相当的竞争力,特别对低缺失率(<50%)修复任务同时保持了不错的精度与效率;与HaLRTC相比,BGCP模型对各缺失率修复任务的性能指标维持了较低水准,特别对于较高缺失率的实验证明了其较强的稳定性;作为BGCP模型的扩展,LATC对各缺失状况的修复精度更高且明显优于HaLRTC;在低缺失率范围内,LRTC-TNN与ST-RTL的修复效果较为接近且相对其他模型更优。但随着缺失率增加,前者的各评价指标值逐渐呈加速扩增趋势。因此,充分对比表1中各指标后表明,所建立的ST-RTL在RM场景下要优于其他基准模型,其在80%缺失率情况下的RMSE、MAPE和MAE值仅为6.570 2、29.840 0和5.850 0。

相同标准下,研究利用ST-RTL和基准模型对CM和HM场景的缺失交通张量进行修复。表2和3记录了所有模型在两种模式下的RMSE、MAPE和MAE。据表可知,尽管模型在两种模式下的修复指标大于RM模式,但它们的性能变化趋势随着缺失率增加符合上述RM模式的演化规律。其中,ST-RTL的修复性能在CM与HM模式下总体仍优于五种主流基准模型;且相同缺失率下ST-RTL对CM和HM模式的修复指标值更大,这表明它们对张量结构的破坏程度更严重,而且这种现象随缺失率增加呈加速扩张趋势。同时,随缺失率增加,部分指标因可观测数据量改变而导致其与剩余指标的变化不一致,但这不影响模型性能的总体变化规律。综上所述,本文的ST-RTL模型利用三阶CP张量分解生成缺失交通值,然后通过残差优化减少模型误差以提高修复精度,较基准模型而言,ST-RTL更能适应复杂缺失环境,最终获得了较好的修复精度和泛化能力。

3.5 修复效果可视化

为了直观验证模型修复缺失交通值的能力,研究进一步对ST-RTL模型的修复值及其残差进行可视化分析。如图4~6所示,截取2019年1月1日到1月10日杭州交通数据集#1路段的真实客流作为基准曲线,研究分别展示了ST-RTL模型与经典的BGCP模型在50%缺失率及RM、CM和HM场景下的修复值曲线。据图可知,修复模型对地铁客流进行了良好的拟合,能基本覆盖各突变与平稳时段的客流变化。但就修复能力而言, ST-RTL模型在图4~6中对应标示的各残差块面积要明显小于BGCP,这证实了所建立的ST-RTL模型具有更优秀的修复性能。同时,纵向对比图4~6后发现,ST-RTL与BGCP模型修复三种缺失场景的难易程度正好符合3.3节和3.4节中的结论(即对张量结构的破坏程度:CM>HM>RM)。因此,在路網交通数据采集过程中,应尽量避免出现大面积/超时段的数据丢失情况。

4 結束语

针对路网交通数据修复问题,本文从CP张量分解和模型残差优化角度出发,提出了一种基于时空残差张量学习ST-RTL的交通数据修复方法。在真实城市地铁客流数据上的实验结果表明:a)研究在确定RM、CM和HM场景下的张量秩分别为15、30和20后,利用CP分解低秩重构不完整交通张量,实现了对缺失数据的有效修复;b)设计的双向残差优化结构经过100次迭代后促使低秩张量修复过程充分挖掘到残差中的时空依赖关系,保证了ST-RTL在RM、CM和HM模式与10%~80%缺失率的不同组合下具有良好的修复效果;c)与GAIN、BGCP、LATC及LRTC-TNN等主流基准模型相比,本文建立的ST-RTL模型具有更强的修复性能。在后续研究中,将考虑更多复杂的交通环境(如天气、道路及环境条件等)对ST-RTL的影响,并采用更多城市路网交通数据对模型进行测试和比较。

参考文献:

[1]武江南,张红梅,赵永梅,等.基于张量奇异值理论的交通数据重构方法[J].计算机应用研究,2022,39(5):1449-1453,1459.(Wu Jiangnan, Zhang Hongmei, Zhao Yongmei, et al. Data reconstruction method based on tensor singular value theory[J].Application Research of Computers,2022,39(5):1449-1453,1459.)

[2]张伟斌,张蒲璘,苏子毅,等.基于自注意力机制与图自编码器的路网交通流数据修复模型[J].交通运输系统工程与信息,2021,21(4):90-98.(Zhang Weibin, Zhang Pulin, Su Ziyi, et al. Missing data repairs for road network traffic flow with self-attention graph auto-encoder networks[J].Journal of Transportation Systems Engineering and Information Technology,2021,21(4):90-98.)

[3]Li Jinlong, Wu Pan, Li Ruonan, et al. ST-CRMF:compensated resi-dual matrix factorization with spatial-temporal regularization for graph-based time series forecasting[J].Sensors,2022,22(15):5877.

[4]Cui Zhiyong, Ke Ruimin, Pu Ziyuan, et al. Stacked bidirectional and unidirectional LSTM recurrent neural network for forecasting network-wide traffic state with missing values[J].Transportation Research Part C: Emerging Technologies,2020,118:102674.

[5]Xu Dongwei, Wei Chenchen, Peng Peng, et al. GE-GAN:a novel deep learning framework for road traffic state estimation[J].Transportation Research Part C: Emerging Technologies,2020,117:102635.

[6]Li Jinlong, Li Ruonan, Huang Zilin, et al. Dynamic adaptive generative adversarial networks with multi-view temporal factorizations for hybrid recovery of missing traffic data[J].Neural Computing and Applications,2022,35(10):7677-7696.

[7]Liu Ji, Musialski P, Wonka P, et al. Tensor completion for estimating missing values in visual data[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2012,35(1):208-220.

[8]Ran Bin, Tan Huachun, Wu Yuankai, et al. Tensor based missing traffic data completion with spatial-temporal correlation[J].Physica A:Statistical Mechanics and its Applications,2016,446:54-63.

[9]Chen Xinyu, He Zhaocheng, Sun Lijun. A Bayesian tensor decomposition approach for spatiotemporal traffic data imputation[J].Transportation Research Part C:Emerging Technologies,2019,98:73-84.

[10]Chen Xinyu, Lei Mengying, Saunier N, et al. Low-rank autoregressive tensor completion for spatiotemporal traffic data imputation[J].IEEE Trans on Intelligent Transportation Systems,2021,23(8):12301-12310.

[11]Li Jinlong, Xu Lunhui, Li Ruonan, et al. Deep spatial-temporal bi-directional residual optimisation based on tensor decomposition for traffic data imputation on urban road network[J].Applied Intel-ligence,2022,52(10):11363-11381.

[12]Yoon J, Jordon J, Schaar M. GAIN: missing data imputation using generative adversarial nets[C]//Proc of International Conference on Machine Learning.2018:5689-5698.

[13]Chen Xinyu, Yang Jinming, Sun Lijun. A nonconvex low-rank tensor completion model for spatiotemporal traffic data imputation[J].Transportation Research Part C: Emerging Technologies,2020,117:102673.

[14]Li Jinlong, Sun Laijun, Li Yingsong, et al. Rapid prediction of acid detergent fiber content in corn stover based on NIR-spectroscopy technology[J].Optik,2019,180:34-45.

[15]Li Ruonan, Qin Yang, Wang Jinbo, et al. AMGB: trajectory prediction using attention-based mechanism GCN-BiLSTM in IOV[J].Pattern Recognition Letters,2023,169,17-27.

[16]Li Jinlong, Sun Laijun, Li Ruonan, et al. Application of siSVR-Vis/NIR to the nondestructive determination of acid detergent fiber content in corn straw[J].Optik,2020,202:163717.

收稿日期:2023-03-02;修回日期:2023-04-25

基金項目:国家自然科学基金资助项目(52072130,11702099)

作者简介:李金龙(1993-),男,湖北荆州人,博士研究生,主要研究方向为城市计算、时空数据建模与交通信号控制;李若南(1993-),女,河南南阳人,博士研究生,主要研究方向为物联网、边缘计算与联邦学习;吴攀(1991-),女,重庆忠县人,讲师,博士,主要研究方向为交通大数据挖掘与分析;于广婧(1999-),女,河北定州人,硕士研究生,主要研究方向为交通安全与数据挖掘;许伦辉(1965-),男(通信作者),江西南康人,教授,博导,博士,主要研究方向为车路协同、交通大数据分析与交通流理论及仿真(lhxu@scut.edu.cn).

猜你喜欢

智能交通高斯分布
利用Box-Cox变换对移动通信中小区级业务流量分布的研究
2种非对称广义高斯分布模型的构造
在航集装箱船舶摇摆姿态的概率模型
不同分布特性随机噪声的FPGA实现
一种基于改进混合高斯模型的前景检测
大数据时代城市智能交通的数据技术
基于物联网的智能交通系统架构
基于支持向量机的车牌字符识别方法
智能交通中的车辆检测专利技术综述
一种改进的混合高斯模型背景估计方法*