基于时空动态约束图反馈的交通流预测

侯越 ,  张鑫 ,  武月

吉林大学学报(工学版) ›› 2026, Vol. 56 ›› Issue (01) : 183 -198.

PDF (2434KB)
吉林大学学报(工学版) ›› 2026, Vol. 56 ›› Issue (01) : 183 -198. DOI: 10.13229/j.cnki.jdxbgxb.20240640
交通运输工程·土木工程

基于时空动态约束图反馈的交通流预测

作者信息 +

Traffic flow prediction based on spatio-temporal dynamic constraint graph feedback

Author information +
文章历史 +
PDF (2491K)

摘要

针对现有交通流预测研究中对路网节点隐藏空间关联时变特性考虑不充分的问题,提出了一种基于时空动态约束图反馈的交通流预测模型。首先,通过门控循环单元(GRU)提取时序特征,在STC-GCL组件内,利用时空图生成器和时空融合约束矩阵生成表征当前时刻路网邻域关系的动态约束图,再利用多层图结构卷积操作实现空间特征提取。其次,利用多尺度门控卷积单元动态调整重要特征信息流,完成对关键特征的精细化筛选。最后,通过将STC-GCL嵌入GRU的方式,实现时空特征的一致性提取。试验在高速路网PeMSD4、PeMSD8、成都-滴滴公开数据集上进行测试,结果表明:与当前主流交通流时空预测方法FGI相比,本文模型的MAE在3个数据集上分别降低了2.69%、1.88%、0.92%。

Abstract

Aiming at the problem of insufficient consideration of the time-varying characteristics of hidden spatial associations of road network nodes in the existing traffic flow prediction studies, this paper proposes a traffic flow prediction model based on the feedback of spatio-temporal dynamic constraint graph. First, the temporal features are extracted by GRU, generates a dynamic constraint graph characterising the neighbourhood relationship of the road network at the current moment by using a spatio-temporal graph generator and a spatio-temporal fusion constraint matrix within the STC-GCL component, and then realises spatial feature extraction by using a multilayer graph structure convolution operation. Second, the multi-scale gated convolution unit is used to dynamically adjust the information flow of important features to complete the fine screening of key features. Finally, the consistent extraction of spatio-temporal features is achieved by embedding STC-GCL into GRU. The experiments are tested on the public datasets of high-speed road network PeMSD4, PeMSD8, and Chengdu-DDT, and the results show that compared with the current mainstream spatio-temporal prediction methods for traffic flow FGI, the MAE of the proposed model in this paper reduced by 2.69%, 1.88%, and 0.92% in the three datasets, respectively.

Graphical abstract

关键词

交通流预测 / 时空性 / 动态性 / 图卷积神经网络

Key words

traffic flow prediction / spatio-temporal nature / dynamic nature / graph convolutional neural network

引用本文

引用格式 ▾
侯越,张鑫,武月. 基于时空动态约束图反馈的交通流预测[J]. 吉林大学学报(工学版), 2026, 56(01): 183-198 DOI:10.13229/j.cnki.jdxbgxb.20240640

登录浏览全文

4963

注册一个新账户 忘记密码

0 引 言

近年来,有限的道路占有率与逐年快速增长的机动车保有量间的矛盾越发突出,交通拥堵问题已成为影响城市发展的一项痼疾。智能交通系统作为城市交通治理的重要信息化手段1,主要通过交通流预测技术对现有交通运行状况进行分析、评估和预测,从而为交管部门先期预警提供决策,实现数字化缓解交通拥堵的目的。

交通流预测方法按发展阶段主要分为统计学方法23、机器学习方法45、深度学习方法6-11。其中,深度学习方法凭借高度抽象非线性数据复杂关系的优势,被广泛应用于交通流预测任务中。深度学习预测方法主要有循环神经网络67(Recurrent neural net,RNN)、长短时记忆神经网络89(Long short term memory,LSTM)、门控循环单元1011(Gate recurrent unit,GRU)及其变体。这类方法主要通过积累不同时间步信息学习交通流数据的时序特性,但缺陷在于考虑交通流时序特性的同时,忽略了实际路网节点间的空间依赖关系,导致预测精度难以满足实际要求。近年来,结合卷积神经网络1213(Convolutional neural network,CNN)、图神经网络1415(Graph neural network,GNN)、图卷积神经网络1617(Graph convolutional neural network,GCN)的改进方法为交通流预测提供了有效的解决方案,这类方法可在一定程度上满足实际路网时空关系的学习任务。Zhu等18采用Transformer架构学习交通流时序的全局依赖关系,利用图卷积注意网络(Graph convolutional attention network, GCAT)学习区域路网间的空间依赖关系,并通过串联方式建立基于混联交通流的时空网络(TRGCAT)预测模型。上述方法虽综合考虑了交通流的时空特性,提升了模型预测性能,但模块间的串行连接方式割裂了时空特征的内在联系,使得模型在时空关系表征方面存在一定的局限。为解决该问题,Zhao等19结合预定义图和历史交通流数据,利用CNN提取交通流时间特征,利用GCN提取其空间特征,并通过时空同步建模机制实现交通流时空特征的一致性提取。然而,基于静态预定义图的时空同步建模机制,难以反映路网节点间空间关联性的动态变化。Bai等20提出一种用于流量预测的自适应图卷积循环网络,该方法基于自适应邻接矩阵,通过数据驱动方式学习路网节点间的动态关联关系,进而在进行GCN空间特征提取时,为每个节点分配单独的权重和偏置,以学习各节点特有的交通模式。该方法虽利用自适应邻接矩阵动态表征路网节点间的动态关系,但没有充分利用历史交通数据,模型会随着模型训练的停止而固定。Liu等21提出一种面向交通预测的时空动态交互图卷积网络,该方法基于奇偶子序列划分后的交通流数据及先验知识,设计动态图卷积模块对每个子序列进行动态图的生成及空间特征的提取,进而通过交互式学习策略同步捕获划分后交通数据的时空依赖关系。该方法虽通过生成动态图有效捕获了交通网络中动态变化的空间相关性,但在利用图卷积进行空间建模时忽略了空间特征提取过程中产生的冗余信息。为解决此问题,Ju等22提出一种新的时空动态融合图卷积网络,在将路网作为一个整体的基础上,利用超图从短期动态波动图和全局长期静态稳定图两个方面动态生成最优图结构,继而通过时间卷积网络、光谱域图卷积实现交通流预测。上述方法虽通过超图有效表征了现实路网中节点的动态时空关联关系,但忽略了多层图卷积进行空间特征提取时易产生冗余信息的问题。Cao等23提出一种用于交通速度预测的多头自注意力门控时空图卷积网络,结合TCN和GCN分别提取交通时空特征,并通过循环门控机制逐层丢弃不相关的信息,以控制多层GCN中信息的传播,有效地避免了特征冗余问题。

综上所述,对于复杂路网交通流时空预测建模而言,路网节点间的动态关联关系表征、交通流时空特性的同步学习及冗余特征的筛选是实现交通流精准预测的关键。鉴于此,本文从路网节点间的动态邻域关系及交通流时空特性同步学习的角度出发,构建了基于时空动态图反馈的交通流预测模型(STC-GCL-MGRU)。该模型在原始路网拓扑结构与GRU时序特征的基础上,利用本文所提时空图生成器构建包含当前时间步时序特征和原始空间拓扑关系的图结构。同时,采用改进互信息的时空融合矩阵构造方法,与图结构融合生成同时间步下具有路网实际拓扑关系约束的动态约束图。在此基础上,利用三层图卷积操作对动态图进行空间特征提取,通过多尺度门控卷积单元去除干扰冗余信息,并筛选出对当前时间步交通流预测具有显著影响的关键特征,继而将筛选后的特征序列反馈至下一时间步的特征提取阶段,以实现多个时间步时空特征一致提取的反馈全过程。

1 问题定义

为清晰地描述路网的动态时空特性,本文以图结构理论为基础对实际路网节点关系进行建模,用GVEA )表示具有N个节点的区域路网拓扑结构。其中,V为节点集合,E为节点连接边集合, A 为原始路网邻接矩阵。设Xt=(x1t,x2t,,xNt)t时刻N个节点的交通流数据,X=(X1,X2,,Xs)为历时s个时间片的交通流数据,Y=(Xs+1,Xs+2,,Xs+s^)为未来s^个时间片的交通流数据。因此,区域路网交通流预测问题可描述为:

XG(t-T+1),,XG(t)fXG(t+1),,XG(t+T')

式中:f为时空动态约束图反馈的交通流建模函数;整体表达式含义为使用历时s个时间片的交通流观测值预测未来s^个时间片的交通流数据。

2 交通流时空动态特性分析

交通流序列的特性主要包括时间自相关性和空间相关性。其中,时间自相关性是指单个节点的交通流在不同时间点上呈现出的动态相关性。在实际路网中,由于单个节点采集的交通流量数据xt在每个时刻t下只有一个观测值,因此单个节点在t-st两个时刻的相关系数可表示为:

λ(xt-s,xt)=i=1t-s(xi-β)(xi+s-β)j=1t(xj-β)2

式中:xt-sxt分别为单个节点在t-st时刻的平均交通流量;s为时间间隔阶数;β为单个节点的平均交通流量;λ为自相关系数,其值越大,说明两个时刻的交通流量数据自相关程度越高。

为充分刻画交通流数据的动态时间自相关性,本文依据式(1)对PeMSD8数据集中7个节点采集的交通流量数据进行3个连续时段的时间自相关分析,结果如图1所示。

图1为PeMSD8中7个节点在不同时间段内交通流量自相关分析结果。以5号节点为例,在7:00~8:00时段内,其自相关系数为0.826 3,属极强相关;在8:00~9:00时段内,自相关系数为0.372 8,属弱相关;在9:00~10:00时段内,自相关系数为0.536 9,属中度相关。上述分析表明,单个节点交通流数据的自相关程度随时间呈现动态变化规律。从7个节点整体交通流量分析可以看出,7:00~8:00时段的平均自相关系数为0.685 1,属强相关;8:00~9:00、9:00~10:00时段的平均自相关系数分别为0.536 3、0.559 4,属中度相关。由此可知,整个区域交通流量自相关程度均随时间动态变化。

在空间相关性分析方面,本文以2号、5号节点的流量数据为研究对象,具体结果如图2所示。在7:00~8:00时段内,两节点间的空间关联度为0.725 2,属强相关;在8:00~9:00时段内,两节点间的空间关联度为0.134 9,属弱相关;在9:00~10:00时段内,两节点间的空间关联度为0.359 9,属弱相关。由此可知,区域节点间的空间关系呈现随时间动态变化的规律。

综上所述,任意节点的交通序列不仅受当前时刻邻域节点交通流的影响,还受历史时刻自身交通流的影响,单纯依赖时间或空间维度的分析,不能准确反映交通流数据的动态变化规律。因此,需综合考虑不同时段内交通流数据的时间自相关性、空间相关性及节点在不同时空位置下的动态性,以准确模拟路网节点数据间的动态关联变化规律。

3 时空动态约束图反馈的交通流预测模型

本文提出了一种基于时空动态约束图反馈的交通流预测模型STC-GCL-MGRU。该模型在GRU框架下,通过构建STC-GCL组件,实现路网动态空间关系的学习及关键特征的筛选,具体框架如图3所示。STC-GCL组件由时空动态约束图构造模块、空间特征提取层及多尺度门控卷积单元组成。其中,时空动态约束图构造模块基于GRU提取的时间特征及先验知识,通过时空图生成器和时空融合约束矩阵,生成当前时间步的动态约束图结构,进而利用空间特征提取层及多尺度门控卷积单元学习动态约束图的空间依赖关系,以筛选出对交通流预测具有显著影响的关键特征。同时,通过将STC-GCL嵌入GRU的方式,实现时空特征的一致性提取。此外,在多时间步尺度下,GRU可通过串行循环机制将当前时间步的时空特征反馈至下一时间步,从而实现时空动态图约束下的交通流预测全过程。

3.1 时空图生成器

在路网节点间空间邻域关系表征方面,现有研究主要通过预定义图或构建自适应邻接矩阵的方式,捕获实际路网节点间的隐藏空间关联关系。然而,这类方法未充分利用历史流量数据,忽略了时间因素对交通流空间关联关系的影响,难以反映节点间关联关系随时间的动态变化。鉴于此,本文提出时空图生成器,旨在基于时序特征和原始路网拓扑结构,构建反映当前时间步节点关联关系的动态图结构,其架构如图4所示,具体计算过程如下:

首先,将时间特征提取后的特征HRB×C×N×T及预定义的原始路网拓扑结构MadjRN×M作为时空图生成器的输入,在实现节点信息循环流动更新、保持节点连接关系、融入时序信息的基础上,融合不同循环次数下的Hi',以达到整合不同层次空间信息、增强特征表达丰富性的目的,具体计算如式(3)(4)所示:

Hi'=n=1NHBCnT*MadjnM
H¯=Dropout(Conv2d(i=1NHi'))

式中:B为批次大小;C为通道数量;NM为节点数量;T为时间步;Hi'为第i次流动后的结果;H¯为整合后的节点特征总和,H¯RB×C×N×T

其次,基于H¯,依据式(5)计算节点对之间的相似度,得到相似度学习矩阵MLe如下:

Mij=Softmax(ReLu(c=1Ct=1TH¯BCit·t=1TH¯BCjtC))
MLe=M11M12M1MM21M22M2MMN1MN2MNM

式中:H¯BCiH¯BCj分别为节点i和节点j的特征表示;Mij为节点i和节点j之间的相似度;·表示点积。

最后,本文定义了自适应邻接矩阵MAdpRN×M,将该矩阵与学习矩阵MLe自适应融合,得到当前时刻的动态图MDyn。具体计算如式(7)(8)所示:

MAdp=Softmax(ReLu(E1·E2T))
MDyn=σMLe+(1-σ)MAdp

式中:E1E2为可学习参数;σ为可学习的融合因子。

3.2 时空融合约束矩阵构造

在时空图生成器训练过程中,随着图结构推理复杂性的增加,易造成不相关节点间的虚假连接,从而影响交通流时空特性的内在联系。同时,考虑到交通流具有显著的非线性特性,常用的皮尔逊相关系数、余弦距离、欧式距离等线性空间相似性度量法,难以有效刻画交通流数据间的非线性规律。而互信息法在衡量任意两个随机变量的非线性关系方面具有优势,可实现路网节点实际空间关系的量化,但该方法主要适用于离散数据,对交通流时序数据的适用性不强。鉴于此,本文提出一种基于改进互信息的时空融合约束矩阵构造法,旨在依据不同时段输入数据的差异,构建各时段特定的时空约束矩阵,具体架构如图5所示。

本文所用交通流数据以5 min为采样间隔,基于历史1 h的交通流数据预测未来1 h的交通流趋势。在此过程中,利用滑动窗口对每相邻12条交通流数据进行动态封装,并采用改进互信息时空融合约束矩阵构造法计算其对应的时空约束矩阵,完成对动态图结构的约束过程,具体步骤如下:

首先,在时间维度上,利用式(2)中的自相关函数对每小时内的多节点交通流数据进行时间自相关性分析,得到时间自相关矩阵MT,矩阵定义如式(9)所示:

MT=λ(x1)λ(xn)

式中:λ(xj)(j=1,2,,n)为节点j采集的交通流在时间维度上的自相关系数。

其次,在空间维度上,采用等距离离散化互信息法计算空间关联度矩阵,具体步骤如下:

Step1 对每小时内的交通流数据进行离散化处理。

Δ=max(xn)-min(xn)L

式中:xn为节点n采集的交通流数据;L为目标区间数量;Δ为区间范围大小。对节点n的每条数据xnk,计算其所在的区间索引xnl

xnl=xnk-min(x)ΔMn=xn1,xn2,,xnl,l=1,2,,m

式中:·表示向下取整操作;xnl为节点n的第k条数据离散化后的结果;Mn为节点n采集的交通流数据离散化后的结果,是一个长度为m的一维数组,其中Mnl为第n个节点在第l个时间点离散化后的结果。循环执行Step1,实现所有节点交通流数据的离散化全过程,结果如图6所示。

Step2 由图6可知,离散化后的流量序列仍保持原始流量序列的时间趋势信息。依据离散化后的流量序列计算各节点间的互信息得分,两个节点间的互信息定义如式(12)所示:

r(Mi,Mj)=aMibMjp(a,b)log(p(a,b)p(a)p(b))

式中:r(Mi,Mj)为节点i和节点j之间的互信息得分;MiMj分别为节点ij离散化后的交通流数据;pa,b)为节点ij同时取值ab的概率;pa)和pb)为节点分别取值ab的边缘概率。

Step3 根据Step2计算路网节点间的互信息得分,以此构建空间关联度矩阵MS,矩阵定义如式(13)所示:

MS=r(M1,M1)r(M1,Mn)r(Mn,M1)r(Mn,Mn)

最后,在上述已构建的空间关联度矩阵MS基础上,结合时间自相关矩阵MT和原始路网拓扑结构Madj,依据式(14)计算每小时内的时空约束矩阵MCST

MCST=MSMadj-I+MT

式中:Madj为原始路网拓扑结构; I 为阶数为n的单位矩阵;MCST为所得时空约束矩阵。

将上文得到的时空约束矩阵MCST与3.1节中的动态图进行融合约束操作,得到不同时段内贴合实际空间关联关系的动态约束图,进而与时序特征共同作为空间特征提取层的输入,再利用三层图卷积操作实现路网显著信息的筛选,以达到深层次挖掘现实路网隐藏时空关系的目的,如下所示:

MCDyn=Softmax(Relu(MCSTMDyn))

式中:MCDyn为动态约束图;MDyn为3.1节中的动态图。

3.3 多尺度门控卷积单元

为避免空间特征提取过程中产生的冗余信息,导致GRU过度适应特征序列中的噪声而非真实的时序信息,本文在有效提取交通流空间特征的基础上,提出改进多尺度门控卷积单元,其结构如图7所示。该单元通过1×1  3×3  5×5三种不同尺寸的卷积核捕获不同尺度的空间特征,并对其结果使用门控机制学习不同特征间的重要性,进而达到筛选关键特征、去除冗余信息的目的,具体计算公式如式(16)~(23)所示:

XS=(WS1X+bS1)
XM=(WM1X+bM1)
XL=(WL1X+bL1)
GateS=σ(WS2X+bS2)
GateM=σ(WM2X+bM2)
GateL=σ(WL2X+bL2)
Xnew=XSGateS+XMGateM+               XLGateL
Xgout=Dropout(W3Xnew+b3)

式中:WSiWMiWLii=1,2)分别为1×1 3×3 5×5三种不同卷积核大小的权重矩阵;bS1bS2bM1bM2bL1bL2为对应的偏置项;σ为sigmoid函数;表示矩阵运算;Dropout为正则化层;GateS GateM GateL为门控信号;Xnew为融合不同尺寸空间特征后的结果序列;Xgout为多尺度门控卷积单元输出。

3.4 时空特征一致性反馈提取

在对现实路网空间关联关系进行有效表征的基础上,交通流时空特征的同步提取是实现交通流精准预测的关键。因此,本文利用三层图卷积层设计空间特征提取层,基于时空图生成器、时空融合约束矩阵构造法构建时空动态约束图构造模块,并联合多尺度门控卷积单元构建时空约束图卷积门控组件STC-GCL。在此基础上,结合STC-GCL组件和GRU单元,通过组件嵌入方式构建时空特征提取模块STC-GCL-GRU。在该模块内,将时间特征提取中的历史状态贡献度计算结果h˜t-1和当前状态贡献度计算结果h˜t输入STC-GCL组件,进行路网动态空间关系的学习及关键特征的筛选,以便利用GRU的串行循环机制将当前时间步筛选后的时空特征反馈序列ht反馈至下一时间步,继而在单一框架内完成时空特征一致性提取及反馈过程,具体结构如图8所示,计算公式如式(24)~(31)所示:

Rt=σ(Whrht-1+WnrXt+br)
Ut=σ(Whuht-1+WnuXt+bu)
Ft=tanh(Wh˜h(Rtht-1)+Wh˜nXt+bh˜)
h˜t-1=(1-Ut)ht-1
h˜t=UtFt
ht-1'=Φt-1(h˜t-1,Θt-1[h˜t-1,Xt,Madj])
ht'=Φt(h˜t,Θt[h˜t,Xt,Madj])
ht=Ψt-1(ht-1')+Ψt(ht')

式中:ht-1ht分别为t-1时刻和t时刻的反馈隐藏状态;Xt为第t个时间步的输入;WhuWhr分别为历史时刻更新门和重置门的权重参数矩阵;WnuWnr分别为当前时刻更新门和重置门的权重参数矩阵;bubr分别为重置门和更新门的偏置矩阵;Wh˜hWh˜nbh˜分别为候选状态在历史时刻和当前时刻的权重参数矩阵和偏置矩阵;RtUtFt分别为重置门、更新门和候选隐藏状态;Madj为原始路网邻接矩阵;h˜t-1为历史反馈状态贡献度;h˜t为当前反馈状态贡献度;式(27)(28)分别为历史状态贡献度计算和当前状态贡献度计算操作;Θ代表STC-GCL组件中时空图生成器和时空融合约束矩阵的构造运算;Φ为空间特征提取中的三层图卷积操作;Ψ为多尺度门控卷积单元运算;Ψt-1(ht-1')为经h˜t-1得到的特征反馈序列;Ψt(ht')为经h˜t得到的特征反馈序列。

4 实验设计与验证

4.1 数据集及实验参数描述

本文选取美国公路交通数据集PeMSD4、PeMSD8流量数据集和成都-滴滴速度数据集进行实验验证。实验以50 d数据作为训练集,10 d数据作为测试集,同时从训练集中划分300个数据样本作为验证集。其中,PeMSD4、PeMSD8以5 min为一个时间片对交通流量进行聚合,成都-滴滴数据集以10 min为一个时间片对交通速度进行聚合。数据集详情如表1所示。

4.2 实验设置与评估指标

本文基于pytorch1.11,在NVIDIA GeForce GTX 3060 Super硬件设施设备上进行实验。实验中,PeMSD4、PeMSD8数据集的历史滑动窗口及未来滑动窗口均设置为12,成都-滴滴数据集的历史滑动窗口及未来滑动窗口均设置为6,模型优化器采用Ranger,批量大小设为16,初始学习率设为0.001,并采用指数衰减率0.001在训练模型过程中更新学习率。同时,本实验利用z-score对数据集进行归一化处理,将原始数据映射至[0,1]区间。基准线模型的参数设置与本文模型的相同。为验证本文模型STC-GCL-MGRU的有效性,本文采用平均绝对误差(Mean absolute error,MAE)、均方根误差(Root mean square error,RMSE)和决定系数(R2)作为评价指标,具体计算公式如式(32)~(34)所示:

MAE=1Ni=1Nyi-y¯i
RMSE=1Ni=1Nyi-y¯i2
R2=1-J=1Zy^J-yJ2J=1Zy¯-yJ2

式中:N为样本数据的总数量;yi为真实值;y¯i为预测值。

4.3 基线模型

为验证本文模型具有较好的预测效果,本文选取以下7个模型作为基准线方法:

CNN-LSTM11:分别采用CNN和LSTM学习交通流数据的空间依赖关系、时间依赖关系。

ASTGCN:通过引入空间注意力机制和时间注意力机制,分别捕获空间依赖关系和时间依赖关系。

DCRNN:结合扩散卷积及GRU进行时空特征一致性提取。

SCINet24:构建交互学习结构,并递归使用多个样本卷积捕捉交通流的时间特征。

STG-NCDE25:利用两个神经控制微分方程进行时空依赖性的学习。

DeepSTUQ26:编码器采用GRU、GCN捕捉交通流的时空相关性,解码器采用卷积层进行交通流预测。

FGI27:通过自适应邻接矩阵及特征增强机制捕捉交通流的空间相关性,利用GRU捕捉其时间相关性。

4.4 实验结果分析

为充分验证本文STC-GCL-MGRU模型的交通流量预测性能,本文将多个基准线模型的预测性能与STC-GCL-MGRU模型进行对比。利用不同模型预测未来1 h交通流量的平均性能指标,如表2所示。

分析表2数据可知,CNN-LSTM虽考虑了空间维度和时间维度的信息,但预测性能表现最差。DCRNN将空间依赖性建模为有向图上的扩散过程,ASTGCN分别利用注意力机制和GCN学习交通流的时间和空间相关性,二者的预测性能均有一定提升。作为典型的时间序列模型,SCINet通过下采样交互卷积方式取得了较好的预测结果,其MAE和RMSE在PeMSD4、PeMSD8数据集上分别为20.41、32.48,16.69、26.15。STG-NCDE通过自适应矩阵对路网进行建模,DeepSTUQ结合GCN和GRU,以组合建模的方式学习交通时空依赖关系,这两个模型在3种数据集上的MAE、RMSE分别为20.29、31.99,15.82、24.89,2.32、3.44;19.15、31.36,15.04、23.97,2.29、3.44。FGI利用加权邻接矩阵和特征增强机制学习路网空间时变关联特性,其MAE、RMSR、R2在PeMSD4、PeMSD8数据集上分别为19.307 5、31.676 7、0.928 2,14.934 2、23.602 3、0.939 6。

相比之下,本文STC-GCL-MGRU模型基于提取的时序特征及先验知识,利用时空图生成器和时空融合约束矩阵构造生成表征当前时间步路网空间关联关系的图结构,进而实现对路网动态空间关联关系的有效学习。在此基础上,针对多层图卷积空间特征提取过程中产生的冗余信息,STC-GCL-MGRU能够利用多尺度门控卷积单元筛选出对预测结果具有显著影响的关键特征。由表2可知,本文模型的MAE、RMSE、R2在PeMSD4、PeMSD8流量数据集上的结果分别为18.79、30.28、0.962 8,14.65、23.69、0.963 4,相较于其他基准线模型,STC-GCL-MGRU的预测性能最好,尤其在PeMSD8数据集上,相比于DeepSTUQ,其MAE、RMSE分别降低了2.6%、1.2%。

同时,在成都-滴滴数据集上,与最先进的DeepSTUQ、FGI时空交通流预测模型相比,STC-GCL-MGRU的MAE、RMSE分别降低了5.68%、4.94%,0.92%、1.21%,性能表现最佳。这表明本文STC-GCL-MGRU模型即使在具有高度非线性和不确定性(如突发事件或高峰时段的流量波动)的大规模路网中,仍能有效表征路网动态空间关联关系并筛选出关键特征。由此可见,本文STC-GCL-MGRU模型在不同的公开高速路网数据集中均具有较好的性能表现,可实现更精准的交通流预测。

为验证本文STC-GCL-MGRU模型预测未来1 h交通流量的性能,本文在图9~11中可视化了STC-GCL-MGRU模型和基准线模型在PeMSD4、PeMSD8数据集上不同时间步的预测指标。由图9~11可知,HA及SVR无法有效学习交通流量数据的复杂特征,整体预测性能欠佳。

相比之下,LSTM能更好地提取交通流量的时序特征,预测指标有所提升。而CNN-LSTM在使用CNN提取空间特征的基础上,使用LSTM提取时间特征,预测效果稳定。此外,在预测前两个时间片时,DCRNN、ASTGCN、SCINet、DeepSTUQ、STG-NCDE、FGI的预测性能相仿,但随着时间步的增加,DCRNN与ASTGCN、SCINet、DeepSTUQ、STG-NCDE、FGI间的性能差异逐渐扩大。而本文STC-GCL-MGRU模型在多个时间步预测中整体性能均具有较优表现,尤其在预测第一个时间步时,STC-GCL-MGRU在PeMSD4数据集上的MAE和RMSE分别为17.38、27.96,误差较低。同时,随着时间步的增加,STC-GCL-MGRU的误差曲线上升速度较为平缓,具有较好的稳定性能。

4.5 外部天气影响实验

在实际路网中,交通流的动态演变不仅受交通流内部参数的影响,还受到外部天气的直接影响。图12为PeMSD8平均交通流量与天气状况、相对湿度、温度、气压、可视度、风速等气象参数间的相关性热力图。本节实验将以外部天气作为噪声因素对模型进行干扰,在外部天气影响下模型的预测性能低于无外部天气影响下模型的预测性能。同时,为有效评估外部天气扰动下本文STC-GCL-MGRU模型的预测效果,本文新增外部天气扰动下部分基准线模型的多步预测实验,结果如表3所示。

分析表3中数据可知,当预测时间为5 min时,SCINet的预测效果最差,其MAE、RMSE、R2分别为14.49、22.17、0.940 1;STG-NCDE模型和DeepSTUQ模型的MAE、RMSE分别为14.22、21.79,13.54、20.99。相比之下,本文STC-GCL-MGRU模型的预测性能最优,相较于DeepSTUQ,其MAE、RMSE分别降低了2.07%、1.76%。当预测时间为60 min时,本文模型的MAE、RMSE、R2分别为18.11、28.71、0.941 3,其预测性能同样最佳。

图13为STC-GCL-MGRU模型在有、无气象扰动下的多步预测性能评价指标结果。通过分析图13中数据可知,第一个时间步有、无气象扰动下的RMSE分别为20.60、20.15,预测性能相近,但随着时间步的增加,有、无气象扰动下的指标差距逐渐加大,且有气象扰动下的预测性能均低于无气象扰动下的预测性能。此外,MAE、RMSE、R2指标平均性能在有、无天气扰动下的误差分别为1.18、1.44、0.003 4,误差较小。由此可见,本文模型STC-GCL-MGRU在外部天气扰动下仍具有较好的稳定性能,抗干扰能力较强。

4.6 过程性仿真

为评估模型各组件的有效性,以PeMSD8数据集为研究对象,设计系列对比模型:将采用原始路网拓扑结构ADJ,且仅利用GRU和三层图卷积层组件嵌入方式进行时空特征一致性提取的模型命名为GRU-GCL;基于GRU-GCL,将增加时空图生成器的模型命名为STC-GCL-ADD-IG;基于STC-GCL-ADD-IG,将增加时空融合约束矩阵构造的模型命名为STC-GCL-ADD-ST;基于STC-GCL-ADD-ST,增加多尺度门控卷积单元的模型为本文模型,即STC-GCL-MGRU。各模型具体预测结果如表4所示。

表4给出了不同模型预测未来1 h交通流量的平均性能指标,图14展示了增加动态时空图生成器和时空融合约束矩阵构造后的空间拓扑图变化,图15展示了增加动态时空图生成器、时空融合约束矩阵构造和多尺度门控卷积单元后,经过空间特征提取运算的特征分布。结合表4图14图15,以1号及2号节点为例进行数据分析可知,GRU-GCL依赖的原始路网拓扑结构仅能反映1号及2号节点间是否连接的二元信息,无法提供节点连接强度或交通流量的相关信息,其预测效果最差。相比之下,STC-GCL-ADD-IG模型引入了动态时空图生成器,能够在保持原始路网结构信息的基础上,结合输入的时序特征,量化当前时段节点间的相互作用强度,其中1号及2号节点之间的关联强度为0.015 3。此外,空间特征提取后的结果能反映不同时间步下节点间交互强度的基础动态变化,STC-GCL-ADD-IG模型的MAE、RMSE分别为17.64、28.39。在此基础上,STC-GCL-ADD-ST模型能够融合不同时段的时空融合约束矩阵及时空图生成器生成的动态图结构,1号及2号节点间的关联强度更新为0.018 52,使融合后的动态约束图更贴合实际路网在不同时段的动态变化。在空间特征提取后,不同时间步下节点间交互的复杂度及差异性有所增加,相较于STC-GCL-ADD-IG,其MAE、RMSE指标分别降低2.6%、2.1%。集成多尺度门控卷积单元后,STC-GCL-MGRU模型能够对已提取的空间特征进行筛选和过滤,精细化最终的特征表示,相较于性能最佳的STC-GCL-ADD-ST模型,其MAE、RMSE分别降低了14.78%、14.75%。

4.7 不同高峰期预测实验

为验证模型在不同时段的预测能力,本文基于PeMSD8数据集及部分基准线模型,通过抽取测试集中的早高峰(7:00~9:00)、午高峰(11:00~13:00)、晚高峰(17:00~19:00)时段数据进行不同高峰期预测实验,结果如图16所示。

图16为部分基准线模型和本文STC-GCL-MGRU模型早、午、晚高峰的预测性能,分析图中数据可知,不同时段的模型测试结果显示,各模型的表现存在显著差异。其中,SCINet在所有时段的表现均不理想,尤其是在午高峰时段,其RMSE达到最高值27.26,表明该模型在处理非平稳交通数据时可能存在瓶颈。此外,STG-NCDE的误差也较大,这可能与其捕捉短期动态特征的能力不足有关。相较于上述两种模型,DeepSTUQ的表现较为突出,在早高峰(MAE=14.53)和午高峰(MAE=17.17)的预测中表现优异,表明该模型在高峰期的突发流量预测方面具有优势。相比之下,本文STC-GCL-MGRU模型在所有时段的预测中均具有最好的稳定性和泛化能力,特别是在晚高峰时段,其MAE和RMSE分别为15.53和23.51,表明该模型在应对复杂交通状况时具备良好的时空特征捕捉能力。造成上述差异的原因在于:早高峰和晚高峰的交通流量模式相对规律,模型更容易学习这些特征;而午高峰时段,交通流量更加分散且波动频繁,增加了预测难度,导致模型误差相对较大。综合来看,STC-GCL-MGRU模型的良好表现说明,其在应对多样化交通模式时具有较强的泛化能力。

4.8 消融实验分析

为评估模型中各组件的有效性,本文以STC-GCL-MGRU模型为基础,将移除动态时空图生成器的模型命名为STC-GCL-MGRU-IG,将移除时空融合约束矩阵的模型命名为STC-GCL-MGRU-ST,将移除多尺度门控卷积单元的模型命名为STC-GCL-MGRU-GCU,在PeMSD8数据集上对各消融模型进行实验分析,结果如表5所示。

表5给出了不同消融模型预测未来1 h交通流量的平均性能指标,图17为各模型在不同时间步下的预测性能。分析表5中数据可知,STC-GCL-MGRU-IG模型的预测效果最差;STC-GCL-MGRU-ST模型和STC-GCL-MGRU-GCU模型的MAE、RMSE分别为18.41、29.36,17.19、27.79。相比之下,本文STC-GCL-MGRU模型的预测性能得到较大提升,相较于最佳的STC-GCL-MGRU-GCU模型,其MAE、RMSE指标分别降低了12.46%、25.81%。分析图17中数据可知,在预测第1个时间步时,STC-GCL-MGRU-IG、STC-GCL-MGRU-ST、STC-GCL-MGRU-GCU、STC-GCL-MGRU的MAE分别为15.12、13.99、13.47、12.85,STC-GCL-MGRU的预测效果最佳。同时,随着时间步的增加,STC-GCL-MGRU的性能优势逐渐扩大。在预测第12个时间步时,STC-GCL-MGRU的RMSE指标相较于STC-GCL-MGRU-IG、STC-GCL-MGRU-ST、STC-GCL-MGRU-GCU分别降低了33.21%、27.35%、23.43%,同样具有最佳的预测性能。

5 结束语

本文提出了一种基于时空动态约束图反馈的交通流预测模型构建方法。该方法在GRU框架下构建STC-GCL组件,有效解决了时空交通流预测中路网动态时变特性刻画不充分、时空特征提取不完备的问题。其中,GRU用于学习序列的时间依赖性;STC-GCL通过生成表征当前时间步路网邻域关系的动态约束图结构,实现区域路网空间关系的动态学习及关键特征的有效筛选,进而解决了路网节点间隐藏动态关联刻画不足的问题。在此基础上,通过将STC-GCL组件嵌入GRU的方式,实现了时空特征的一致性提取,解决了串行组织结构难以保障时空特征提取一致性和完备性的问题。实验结果表明,本文模型优于基准线模型及消融模型,在未来多步交通流预测中,进一步验证了本文模型在现实路网场景下能够精确、稳定地进行交通流预测,可为交通管理措施及交通信号控制方案的制定提供可靠的决策依据。

参考文献

[1]

Dimitrakopoulos G, Demestichas P. Intelligent transportation systems[J].IEEE Vehicular Technology Magazine, 2010, 5(1): 77-84.

[2]

Sun Y J, Zhang G H, Yin H H. Passenger flow prediction of subway transfer stations based on nonparametric regression model[J]. Discrete Dynamicsin Nature and Society, 2014, 2014: No. 397154.

[3]

Kumar S V, Vanajakshi L. Short-term traffic flow prediction using seasonal ARIMA model with limited input data[J]. European Transport Research Review, 2015, 7: 1-9.

[4]

Tong J C, Gu X, Zhang M, et al. Traffic flow prediction based on improved SVR for VANET[C]∥The 4th International Conference on Advanced Electronic Materials, Computers and Software Engineering (AEMCSE), Piscataway, USA, 2021: 402-405.

[5]

谷远利, 张源, 芮小平, . 基于免疫算法优化LSSVM的短时交通流预测[J]. 吉林大学学报: 工学版, 2019, 49(6): 1852-1857.

[6]

Gu Yuan-li, Zhang Yuan, Rui Xiao-ping,et al.Short⁃term traffic flow prediction based on LSS-VMoptimized by immune algorithm[J]. Journal of Jilin University(Engineering and Technology Edition), 2019, 49(6): 1852-1857.

[7]

Zaremba W, Sutskever I, Vinyals O. Recurrent neural network regularization[J/OL].[2014-12-22].

[8]

Zhang T P, Ding W L, Xing M D. Attention-based dynamic graph convolutional recurrent neural network for traffic flow prediction in highway transportation[J/OL].[2023-12-12].

[9]

Graves A. Long short-term memory[J]. Supervised Sequence Labelling with Recurrent Neural Networks, 2012, 385: 37-45.

[10]

曹洁, 苏广, 张红, . CapsNet融合D-BiLSTM的区域复杂路网交通速度预测[J]. 吉林大学学报: 工学版,2024,54(9):2531-2539.

[11]

Cao Jie, Su Guang, Zhang Hong, et al. Traffic speed prediction for complex regional road networks based on CapsNet and D-BiLSTM fusion[J]. Journal of Jilin University(Engineering and Technology Edition),2024,54(9):2531-2539 .

[12]

Fu R, Zhang Z, Li L. Using LSTM and GRU neural network methods for traffic flow prediction[C]∥The 31st Youth Academic Annual Conference of Chinese Association of Automation(YAC), Piscataway, USA, 2016: 324-328.

[13]

李桃迎, 王婷, 张羽琪. 考虑多特征的高速公路交通流预测模型[J]. 交通运输系统工程与信息, 2021, 21(3): 101-111.

[14]

Li Tao-ying, Wang Ting, Zhang Yu-qi. Highway traffic flow prediction model with multi-features[J]. Journal of Transportation Systems Engineering and Information Technology, 2021, 21(3): 101-111.

[15]

Ma X L, Dai Z, He Z B, et al. Learning traffic as images: a deep convolutional neural network for large-scale transportation network speed prediction[J]. Sensors, 2017, 17(4): No.818.

[16]

Wu S F. Spatiotemporal dynamic forecasting and analysis of regional traffic flow in urban road networks using deep learning convolutional neural network[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(2): 1607-1615.

[17]

Bruna J, Zaremba W, Szlam A, et al. Spectral n-etworks and locally connected networks on graphs[J/OL].[2013-12-20].

[18]

Li Y B, Zhao W, Fan H L. A spatiotemporal graph neural network approach for traffic flow prediction[J]. Mathematics, 2022, 10(10):No. 1754.

[19]

Kipf T N, Welling M. Semi-supervised classification with graph convolutional networks[J/OL].[2016-12-20].

[20]

井佩光, 田雨豆, 汪少初, . 动态扩散图卷积交通流量预测算法[J]. 吉林大学学报: 工学版, 2024, 54(6): 1582-1592.

[21]

Jing Pei-guang, Tian Yu-dou, Wang Shao-chu,et al.Traffic flow prediction algorithm based on dynamic diffusion graph convolution[J]. Journal of Jilin University(Engineering and Technology Edition), 2024, 54(6): 1582-1592.

[22]

Zhu C F, Yu C X, Huo J Y. Research on spatio-temporal network prediction model of parallel-series traffic flow based on transformer and GCAT[J]. Physica A: Statistical Mechanics and its Applications, 2023, 610: No.128414.

[23]

Zhao L, Song Y J, Zhang C, et al. T-GCN: A temporal graph convolutional network for traffic prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 21(9): 3848-3858.

[24]

Bai L, Yao L N, Li C, et al. Adaptive graph convolutional recurrent network for traffic forecasting[J]. Advances in Neural Information Processing Systems, 2020, 33: 17804-17815.

[25]

Liu A Y, Zhang Y Y. Spatial-temporal interactive dynamic graph convolution network for traffic forecasting[J/OL].[2022-12-20].

[26]

Ju X, Xie X S, Yu Y F, Spatial-temporal dynamic fusion graph convolutional network for traffic forecasting[C]//The 5th International Academic Exchange Conference on Science and Technology Innovation (IAECST), Piscataway, USA, 2023: 709-713.

[27]

Cao C, Bao Y, Shi Q, et al. Dynamic spatiotemporal correlation graph convolutional network for traffic speed prediction[J]. Symmetry, 2024, 16(3):No.308.

[28]

Liu M H, Zeng A L, Xu Z, et al. Time series is a special sequence: forecasting with sample convolution and interaction[J/OL].[2021-12-20].

[29]

Choi J, Choi H, Hwang J, et al. Graph neural controlled differential equations for traffic forecastting[C]∥Proceedings of the AAAI Conference on Artificial Intelligence, 2022, 36(6): 6367-6374.

[30]

Qian W Z, Zhang D L, Zhao Y, et al. Uncertainty quantification for traffic forecasting: A unified approach[C]∥IEEE 39th International Conference on Data Engineering(ICDE), Piscataway, USA, 2023: 992-1004.

[31]

Hou Y, Zhang D, Li D, et al. Regional traffic flow combination prediction model considering virtual space of the road network[J]. Physica A: Statistical Mechanics and its Applications, 2024, 637: No.129598.

基金资助

国家自然科学基金项目(62063014)

国家自然科学基金项目(62363020)

甘肃省自然科学基金项目(22JR5RA365)

AI Summary AI Mindmap
PDF (2434KB)

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/