面向大规模路网的车辆行程时间不确定性量化方法研究

吴庭锐; 毛潇苇; 郭晟楠; 林友芳; 万怀宇

doi:10.13232/j.cnki.jnju.2026.01.008

南京大学学报（自然科学） ›› 2026, Vol. 62 ›› Issue (01) : 83 -96. DOI: 10.13232/j.cnki.jnju.2026.01.008

面向大规模路网的车辆行程时间不确定性量化方法研究

吴庭锐 ¹ ,
毛潇苇 ¹ ,
郭晟楠 ¹^,³ ,
林友芳 ¹^,² ,
万怀宇 ¹^,²

作者信息 +

Research on vehicle travel time uncertainty quantification method for large⁃scale road networks

Tingrui Wu ¹ ,
Xiaowei Mao ¹ ,
Shengnan Guo ¹^,³ ,
Youfang Lin ¹^,² ,
Huaiyu Wan ¹^,²

Author information +

文章历史 +

PDF (1339K)

摘要

随着智能交通系统和共享出行服务的迅猛发展，人们对行程时间预测的需求日益增长，准确的行程时间预测已成为提升交通效率和优化用户体验的重要任务.传统的行程时间估计方法大多侧重于预测均值，提供点估计结果，忽略了复杂且动态变化的交通状况带来的不确定性.量化行程时间的不确定性以提供包含置信区间的结果，可以为用户和共享出行平台提供更全面可信的预测信息.但是，由于动态变化的路段通行时间分布以及多个路段通行时间不确定性的累积问题，难以准确量化行程时间的不确定性.为解决上述问题，提出了一种基于动态交通路况的行程时间预测与不确定性量化方法，设计了一个分布感知行程时间不确定性估计模型（Distribution Aware Travel Time Estimation，DATE），该模型包括路网板块化模块、全局分布感知器模块以及分布融合不确定性估计模块.该模型能在准确预测行程时间的同时，提供可靠的置信区间，全面量化不确定性.实验结果表明，DATE在两个真实数据集上的表现优于现有方法，且能有效提高行程时间预测的精度和可靠性，为智能交通系统提供更为可靠的决策支持.

Abstract

With the rapid development of intelligent transportation systems and shared mobility services,the demand for accurate travel time prediction has been increasing. As a result，accurate travel time estimation has become a crucial task for improving traffic efficiency and optimizing user experience. Traditional travel time estimation methods mostly focus on predicting the mean value and provide point estimates，while ignoring the uncertainty caused by complex and dynamically changing traffic conditions. Quantifying the uncertainty of travel time and providing results with confidence intervals can offer more comprehensive and trustworthy predictions for users and mobility platforms. However，due to the dynamically varying travel time distributions of road segments and the accumulated uncertainty across multiple segments，it remains challenging to quantify travel time uncertainty accurately. To address this issue，this paper proposes a travel time prediction and uncertainty quantification method based on dynamic traffic conditions. A novel model，Distribution Aware Travel Time Estimation (DATE)，is designed，which consists of a road network partitioning module，a global distribution⁃aware module，and a distribution fusion⁃based uncertainty estimation module. This model not only improves the accuracy of travel time prediction but also provides reliable confidence intervals for comprehensive uncertainty quantification. Experimental results on two real⁃world datasets demonstrate that DATE outperforms existing methods in terms of both prediction accuracy and reliability，offering robust decision support for intelligent transportation systems.

Graphical abstract

关键词

行程时间预测 / 不确定性量化 / 分布感知 / 时空数据挖掘 / 机器学习

Key words

travel time estimation / uncertainty quantification / distribution awareness / spatial⁃temporal data mining / machine learning

引用本文

引用格式 ▾

吴庭锐,毛潇苇,郭晟楠,林友芳,万怀宇. 面向大规模路网的车辆行程时间不确定性量化方法研究[J]. 南京大学学报（自然科学）, 2026, 62(01): 83-96 DOI:10.13232/j.cnki.jnju.2026.01.008

登录浏览全文

4963

注册一个新账户忘记密码

行程时间估计（Travel Time Estimation，TTE）指的是预测车辆沿查询路径从一个地点到另一个地点所需的时间，对导航和行程规划至关重要.行程时间估计可以视为一个时空领域内的回归任务^［1］，其特点是观测数据稀疏、不规则且片段化^［2］.与传统的时空数据预测（如时间序列预测）相比，行程时间估计更复杂，主要体现在其时序的连续性和行程序列中固有的复杂空间依赖性.因此，行程时间估计近年来受到了广泛关注，为自动驾驶决策和导航等技术提供了重要的数据支持.

然而，在许多实际应用中，仅仅提供行程时间的平均估计值是远远不够的.一种更为可靠、信息量更丰富的方法是量化行程时间不确定性.具体而言，我们的目的是估计具有指定置信水平的行程时间的置信区间，以量化不确定性，这在许多场景中都有重要意义.例如，网约车服务可以从为顾客提供出行时间的置信下界和置信上界中获益，以便更好地规划自己的行程.此外，了解行程时间不确定性可以帮助网约车和物流平台提高决策有效性，例如，订单调度和车辆调度.

量化行程时间不确定性的关键在于预测每个路段通行时间分布，此外，还需要捕获多个路段通行时间不确定性的累积.要完成这一任务将会面临许多挑战.

由于交通流量在相邻路段之间具有较强的时空依赖性，前一个路段的交通状况直接影响到后续路段的行程时间.例如，在城市道路网络中，前一个路段的拥堵情况或交通事件（如交通信号灯、事故等）直接影响车辆在下一个路段的行驶速度，导致后续路段的行程时间发生变化.忽视这种相邻路段间的依赖关系可能导致行程时间预测不准确.因此，如何准确捕捉和建模这种时空依赖性，成为了行程时间不确定性量化中的一大挑战.

此外，每个路段上的行程时间状况都是随时间不断变化的，对总体路径不确定性的贡献也在随之变化，如何捕捉这种变化、有效建模不同条件下各路段行程时间对整体行程时间不确定性的影响十分具有挑战性.如图1所示，行程1中车辆到达路段

e 6

的时间为9：00，由于8：50-9：00的统计行程时间分布集中在30 s左右，因此，行程1中车辆在

e 6

的行程时间是相对确定的.然而，在9：10-9：20，车辆在

e 6

的行程时间分布范围更广，表现出更高的方差和波动性.增加了行程2在9：20开始的不确定性.受交通状况、出发时刻等复杂因素的影响，路段层面的行程时间不确定性不断变化，难以准确量化整体路径层面的行程时间不确定性.

在过去几十年中，许多算法已被用于精准预测未来的交通状况，这些方法从统计模型^［3］到数据驱动的模型^［4］都有涉及.最初，时序建模方法例如循环神经网络（RNN）和自回归综合滑动平均（ARIMA）模型用于学习交通数据中单一时序的时间演化^［5-6］，但这些方法忽略了多个交通时序之间的空间传递关系.随着技术的发展，时空图神经网络（Spatio⁃Temporal Graph Neural Networks，ST⁃GNN）成为捕捉时空依赖关系的前沿方法，能协同捕捉空间和时间依赖性^［7-9］.然而，传统时空图神经网络中的固定静态图无法反映不同时间阶段的各种空间相关性，这是因为交通点的空间关联性随时间的变化而变化.因此，动态空间建模技术逐渐成为交通预测的主流研究方向^［10］，旨在揭示每个时间片的空间相关性并动态地传播空间信息.然而，大多数动态空间建模方法的计算复杂度相对行程长度呈二次幂，因此交通预测通常只能在较小的区域尺度进行，难以满足现实城市中包含数千个交通点的交通预测需求^［11］.

为了解决上述问题，本文提出了一种基于分布感知的行程时间预测模型——DATE （Distribution Aware Travel Time Estimation）.模型有一个时间分布感知模块，首先将路网中的路段划分成一个个板块（Patch）并构建子图，然后将路段信息编码后分别对板块内和板块间交替使用深度和广度注意力机制来得到各个路段之间复杂的空间和时序依赖关系，从而捕捉各个路段行程时间分布的变化情况，同时给出行程轨迹中未来每个路段的通行时间分布预估.这样的设计降低了动态空间建模的复杂度，保证了可解释性和保真性.接着，模型通过分布融合不确定性估计模块，结合各路段的历史信息和分布预估进行端到端训练，最终输出通行时间预测值和置信区间的估计.这一创新性方法不仅提高了行程时间预测的准确性，还提供了对预测不确定性的全面量化，为智能交通系统中的决策支持提供了更为可靠的数据依据.

1 相关工作

1.1　行程时间估计

行程时间估计的研究可以追溯到20世纪90年代初.早期方法是将路段历史行程时间相加来估计到达时间，这些方法能为出行者在一定程度上提供行程时间估算.然而，随着大数据和实时交通信息的不断发展，基于动态数据的行程时间预测逐渐成为研究主流.当前的研究方法主要包括统计回归、机器学习以及深度学习等模型.基于统计回归的估计方法主要通过回归分析技术，例如，加权回归和多元线性回归，为行程时间提供初步的估计，但由于缺乏对动态交通流和时空变动的考虑，常常无法适应复杂的交通状况.

近年来，随着机器学习方法的兴起，许多研究者开始采用支持向量机（SVM）^［12］、决策树^［13］和随机森林（RF）^［14］等算法进行行程时间预测.这些方法能在非线性和高维数据处理中展现出较强的优势，能更好地应对复杂交通环境.例如，支持向量回归（SVR）^［15］模型通过引入非线性关系，显著提高了行程时间的预测精度.随着深度学习技术的突破，卷积神经网络（CNN）^［16］和循环神经网络（RNN）^［17］逐渐成为行程时间估计的主流方法.基于长短期记忆网络（LSTM）^［18］的预测方法，通过建模历史交通数据的时序特性，能更好地捕捉动态交通流的波动，为行程时间提供准确的预测.

为了进一步提升预测的准确性，研究者们提出了更复杂的模型来捕捉动态复杂的时空依赖关系.许淼^［19］构建了基于动态时空图卷积网络和多组件融合机制的预测框架，在综合考虑交通流动态性与异常事件影响的基础上，实现了在复杂城市路况下的高精度行程时间预测.Fang et al^［20］提出的ConSTGAT设计了一个上下文感知的时空图注意力网络，在统一框架内融合了交通预测与路径的上下文信息.Chen et al^［21］提出的HierETA则采用分层自注意力网络，创新地从路段、路链和交叉口等多个不同粒度的视角来综合建模轨迹.这些先进的模型通过更强大的网络结构，得到更准确的行程时间预测结果.

这些方法虽然在行程时间预测方面取得了显著进展，但它们主要关注点估计，未考虑行程时间的不确定性，难以提供可信的置信区间；同时对动态交通变化的适应性有限，在面对大规模路网中复杂且动态变化的交通状况时，未充分考虑路段间的时空依赖关系与交通流波动性，影响了在实际复杂场景中的稳健性与可靠性.

1.2　行程时间不确定性量化

尽管现有的行程时间估计方法在准确性上取得了显著进展，但通常仅仅提供均值估计，缺乏对行程时间不确定性的量化.为了解决这一问题，许多研究开始关注如何在行程时间估计中引入不确定性量化，尤其是置信区间的设计.贝叶斯神经网络（BNN）^［22］是一种常见的用于量化不确定性的方法，通过在神经网络中引入概率分布，贝叶斯方法能提供行程时间估计的置信区间.例如，一些研究采用贝叶斯神经网络对交通流进行建模，不仅估计了行程时间的均值，还提供了相应的不确定性范围，显著提升了预测结果的可靠性.蒙特卡罗方法通过多次随机采样和概率统计来计算行程时间的不确定性，能为每个预测提供置信区间，尽管该方法能提供较为全面的结果，但其计算复杂度较高，且在实时预测中存在一定的限制.近年来，研究者们探索了多种结合深度学习的概率估计框架.例如，基于图神经网络（GNN）^［23］的方法有效捕捉了路段间复杂的空间相关性，并结合时间序列模型（如RNN或LSTM）建模路况随时间的动态变化.这些方法通过融合概率推断与深度神经网络的强大特征表示能力，显著提高了行程时间预测的可靠性与不确定性量化的精度.

此外，Mao et al^［24］提出的GMDNet创新性地使用了混合密度网络来预测行程时间的多峰形态分布，能有效捕捉由不同交通状况导致的多种可能结果，但其基于全图的编码方式在应用于大规模城市路网时面临扩展性挑战.Xu et al^［25］提出的ProbTTE模型，通过学习路段的低秩表示来构建多趟行程间的联合高斯分布，并基于实测的相邻行程进行条件推断，但其单峰高斯分布的假设可能难以完全捕捉城市环境中复杂的行程时间分布.最近，一些新兴的基于高斯过程的框架（如SPTTE模型^［26］）采用时空联合分布建模，能在处理数据稀疏性和空间异质性时提供更加稳健的不确定性量化结果.这些方法通过建模路径上的各路段之间的相关性，将动态交通流与空间拓扑关系结合起来，实现了对复杂交通环境的不确定性描述.通过这些研究，行程时间不确定性量化的方法在理论和应用方面都得到了显著提升.

尽管上述方法在行程时间不确定性量化方面各具优势并取得了显著成果，但由于建模复杂、计算开销大、对特定场景的依赖或模型假设的限制等问题，普遍难以在大规模路网中高效应用.

2 问题定义

2.1　道路网络定义

道路网络（以下简称路网）定义为一个研究区域或城市内所有路段的集合，被建模为一个有向图

𝒢 = 𝒱, ℰ

，其中，

𝒱

是节点

v i

的集合，

v i

用以表示路口或路段的起止点；

ℰ

是边

e i

的集合，

e i

用以表示路段，即节点之间的连接道路.路网中的每个节点和路段都有一个唯一的索引.

2.2　轨迹、行程和路径定义

轨迹

𝒯

是一组带有时间戳的GPS点的序列，如式（1）所示：

T = g 1, c 1; ⋯; g 𝒯, c 𝒯

（1）

其中，

g i = l n g i, l a t i

表示第

i

个GPS点，lng表示经度，lat表示纬度，

𝒯

表示轨迹中的总GPS点数.

行程

x 𝒯

是一组节点的序列，表示为

x 𝒯 = v 1, c 1, ⋯, v k, c k

，其中，时间戳

c

是单调递增的.行程的总时间

y = c k - c 1

.值得注意的是，多个GPS数据点可以位于同一条路段上.

路径被定义为一系列节点的序列，表示为

x = v 1, …, v x

，其中，每一对相邻节点是相邻的，即

∀ i = 0, …, x - 1, v i, v i + 1 ∈ ℰ

，其中，

ℰ

是路网中的边集合，表示相邻节点之间的连接关系.

2.3　问题陈述

我们旨在学习一个映射函数

f θ

，该函数基于给定路径和出发时间的输入，预测总行程时间

y

及其上下置信区间，分别记为

l^和 u^

，以量化行程时间的不确定性.这样，

l^, u^

表示一个能覆盖实际行程总时间的置信区间，且置信度为

1 - ρ

，将路径和出发时间的输入对记作

r e q = r, s

，其中，

r

表示路径，

s

表示行程出发时间.

3 本文方法

DATE模型的整体架构如图2所示，划分成三个模块：路网板块化模块（包含图中板块划分和板块填充）、全局分布感知器模块以及分布融合不确定性估计模块.

为了降低处理大规模路网的复杂度，首先将整个路网上的路段按照一阶邻接关系不重不漏地切分为若干板块（Patch）来构建子图，这样可以尽量保留路段间的空间相关性.

接着，通过对每个Patch中已有的路段信息进行简单的平均处理，用以填充当前Patch，使每个Patch里的元素个数统一，方便后续模型处理.

随后，处理好的所有Patch被送入双注意力编码器，深度注意力作用于每个Patch内部，使每个路段都能融合邻居路段的信息.广度注意力作用于每个Patch之间，使每个路段都能融合更远的全局的路段的信息.两者交替使用且均采用多头注意力机制，以多视角并行建模并融合时空信息，以便每个路段更好地捕捉到整个路网的信息.编码结果经投影解码器映射为离散的行程时间概率分布，Softmax保证各时间区间概率和为1，可以直接得到各路段的完整通行时间分布，而不是单点预测.将预测分布嵌入向量与额外的历史信息一同输入LSTM，进一步建模序列动态变化.

最终，输出行程时间的点估计及上下置信区间，既准确预估了行程时间，又实现不确定性量化.整套流程借助Patch级局部拓扑、双重注意力以及分布式输出与序列建模的结合，达到对行程时间及其不确定性的高精度联合预测.

3.1　路网板块化模块

为了提高模型在复杂交通网络中的适应性和计算效率，路网板块化模块通过合理划分路网并构建板块子图，能优化时空特征的处理和融合，降低动态空间建模的计算复杂度.

在构建路网板块化输入之前，首先对时间域进行离散化处理，将一天24 h等分为长度为10 min的时间片，共有144个时间片，每个时间片都是一个离散区间.给定某个具体时刻

τ

，其所在的时间片索引

s

表示如式（2）所示：

s = h o u r τ × 60 + m i n u t e τ 10, s ∈ 0, …, 143

（2）

然后，对每个路段

u

，构建其在目标时刻所在时间片

s

之前

T

个时间片

[s - T, …, s - 1]

上的历史通行时间信息序列.令在时间片

t

上路段

u

的通行时间分布如式（3）所示：

ϕ u t = ϕ u t 1, ϕ u t 2, …, ϕ u t K T ∈ ℝ K

（3）

其中，

K

为离散区间数，其平均通行时间为标量

μ u t ∈ R

，将这两部分特征在时间维度上拼接，得到路段

u

的历史特征张量：

X u = ϕ u s - T, μ u s - T, ϕ u s - T + 1, μ u s - T + 1, …, ϕ u s - 1, μ u s - 1 ∈ ℝ T × K + 1

（4）

随后，利用路网的邻接矩阵

A ∈ 0,1 N × N

（

N

为路段总数），将每个路段

u

与其一阶邻居集合共同组成局部子图（Patch），如式（5）所示：

N u = v A u v = 1 o r A v u = 1 ⋃ u

(5)

为了不重不漏地划分路网，每划分一个Patch后，都要把Patch里所有的路段从路网中删除，再对剩余路段进行新一轮划分，直到所有路段都被划分到各自的Patch中.由于不同路段的一阶邻居数可能不一致，为了后续模型批量处理，需要将每个Patch统一为大小为

M

的定长集合（

M

为最大Patch的长度）.记

𝒫 u

为每个Patch中的实际路段数目，若

𝒫 u < M

，则用该子图内所有节点在每个时间片

t

上的特征均值进行填充：

X ¯ t = 1 𝒫 u ∑ v ∈ 𝒫 u X v t, X v t = P v t, μ v t

（6）

将

X ¯ t

复制至补齐位置，直至节点数达到

M

.经过上述处理后，每个路段

u

对应的Patch表示为一个形状为

M × T × K + 1

的张量，如式（7）所示：

P u = X 1, X 2, …, X M ∈ ℝ M × T × K + 1

（7）

所有Patch一并输入后续的全局分布感知器模块，为空间⁃时序特征学习打下统一且可并行的输入基础.

3.2　全局分布感知器模块

在全局分布感知器模块中，我们的目标是捕捉并建模路网中各路段间复杂的时空依赖关系，更好地估计路径的通行时间及其不确定性.

如图2和图3所示，本模块接收路网板块化模块输出的路网划分后的Patch张量：

P = P i, P ∈ ℝ P × M × T × K + 1

（8）

其中，

P

表示Patch的数量，首先通过线性映射将原始通行时间分布与平均通行时间特征投射到隐藏维度

d

：

ℋ 0 = P W 0 + b 0, W 0 ∈ ℝ K + 1 × d, b 0 ∈ ℝ d, ℋ 0 ∈ ℝ P × M × T × d

（9）

随后对投射后的特征进行

L

层交替编码，每层统一采用如下表示：

ℋ (1) = L a y e r N o r m ℋ l - 1 + D A t t n ℋ l - 1 + B A t t n ℋ l - 1

（10）

其中，DAttn和BAttn分别表示深度注意力和广度注意力.

深度注意力（Depth Attention）部分作用于每个Patch内的

M

个路段节点，用于捕获局部空间依赖.举例来说，对某Patch

𝒫 i

，时间片

t

上的特征矩阵，记为

X ∈ ℝ M × d

，深度注意力表示如式（11）所示：

D A t t n X = S o f t m a x Q d K d T d k V d

(11)

其中，

Q d

，

K d

，

V d

均由输入

X

经线性映射得到.

广度注意力（Breadth Attention）部分作用于跨Patch的同一“相对位置”节点，用以捕捉全局空间依赖.对跨所有Patch，在某个相同位置上的节点特征合并起来，记为

Y ∈ ℝ P × d

，广度注意力表示如式（12）所示：

B A t t n Y = S o f t m a x Q b K b T d k V b

(12)

其中，

Q b

，

K b

，

V b

均由输入

Y

经线性映射得到.

在完成

L

层深度和广度注意力机制的交替编码过后，将得到向量

ℋ L ∈ ℝ P × M × T × d

，这时候将所有的Patch合并起来，丢掉一开始使用路段历史通行时间分布均值填充得到的节点，提取出原始的

N

条有效路段，得到

X e f f ∈ ℝ T × N × d

，最后将每个节点的最后一层表示通过一个线性层映射到

K

维通行时间分布的logits：

l = X e f f W 0 + b 0 ∈ ℝ T × N × K

(13)

将

l

在时间维度上取最后一片（代表往后预测一个时间片）：

D^= S o f t m a x l T - 1, :, : ∈ ℝ 1 × N × K

(14)

其中，Softmax在最后一个维度（

K

个区间）上进行，输出即为每条路段在其所在轨迹出发时间片的后一个时间上的通行时间分布预测，用于后续的不确定性量化.

本模块的核心是深度和广度注意力机制，这样的组合能让模型在两个尺度上同时学习交通网络的空间结构.深度注意力专注于同一Patch内相邻路段之间的细粒度依赖，捕捉局部道路网节点在微观层面的相互影响，例如交叉口附近的拥堵传播和信号灯周期带来的短时序上下文；广度注意力则跨越不同Patch，将城市不同区域之间的长距离关联纳入考量，如主干道与支路之间在高峰期的联动效应或事故影响的远程扩散.通过这样的“先局部再全局”的分层建模，模型不仅可以获得更丰富、更具辨识度的多尺度表征，还可以提高对不同交通模式（如早晚高峰、节假日出行）的适应性和鲁棒性.

此外，这样的机制大幅降低了计算复杂度.传统点积方式对所有

N

个路段直接做一次全局注意力的复杂度为

O N 2

，而本文改进之后的方法对

P

个Patch乘

M

个节点做一次深度和广度注意力的复杂度为

O P M 2 + M P 2

.由实验可知，

P

比

N

小一至两个量级，

M

为个位数，因此

O P M 2 + M P 2 ≪ O N 2

，极大地提升了模型的计算效率和可扩展性.

3.3　分布融合不确定性估计模块

本模块旨在在全局分布感知器输出的基础上，进一步融合每条轨迹中各路段的通行时间分布预测结果与其历史观测信息，实现对整体路径通行时间的精准估计及其不确定性区间的量化.本模块以轨迹为单位开展建模，综合考虑了多路段间的动态关联与误差累积特性，并通过端到端的方式输出行程时间的点估计及上下置信区间.设某条轨迹由

Q

条路段组成，各路段在轨迹出发时刻所在时间片的下一个时间片上的分布预测为：

d^i i = 1 Q, d^i = d^i, 1, …, d^i, K T, ∑ k = 1 K d^i, k = 1

(15)

其中，

K

为离散时间区间数目，各区间中心为

c k k = 1 K

，对于第

i

路段，基于该预测分布，计算加权平均的通行时间如式（16）所示：

t ¯ i = ∑ k = 1 K d^i, k c k

（16）

记该路段在轨迹出发时间片的历史观测平均通行时间为

r i

，为了充分融合历史信息与分布预测信息，将两者及预估的完整分布拼接，构成第

i

路段的特征向量：

x i = r i, t ¯ i, d^i, 1, …, d^i, K T ∈ ℝ K + 2

(17)

将序列

x i i = 1 Q

输入LSTM模型，递归更新式如式（18）所示：

h i, c i = L S T M x i, h i - 1, c i - 1, i = 1, …, Q

（18）

取最后一步隐藏态

h Q

作为整条轨迹的全局表征，最终，模型分别通过三组由两层全连接网络组成的输出头，预测轨迹总行程时间的点估计值、下界偏差

δ l

与上界偏差

δ u

，生成完整的置信区间如式（19）所示：

y ̲, y ¯ = y^- δ l, y^+ δ u

（19）

由于本文模型是为了得到更准确的点估计、更窄的上下界，同时上下界能将真实通行时间覆盖在内，为了达到这一目标，做到更好的平衡，我们设计了独立的预测头来估计通行时间以及上下界区间，监督目标为均值区间得分（Mean Interval Score，MIS）对于置信度为

1 - ρ

的置信区间，第

i

个样本的通行时间的预测上界和下界定义如式（20）所示：

u^i = y^i + δ i u, l^i = y^i - δ i l

（20）

MIS损失函数表示如式（21）所示：

ℒ M I S = 1 N ∑ i = 1 N u^i - l^i + 2 ρ 𝕀 y i > u^i y i - u^i + 2 ρ 𝕀 y i < l^i l^i - y i + y i - y^i

（21）

其中，

𝕀

表示指示函数.当

y i

大于

u^i

时，惩罚项将增加；当

y i

小于

l^i

时，惩罚项也将增加，从而鼓励预测区间包含实际的到达时间，确保置信区间尽可能包含真实的到达时间.MIS损失函数奖励较窄的置信区间，同时鼓励它们包含实际的到达时间.

4 实验分析

为了评估本文提出的方法在行程时间预测和不确定性量化问题上的有效性，我们在两个真实数据集上进行了实验，并将所提出的算法与其他的几种先进方法进行了比较.此外，进行了消融实验，旨在验证模型各个组件的有效性.

4.1　实验数据集

本文使用两个真实世界的数据集XA和CD.在对数据集进行预处理操作中，将数据组织成路段通行时间分布以及路段通行时间均值的记录.XA和CD数据集都是由滴滴公司发布的包含了2018年10月31日至2018年11月20日期间在成都和2018年10月14日至2018年10月31日期间在西安运营的出租车的GPS轨迹.首先从OpenStreetMap中获取成都和西安两个城市的道路网络，并将轨迹映射到该网络上.接着，将每天的24 h按照10 min一个时间片的方式均匀划分成144个时间片.数据集统计情况如表1所示.

对XA，CD两个数据集进行初步处理和路网匹配后，又对轨迹路段数量进行了统计.统计结果图4所示.

两个数据集大致按照6∶2∶2的比例来划分训练集，验证集和测试集.模型在训练集上进行训练，并在测试集上进行评估，验证集用于调整超参数和实现早停.

4.2　评价指标

为了全面地评估模型在行程时间预测和不确定性量化上的综合性能，采用一系列评价指标.MIS作为衡量模型不确定性量化综合质量的主要指标，置信区间宽度（Width）和区间覆盖率（Prediction Interval Coverage Probability，PICP）两个指标作为参考.此外，为了专门评估模型点估计的准确性，引入平均绝对误差（Mean Absolute Error，MAE）、均方根误差（Root Mean Squared Error，RMSE）和平均绝对百分比误差（Mean Absolute Percentage Error，MAPE）三个标准回归指标.

在效率评估方面，记录模型在整个测试集上的推理时间.XA和CD数据集的测试样本数量分别为159028和295785，据此可以衡量模型在大规模路网下的实际运行效率.

（1）不确定性量化评价指标

M I S = 1 N u^i - l^i + 2 ρ 𝕀 y i > u^i y i - u^i + 2 ρ 𝕀 y i < l^i l^i - y i + y i - y^i

(22)

MIS同时衡量点估计的准确性、置信区间的宽度、置信区间对真实行程时间的覆盖率，是模型综合性能的直接度量，也是主要指标.MIS越小，模型越好.

W i d t h = 1 N ∑ i = 1 N u^i - l^i

（23）

Width是置信区间的宽度，即预测的通行时间上界与下界之间的差值，衡量了模型对预测不确定性的表达程度.较宽的置信区间意味着模型对预测的不确定性较高，而较窄的置信区间表明模型对预测结果的信心较强.在一定程度上Width越小，模型越好，但过小的Width可能导致PICP极低，将Width作为参考指标.

P I C P = 1 N ∑ i = 1 N 𝕀 l^i ≤ y i ≤ u^i

（24）

PICP表示预测置信区间能够覆盖真实通行时间的比例，反映了模型预测区间的可靠性.较高的PICP表明模型在大多数情况下能够准确地预测通行时间，并且置信区间有效地覆盖了真实值.但PICP过高也可能意味着Width极大，将PICP也作为参考指标.

通过MIS，Width，PICP这三个指标的结合，可以更全面地评估模型在处理不确定性和动态环境下的表现.

（2）点估计评价指标

M A E = 1 N ∑ i = 1 N y i - y^i

(25)

MAE计算点估计值与真实值之间绝对误差的平均值.

R M S E = 1 N ∑ i = 1 N y i - y^i 2

(26)

RMSE计算预测误差平方的平均值的平方根，其对较大的预测误差给予了更高的权重，更能反映模型的偏差情况.

M A P E = 100 % N ∑ i = 1 N y i - y^i y i

(27)

MAPE计算预测误差占真实值的百分比的平均值.

MAE，RMSE，MAPE这三个指标越小，说明模型的点估计结果越准确.

4.3　基准模型

将提出的方法与其他几种行程时间估计的方法进行对比来衡量提出的方法的综合性能，对点估计模型进行修改，如ConSTGAT和HierETA，让其额外输出置信区间的上下界，以便参与MIS等指标的评估.

（1）历史分布卷积（Historical Distribution Convolution，HDC）通过结合每条轨迹每个路段的历史通行时间分布数据，利用卷积计算近似得到整条路径的通行时间分布.

（2）高斯分布先验（Gaussian Prior Distribution，GPD）假设路径通行时间服从高斯分布，通过LSTM预测其均值和标准差，以构建置信区间和点估计值.

（3） ConSTGAT^［20］模型采用3D图注意力网络（3DGAT），在图结构上融合空间与时间特征进行交通状态预测，同时使用局部卷积结构捕捉路径中相邻路段的上下文信息，最终得到路径通行时间的预测值.

（4） MC Dropout^［27］在DATE模型的基础上，在训练、验证和测试过程中都启用Dropout层，进行多次前向传播，生成多个预测结果作为采样，最终计算这些采样的均值和上下分位数，得到置信区间和点估计结果.

（5） ProbTTE^［25］模型通过学习路段表示来构建多趟行程间的联合多元高斯分布，并基于实测的相邻行程数据进行条件推断，最后得到查询路径的通行时间预测值.

（6） GMDNet^［24］模型首先利用图神经网络（GNN）对路径上的各个路段进行编码，以捕捉复杂的空间依赖关系，然后通过一个混合密度网络来估计行程时间分布的多个组成部分（如高斯混合模型的均值、方差和权重），从而对多峰不确定性进行建模，最终得到路径行程时间预测值.

（7） HierETA^［21］模型采用一种分层的自注意力网络（Hierarchical Self⁃Attention Network），通过并行编码器分别对路段内部的精细局部交通动态和跨路链（包含几个路段）与交叉口的宏观结构信息进行建模，最后通过一个层次感知的注意力解码器，动态融合这些多粒度特征，最终得到路径通行时间的预测值.

4.4　实验结果

本文模型和基准模型的结果比较如表2所示，其中，黑体表示结果最优.

由表可见，DATE模型框架在不确定性量化和点估计精度上均展现了最先进的性能.具体而言，在不确定性量化这一核心任务上，DATE （main）在综合指标MIS上表现最优，在两个数据集上均达到最低.这表明与ProbTTE和GMDNet这样先进的概率模型相比，DATE （main）能更准确地捕获通行时间的不确定性，给出更加稳定可靠的置信区间.

在点估计方面，DATE⁃MC变体在两个数据集上均取得了MAE，RMSE和MAPE指标的全面最优，这证明了DATE模型的基础架构在特征提取和关系建模上具有卓越的能力，超越了所有基准模型.与DATE （main）相比，DATE⁃MC方法旨在捕获模型固有的不确定性，该方法将蒙特卡罗Dropout视为一种贝叶斯近似手段，通过对多次前向传播的结果求平均，虽然可以获得更精确的点估计，但是没有显式建模行程时间的上界和下界，导致区间过窄，PICP过低，使MIS的结果较差.

在推理效率方面，DATE （main）在两个数据集上推理时间都最短，远优于HierETA等结构复杂的模型.值得注意的是，DATE⁃MC由于需要进行多次前向传播采样，其推理时间显著增加，这进一步凸显了DATE （main）在提供可靠不确定性量化的同时，兼具高效率的巨大优势.

总体而言，DATE在准确性、不确定性量化和计算效率上均具优势，展现了更强的实用价值.

4.5　消融实验

为了评估DATE中成分的有效性，我们比较了完整方法和两种变体的性能.

（1）-全局分布感知：去掉全局分布感知器模块，不去捕捉并建模路网中各路段间复杂的时空依赖关系，在进行行程时间估计和不确定性量化时，直接使用每个路段的历史信息作为输入.

（2） -LSTM：在分布融合不确定性估计模块中，进行行程时间估计和不确定性量化时，不使用LSTM来对轨迹中的路段序列进行处理，而是直接使用一个线性层进行处理.

这些变体在XA和CD数据集上的性能表现如表3所示，其中，表中黑体表示结果最优.由实验结果可见，去除全局分布感知器模块和LSTM模块都会导致模型性能的下降.具体而言，去除全局分布感知器模块后，模型无法有效捕捉路网中各路段间复杂的时空依赖关系，影响了行程时间估计和不确定性量化的精度；去除LSTM模块后，模型对轨迹的时序特征处理能力不足，导致预测准确性和不确定性量化效果下降.通过对比DATE的完整模型和去除模块后的变体，可以看出全局分布感知器模块在捕捉时空依赖关系方面的不可替代性，LSTM在处理轨迹的时序特征中起到了重要作用.

为了更深入地验证全局分布感知器模块的有效性和先进性，我们将其单独作为一个路段通行时间分布的预测器，与一个经典的时空图神经网络ASTGNN^［28］进行比较.ASTGNN通过在时间和空间维度上分别设计动态注意力机制来捕捉交通数据动态性，可以有效建模复杂的时空依赖关系.除了MAE，RMSE，MAPE等指标，我们还使用KL散度（Kullback⁃Leibler Divergence，KLD）作为评估指标，如式（28）所示：

D K L P Q = ∑ k = 1 K P k l g P k Q k

（28）

其中，

K

代表设定的离散区间的总数量.KLD用于衡量一个概率分布

Q

（模型预测分布）与另一个参考概率分布

P

（真实分布）之间的差异.这是一种非对称度量，值越小，表示两个分布越接近.在我们的任务中，其直接量化了模型预测的路段通行时间分布与真实统计分布的拟合程度，是评估分布预测质量的关键指标，

DATE中全局分布感知器模块与ASTGNN模型对路段通行时间分布预测的比较结果如表4所示，其中，表中黑体表示结果最优.由表可见，DATE全局分布感知器模块在所有评估指标上均显著优于ASTGNN.在分布预测质量上，其KLD损失在两个数据集上分别降低了约42%和45%，表明DATE模块预测的分布与真实分布更接近.在基于分布均值的点估计精度上，其MAPE在两个数据集上也分别相对提升了约30%和23%.此外，得益于我们设计的板块化（Patching）和双重注意力机制，该模块的推理时间也远低于ASTGNN，效率提升了近2~3倍，表明了模型在大规模路网上高效应用的潜力.

图5进一步展示了全局分布感知器模块的预估效果，由图可见，该模块对所有路段所有时间片的通行时间分布的估计都是十分准确的.例如在11月5日第55个时间片（表示上午9：10-9：20）上，此时编号4465的路段交通情况比较复杂，有时还发生拥堵，但是全局分布感知器模块对这一情况做出了相当准确的预测，说明其很好地捕捉到了交通的动态变化情况.通过合理的路网板块化和时空依赖建模，模型不仅有效地捕捉了局部交通模式，而且反映出整个路网的动态变化.与去除该模块后的模型相比，使用全局分布感知器模块的模型在准确性和不确定性量化上均有显著提升.结果表明，深度时空建模和全局分布感知的结合对提升行程时间预测的精度和可靠性具有重要作用.

5 结论

本文提出了一种面向大规模路网的行程时间预测和不确定性量化方法，旨在解决传统行程时间估计方法在面对动态复杂交通状况时的局限性.通过结合路网板块化、全局分布感知以及分布融合不确定性估计模块，本文提出的DATE模型能有效提高行程时间预测的精度，并提供可靠的预测置信区间，以实现对不确定性的全面量化.在两个真实数据集上的大量实验结果表明了DATE模型的有效性，充分验证了该方法在行程时间估计和不确定性量化中的可靠性和优势.

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	Yan C W, Johndrow J, Woodard D,et al. Efficiency of eta prediction. SIAM Journal on Mathematics of Data Science,2024,6(2)：227-253.

[2]	Chen X X, Cheng Z H, Sun L J. Bayesian inference for link travel time correlation of a bus route. Transportmetrica B：Transport Dynamics,2024,12(1)：2416181.

[3]	Chandra S R, Al⁃Deek H. Predictions of freeway traffic speeds and volumes using vector autoregressive models. Journal of Intelligent Transportation Systems,2009,13(2)：53-72.

[4]	Jin G Y, Liang Y X, Fang Y C,et al. Spatio⁃temporal graph neural networks for predictive learning in urban computing：A survey. IEEE Transactions on Knowledge and Data Engineering,2024,36(10)：5388-5408.

[5]	Kumar S V, Vanajakshi L. Short⁃term traffic flow prediction using seasonal ARIMA model with limited input data. European Transport Research Review,2015,7(3)：21.

[6]	Lv Z J, Xu J J, Zheng K,et al. Lc⁃rnn：A deep learning model for traffic speed prediction∥Proceedings of the Twenty⁃Seventh International Joint Conference on Artificial Intelligence. Stockholm：IJCAI,2018：3470-3476.

[7]

Jiang X K, Zhuang D Y, Zhang X H,et al. Uncertainty quantification via spatial⁃temporal Tweedie model for zero⁃inflated and long⁃tail travel demand prediction∥Proceedings of the 32nd ACM International Conference on Information and Knowledge Management. New York：Association for Computing Machinery,2023：3983-3987.

[8]	Luo J, Zhang W, Fang Y,et al. Time Series supplier allocation via deep black⁃litterman model. arXiv preprint 2024，arXiv：2401.17350,.

[9]	Wang T F, Deng L W, Wang C,et al. COMET：NFT price prediction with wallet profiling∥Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. New York：Association for Computing Machinery,2024：5893-5904.

[10]	Guo S N, Lin Y F, Feng N,et al. Attention based spatial⁃temporal graph convolutional networks for traffic flow forecasting. Proceedings of the AAAI Conference on Artificial Intelligence. Honolulu：AAAI Press,2019,33(1)：922-929.

[11]	Liu X, Xia Y, Liang Y,et al. Largest：A benchmark dataset for large⁃scale traffic forecasting. Advances in Neural Information Processing Systems,2023,36：75354-75371.

[12]	Cortes C, Vapnik V. Support⁃vector networks. Machine Learning,1995,20(3)：273-297.

[13]	Quinlan J R. C4.5：Programs for machine learning. Amsterdam：Elsevier,2014.

[14]	Breiman L. Random forests. Machine Learning,2001,45(1)：5-32.

[15]	Awad M, Khanna R. Support vector regression∥Awad M,Khanna R. CA：Efficient learning machines：theories,concepts,and applications for engineers and system designers. Berkeley：Apress,2015：67-80.

[16]	Lecun Y, Bottou L, Bengio Y,et al. Gradient⁃based learning applied to document recognition. Proceedings of the IEEE,1998,86(11)：2278-2324.

[17]	Wang Z, Fu K, Ye J P.Learning to estimate the travel time∥Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York：Association for Computing Machinery,2018：858-866.

[18]	Gers F A, Schmidhuber J, Cummins F. Learning to forget：continual prediction with LSTM. Neural Computation,2000,12(10)：2451-2471.

[19]	许淼. 基于深度学习的城市路网行程时间预测方法研究. 博士学位论文. 长春：吉林大学,2022.

[20]	Fang X M, Huang J Z, Wang F,et al. Constgat：contextual spatial⁃temporal graph attention network for travel time estimation at Baidu maps∥Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York：Association for Computing Machinery,2020：2697-2705.

[21]

Chen Z B, Xiao X L, Gong Y J,et al. Interpreting trajectories from multiple views：A hierarchical self⁃attention network for estimating the time of arrival∥Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. New York：Association for Computing Machinery,2022：2771-2779.

[22]	Blundell C, Cornebise J, Kavukcuoglu K,et al. Weight uncertainty in neural networks∥Proceedings of the 32nd International Conference on International Conference on Machine Learning. Lille：JMLR,2015：1613-1622.

[23]	Derrow⁃Pinion A, She J, Wong D,et al. Eta prediction with graph neural networks in google maps∥The 30th ACM International Conference on Information and Knowledge Management. New York：Association for Computing Machinery,2021：3767-3776.

[24]	Mao X W, Wan H Y, Wen H M,et al. GMDNet：A graph⁃based mixture density network for estimating packages' multimodal travel time distribution∥Proceedings of the AAAI Conference on Artificial Intelligence,2023,37(4)：4561-4568.

[25]	Xu C, Wang Q, Sun L J. Link representation learning for probabilistic travel time estimation. IEEE Transactions on Intelligent Transportation Systems,2025,26(11)：21149-21161.

[26]	Xu C, Wang Q, Sun L G. SPTTEA：Spatiotemporal probabilistic framework for travel time estimation. (2024-11-27) [2025-05-28].

[27]	Gal Y, Ghahramani Z. Dropout as a Bayesian approximation：representing model uncertainty in deep learning∥Proceedings of the 33rd International Conference on International Conference on Machine Learning. New York：JMLR,2016,48：1050-1059.

[28]	Guo S N, Lin Y F, Wan H Y,et al. Learning dynamics and heterogeneity of spatial⁃temporal graph data for traffic forecasting. IEEE Transactions on Knowledge and Data Engineering,2021,34(11)：5415-5428.

基金资助

国家自然科学基金(62202043)

北京市自然科学基金(4242029)

AI Summary AI Mindmap

PDF (1309KB)

访问

被引

详细

导航

Received	Accepted	Published
2025-09-09
Issue Date
2026-04-30

摘要

Abstract

Graphical abstract

关键词

Key words

引用本文

1 相关工作

1.1 行程时间估计

1.2 行程时间不确定性量化

2 问题定义

2.1 道路网络定义

2.2 轨迹、行程和路径定义

2.3 问题陈述

3 本文方法

3.1 路网板块化模块

3.2 全局分布感知器模块

3.3 分布融合不确定性估计模块

4 实验分析

4.1 实验数据集

4.2 评价指标

（1）不确定性量化评价指标

（2）点估计评价指标

4.3 基准模型

4.4 实验结果

4.5 消融实验

5 结论

参考文献

基金资助

AI思维导图

1.1　行程时间估计

1.2　行程时间不确定性量化

2.1　道路网络定义

2.2　轨迹、行程和路径定义

2.3　问题陈述

3.1　路网板块化模块

3.2　全局分布感知器模块

3.3　分布融合不确定性估计模块

4.1　实验数据集

4.2　评价指标

4.3　基准模型

4.4　实验结果

4.5　消融实验