面向主线匝道协调的深度强化学习匝道控制方法

交通信息与安全 ›› 2025, Vol. 43 ›› Issue (6) : 86 -97.

作者信息 +

Author information +

文章历史 +

摘要

高速公路匝道合流区是交通拥堵和事故频发的重要区域，为提升传统匝道控制算法在响应速度和控制精度方面的性能，研究了1种基于强化学习的匝道控制方法。将匝道控制问题转化为马尔可夫决策过程，使用离散信号灯相位设计动作空间提高训练效率，构建涵盖主线和匝道运行状态的状态空间和多维奖励函数。在状态感知层面添加实时交通检测机制并在动作输出时添加最小相位持续约束避免高频相位切换，同时在训练过程中使用优先经验回放提高模型性能。此外，为提升算法在复杂交通环境下的收敛速度与泛化能力，对深度网络结构进行了优化设计，引入了残差连接和层归一化，构建了轻量且高效的多层感知网络。使用微观仿真平台进行了系统性实验，验证所提方法的控制效果。结果表明：所提出的主线匝道协调的匝道控制方法相较于无控制场景系统吞吐量提升了52.67%，平均旅行时间减少了58.21%；并且在本文方法的控制下主线和匝道的通行效率显著上升。将所提出的方法部署于杭徽高速杭州西至於潜互通段入口限流工程案例中，对该路段的路网结构与交通流特征进行了完整还原。结果表明：路网在途量和主线平均速度相较于无管控场景都有所提升，并且车速波动相比无管控场景更加缓和，具备较高的工程部署潜力。