基于安全强化学习的交叉口多车协同决策方法

黄亚飞; 石晴; 田浩; 张云龙; 胡伟

重庆理工大学学报（自然科学版） ›› 2026, Vol. 40 ›› Issue (1) : 54 -61.

黄亚飞, 石晴, 田浩, 张云龙, 胡伟

作者信息 +

Author information +

文章历史 +

摘要

针对城市路口多车驾驶场景中，如何准确表征自动驾驶车辆之间的动态交互，优化通行顺序，确保驾驶安全，提出一种基于多智能体安全强化学习的协同控制方法，旨在避免因缺乏安全约束引发的不安全行为。将约束马尔可夫博弈与多智能体强化学习相结合，利用拉格朗日乘子法与多智能体深度确定性策略梯度算法，在最大化奖励的同时最小化安全成本，以限制危险行为；提出安全经验回放机制，避免决策空间受限带来适应性下降和局部最优问题。仿真结果表明，所提方法在安全性方面优于基准算法，可使碰撞率下降至8.6%,能有效提升该场景下自动驾驶车辆的协同决策能力。