基于安全强化学习的交叉口多车协同决策方法

黄亚飞, 石晴, 田浩, 张云龙, 胡伟

重庆理工大学学报(自然科学版) ›› 2026, Vol. 40 ›› Issue (01) : 54 -61.

PDF
重庆理工大学学报(自然科学版) ›› 2026, Vol. 40 ›› Issue (01) : 54 -61.

基于安全强化学习的交叉口多车协同决策方法

    黄亚飞, 石晴, 田浩, 张云龙, 胡伟
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对城市路口多车驾驶场景中,如何准确表征自动驾驶车辆之间的动态交互,优化通行顺序,确保驾驶安全,提出一种基于多智能体安全强化学习的协同控制方法,旨在避免因缺乏安全约束引发的不安全行为。将约束马尔可夫博弈与多智能体强化学习相结合,利用拉格朗日乘子法与多智能体深度确定性策略梯度算法,在最大化奖励的同时最小化安全成本,以限制危险行为;提出安全经验回放机制,避免决策空间受限带来适应性下降和局部最优问题。仿真结果表明,所提方法在安全性方面优于基准算法,可使碰撞率下降至8.6%,能有效提升该场景下自动驾驶车辆的协同决策能力。

关键词

多智能体强化学习 / 安全强化学习 / 协同通行策略 / 自动驾驶

Key words

引用本文

引用格式 ▾
基于安全强化学习的交叉口多车协同决策方法[J]. 重庆理工大学学报(自然科学版), 2026, 40(01): 54-61 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/