针对混合交通下信号交叉口闯行行多、人车冲突风险高且拥堵延误大的问题,研究了信号灯、智能网联汽车(connected autonomous vehicle,CAV)和行人的协同控制方法。第一阶段,结合保护/禁止右转(protect/prohibit right turning,PPRT)策略,构建面向行人安全的深度强化学习信控框架。状态以车辆与行人的位置和速度矩阵表示,刻画路口的时空态势。动作按行人直行与车辆左/右转拆分相位,以信号层面的时空分离抑制主要人车冲突。奖励采用等待时间差,考虑载客量对效率的影响,并以决斗双重深度Q网络算法求解最优策略。第二阶段,建立行人与CAV的速度规划模型,减少人车交互并降低延误。行人侧根据过街距离与绿灯余长计算可行速度区间,并受加速度与速度约束,考虑人群的服从度与随机扰动。CAV侧在高风险场景时,调整满足安全约束的速度水平,削减冲突发生条件。对左转与直行的CAV进行速度引导,使其平滑通过路口。基于长沙市交叉口场景和交通流数据,构建智能网联交叉口和混合交通场景,在城市交通流仿真工具(simulation of urban mobility,SUMO)进行仿真实验。结果表明,在50%CAV渗透率场景下,本文方法的人车冲突和闯行分别为897次和272次,较PPRT分别降低43.37%和53.7%。人均延误11.61 s,较感应式信号控制、PPRT、深度强化学习信号控制分别减少39.15%、55.03%、13.62%,停车次数降至3 279次。优化效果随CAV渗透率的增加而提升,在0%~25%时,冲突减少16.60%,升至100%时综合指标最优。