基于可解释随机森林的多类别交通事故风险研判

董春娇; 万雨杰; 李鹏辉

北京工业大学学报 ›› 2026, Vol. 52 ›› Issue (3) : 315 -323.

董春娇, 万雨杰, 李鹏辉

作者信息 +

Author information +

文章历史 +

PDF

摘要

为了探究影响因素对不同事故类别的影响程度,考虑道路条件、天气状况和交通流状态三方面因素,采用网格搜索方法确定超参数的最优参数,建立了基于随机森林的道路交通事故风险研判模型,研判是车车碰撞还是人车碰撞事故风险,是受伤事故还是死亡事故风险。为了量化影响因素对事故风险研判结果的贡献,提出基于SHAP(shapley additive explanations)的交通事故风险致因解释方法。利用北京市京开高速和南六环等路段的事故数据对构建的模型方法进行参数标定和测试,并与传统随机森林、逻辑回归和支持向量机(support vector machines,SVM)进行了对比。研究结果表明:构建的模型在人车碰撞事故风险研判上表现最优,有较高的测试精度,召回率(recall,REC)相较传统随机森林、逻辑回归模型和支持向量机模型分别有30%、40%和40%的提升;在总体交通事故和受伤事故风险研判上表现次之,相较对比模型提升约20%、10%和10%;在车车碰撞事故上相较逻辑回归模型有30%的提升;而在死亡事故上无显著提升。影响因素中,当前车道车头间距、时间占用率、降水等对总体事故风险研判分别有约30%、30%和10%的影响;而在各类细分事故上降水才是主导因素,其次才是车道车头间距、时间占用率因素。