PDF
摘要
预测全国GDP可为政策制定提供重要依据,随机森林(RF)模型能整合经济变量间复杂非线性关系,但其预测性能依赖于决策树的参数合理性。基于国家统计局2003—2023年季度数据,提出“决策树参数优化—随机森林模型”的预测框架,先采用粒子群(PSO)、遗传(GA)、差分(DE)、贝叶斯优化(BO)4种算法,对决策树的最大深度、最小样本分割、最小样本叶子节点3个核心参数进行寻优;再以优化后的决策树为基学习器构建随机森林(RF)模型,通过袋外误差(OOB)确定模型的最佳决策树数量与最大特征数,最终形成4种优化随机森林预测模型。采用10重交叉验证,以决定系数、平均绝对误差、均方根误差评估模型性能,并基于最优模型开展特征重要性排序。结果显示,PSO优化决策树参数的RF模型(PSO-DT)预测效果最佳,影响GDP的主要经济指标为第二产业、第三产业、批发和零售业及交通运输仓储邮政业,该模型可为各方洞察经济趋势、提升政策效能提供理论支撑。
关键词
随机森林(RF)模型
/
粒子群优化算法
/
遗传算法
/
差分算法
/
贝叶斯优化算法
Key words
基于优化决策树参数的随机森林模型预测全国GDP[J].
中国林业经济, 2025, 0(04): 39-50 DOI:10.13691/j.cnki.cn23-1539/f.2025.04.005