基于3种时间序列模型的北京市每日花粉浓度预测

张鑫, 杨华, 董玲玲, 张宏远

北京林业大学学报 ›› 2025, Vol. 47 ›› Issue (06) : 90 -100.

PDF
北京林业大学学报 ›› 2025, Vol. 47 ›› Issue (06) : 90 -100.

基于3种时间序列模型的北京市每日花粉浓度预测

作者信息 +

Author information +
文章历史 +
PDF

摘要

【目的】分析花粉高峰期持续时间和浓度峰值,构建北京市每日花粉浓度的最优预测模型,为科学预测未来每日花粉浓度提供数据支持。【方法】采用多重插补法处理2015—2020年北京市每日花粉浓度时间序列中的缺失数据,2015—2019年数据用于建立SARIMA、LSTM和Prophet 3种时间序列模型,预测未来一年(2020年,共计182 d)的花粉浓度变化。【结果】(1)随机森林法、贝叶斯线性回归法、观测值中随机取样法和加权预测均值匹配法4种多重插补法中,随机森林法的第3个插补数据集P值最小(P=0.002),为最优插补数据集。(2)2015—2020年每日平均花粉浓度数据显示,春季高峰期集中在3—6月,4月初达到峰值(792粒/(10~3 mm2));秋季高峰期集中在8月至9月末,在9月初达到峰值(449粒/(10~3 mm2))。2015—2019年花粉浓度总体呈逐年下降趋势,2020年呈现阶跃式上升;其中,2015年高峰期持续时间最长(春季107 d,秋季65 d),2018年最短(春季60 d,秋季46 d);2020年花粉浓度峰值达到最高水平,而2019年花粉浓度峰值最低。(3)3种时间序列模型中,LSTM模型对北京市每日花粉浓度时间序列的描述和预测效果最佳。当LSTM模型的时间步长(look_back)为60时,模型预测效果最佳,RMSE、MAE均为最小,R2=0.78。相比之下,Prophet模型效果较差,无法灵敏捕捉浓度峰值,预测值存在负数情况,预测效果不佳。SARIMA模型拟合效果尚可,但预测效果不理想,预测值存在为负的情况。【结论】与SARIMA和Prophet模型相比,LSTM模型更适用于北京市每日花粉浓度时间序列模型的建立与长期预测。未来研究应完善花粉浓度数据,优化模型性能,以更准确地预测花粉高峰期的起止时间、持续时间及高峰浓度,为过敏性疾病的防控提供更可靠的依据。

关键词

多重插补法 / 花粉浓度 / 长短期记忆神经网络 / 长期预测

Key words

引用本文

引用格式 ▾
张鑫, 杨华, 董玲玲, 张宏远 基于3种时间序列模型的北京市每日花粉浓度预测[J]. 北京林业大学学报, 2025, 47(06): 90-100 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

53

访问

0

被引

详细

导航
相关文章

AI思维导图

/