PDF
摘要
为研究空气质量因素和气象因素对广东省广州市新冠病毒感染(corona virus disease 2019,COVID-19)疫情预测的影响,论文建立了一种基于空气质量和气象因素的多变量时间序列预测模型。首先,由于空气质量因素和气象因素较多,为了有效地减少预测模型的输入变量以提高运行效率和预测精度,通过Spearman相关性分析剔除与新冠确诊病例数相关性较小的影响因素;其次,对保留下的影响因素进行主成分分析(principal component analysis, PCA);最后,将降维后的有效主成分和历史新冠确诊病例数据一同作为LSTM模型的输入进行训练和预测。研究结果表明:相比于多变量LSTM模型、多变量RNN模型、Spearman-LSTM模型和PCA-LSTM模型,本实验建立的模型产生的误差最小,其均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R2)和希尔不等系数(TIC)的值分别为3.426、2.682、0.938和0.050。本实验建立的基于Spearman-PCA-LSTM的COVID-19多变量时间序列预测模型有更好的预测效果,该方法也为其他病毒疫情预测提供可借鉴思路。
关键词
Spearman
/
主成分分析
/
LSTM
/
COVID-19
/
多变量
/
预测
Key words
基于Spearman-PCA-LSTM的COVID-19预测模型研究[J].
贵州大学学报(自然科学版), 2025, 42(06): 80-89 DOI:10.15958/j.cnki.gdxbzrb.2025.06.11