PDF
摘要
目的 丙型肝炎是一类危害较大、隐匿性较强的传染病,准确的趋势预测是确保精准干预的重要措施。本文旨在证实多变量时序预测方法和互联网数据的有效性,为丙肝预测提供较好的数据和方法基础。方法 纳入2011—2018年重庆市丙肝月发病率的研究数据,包含传染病发病数据和互联网预测数据。为筛选重要特征,本文引入了特征熵值的理论基础,并经过共线性去除、方向性评价和信息量评价等步骤,提出了“自适应相关熵权法”(adaptive correlation entropy weight method,ACEW)以进行特征选择。此后,本文构建了多变量时序模型(CNN-BiLSTM-Attention),并进行了特征性能检验(包括前瞻性评价和后验性评价)和模型效能探究。结果 前瞻性评价揭示ACEW选择出的变量彼此间一致性较低,各变量计算出的权值分布较为均等。后验性评价揭示了ACEW筛选出的特征集在各模型中均可取得最优预测信息。在模型效能探究中,多变量时序预测模型总体性能明显优于单变量模型。当联用ACEW和CNN-BiLSTM-Attention时,测试集的MSE、MAE、RMSE、MAPE和R2分别为0.0223、0.0649、0.0771、5.9285和0.9156。结论 在丙肝发病率预测研究中,本文进行了数据融合和方法改良的研究。改良特征选择方法(ACEW)可为丙肝的调控提供契机,多变量时序预测模型可提升丙肝趋势预测的性能,从而有效控制和预防丙肝,具有较好的公共卫生防控意义。
关键词
特征选择
/
信息熵
/
丙型肝炎
/
时间序列
/
机器学习
Key words
联用自适应相关熵权法和多变量时序模型的丙肝发病率预测研究[J].
中国卫生统计, 2025, 42(05): 642-648 DOI: