考虑机器学习建模中训练/测试集时空划分原则的滑坡易发性预测建模
黄发明 , 欧阳慰平 , 蒋水华 , 范宣梅 , 连志鹏 , 周创兵
地球科学 ›› 2024, Vol. 49 ›› Issue (05) : 1607 -1618.
考虑机器学习建模中训练/测试集时空划分原则的滑坡易发性预测建模
Landslide Susceptibility Prediction Considering Spatio-Temporal Division Principle of Training/Testing Datasets in Machine Learning Models
滑坡易发性预测时大多按空间随机来划分模型训练/测试数据集,但随机划分方式难免将不确定性因素引入建模中.因为理论上滑坡易发性是基于过去的滑坡来预测将来发生滑坡的空间概率,具有显著的时间顺序特征而非单纯的空间随机,可见有必要探索基于滑坡发生的时间顺序划分模型训练/测试集.以浙江文成县为例获取11类环境因子及128个时间准确的滑坡;之后将联接了环境因子的滑坡‒非滑坡样本分别按照滑坡时间顺序和空间随机的原则,划分为两类不同训练/测试集;其划分比例分别设定为9∶1、8∶2、7∶3、6∶4和5∶5等以避免不同比例影响研究结果,由此得到10种组合工况下的训练/测试集;最后再训练测试支持向量机(SVM)、多层感知器(MLP)和随机森林(RF)等模型以预测滑坡易发性并分析其不确定性.结果表明:(1)训练/测试集按时间顺序划分的SVM、MLP和RF模型预测的滑坡易发性的不确定性略低于按空间随机性划分的模型,验证了按时间顺序划分的可行性;(2)训练/测试集按时间顺序划分实际上是其在空间随机划分下的一种更符合滑坡发生实际情况的“确定性”特征,当然对缺乏滑坡发生时间的数据集开展空间随机划分也是可行的.
滑坡 / 滑坡易发性 / 时间顺序 / 训练/测试集比例 / 机器学习 / 工程地质
landslides / landslide susceptibility / time series / training/testing dataset / machine learning model / engineering geology
/
〈 |
|
〉 |