基于耦合信息量法选择负样本的区域滑坡易发性预测

周晓亭; 黄发明; 吴伟成; 周创兵; 曾诗怡; 潘李含

doi:10.15961/j.jsuese.202100808

工程科学与技术 ›› 2022, Vol. 54 ›› Issue (03) : 25 -35. DOI: 10.15961/j.jsuese.202100808

基于耦合信息量法选择负样本的区域滑坡易发性预测

周晓亭, 黄发明, 吴伟成, 周创兵, 曾诗怡, 潘李含

作者信息 +

Author information +

文章历史 +

摘要

在利用机器学习（machine learning,ML）模型预测滑坡易发性时，选择合理的负样本对预测结果具有重要影响。现有研究大多从整个研究区或低坡度等特定属性区内随机选择负样本，往往不够准确或以偏概全，降低了易发性制图的可靠性。为解决这一问题，提出基于耦合信息量法（information value,IV）的ML模型开展易发性建模。以江西省瑞金市为例，采用IV法将环境因子的属性值转化为对滑坡贡献的信息量值，划定极低和低易发区，并从中随机选择出ML模型训练验证用的负样本数据，构建全新的信息量–支持向量机（IV–SVM）、信息量–随机森林（IV–RF）耦合模型，并预测瑞金滑坡易发性。进一步地，与从全区随机选择负样本的单独SVM和RF模型，以及从坡度小于2°的特定属性区内随机选择负样本的低坡度SVM和RF模型开展对比研究。最后，采用Kappa系数和ROC曲线等指标验证和比较建模结果，IV–SVM和IV–RF模型的Kappa系数分别为0.828和0.876，且对应的ROC曲线的AUC值分别为0.920和0.988，均高于单独SVM、RF和低坡度SVM、RF模型；同时，IV–SVM和IV–RF模型易发性概率分布的平均值较小而标准差较大。结果表明：1)IV–SVM和IV–RF模型具有比单独SVM和RF模型，以及低坡度SVM和RF模型更高的滑坡易发性预测精度，且更有效地反映了瑞金滑坡易发性分布规律；2)RF模型相较于SVM模型具有更高的预测精度；3)IV–RF等耦合模型能够解决单独模型存在的负样本采样不准确和低坡度模型存在的坡度因子对模型贡献度有误差的问题，其滑坡易发性预测精度更高，更加合适区域滑坡易发性预测建模。本文研究为机器学习预测滑坡易发性的负样本采样方法提供了新思路。