基于统计方法和机器学习耦合模型的吉林磐石地质灾害易发性评价

于海滨, 王明常, 王凤艳, 刘子维, 揭磊

世界地质 ›› 2025, Vol. 44 ›› Issue (3) : 433 -445.

世界地质 ›› 2025, Vol. 44 ›› Issue (3) : 433 -445.

基于统计方法和机器学习耦合模型的吉林磐石地质灾害易发性评价

    于海滨, 王明常, 王凤艳, 刘子维, 揭磊
作者信息 +

Author information +
文章历史 +

摘要

本文对于选择何种统计方法和机器学习模型结合得到更优预测结果的耦合模型进行地质灾害易发性评价,以及模型特征因子贡献度的解释做了进一步研究。文中提出2种统计方法和2种机器学习结合构建的4种耦合模型,以磐石市为例,研究耦合模型对于单一统计模型的精度提升效应,并从中选择精度最优模型解释各种致灾因子对于预测结果的贡献程度。首先使用ISO聚类算法选取非地灾样本;再将信息量法(IV)和确定性系数法(CF)分别与支持向量机(SVM)和随机森林(RF)结合,得到4种耦合模型(IV-SVM、CF-SVM、IV-RF、CF-RF)进行训练,利用混淆矩阵、接受者操作特性曲线评估模型的性能;然后采用自然断点法得到地质灾害易发性分级图(分为极低、低、中等、高、极高5个级别),采用地灾强度指数评估分级精度,并进行地质灾害易发性评价;最后,用沙普利加和解释算法解释最佳性能模型。结果表明:4种耦合模型的性能整体上均优于单一的统计模型,其中CF-RF模型的精度评估结果最优,准确率(0.896)、精确率(0.872)、F1分数(0.899)和AUC值(0.959),较单一CF模型分别提高了0.066、0.098、0.054和0.059;4种耦合模型历史地灾点绝大多数均分布在高和极高易发区,地灾强度指数随着地灾易发性级别的提高而增大,其中CF-RF模型的分级效果最佳;沙普利加和解释算法可以帮助理解模型决策的原因以及地质灾害的发生规律。研究表明,土地利用和道路修建是本研究区地质灾害易发的主要诱因。

关键词

地质灾害易发性评价 / 信息量法 / 确定性系数法 / ISO聚类算法 / 支持向量机 / 随机森林 / 沙普利加和解释

Key words

引用本文

引用格式 ▾
于海滨, 王明常, 王凤艳, 刘子维, 揭磊. 基于统计方法和机器学习耦合模型的吉林磐石地质灾害易发性评价[J]. 世界地质, 2025, 44(3): 433-445 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

基金资助

国家自然科学基金项目(42171407,42077242); 吉林省自然科学基金项目(20210101098JC); 吉林省教育厅科学技术研究项目(JJKH20231181KJ)

AI Summary AI Mindmap

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/