基于可解释性机器学习的九寨沟景区滑坡易发性评价及驱动力分析

申振宏 ,  何松膛 ,  王道杰 ,  林勇明 ,  裴曾莉 ,  赵鹏

水土保持通报 ›› 2025, Vol. 45 ›› Issue (06) : 213 -226.

PDF (6693KB)
水土保持通报 ›› 2025, Vol. 45 ›› Issue (06) : 213 -226. DOI: 10.13961/j.cnki.stbctb.2025.06.028
水保监测与应用技术

基于可解释性机器学习的九寨沟景区滑坡易发性评价及驱动力分析

作者信息 +

Landslide susceptibility evaluation and driving force analysis for Jiuzhaigou scenic area based on explainable machine learning

Author information +
文章历史 +
PDF (6852K)

摘要

目的 构建“因子筛选—模型评价—机制解析”技术路径,探究滑坡易发性评价中的预测精度较高的评价模型,揭示滑坡灾害发生的关键驱动因子,深入探讨复杂地质条件下滑坡影响因子的相互作用机制。为九寨沟景区及类似震后高隐蔽性滑坡区的灾害风险管控和生态保护策略制定提供科学依据。 方法 以九寨沟景区为研究区,采用传统方法(层次分析法AHP、信息量法IV、确定系数法CF)与机器学习方法(XGBoost,LightGBM,CatBoost)进行易发性评价,基于相关性分析和共线性检验构建系统的评价指标体系,结合SHAP(shapley additive explanations)可解释性算法与最优参数地理探测器(OPGD)模型,识别关键驱动因子并探讨其作用机制。 结果 滑坡易发性评价模型中,机器学习模型整体优于传统方法,CatBoost模型性能最优(AUC=0.927),高易发区集中于熊猫海、箭竹海、丹祖沟西北部、草海西南部及长海东南部;SHAP与OPGD共同识别距水系距离、归一化植被指数(NDVI)、坡向及多年年均降雨量为主要控制因子;OPGD交互作用探测显示距水系距离与距断层距离交互作用最强(q=0.33),多年年均降雨量与NDVI呈非线性增强关系(q=0.16)。 结论 九寨沟景区内存在多处潜在滑坡高易发区,在高精度评价模型的基础上,SHAP算法对关键驱动因子的识别可靠,且多因子协同作用是九寨沟景区滑坡发育的关键机制。

Abstract

Objective This study aims to establish a technical pathway of ‘factor selection-model evaluation-mechanism analysis’ to investigate evaluation models with high predictive accuracy for landslide susceptibility, reveal the key driving factors of landslide disasters, and explore the interaction mechanisms among landslide influencing factors under complex geological conditions. It can provide scientific support for disaster risk management and the formulation of ecological protection strategies in the Jiuzhaigou scenic area and similar post-seismic regions with highly concealed landslides. Methods The Jiuzhaigou scenic area was selected as the study area. Landslide susceptibility was evaluated using both traditional methods-analytic hierarchy process (AHP), information value (IV), and certainty factor (CF) and machine learning models (XGBoost, LightGBM, and CatBoost). A systematic evaluation indicator system was constructed based on correlation analysis and collinearity tests. The shapley additive explanations(SHAP) explainable algorithm and the optimal parameter-based geodetector model (OPGD) were used to identify key controlling factors and investigate their interaction mechanisms. Results Among the landslide susceptibility evaluation models, the machine learning models overall outperformed the traditional methods, with the CatBoost model achieving the highest predictive accuracy (AUC=0.927). High-susceptibility zones were concentrated in Panda Lake, Arrow Bamboo Lake, northwestern Danzugou, southwestern Grass Lake, and southeastern Long Lake. Both SHAP and OPGD identified distance to water systems, normalized difference vegetation index (NDVI), slope aspect, and multi-year average annual rainfall as the primary controlling factors. OPGD interaction detection revealed that the interaction between distance to water systems and distance to faults was the strongest (q=0.33), and the relationship between multi-year average annual rainfall and NDVI showed a nonlinear enhancement (q=0.16). Conclusion There are multiple potential zones of high landslide susceptibility within the Jiuzhaigou scenic area. Based on high-accuracy evaluation models, the SHAP algorithm effectively identifies key driving factors. Moreover, the synergistic effects of multiple factors are the key mechanisms for landslide development in this region.

Graphical abstract

关键词

滑坡易发性 / 机器学习 / SHAP / 地理探测器 / 九寨沟景区

Key words

landslide susceptibility / machine learning / shapley additive explanations SHAP / geodetector / Jiuzhaigou scenic area

引用本文

引用格式 ▾
申振宏,何松膛,王道杰,林勇明,裴曾莉,赵鹏. 基于可解释性机器学习的九寨沟景区滑坡易发性评价及驱动力分析[J]. 水土保持通报, 2025, 45(06): 213-226 DOI:10.13961/j.cnki.stbctb.2025.06.028

登录浏览全文

4963

注册一个新账户 忘记密码

文献参数: 申振宏, 何松膛, 王道杰, 等.基于可解释性机器学习的九寨沟景区滑坡易发性评价及驱动力分析[J].水土保持通报,2025,45(6):213-226. Citation:Shen Zhenhong, He Songtang, Wang Daojie, et al. Landslide susceptibility evaluation and driving force analysis for Jiuzhaigou scenic area based on explainable machine learning [J]. Bulletin of Soil and Water Conservation,2025,45(6):213-226.
滑坡作为一种高破坏性的地质灾害,严重威胁山区工程设施与生态安全,在气候变化加剧和人类活动扰动下,其诱发机制日趋复杂1。高植被覆盖区的滑坡体因为林木冠层遮蔽,形态难辨,隐蔽性显著2,地震诱发的地层扰动与坡体结构失稳,则进一步加剧了滑坡的突发性与不确定性3。因此,精准评估滑坡易发性并解析其驱动机制,是科学防控与风险治理的理论基础。然而,传统方法难以量化多因子间的复杂非线性交互作用,机器学习模型虽然预测精度较高,却因可解释性制约滑坡驱动机制解析4。因此,亟待构建兼具高预测性能与驱动机制解析能力的评估框架,实现滑坡精细化防控。
滑坡是多种因素长期复杂耦合作用的结果,其形成机制表现出显著的复杂性和区域异质性5。当前研究多基于地质构造、地形地貌、水文条件及人类活动等信息,结合历史滑坡数据对滑坡易发性进行预测6。传统滑坡易发性评价方法主要依赖于统计模型或专家知识的多准则决策,如信息量法7、确定系数法8、层次分析法等9。这些模型侧重因子与滑坡之间的相关性分析,而对因子间非线性关系及多因子协同作用的系统探讨较为缺乏,限制了对滑坡内在驱动机制的深入理解。相比之下,机器学习模型凭借其出色的非线性拟合能力和数据驱动特性,在滑坡易发性评价领域展现出巨大潜力。常用模型包括随机森林10、人工神经网络11、支持向量机12以及基于决策树的集成模型如XGBoost13,LightGBM14和CatBoost等15。然而,大多数机器学习模型属于“黑箱”类型,难以解释模型输出与因子特征之间的因果关系,限制了其在机制解析与政策指导中的应用价值4。近年来,SHAP(shapley additive explanations)算法被引入滑坡易发性研究16,用于量化各因子对模型决策的边际贡献,提升了模型的可解释性。尽管如此,SHAP算法在地质灾害评价中的应用尚处于起步阶段,其解释效果受限于基础模型的非线性拟合能力,因子贡献度及效应的识别可靠性仍需结合其他方法进行验证。
九寨沟地质背景复杂多样,构造活动频繁,断层、褶皱、岩溶地貌相互交错。尽管该区植被覆盖良好,森林与湿地生态系统具有较高的生态服务功能17,但受地震影响,高植被覆盖区堆积大量松散碎屑物,在复杂地质环境和失稳坡面条件下,滑坡的发生呈现隐蔽性与突发性,对生态安全及旅游活动构成严峻威胁。2017年九寨沟7.0级地震进一步加剧了区域地质环境的脆弱性18-19。基于此,本研究以九寨沟国家自然保护区为研究区,通过野外考察、遥感解译与空间分析获取多源数据,系统揭示滑坡灾害发生与各类环境因子的相关性与空间分布特征;构建以可解释性机器学习模型为核心的滑坡易发性评价体系,结合SHAP算法量化不同因子对滑坡易发性的贡献度,揭示滑坡灾害发生的关键驱动因子;结合地理探测器方法从空间异质性角度验证因子交互影响,深入探讨研究区复杂地质条件下滑坡影响因子的相互作用机制,为九寨沟景区滑坡灾害风险识别、监测预警及综合治理提供理论支撑和技术保障,助力区域生态环境保护与可持续发展。

1 研究区概况

九寨沟国家级自然保护区(103°46′14″—104°5′3″E,32°54′13″—33°19′57″N)地处四川省阿坝藏族羌族自治州九寨沟县漳扎镇,总面积655.49 km²,位于青藏高原东缘向四川盆地过渡的岷山山脉南段,属白水江源头流域(图1)。该区域气候湿润,年平均气温7.3 ℃,年降水量600~800 mm,且降水集中于夏季,短时强降雨事件频发。地貌组合复杂多样,发育以呈“Y”字形展布的日则沟、则查洼沟及树正沟为主体的高寒喀斯特地貌,区内海拔1 900~4 764 m,最大相对高差达2 764 m,形成南高北低的陡峻高山峡谷地形,为滑坡提供了势能和空间上的有利条件。地质构造上,区内岩性以古生界至三叠系碳酸盐岩为主,在物理风化(如冬季冻融循环)和化学溶蚀作用下易发生崩解20,同时该区位于松潘-甘孜造山带与西秦岭造山带接合部,受塔藏断裂、虎牙断裂等多组活动断裂强烈控制,导致岩体破碎、节理裂隙发育21,加剧了区域地质环境的脆弱性和岩体损伤程度,为滑坡提供了丰富的松散固体物源。

2 数据来源与研究方法

2.1 数据来源

基于遥感解译和空间统计等多种手段获取研究区地形、气象、地质等多源数据,构建滑坡灾害影响因子的基础数据库,并将各数据的坐标系统一为WGS_1 984_UTM_Zone_47 N,栅格数据的像元大小统一为30 m×30 m。

(1) 从地理空间数据云获取ASTER GDEM数字高程模型数据(DEM),分辨率为30 m(https:∥www.gscloud.cn/)。基于ArcGIS平台提取坡向、坡度、平面曲率、剖面曲率、地形起伏度、地表粗糙度和水流功率指数。

(2) 从Open Street Map中获取道路和水系矢量文件(https:∥www.openstreetmap.org/)。

(3) 从国家青藏高原科学数据中心获取2018—2023年逐月降雨量栅格数据,分辨率为1 km(https:∥data.tpdc.ac.cn/)。

(4) 从中国科学院资源环境科学与数据中心获得中国2020年土地利用、归一化植被指数(normalized difference vegetation index, NDVI)最大值栅格数据,分辨率为30 m;2015年土壤侵蚀栅格数据,分辨率为1 km(https:∥www.resdc.cn/)。

(5) 从1∶250万中华人民共和国数字地质图获取岩性和断层数据。

(6) 从中国地震台网获得2012—2024年地震震中位置(https:∥news.ceic.ac.cn/)。

(7) 从地质云、水工环地质信息服务平台获取滑坡灾害数据(https:∥geocloud.cgs.gov.cn/),并结合遥感影像目视解译,得到滑坡点共计386处。

2.2 滑坡易发性评价

2.2.1 评价模型

(1) AHP。层次分析法(analytic hierarchy process, AHP)是一种将定性与定量相结合解决多准则问题的决策方法,它可以对多种因素进行权重分析,从而做出最优决策。具体步骤依次为建立层次结构模型、构建判断矩阵、一致性检验、计算各评价因子综合权重。本研究以滑坡影响因子构成的评价指标体系为基础,建立层次结构模型,参考前人研究对因子进行两两比较922。利用一致性指数(CI)、随机一致性指数(RI)、一致性比率(CR)来衡量判断矩阵的结果,当CR小于0.1时,认为矩阵一致性较好。经计算λmax为15.97,RI为1.58,最终计算CR值为0.04<0.1满足标准,得到每个影响因子的权重。其计算公式为

CI=λmax-nn-1
CR=CIRI

式中:λmax是判断矩阵的最大特征根; n判断矩阵的阶数。

(2) IV。信息量法(information value method, IV)是基于信息熵理论构建的地质灾害评价基础性方法7,其核心机理在于通过概率密度函数量化滑坡灾害与各环境因子间的统计关联性,表征不同因子对滑坡灾害发生的空间贡献度,具有明确的物理意义和可追溯的计算过程。计算公式为

I=i=1nI(xi,H)=i=1nlnNi/NSi/S

式中:IxiH)为因子xi 对滑坡贡献的信息量; S为研究区面积; xi 为评价单元内所取的因子等级; Si 为因子等级xi 的面积; N为研究区地质灾害总数; Ni 为因子等级xi 内发生滑坡的数量; I为评价单元中综合信息量;n为影响因子数量。

(3) CF。确定系数法(certainty factor, CF)是一种针对不确定性推理的置信度量化模型。该方法通过分析条件概率与先验概率的差异性,表征地质环境因子对滑坡灾害发生的正向促进或负向抑制作用3。其核心在于构建分段函数计算各因子类别的CF值,值域为[-1,1],正值体现因子对滑坡发生的促进作用强度,负值表征抑制作用程度。该方法的数学表达为

CF=Pa-PsPa(1-Ps)(Pa>Ps)Pa-PsPs(1-Pa)(Pa<Ps)

式中:Pa 为因子分类a中的滑坡灾害个数与数据分类a的面积比值; Ps 为整个研究区灾害总个数与研究区总面积比值。

(4) XGBoost。XGBoost(extreme gradient boosting)是基于GBDT改进的一种监督式集成学习算法13。在训练过程中,其采用逐步构建决策树的方式,且引入了分裂点查找算法与二阶导数信息提高计算效率。同时引入了L1,L2正则化以及后剪枝策略对决策树的复杂度进行约束,防止过拟合,确保模型具有良好的泛化能力。对于包含m棵树、训练数据集样本为(xi,yi)的XGBoost模型,第t轮迭代正则化目标函数如下:

(t)=i=1ngift(xi)+12hift2(xi)+γT+12λj=1Twj2

式中: ftxi )为第t棵决策树对样本xi 的预测值; n为训练样本数; gihi 为损失函数对样本xi 的一阶梯度和二阶梯度; T为树的叶节点数量; wj 为第j个叶子的权重; γλ为控制叶子分裂和权重的正则化系数。

(5) LightGBM。LightGBM(light gradient boosting machine)也是基于GBDT改进的一种监督式集成学习算法,其目标函数与XGBoost类似14。在大规模数据训练时,采用直方分箱算法、互斥特征捆绑技术、单边梯度采样(GOSS),提高运行效率。最核心技术GOSS认为,梯度绝对值大的样本对信息增益的贡献更大,因此应保留这些样本并随机降采样低梯度样本。这一策略通过方差增益公式实现优化:

Vjd=xiAgi+1-aaxiBgi2xiAhi+1-aaxiBhi

式中:A为高梯度样本集(最大值-a×100%); B为随机采样的低梯度样本集(b×100%); ab为GOSS的采样比例参数; gihi 为损失函数对样本xi 的一阶和二阶梯度。

(6) CatBoost。CatBoost(categorical boosting)是专为解决类别型特征建模难题而设计,其核心创新是有序提升和对称树技术15。针对传统梯度提升算法因样本顺序依赖性导致的类别特征梯度估计偏差,有序提升通过动态调整训练样本顺序,在树节点分裂时自动生成类别特征的数值编码,无需人工特征工程即可实现高效表达。对称树通过强制每层节点采用相同特征与分裂阈值,约束树结构对称性,降低模型复杂度并加速推理速度,增强对地理现象空间对称性的捕捉能力,同时结合GPU并行计算与目标函数交叉熵损失和L2正则化的联合优化,其目标函数定义为

=i=1nyiln(pi)+(1-yi)iln(1-pi)+λj=1mθj2

式中:yi 为实测值; pi为预测概率; θj ​为模型参数; λ为正则化系数。

2.2.2 超参数优化

Optuna是基于贝叶斯优化理论的超参数自动搜索框架23。其核心采用树结构Parzen估计器算法,通过智能剪枝机制淘汰低效试验,结合分布式并行架构加速大规模复杂模型的参数搜索进程,同时支持多目标优化功能,在复杂地质环境与监测数据构成的高维超参数空间中,精准识别最优参数配置组合,为提升滑坡灾害预测模型的泛化能力与预测精度提供技术支撑。

2.2.3 精度对比

本研究采用受试者工作特征曲线(receiver operating characteristic curve, ROC)下面积(area under the curve, AUC)作为模型性能评估的核心指标。AUC值通过整合滑坡与非滑坡样本的预测概率分布,量化模型对滑坡与非滑坡的区分能力,其取值越接近1,表明模型对滑坡易发性的预测精度越高6

2.3 滑坡驱动力分析

2.3.1 影响因子筛选

结合研究区概况及前人经验18,初步选取高程、坡度、坡向、平面曲率、剖面曲率、地表粗糙度、地形起伏度、土地利用、岩性、距地震震中距离、距断层距离、距道路距离、距水系距离、多年平均降雨量、NDVI、水流功率指数和土壤侵蚀共18个影响因子用于滑坡易发性评估。为保证影响因子的相对独立性以及评价模型的准确性和可靠性,本研究采用皮尔逊相关系数(Pearson correlation coefficient, PCC)度量两个变量之间的线性相关程度24。结果显示,高程与多年年均降雨量、坡向与地表粗糙度的相关系数大于0.8图2),剔除高程、地表粗糙度。

其次,若因子之间存在较高的线性相关性,将影响ML模型对因子重要性的判断,导致部分变量的重要性被高估或低估,从而引发错误决策。多数学者选择方差膨胀系数(variance inflation factor, VIF)和容忍度(tolerance, TOL)剔除共线性较高的变量,VIF<10且TOL>0.1的因子满足要求24。结果表明,经过PCC筛选后,各因子共线性均满足需求(表1)。最终以表1内所有因子为基础构建滑坡易发性评价指标体系。图3是部分影响因子专题地图。

2.3.2 驱动力分析

(1) 最优参数地理探测器。地理探测器(geodetector)是一种基于空间分层异质性理论的空间分析方法,其通过非参数检验方法量化地理要素的空间分异特征及其驱动机制25。鉴于传统地理探测器在参数选择(如离散化方法)和空间尺度效应方面存在敏感性局限,Song等26创新性地提出最优参数地理探测器模型(optimal parameters-based geodetector model, OPGD)。

该模型通过构建贝叶斯优化框架,集成等间隔法、自然断点法等多元离散化方法,采用概率密度加权算法实现分类区间与参数组合的动态适配与自适应优化。在优化过程中,以因子解释力指标q值为目标函数(q值越接近1表示解释力越强),通过构建高斯过程回归模型对q值响应建模,并在每轮迭代中基于期望改进准则采样新的参数组合进行评估,直至q值收敛或达到最大迭代次数,从而获得最优的离散化方法及其参数组合。q值的计算公式为

q=1-h=1LNhσh2Nσ2

式中:h为某个因子的分类数或分区;N为区域内的单元数; Nh 为第h层的单元数; σh2σ2分别为第h层和研究区滑坡易发性的方差。

(2) SHAP算法。SHAP算法基于博弈论中的Shapley值,能够量化各特征对预测结果的全局贡献,具有高度一致性和解释性27。在全局层面,SHAP可揭示各影响因子的重要性排序、贡献大小及其正负作用方向,有效识别滑坡易发性的关键驱动因子,剖析因子空间分布对滑坡发生的影响趋势,为滑坡驱动机制的深入理解提供有力支撑。

SHAP值计算公式为

ϕi=SN{i}|S|!(n-|S|-1)!n!f(S{i})-f(S)

加法特征归因:

g(z')=ϕ0+i=1Mϕizi'

式中:fi 表示第i个评价因子的贡献; N表示所有评价因子的集合; S表示给定预测的评价因子的子集; fS∪{i})和fS)分别表示有或没有第i个评价因子的模型结果,z∈{0,1} M,当样本中含有评价因子i时等于1,否则等于0; M为输入评价因子的数量; ϕ0为平均预测值;ϕi为第i个评价因子的贡献值,即SHAP值。

3 结果与分析

3.1 易发性影响因子对滑坡的影响

研究结果(图4)表明,坡度在(27.24°,35.98°]时,发生滑坡数最多(125处),而在(35.98°,45.48°]时,滑坡点密度最高,为0.73处/km²;阳坡的滑坡数和滑坡点密度均最高,分别为147处和1.14处/km²;地形起伏度在(184,243]时滑坡数和滑坡点密度均为最高,分别为163处和0.75处/km²;平面曲率在(-0.65,0.09]时发生滑坡数最多(186处),小于-1.88时,滑坡点密度最高(0.73处/km²);剖面曲率在(-0.85,0.58]时,发生滑坡数最多(246处,灾害点占比63.7%),大于2.64时,滑坡点密度最高(0.86处/km²)。

地质类因子中,岩性中石灰岩/白云岩滑坡数最多(235处,灾害点占比60.9%);距地震震中距离小于5 km时,发生滑坡253处(灾害点占比65.5%),其中(1,3]km时滑坡数最多(113处),(3,5]km时滑坡点密度最高(0.78处/km²);距断层距离小于5 km时,发生滑坡162处。

多年年均降雨量在(830.16,863.7]mm时滑坡数和滑坡点密度最高,分别为126处和0.75处/km²;水流功率指数在(4.32,5.89]时滑坡数和滑坡点密度均为最高,分别为133处和0.8处/km²;距水系距离在(400,600]m时滑坡点密度最高(1.05处/km²)。

土地利用类型中,草地滑坡数最多(270处,灾害点占比69.9%);距道路距离在(200,400]m时滑坡点密度最高(0.76处/km²),发生18处滑坡;NDVI小于0.49时共发生305处滑坡(灾害点占比79.0%),在(0.34,0.49]时发生滑坡数最多(138处);土壤侵蚀等级为轻微侵蚀时发生滑坡数最多(140处),严重侵蚀时滑坡点密度为0.78处/km²。

3.2 基于传统方法和机器学习方法的滑坡易发性评价

表2是各因子不同区间的CF值、IV值以及AHP权重的统计结果,通过因子加权叠加得到评价结果。图5表明,各模型在识别易发性较高的区域方面存在显著共性。所有模型均将熊猫海与箭竹海周边、丹祖沟西北部、草海西南部、中季节海及长海东南部划定为高和极高易发区;部分模型的易发性空间分异特征显著。AHP模型的极高易发区沿研究区西北-东南轴线呈条带状延展,极低易发区则集中于东北部,各等级分区呈现交错嵌套的复杂格局。相比之下,其他模型呈现明显的空间集聚特征,各易发性分区的分布方位没有显著差异。其中,高易发区与极高易发区主要集中分布于研究区西北部和东南部的山地和河谷区域,其他易发性等级围绕这些核心区域呈分级缓冲状向外扩展。

通过比较ROC曲线,系统评估各模型的预测精度(图6)。各模型按AUC值从高到底的排序依次为:CatBoost>XGBoost>LightGBM>IV>CF>AHP,CatBoost模型(AUC=0.927)为最优模型,显著高于罗路广等18提出的CF-Logistic模型(AUC=0.847)。传统模型中IV表现最好(AUC=0.824),3种机器学习模型的AUC值均远高于传统模型。此外,在相同计算环境下,CatBoost模型的训练耗时仅为15″,而XGBoost和LightGBM分别耗时22″与26″,进一步表明CatBoost在多线程优化与数据处理效率上的优势,具有更强的实际应用潜力。

3.3 基于OPGD与SHAP的滑坡驱动力分析

通过OPGD对最优模型CatBoost进行因子探测,结果表明,距水系距离、坡向、多年年均降雨量、NDVI、距道路距离、坡度为主控因子(表3),部分因子探测结果p值大于0.05不予排序;而通过SHAP算法得到3种机器学习模型的因子重要性排序(图7)表明,NDVI、距水系距离、坡向、多年年均降雨量,距地震震中距离、剖面曲率等因子为主控因子。从两类方法的识别结果看,九寨沟景区滑坡的主控因子为NDVI、距水系距离、坡向、多年年均降雨量。

交互作用探测分析结果表明,在105对交互因子中,双因子增强31对,非线性增强66对,单因子非线性减弱7对,非线性减弱1对,因子交互作用主要表现为非线性增强和双因子增强型(图8),交互作用影响力最高的是距水系距离与距断层距离(q=0.33),其次是距水系距离与多年年均降雨量(q=0.32)、距水系距离与NDVI(q=0.31)。同时,距水系距离与坡度、坡向、地形起伏度、土壤侵蚀、距道路距离为双因子增强作用类型,影响力均大于0.2;多年年均降雨量与坡向、距断层距离、距道路距离、距水系距离、土壤侵蚀、NDVI为非线性增强作用类型,影响力均大于0.1;坡向与其他因子的交互作用影响力均大于0.1。

4 讨 论

4.1 传统方法与机器学习方法的对比

从滑坡易发性分区的统计结果(图9)可以看出,传统方法与机器学习模型在分区结果上存在显著差异。传统模型主要包括主观赋权类方法(如AHP)和经验统计类方法(如CF与IV)。其中,AHP模型依赖主观判断来构建因子权重,通常保留较大面积的中间过渡区域,以规避极端划分可能带来的不确定性。而CF与IV模型则依据滑坡发生的频率来估算各因子对滑坡的影响,尽管具备一定的数据驱动特征,但在多因子间非线性关系建模方面存在显著局限,难以捕捉复杂因子耦合下的综合效应。因此,3种传统模型在滑坡易发性等级划分中普遍呈现出“中易发区面积最大”的单峰分布特征,极低和极高易发区面积相对较小。这一现象表明,传统方法在分类划分上更偏向连续性和渐变性,缺乏清晰的分类边界。

机器学习模型凭借其算法在非线性拟合与高维交互建模方面的优势,能够有效学习多因子之间的复杂交互关系,并通过目标函数与参数优化机制,在训练过程中动态调整分类阈值。该过程不仅压缩了中易发区面积,还显著增加了低易发区面积,从而提升了模型的判别精度和区分能力。以CatBoost模型为例,尽管其极高易发区面积较小,但成功识别出247处滑坡点,滑坡点密度高达2.51处/km²,反映出其对高易发性区域的空间识别能力极强。相比之下,AHP模型虽然极高易发区面积较大,但仅识别出77处滑坡点,密度仅为1.05处/km²,说明其判别边界相对模糊。对于极低易发区,AHP模型在该区域滑坡点密度达0.15处/km²,CF与IV模型亦存在不同程度的滑坡点分布,表明传统模型依然存在一定的误判问题,且在边界识别上存在显著“模糊性”与“过渡性”。与之形成鲜明对比的是,各类机器学习模型在极低易发区的滑坡点密度均为0.01处/km²,显示出其在划分低风险区域方面具备更强的区分能力。这进一步表明,基于单因子频率或专家经验的传统方法,在应对复杂地质条件和多因子耦合作用时,难以构建准确的空间风险边界。

在模型适用性方面,传统模型具有方法简便、计算效率高和解释性强等优势,适用于数据稀缺或需快速评估的应用场景。然而,在地形地貌复杂、地质环境空间异质性显著的区域,其对滑坡致灾机制的响应能力存在明显不足。相对而言,机器学习模型凭借其多维交互建模、高阶特征识别能力和自适应优化机制,显著提升了对极高风险区域的识别精度,同时有效降低了低风险区的误判率,具有更强的空间泛化能力和实际应用潜力。

4.2 九寨沟景区滑坡驱动机制解析

本研究聚焦九寨沟景区地震诱发的地层扰动与高植被覆盖区的隐蔽性滑坡特征,融合OPGD与SHAP方法筛选主控因子,挖掘非线性关系与高阶交互作用,构建驱动机制分析框架。

单因子效应分析显示,距水系距离作为主控因子,其作用机理可归结为河流通过下切和侧向侵蚀破坏基底支撑来降低岩土体抗剪强度,进而增加滑坡易发性。虽然高植被覆盖区的根系固土与截留雨水效应可增强坡体稳定性,但在地震扰动或极端降雨/风力耦合条件下,植被荷载和根系持水效应亦可能通过增加剪切面剪应力或改变孔隙水压力而削弱坡体稳定性28。本研究中,在NDVI小于0.49的区域滑坡发生305处,表明植被覆盖较低区域固土能力不足,滑坡更易发生。降雨能够增大坡体自重,改变土体结构,从而降低岩土体抗剪强度,同时地震后产生的松散物质与地表裂隙进一步加速降雨渗透,从而增加滑坡易发性,An等29对九寨沟景区所属的九寨沟县进行滑坡驱动力分析,同样揭示了降雨的主要驱动作用。本研究中,坡向被列为滑坡的主控因子之一,这与罗路广等18在九寨沟景区对滑坡影响因子贡献的分析结果一致。阳坡受到更强太阳辐射,促进岩土体在干湿循环中干缩膨胀、裂隙发育,增加滑坡易发性;尽管高植被覆盖可在一定程度上缓解这种辐射效应,但统计结果仍表明阳坡的滑坡数量和滑坡点密度均为最高,说明可能存在其他因子与坡向交互作用而导致滑坡发生,如陡峭阳坡在强日照和降雨的复合作用。其他影响因子中,坡度影响坡体应力分布和孔隙水压力,加速岩土体裂隙发育与强度衰减;距震中距离反映地震震动强度的衰减规律,近震中区域因强震动引发的惯性力、超孔隙水压力及结构损伤,多次地震累积效应更会加剧坡体失稳风险,显著提升滑坡易发性;距断层距离体现为近断层区域因构造应力集中、岩体破碎及地下水渗透通道发育,促进滑坡发生。

多因子协同作用显著影响滑坡易发性。距水系距离与距断层距离交互强度最高(q=0.33),在活跃构造区,断层破碎带不仅降低岩体强度,还为地下水渗流提供通道;水系和地下径流不断软化破碎岩体,加剧坡体失稳风险。余明威等30对西藏林芝地区研究发现在水系和活动断裂带的共同控制下,滑坡灾害沿水系两侧及断裂带附近集中分布,这一结果验证了水系与断裂带交互作用对滑坡易发性的主导影响。距水系距离与NDVI的交互作用显著(q=0.32),水系附近土壤含水量高,植物根系可增加土壤孔隙度,促进水分入渗。另外植被自重可能会影响坡体受力而加剧滑坡风险。距水系距离与坡度为双因子交互增强,说明陡坡地形加速水流速度,增强下切侵蚀与侧蚀作用,更易引发坡体失稳。多年年均降雨量与NDVI的非线性增强关系印证了植被对于坡体的双重效应。适度降雨条件下,植被通过根系固土和蒸腾排水提高坡体稳定性,但长期强降雨时,植被截留雨水延缓地表径流,增加土壤含水量,结合植被自重对坡体抗剪切力的影响,反而增加滑坡易发性28

本研究系统剖析了九寨沟景区诱发滑坡的主控因子及其复杂作用机制,不仅为该区域滑坡易发性预测提供了科学精准的模型依据,也深化了对高植被覆盖与地震扰动耦合区域滑坡机理的认知。后续可进一步拓展研究范围,探究不同地质环境下因子作用机制的异同,为滑坡灾害防治提供更具普适性的技术支撑。

5 结 论

(1) 机器学习模型显著优于传统方法。CatBoost模型预测精度最高(AUC=0.927)。极高易发区面积仅占研究区15%,却集中了63.9%的历史滑坡点,CatBoost模型识别出熊猫海与箭竹海周边、丹祖沟西北部、草海西南部、中季节海及长海东南部为高和极高易发性区域。

(2) 在高精度评价模型的基础上,SHAP算法对关键驱动因子的识别可靠。通过SHAP与OPGD的验证分析,九寨沟景区滑坡发育的主控因子为NDVI、距水系距离、坡向以及多年平均降雨量。

(3) 多因子协同作用是驱动滑坡发育的关键机制。距水系距离与距断层距离的交互效应最强(q=0.33),距水系距离与NDVI(q=0.31)、多年年均降雨量与NDVI的交互作用类型为非线性增强(q=0.16)。

参考文献

[1]

崔鹏.中国山地灾害研究进展与未来应关注的科学问题[J].地理科学进展201433(2):145-152.

[2]

Cui Peng. Progress and prospects in research on mountain hazards in China [J]. Progress in Geography201433(2):145-152.

[3]

杨正荣,喜文飞,史正涛,.复杂植被山区滑坡蠕变与植被覆盖度关系研究[J].测绘科学202348(1):157-165.

[4]

Yang ZhengrongXi WenfeiShi Zhengtaoet al. Study on the relationship between landslide creep and vegetation cover in mountainous areas with complex vegetation [J]. Science of Surveying and Mapping202348(1):157-165.

[5]

许冲,戴福初,姚鑫,.基于GIS与确定性系数分析方法的汶川地震滑坡易发性评价[J].工程地质学报201018(1):15-26.

[6]

Xu ChongDai FuchuYao Xinet al. GIS platform and certainty factor analysis method based Wenchuan earthquake-induced landslide susceptibility evaluation [J]. Journal of Engineering Geology201018(1):15-26.

[7]

纪守领,李进锋,杜天宇,.机器学习模型可解释性方法、应用与安全研究综述[J].计算机研究与发展201956(10):2071-2096.

[8]

Ji ShoulingLi JinfengDu Tianyuet al. Survey on techniques, applications and security of machine learning interpretability [J]. Journal of Computer Research and Development201956(10):2071-2096.

[9]

黄润秋.20世纪以来中国的大型滑坡及其发生机制[J].岩石力学与工程学报200726(3):433-454.

[10]

Huang Runqiu. Large-scale landslides and their sliding mechanisms in China since the 20th century [J]. Chinese Journal of Rock Mechanics and Engineering200726(3):433-454.

[11]

古腾飞,段平,王伟鹏,.滑坡易发性评价方法综述[J].自然灾害学报202433(6):1-16.

[12]

Gu TengfeiDuan PingWang Weipenget al. Review of methods for landslide susceptibility assessment [J]. Journal of Natural Disasters202433(6):1-16.

[13]

范林峰,胡瑞林,曾逢春,.加权信息量模型在滑坡易发性评价中的应用:以湖北省恩施市为例[J].工程地质学报201220(4):508-513.

[14]

Fan LinfengHu RuilinZeng Fengchunet al. Application of weighted information value model to landslide susceptibility assessment: A case study of Enshi City, Hubei Province [J]. Journal of Engineering Geology201220(4):508-513.

[15]

郑迎凯,陈建国,王成彬,.确定性系数与随机森林模型在云南芒市滑坡易发性评价中的应用[J].地质科技通报202039(6):131-144.

[16]

Zheng YingkaiChen JianguoWang Chengbinet al. Application of certainty factor and random forests model in landslide susceptibility evaluation in Mangshi City, Yunnan Province [J]. Bulletin of Geological Science and Technology202039(6):131-144.

[17]

许冲,戴福初,姚鑫,.GIS支持下基于层次分析法的汶川地震区滑坡易发性评价[J].岩石力学与工程学报200928(S2):3978-3985.

[18]

Xu ChongDai FuchuYao Xinet al. Gis-based landslide susceptibility assessment using analytical hierarchy process in Wenchuan earthquake region [J]. Chinese Journal of Rock Mechanics and Engineering200928(S2):3978-3985.

[19]

Hong HaoyuanPourghasemi H RPourtaghi Z S. Landslide susceptibility assessment in Lianhua County (China): A comparison between a random forest data mining technique and bivariate and multivariate statistical models [J]. Geomorphology2016259:105-118.

[20]

Kanungo D PArora M KSarkar Set al. A comparative study of conventional, ANN black box, fuzzy and combined neural and fuzzy weighting procedures for landslide susceptibility zonation in Darjeeling Himalayas [J]. Engineering Geology200685(3/4):347-366.

[21]

Huang FamingYan JunFan Xuanmeiet al. Uncertainty pattern in landslide susceptibility prediction modelling:Effects of different landslide boundaries and spatial shape expressions [J]. Geoscience Frontiers202213(2):101317.

[22]

张潇远,苏巧梅,赵财胜,.一种利用贝叶斯算法优化XGBoost的滑坡易发性评价方法[J].测绘科学202348(6):140-150.

[23]

Zhang XiaoyuanSu QiaomeiZhao Caishenget al. A landslide susceptibility evaluation method using Bayesian algorithm to optimize XGBoost [J]. Science of Surveying and Mapping202348(6):140-150.

[24]

何哲,石玉玲,李富春,.基于LightGBM模型的甘肃省临夏县滑坡易发性评价[J].水资源与水工程学报202435(1):197-205.

[25]

He ZheShi YulingLi Fuchunet al. Landslide susceptibility assessment based on LightGBM model in Linxia County, Gansu Province [J]. Journal of Water Resources and Water Engineering202435(1):197-205.

[26]

曾韬睿,王林峰,张俞,.基于CatBoost-SHAP模型的滑坡易发性建模及可解释性[J].中国地质灾害与防治学报202435(1):37-50.

[27]

Zeng TaoruiWang LinfengZhang Yuet al. Landslide susceptibility modeling and interpretability based on CatBoost-SHAP model [J]. The Chinese Journal of Geological Hazard and Control202435(1):37-50.

[28]

Sun DeliangWang JingWen Haijiaet al. Landslide susceptibility mapping (LSM) based on different boosting and hyperparameter optimization algorithms:A case of Wanzhou District, China [J]. Journal of Rock Mechanics and Geotechnical Engineering202416(8):3221-3232.

[29]

王绚,范宣梅,杨帆,.植被茂密山区地质灾害遥感解译方法研究[J].武汉大学学报(信息科学版)202045(11):1771-1781.

[30]

Wang XuanFan XuanmeiYang Fanet al. Remote sensing interpretation method of geological hazards in lush mountainous area [J]. Geomatics and Information Science of Wuhan University202045(11):1771-1781.

[31]

罗路广,裴向军,黄润秋,.GIS支持下CF与Logistic回归模型耦合的九寨沟景区滑坡易发性评价[J].工程地质学报202129(2):526-535.

[32]

Luo LuguangPei XiangjunHuang Runqiuet al. Landslide susceptibility assessment in Jiuzhaigou scenic area with GIS based on certainty factor and logistic regression model [J]. Journal of Engineering Geology202129(2):526-535.

[33]

许冲,王世元,徐锡伟,.2017年8月8日四川省九寨沟Ms7.0地震触发滑坡全景[J].地震地质201840(1):232-260.

[34]

Xu ChongWang ShiyuanXu Xiweiet al. A panorama of landslides triggered by the 8 August 2017 Jiuzhaigou, Sichuan Ms7. 0 earthquake [J]. Seismology and Geology201840(1):232-260.

[35]

曹俊,杨更,杜杰,.8·8地震后九寨沟景区“层湖叠瀑”景观变化研究[J].四川地质学报202141(1):161-166.

[36]

Cao JunYang GengDu Jieet al. Study of change of the “stratified lakes and folded waterfalls” landslide in Jiuzhaigou valley scenic spots after the earthquake on Aug. 8, 2017 [J]. Acta Geologica Sichuan202141(1):161-166.

[37]

姚鑫,周振凯,李凌婧,.2017年四川九寨沟Ms7.0地震InSAR同震形变场及发震构造探讨[J].地质力学学报201723(4):507-514.

[38]

Yao XinZhou ZhenkaiLi Lingjinget al. Insar co-seismic deformation of 2017 Ms7.0 Jiuzhaigou earthquake and discussions on seismogenic tectonics [J]. Journal of Geomechanics201723(4):507-514.

[39]

王进,臧明东,许冲,.基于层次分析与受试者工作特征曲线下面积耦合算法的2022年泸定地震滑坡易发性评估[J].工程地质学报202432(5):1696-1711.

[40]

Wang JinZang MingdongXu Chonget al. Landslide susceptibility assessment following the 2022 Luding earthquake: A coupled analytic hierarchy process and area under the receiver operating characteristic curve algorithm [J]. Journal of Engineering Geology202432(5):1696-1711.

[41]

Akiba TSano SYanase Tet al. Optuna:a next-generation hyperparameter optimization framework [C]∥ Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. Anchorage AK USA. ACM, 2019:2623-2631.

[42]

潘网生,赵恬茵,蔚秀莲,.基于PR-SVM模型的黄陵县滑坡易发性评价[J].自然灾害学报202433(4):48-59.

[43]

Pan WangshengZhao TianyinYu Xiulianet al. Landslide susceptibility assessment in Huangling County based on probability ratio and support vector machine model [J]. Journal of Natural Disasters202433(4):48-59.

[44]

Wang JinfengLi XinhuChristakos Get al. Geographical detectors‐based health risk assessment and its application in the neural tube defects study of the Heshun Region, China [J]. International Journal of Geographical Information Science201024(1):107-127.

[45]

Song YongzeWang JinfengGe Yonget al. An optimal parameters-based geographical detector model enhances geographic characteristics of explanatory variables for spatial heterogeneity analysis: Cases with different types of spatial data [J]. GIScience & Remote Sensing202057(5):593-610.

[46]

Lundberg S MLee S I. A unified approach to interpreting model predictions [C]∥ Proceedings of the 31st International Conference on Neural Information Processing Systems. 2017, Long Beach, California, USA. ACM, 2017:4768-4777.

[47]

Lan HuijuanWang DaojieHe Songtanget al. Experimental study on the effects of tree planting on slope stability [J]. Landslides202017(4):1021-1035.

[48]

An BangshengZhang ZhijieXiong Shenqinget al. Landslide susceptibility mapping based on ensemble learning in the Jiuzhaigou Region, Sichuan, China [J]. Remote Sensing202416(22):4218.

[49]

余明威,郭永刚,苏立彬.西藏林芝地区崩滑流灾害影响因子定量评价[J].中国地质灾害与防治学报202435(6):33-43.

[50]

Yu MingweiGuo YonggangSu Libin. Quantitative evaluation of influencing factors for landslide, rockfall and debris flow hazards in the Nyingchi area of Xizang Autonomous Region [J]. The Chinese Journal of Geological Hazard and Control202435(6):33-43.

基金资助

国家重点研发计划项目“西南诸河上游水电工程扰动生态效应与边坡退化机制”(2024YFF1307801)

国家重点研发计划项目“西南诸河上游水电工程扰动生态效应与边坡退化机制”(2024YFF1307800)

国家重点研发计划项目“西南诸河上游水电工程扰动生态效应与边坡退化机制”(2024YFC3012702)

中国科学院青年创新促进会项目(2023389)

国家自然科学基金(42201094)

国家自然科学基金(42371014)

中国科学院、水利部成都山地灾害与环境研究所自主部署项目(IMHE-CXTD-01)

中国国家留学基金委访问学者项目(202404910203)

AI Summary AI Mindmap
PDF (6693KB)

18

访问

0

被引

详细

导航
相关文章

AI思维导图

/