文献参数: 刘子晗, 苏会卫, 曾铭玥.基于超参数优化与SHAP的广西桂林市滑坡灾害易发性评价[J].水土保持通报,2025,45(6):190-201. Citation:Liu Zihan, Su Huiwei, Zeng Mingyue. Evaluation of landslide susceptibility at Guilin City, Guangxi Zhuang Autonomous Region based on hyperparameter optimization and shapely additive explanations [J]. Bulletin of Soil and Water Conservation,2025,45(6):190-201.
山体滑坡作为喀斯特地貌区典型的地质灾害,严重威胁区域可持续发展与生态安全。在岩溶作用强烈的地区,强降雨叠加频繁的人类活动,显著增加了滑坡灾害风险
[1]。桂林以其独特的喀斯特地貌入选世界自然遗产,但快速发展的旅游业及相关工程活动持续扰动地质环境,导致该地区特有的滑坡灾害问题日益突出。然而,针对其孕灾机制的系统性研究仍显不足
[2]。
滑坡易发性制图(landslide susceptibility mapping, LSM)通过综合地质、地貌、水文及人类活动等多维因子,评估特定区域发生滑坡的可能性,是滑坡灾害风险防控的关键工具
[3-4]。全球LSM研究已发展出多种方法。早期基于统计的信息量法(information value,IV)
[5]和频率比模型(frequency ratio, FR)
[6]在揭示滑坡与环境因子间复杂非线性关系及系统建模方面存在局限
[7]。近年来,大数据挖掘技术的进步推动了机器学习(machine learning, ML)模型在灾害易发性评估中的广泛应用
[8-9]。相较于传统方法,随机森林(random forest, RF)
[10]、支持向量机(support vector machine, SVM)
[11]和极限梯度提升(extreme gradient boosting, XGBoost)等
[12]ML模型在处理海量复杂数据、捕捉灾害易发性与致灾因子间复杂非线性关系方面展现出显著优势,已成为该领域的重要工具,其性能比较也受到广泛关注。
然而,ML模型通常难以解释多因子与模型决策过程间的内在关联,限制了模型的可理解性与用户信任度
[13]。为提高模型可解释性,可解释人工智能(explainable artificial intelligence, XAI)方法
[14],如基于合作博弈论的SHAP(shapley additive explanations, SHAP)
[15]已被成功应用于疾病预测和工程等多个领域
[16]。当前大多数滑坡易发性研究尚未充分集成此类可解释模型,制约了LSM的深入应用和决策支持价值。
桂林市位于中国西南部,拥有典型的喀斯特地貌。复杂的地质环境因素组合使其成为滑坡易发区,而现有关于桂林喀斯特地区的LSM研究普遍缺乏模型可解释性,导致结果的透明度和可信度较低。
为此,本研究以桂林为研究区,在传统评价指标体系基础上,创新性融入岩溶地貌发育特征,地下水位、地表粗糙度和水土流失程度,结合坡向、土壤类型和归一化植被指数等,共10个关键影响因子构建地理空间数据库。选取逻辑回归(logistic regression, LR)
[17]、支持向量机(SVM)、随机森林(RF)、梯度提升机(gradient boosting machine, GBM)和XGBoost5种代表性机器学习算法进行对比分析。采用网格搜索算法优化模型超参数,引入SHAP方法构建综合解释框架,从全局和局部两个层面量化各因子对滑坡发生的贡献度,深入解析喀斯特地貌滑坡孕育的主导因素,为LSM与防灾减灾提供科学参考。
1 材料与方法
1.1 研究区概况
桂林市(109.63°E—111.47°E,24.25°N—26.38°N)位于广西壮族自治区西北部,地处云贵高原向湘桂丘陵过渡带,面积约为2.78×10
4 km
2[18],滑坡点的位置、地形及水系如
图1所示。作为全球典型的岩溶地貌发育区,桂林以其峰林、溶洞、地下河等独特景观闻名,地表与地下双空间结构显著影响区域生态水文过程。桂林的地形呈现出复杂的性质,海拔1 500 m以上的高海拔地区主要集中在东北和西部地区,分别是猫儿山和架桥岭。中部湘江至漓江流域发育呈带状展布的低海拔冲积平原(海拔高度<200 m),形成“两山夹一谷”的地貌格局。该地属亚热带湿润季风气候,降水与气温季节性波动显著。年均气温19.1 ℃,年均降水量1 886.8 mm,其中4—8月的降水量占全年76%以上,降水集中性与岩溶区脆弱生态系统的耦合作用可能加剧岩溶塌陷等地质灾害风险。
1.2 数据来源
选择14个特征因子构建滑坡易发性评价模型。其中,地形因子包括高程、坡度、坡向、岩性、土壤类型、地表粗糙程度、水土流失程度、地下水位、距河流距离和距断层距离;人类活动因子包括距道路距离和土地利用类型;气象与植被因子包括降水量和归一化植被指数。各项数据来源如
表1所示。
1.3 研究方法
为避免多重共线性干扰模型性能,采用皮尔逊相关系数(Pearson correlation coefficient, PCC)评估因子间相关性。依据此分析,剔除相关性较高(PCC>0.6)的因子,最终保留10个核心特征因子
[19]。被剔除的因子为高程、坡度、岩性和降水量。剩余的10个核心特征因子的PCC结果如
图2所示。
本研究采用资源环境科学数据中心提供的753个历史滑坡点数据。为平衡正负样本,在研究区内按设定步长生成761个非滑坡点,正负样本比例接近1∶1(1∶1.01)。采用分层随机抽样将总计1 514个样本按8∶2比例划分为训练集(1 212个)和验证集(302个),确保空间分布代表性。
采用方差膨胀因子(variance inflation factor, VIF)和容忍度(tolerance, TOL)诊断多维特征空间的共线性问题。所有因子VIF值介于1.20至6.61,TOL值介于0.12至0.84,均符合常规阈值要求(VIF<10,TOL > 0.1)
[22]。其中,地下水位(VIF=6.61,TOL=0.15)与归一化植被指数(NDVI)(VIF=6.27,TOL=0.12)均表现出相对较高的共线性趋势。尽管如此,二者均为滑坡水文-生态过程的重要驱动因子,前者直接影响岩土体孔隙水压力,后者则反映植被覆盖状况及其固土能力,两者在环境信息上具有一定互补性,因此在模型中均予以保留。为验证NDVI的保留合理性,本研究对比测试包含与不包含NDVI条件下模型的表现,结果显示保留NDVI时模型在AUC等指标上具有更优表现,且其IGR值较高,对模型贡献显著。同样,地下水位IGR值也达到0.136,说明在滑坡预测中具有重要作用。因此,在控制整体共线性处于可接受水平的前提下,保留NDVI与地下水位是合理且必要的。
采用信息增益比(information gain ratio, IGR)评估因子重要性。
2 结果与分析
2.1 滑坡条件因素分析
图3表明,滑坡的发生与多种地质环境因子密切相关,不同因子在空间分布上共同决定滑坡的易发性。从NDVI来看,滑坡在40~50区间聚集最多,表明中等植被覆盖区的坡体结构可能受到人为干扰或土地利用变化影响而更易失稳;而NDVI极低或极高的区域滑坡相对较少,前者虽植被稀疏但常为裸岩裸土区,地形稳定,后者则由于植被发育良好,具备一定固土能力。土壤类型中,红壤滑坡发生频率高达64.67%,可能由于其物理结构疏松、保水性差,在强降雨条件下更易发生崩滑,而其他类型如黄壤、紫色土等表现出较低滑坡频率,表明其工程性质更稳定。
地貌与地质结构因子方面,滑坡主要集中在靠近河流、道路和断层的区域,尤其是0~0.05 km的距离范围中,道路邻近区的滑坡频率高达92.3%,反映出工程扰动是滑坡发生的重要诱因。这些区域地表破坏较重,地基扰动频繁,排水系统不完善,极易在强降雨或地震诱发下产生滑移。此外,断层带附近(滑坡发生频率69.85%)地应力集中,岩体破碎,地质结构脆弱,是典型的构造控制型滑坡发育区。在坡向方面,滑坡在225°~270°(西南坡)方向频率最高,该方向可能与风向或降雨方向一致,导致岩体长期受水力劣化作用;不同坡度中,陡坡重力势能大,是滑坡的动力基础。地下水含量同样是不可忽视的控制因子。统计结果显示,滑坡在地下水位150~160区间发生频率最高(30.15%),140~170区间占比达68.53%,表明中高含水状态下,岩土体强度下降,孔隙水压力升高,是滑坡高发的敏感条件区。而在含水量超过180之后,滑坡频率逐渐下降,尤其在210~220区间滑坡比例仅为0.80%。这可能是由于高含水区多位于地势低洼、坡度较缓的区域,不具备产生大规模滑坡的重力条件。土地利用及相对高程因素显著影响滑坡空间分布。森林和农田是滑坡多发区,虽然森林通常具备防护功能,但在人为砍伐、建设活动干扰下,易削弱斜坡稳定性。农田则多位于中低海拔带地形起伏地段,水土扰动强烈,成为滑坡集中区。滑坡的发生是多种因子叠加作用的结果,其中以人为活动干扰、地质构造破碎带邻近区及中坡度中海拔地区的滑坡发育最为显著,提示在规划与防治过程中需重点关注这些高敏感区。
各影响因子重要性评估结果(
表2)表明,地形与环境因子整体解释力较强,其中土壤类型(IGR=0.152)、地下水位(0.136)和坡向(0.125)位列前三,显示出地质背景与水文条件对滑坡发育的关键控制作用。构造因子如距断层距离(0.121)和距河流距离(0.116)重要性亦较高,体现出地貌演化过程中的诱发机制。土地利用类型(0.026)和水土流失程度(0.019)贡献度较低,但在人类活动密集区仍具有一定参考价值。在人类活动因子中,距道路距离(0.090)明显高于土地利用类型,进一步表明工程扰动对坡体稳定性的直接影响。
2.2 多种机器学习模型的选择
为了提升模型性能,利用网格搜索(Grid-SearchCV)
[23]方法对各模型的关键超参数进行系统调优,调参策略以F
1-score为评估指标,在三折交叉验证基础上选取最优参数组合。
逻辑回归(LR):最佳正则化强度为C=10,采用liblinear求解器,最大迭代次数为1 000,以较高的容量拟合当前数据分布。
随机森林(RF):不设置上限,最大深度为None,树数量为200,采用balanced权重和较高的最小分裂样本数(10),有助于缓解过拟合并提升对少数类样本的识别能力。
支持向量机(SVM):采用径向基(radial basis function, RBF)核函数,正则化参数C=1,gamma设置为自动学习(scale),平衡了模型复杂度与泛化能力。
梯度提升机(GBM)与XGBoost:均采用较小的学习率(0.01)和较多的弱学习器(200棵树),最大深度为5,子采样率为0.8,2种Boosting模型在面对地质灾害点易发性评价等复杂非线性问题时,通过浅树+低学习率策略取得稳定且强健的性能。
集成模型(RF, GBM, XGBoost)在滑坡易发性建模任务中表现出更强的非线性拟合能力和特征交互建模能力,尤其是XGBoost在调参后的稳定性和性能优越性较为显著。其对类别不平衡具备一定的容错性,加上支持自定义评估函数和强大的树结构优化机制,是当前滑坡预测研究中应用较广的模型之一。相比之下,逻辑回归和SVM模型尽管在特征数量较少的情形下仍有良好表现,但其线性或核变换的假设限制了对复杂空间关系的建模能力。模型性能的差异也反映在对不同特征的敏感度上,XGBoost与RF能通过特征重要性评分挖掘非线性和高阶特征的贡献,而LR则更依赖特征间的独立性与线性边界划分。
2.3 不同模型滑坡易发性评价结果对比
应用5种机器学习模型(逻辑回归、随机森林、支持向量机、梯度提升机和XGBoost)对滑坡易发性进行预测,并根据预测的易发可能性将研究区域划分为5个易发性等级:极低、低、中等、高和极高(
图4)。
统计每一易发性区间内的面积、历史发生滑坡数量以及滑坡密度。由
表3可知,随着易发性等级从“极低”向“极高”过渡,历史滑坡点的密度也呈现出显著的阶梯式增长。
在极低和低易发性区域,各模型的划分策略展现出不同的侧重。该区域覆盖研究区的大部分面积。其中,梯度提升机(GBM)与XGBoost模型表现出强大的识别稳定区域的能力,分别将1.97×104 km²和1.60×104 km²的区域划为极低易发区。然而,与这种划分相应的是,GBM将163处历史滑坡点错误地归入该安全区,导致其滑坡密度达到0.008例/km²,在5种模型中最高,存在一定的漏报风险。相比之下,逻辑回归(LR)模型则表现出极高的稳健性,其划定的极低易发区内未包含任何历史滑坡点,其定义的绝对安全区域最为保守和可靠。随机森林(RF)与支持向量机(SVM)则处于两者之间,在划定较大安全范围的同时,保持极低的滑坡密度(0.002例/km²),实现较好的平衡。进入低易发区后,所有模型的滑坡密度趋于一致,其值为0.019~0.026,表明各模型对于具有轻微致灾风险区域的识别能力已形成共识。
在中等易发性区域中,各模型表现出高度的一致性。尽管不同模型划定的中等易发区面积差异显著,从GBM的1 001.22 km²到LR的8 853.57 km²不等,但其内部的滑坡密度稳定在0.034~0.038例/km²。这一现象表明,无论是基于线性关系的逻辑回归,还是非线性集成模型,对于构成中等风险水平的特征因子组合有着相似的判断标准。该区域可以被视为从稳定状态向失稳状态过渡的临界地带,其特征对于所有模型而言都清晰可辨,增强了整个易发性评价结果的置信度。
随着风险等级的提升,高易发性区域作为滑坡灾害的频发地带,各模型的表现开始出现更大的差异。逻辑回归和支持向量机在此区域划定相对广阔的范围,分别为6 493.36 km²和6 121.99 km²,其滑坡密度稳定在0.05~0.06例/km²,表明能够有效识别大范围、具有普遍高风险特征的区域。相比之下,随机森林和XGBoost这类集成树模型所划定的高易发区范围较小,但其滑坡密度却显著偏高,尤其是随机森林达到0.087例/km²。这反映出它们在识别高风险区域时具有更强的辨识力,能够将具有高致灾潜力的核心区域从一般风险区中剥离出来,显示出更优越的风险识别能力。这种差异预示着,在应对高风险区域时,集成模型可能更具效率。
在防灾减灾工作中,最为关键的极高易发性区域是滑坡灾害的集中爆发地。随机森林模型展现出卓越的性能,其划定的极高易发区面积虽然不大,但滑坡密度达到0.164例/km²,是所有模型之首。这说明RF模型能以最高的精度和效率圈定出最危险的区域,其预测结果对于预警和防治工作的指导价值最大。XGBoost同样表现出色,其滑坡密度高达0.125例/km²。这种优越性主要得益于它们能够有效捕捉致灾因子间复杂的、非线性的相互作用,并通过集成学习机制来提升模型的泛化能力和鲁棒性。另一方面,梯度提升机虽然将最大面积(4 544.14 km²)和最多滑坡点(460处)划入极高易发区,但其滑坡密度(0.101例/km²)并不大,可能存在一定的过预测倾向,即将部分高易发区也囊括进极高范围,导致风险区域的扩大化和密度的稀释。逻辑回归和支持向量机在此区域同样有效,但其滑坡密度略低于集成模型,分别为0.103例/km2和0.096例/km²,这可能与其线性假设对高维复杂问题的参数敏感性有关,限制了它们在极端风险区识别上的精确度。
以随机森林和XGBoost为代表的集成树模型,在识别和判定高风险及极高风险区域时表现出一定的优势。它们不仅能有效捕捉地质环境因子间的复杂非线性关系,更能以极高的精度将历史滑坡点富集于面积有限的极高易发区内,对于实现精准防灾和优化资源配置具有至关重要的指导意义。逻辑回归模型在界定安全区时表现稳健,而支持向量机和梯度提升机虽同样有效,但在风险识别的精度上略逊一筹。从防灾减灾的角度出发,随机森林和XGBoost模型无疑是进行此类研究的首选工具。
2.4 机器学习模型的验证指标
本研究对5种模型进行性能评估,评价指标涵盖准确率、精确率、召回率、F
1-score及受试者工作特征曲线下面积(area under the curve, AUC)。试验结果(
表4,
图5)表明,集成学习类模型在总体性能上显著优于传统线性模型,其中随机森林与XGBoost展现出最优的综合性能,GBM次之。
在滑坡灾害易发性建模中,模型的判别能力不仅体现在分类精度指标上,更体现在对滑坡发生的聚集上。这些指标从不同维度度量模型区分滑坡与非滑坡样本的能力,其结果与易发性分区的空间表现高度一致。集成学习类模型在本研究中表现优异,尤其在处理地质环境中普遍存在的特征非线性、多变量交互等问题时展现出更强的稳定性与适应能力。
随机森林模型在整体性能上最为稳健,准确率达0.85,AUC值高达0.93,F1-score亦维持在0.86的高水平。模型在捕捉滑坡发生区域时表现出良好的均衡性。高达0.90的召回率确保对大部分真实滑坡点的成功识别,而0.82的精确率则意味着其预测结果具有很高的可靠性。高召回与高精度相结合,正是其能够在易发性分区中,以最高效率将滑坡点富集于极高易发区,使其滑坡密度达0.164例/km²的原因。进一步证明其在正负类划分上的清晰边界与判别效率。
梯度提升机(GBM)和XGBoost模型的模拟效果同样优异且高度相似,其各项指标均处于高位,AUC值同为0.92,具有强大的模型性能,其精确率(0.84)高于所有模型,意味着当它们预测某处为滑坡点时,其判断的可信度极高,即在易发性分区中具有有效划定出高风险区域的能力。然而,其召回率略低于随机森林,这可能导致其在识别所有潜在滑坡点方面稍显保守,这与前文分析中GBM模型将部分滑坡点错误归入极低易发区的情况相呼应。
在非集成类模型中,支持向量机(SVM)表现出极端的召回率倾向。其召回率高达0.96,显著高于其他模型,表明其在捕捉正类样本方面极为敏感。然而,精确率仅为0.67,AUC值为0.79,说明该模型存在明显的误报风险。为尽可能多地识别出所有真实滑坡点,SVM模型倾向于将更多区域划分为易发区,虽然保证了极低的漏报率,但也导致其高风险区的范围相对宽泛,风险密度被稀释,这与前文的统计分析结果吻合。逻辑回归作为传统的线性模型,整体模拟性能相对较弱,与SVM相似,其召回率较高(0.83),但精确率较低,仅为0.67,AUC值为0.74,显示出其在非线性关系处理与特征交互建模方面存在明显短板。逻辑回归模型的表现较为典型地反映了线性假设模型在复杂、非平衡数据场景下的局限性,但其参数可解释性强、计算效率高,仍适用于部分资源受限或需强调模型透明度的应用情景。
随机森林、XGBoost与GBM在滑坡灾害风险评价中均具有显著的性能优势,尤其在应对复杂特征关系的问题时,集成学习方法展现出更优的泛化能力与分类精度。SVM虽在召回率方面突出,但高误报率限制其独立应用价值;逻辑回归则适合作为对比基准或在特定需求条件下的备选方案。结合易发性区划与滑坡密度特征分析,集成模型在“高”与“极高”易发区表现出更强的灾害聚集检测能力,是未来地质灾害精细化评估与风险控制的优选模型。
2.5 基于SHAP模型的可解释性
滑坡形成机理复杂,厘清其主导驱动因素及其空间异质性特征对地质灾害防控具有重要意义。为提升模型的可解释性,本文引入SHAP(shapley additive explanations)方法,对各预测模型的输出进行解释,进而揭示不同因子对滑坡发生概率的相对贡献与交互机制。
图6反映了5种模型的特征贡献值的差异,其中每一行代表一个输入特征,每个圆点对应一个样本。点的颜色反映特征值的大小,SHAP值越大,说明该特征对预测为滑坡的正向贡献越大。以“距道路距离”和“距河流距离”为例,高SHAP值区域主要集中在蓝色点上,表明距离这些要素越远,滑坡发生的可能性越低。
图7给出了各特征的平均绝对SHAP值,反映其在模型中的整体重要性。分析结果表明,尽管各模型的内部算法存在差异,但在识别核心致灾因子上形成高度共识,同时也揭示不同模型对因子敏感性的差异。
地下水位是最为关键的控制性因子,也是典型的岩溶因子之一。在梯度提升机、随机森林和XGBoost 3个集成模型中,其SHAP值在重要性排名中均为最高,在逻辑回归和支持向量机中位列前三。地下水位的上升会增加土体的孔隙水压力,从而显著降低斜坡的抗剪强度,是诱发滑坡最直接、最活跃的因素之一。集成树模型能够有效捕捉地下水含量与滑坡风险复杂的、非线性的阈值效应,赋予其较大的权重,从而得到较高AUC值等指标。
土壤类型和与道路距离也至关重要。土壤类型作为滑坡发生的物质基础,其物理力学性质直接决定斜坡的固有稳定性。在结构相对简单的逻辑回归和支持向量机模型中,土壤类型的重要性甚至超过地下水位,这可能表明土壤类型与滑坡风险间存在较强的、易于被模型捕捉的直接关联。红壤在桂林市分布广泛,这种土壤类型分散性强,稳定性差,黏粒含量高,是造成滑坡易发的重要土壤类型之一。土壤类型与地下水含量存在交互作用,地下水通过矿物质和盐分的运输持续改造土壤剖面和物理性质,从而影响滑坡的发生。
距道路距离作为一个显著的人类工程活动指标,其重要性在所有模型中都得到体现,尤其在随机森林和XGBoost模型中表现突出,充分说明道路修建过程中的边坡开挖、荷载增加以及对原始排水系统的破坏,是研究区内滑坡灾害的重要诱发因素。
地表粗糙程度的重要性在不同模型之间存在差异。在梯度提升机、随机森林和XGBoost模型中,它均是排名前三的关键因子;然而,在逻辑回归和支持向量机模型中,其SHAP值几乎可以忽略不计。这种差异源于不同模型的内在特性,地表粗糙度作为一个描述微观地貌形态的指标,其与滑坡风险的关系并非简单的线性关系。集成树模型通过对数据空间进行递归的、精细的划分,能够有效学习到在某一特定地貌组合下,较高的粗糙度意味着更高的风险这类复杂的局部规则。而逻辑回归等线性模型则难以捕捉这种非单调的复杂关系,从而忽视该因子的价值。进一步论证了集成模型在整体预测精度上更优。
距断层距离在梯度提升机模型和XGBoost模型中贡献显著。断层带附近岩体破碎、节理发育,为斜坡失稳提供天然的结构弱面。强大的集成模型能够识别出这种空间邻近性带来的潜在风险。
值得注意的是,水土流失程度的SHAP值在所有模型中普遍较低,这一现象可能源于水土流失对滑坡的影响通常是间接的,并且其与土壤类型存在交互作用,不同土壤类型的水分保持能力和透水性可能决定水土流失的程度,从而影响表层土壤的稳定性,而滑坡往往涉及更深层次的土体失稳。水土流失程度与滑坡发生具有一定的相关性,但其在预测中的作用可能被土壤类型这个更直接的因子所替代,导致其在模型中的贡献度较低。水土流失的空间分布和强度通常较为复杂,受多种因素影响,因此其在模型中的重要性较为分散,可能进一步削弱其在模型中的表现。
不同模型的特征贡献排序存在显著差异,体现算法机制对解释结果的敏感性。
图6中SHAP值的分布特征也揭示各模型在风险评估上的差异。逻辑回归和支持向量机的SHAP值分布则较为集中,特别是在特征如土壤类型、距道路距离方面,SHAP值的离散范围相对较小。表明这些模型主要依赖于特定的、具有明显线性关系的特征,而对复杂因子较为保守。逻辑回归在处理土壤类型时的SHAP值分布非常集中,表明该模型能够快速且准确地捕捉土壤类型与滑坡易发性的直接关系,但缺乏对其他非线性因素的灵活适应性。支持向量机在处理非线性关系时表现优于逻辑回归,但其SHAP值分布仍然较为集中,尤其在地表粗糙度等复杂因子的处理上有所不足。集成模型的SHAP值分布较为宽泛,表明它们在对特征的贡献进行学习时,能够充分挖掘特征复杂的交互作用,并根据不同的条件灵活调整预测结果。在XGBoost的SHAP值分布中,地下水位的贡献值跨越较大范围,显示出该模型能够灵活地识别不同水位条件下的风险差异,并做出相应的调整。这种宽泛的SHAP值分布反映了XGBoost和梯度提升机的强大建模能力,能够应对复杂的非线性关系,并在多因子影响下进行精细化的预测。随机森林的SHAP值分布较为均衡,体现其通过Bagging机制进行多样化学习的特点,能够通过多棵树的集成学习对特征进行充分的多次评估,确保模型在大范围特征空间中的广泛适应性。
SHAP方法不仅证实地表粗糙度、水文因子和人类活动对滑坡预测的重要驱动作用,也揭示了特征间的复杂非线性交互及其在不同模型中的表现差异。树模型在特征排序上的一致性增强解释结果的可信度,而LR与SVM的偏好差异则提示在解读模型输出时需结合算法特性进行综合评估。
3 讨论
本研究以桂林典型喀斯特地貌区为研究对象,融合10个滑坡影响因素,创新性地引入岩溶因子(地下水位),构建机器学习与可解释性算法(SHAP)的滑坡易发性评估框架。通过多模型对比与结果解释,旨在筛选最优预测模型并揭示主导因子作用机制。与以往研究中使用的缺乏可解释性的机器学习“黑匣子”模型相比,本研究提出的新型可解释模型对特定位置的滑坡成因分析和风险预测具有重要意义。
本研究采用5种机器学习模型,成功地构建滑坡易发性评估框架,并验证该框架在桂林喀斯特地貌区滑坡预测中的有效性。然而,模型在准确性和可解释性上仍存在一定局限性,值得进一步优化。
尽管本研究在机器学习模型构建过程中采用超参数优化,但由于样本量较为有限,可能存在模型过拟合的风险。因此,未来的研究应当探索如何利用更多样本和数据源,减少过拟合的可能,提升模型的普适性和广泛适用性。
现有研究普遍认为非滑坡样本的采样区域和比例会影响滑坡易发性评估的敏感性
[24]。虽然本研究中的非滑坡样本避开滑坡发生区域,也与滑坡样本的数量基本相同,但未来研究中应尝试不同的非滑坡样本取样方法及比例,以优化模型的样本代表性,确保评估结果的精度。尤其是在滑坡频发的地区,优化非滑坡样本的选取策略对于提高预测准确度至关重要。
在数据源方面,虽然在滑坡易发性评估中引入地下水位,但仍缺乏地下溶洞等特殊地质数据。因此,未来的研究将进一步寻找更多具有区域特色的地质数据,以丰富模型输入,提高预测的可靠性和精度。同时,研究区的偏远地区,尤其是高海拔
[25]地区,可能因缺乏足够的滑坡信息而影响模型的准确性。尽管如此,滑坡发生的潜力并未因此消失,后续将针对这些空白区域进行更多的滑坡数据收集与研究。
尽管本研究仍存在一定的不确定性和局限性,但其所提出的可解释模型为滑坡易发性评估提供新的视角,尤其在滑坡风险管理中,能够为决策提供更为精准的参考。未来的研究可以借助更多的地质和水文数据,进一步完善滑坡易发性评估体系,提升对滑坡灾害风险的预测与防控能力。
4 结论
(1) 研究区滑坡易发性呈现“面积递减—灾害密度激增”的典型分布特征。极高与高易发区虽面积较小,却集中承载绝大部分历史滑坡事件。各模型对比表明,集成树模型(如RF, XGBoost)在极高风险区的识别能力最强,滑坡密度提升20%~70%,尤其RF与XGBoost在高风险区域的精确度较其他模型高。GBM的覆盖面积最大,但密度较低。逻辑回归表现出较强的保守性,适合用于安全区界定。综合考虑,RF与XGBoost更适用于极高风险区的精准防控,而GBM则需要警惕预测范围过大的问题。
(2) 集成类模型(RF, GBM, XGBoost)整体性能显著优于线性模型LR与核方法SVM。其中,随机森林(RF)表现最佳,其高召回率与高精确率的协同作用,使其能够在极高易发区实现最高密度。梯度提升机与XGBoost虽精确率较高,但召回率相对较低,导致部分滑坡点被误划入安全区。支持向量机极端偏向高召回率,导致高风险区范围扩展。逻辑回归虽然在复杂交互场景中表现较弱,但在安全区域筛查中仍具一定价值。集成模型因其强大的非线性适应能力,是地质灾害精细化风险评估的首选工具。
(3) 地下水位为核心控制因子,集成模型中其重要性最高。土壤类型在逻辑回归与SVM中表现更为突出,尤其是红壤,其与地下水形成交互作用,是区域主要致灾类型。距道路距离在RF与XGBoost中表现突出,反映了工程开挖与排水破坏的诱发机制。地表粗糙度在线性模型中的贡献较弱,因其非线性特性未能完全被捕捉。水土流失的贡献较小,因其作用已被土壤类型替代,并涉及深层失稳机制。集成模型因能捕捉复杂特征间的交互作用,其SHAP值分布较宽,解释更为细致,而线性模型的特征贡献则显得较为集中。
广西高校中青年教师科研基础能力提升项目“基于机器学习的桂林地质灾害易发性评价与旅游安全研究”(2025KY0961)