基于自筛选深度学习的滑坡易发性预测建模及其可解释性

黄发明 ,  陈彬 ,  毛达雄 ,  刘乐开 ,  张子荷 ,  朱莉

地球科学 ›› 2023, Vol. 48 ›› Issue (05) : 1696 -1710.

PDF (10759KB)
地球科学 ›› 2023, Vol. 48 ›› Issue (05) : 1696 -1710. DOI: 10.3799/dqkx.2022.247

基于自筛选深度学习的滑坡易发性预测建模及其可解释性

作者信息 +

Landslide Susceptibility Prediction Modeling and Interpretability Based on Self-Screening Deep Learning Model

Author information +
文章历史 +
PDF (11016K)

摘要

针对滑坡易发性预测建模中滑坡-非滑坡样本可能存在误差、环境因子间非线性关系较复杂且机器学习可解释性未被关注等重要问题,拟提出一种基于自筛选的双向长短时记忆网络与条件随机场的滑坡易发性预测模型(Self-screening Bi-directional Long Short-Term Memory and Conditional Random Fields, SBiLSTM-CRF).SBiLSTM-CRF模型具有深度学习网络层数深、宽度广及可循环迭代建模的优势,能预测出环境因子间的非线性关系,并通过迭代自动筛选阈值区间外的错误滑坡样本.该模型可用于解释各环境因子之间耦合关系的内部作用机制.将SBiLSTM-CRF模型用于陕西延长县滑坡易发性预测,并与cpLSTM-CRF、随机森林、支持向量机、随机梯度下降和逻辑回归模型比较.结果表明,SBiLSTM-CRF克服了传统机器学习中存在的样本误差以及因子间复杂的非线性关系问题,具有更高的预测性能.通过该模型的可解释性能力揭示了坡度、高程和岩性等因子控制延长县的黄土滑坡发育的机制.

关键词

滑坡易发性预测 / 深度学习 / 双向长短时记忆网络 / 条件随机场 / 可解释性 / 工程地质

Key words

landslide susceptibility prediction / deep learning / Bi-directional long short-term memory / conditional random field / interpretability analysis / engineering geology

引用本文

引用格式 ▾
黄发明,陈彬,毛达雄,刘乐开,张子荷,朱莉. 基于自筛选深度学习的滑坡易发性预测建模及其可解释性[J]. 地球科学, 2023, 48(05): 1696-1710 DOI:10.3799/dqkx.2022.247

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

滑坡灾害具有分布广、发生频率高、灾害损失严重等特点,滑坡严重威胁人类生命财产安全(Khan et al., 2021).滑坡易发性预测对滑坡风险评价和潜在滑坡的准确定位具有重要作用.

近几十年来,各种基于GIS平台的方法被用于预测滑坡易发性,包括启发式模型(Moragues et al., 2020),数理统计模型如判别分析(Eiras et al., 2021)、多元线性回归(Jia et al., 2021)、确定性系数等(罗路广等,2021).由于上述模型并不能较好地揭示出易发性建模中各环境因子之间的非线性作用关系,并且通常需要大量先验知识,导致这些模型存在一定的局限性.近年来,机器学习由于其不需要过多的先验知识(如不需要环境因子呈正态分布),且能获得较高预测精度而被广泛应用于滑坡易发性预测,如人工神经网络(田乃满等,2020)、支持向量机 (Support Vector Machine, SVM)(Yao et al., 2008)、决策树(Pradhan, 2013)、随机森林 (Random Forest, RF)(吴润泽等,2021)、多层感知机(Huang et al., 2020a)、逻辑回归 (Logistic Regression, LR)(方然可等,2021)、随机梯度下降(Stochastic Gradient Descent, SGD)(Hong et al., 2020)等.

然而,传统的机器学习应用于滑坡易发性预测还存在许多问题:(1)表征学习需要大量的先验知识和假设空间,且不能充分地提取出各环境因子之间的非线性关系(Huang et al., 2020b);(2)不能较好地实现滑坡样本中的误差剔除,并实现有效的非滑坡样本选择(Yao et al., 2022);(3)模型对数据敏感,如缺失值、噪声和错误数据等;(4)被认为是“黑箱操作”模型,对各类环境因子非线性耦合作用下预测出滑坡易发性值的内部机制缺乏认识,即模型可解释性未得到足够关注.因此研究一种新的用于滑坡易发性预测的机器学习算法非常有必要.

深度学习在一定程度上能够克服传统机器学习的这些缺点,它具有学习能力强、覆盖范围广、适应性好等优点,且以数据驱动而不需要过多的先验知识和假设.目前深度学习已被广泛应用于公安服务领域(Zhou et al., 2022)、医疗辅助诊断领域(Bhattacharya et al., 2021)和公共安全领域等(Xu et al., 2018),当然也被广泛应用于自然灾害易发性预测等领域(Huang et al., 2020b魏志军, 2020赵洪宝等,2022).上述深度学习预测滑坡易发性主要还是从算法改进的角度出发,而没有从滑坡易发性建模本身存在的问题出发来提升建模性能(Zhu et al., 2020).单纯的深度学习算法改进有时难以得到理想的滑坡易发性预测效果,比如建模的滑坡‒非滑坡样本本身就存在误差比较大的问题(黄发明等,2020).这种滑坡‒非滑坡样本误差将会严重制约深度学习模型的输出变量准确性,从而制约深度学习预测滑坡易发性的精度提升.针对该问题,本文提出新的深度学习算法,即基于自筛选的双向长短时记忆网络与条件随机场(Self-screening Bi-directional Long Short-Term Memory and Conditional Random Fields,SBiLSTM-CRF)滑坡易发性预测模型.该算法预期能更准确地分析出各滑坡点之间的相关性,以便提取出环境因子之间更深层的特征信息;能自动筛选掉错误的滑坡样本,通过二次迭代建模选择出准确的非滑坡样本,以便提供比原数据更准确的滑坡空间数据描述(Zhou et al., 2022).为体现SBiLSTM-CRF模型的优越性,本文同时选择了4个传统机器学习模型(即随机森林(Random Forest,RF)、逻辑回归(Logistic Regression,LR)、随机梯度下降(Stochastic Gradient Descent,SGD)、支持向量机(Support Vector Machine,SVM))以及深度学习方法级联并行长短时记忆网络和条件随机场(Cascade-parallel Long Short-Term Memory and Conditional Random Fields,cpLSTM-CRF)进行比较研究(Zhu et al., 2020).

对于滑坡易发性建模的另外一个严肃问题是很难解释影响结果的变量或特征,即深度学习的可解释性(Linardatos et al., 2020).随着深度学习模型越来越广泛地应用于关键环境下的重要预测,对机器学习的透明度也日益增高.其危险在于创建和使用不合理、不合法的决策,或者根本无法获得对其行为的详细解释(成科扬等,2020曾春艳等,2021).其实无论是传统的机器学习还是深度学习,都面临无法充分解释环境因子作用下滑坡易发性指数预测机制的问题(Gaur et al., 2020),尤其大多数以数据驱动的深度学习目前尚处于“黑盒子”状态.为了解决这一局限性,本文重点分析各环境因子对预测模型决策的贡献度以及与预测结果的关联性,以获得更好的可解释性结论.

1 滑坡易发性预测的SBiLSTM-CRF模型

1.1 研究思路

滑坡易发性预测是一个复杂的非线性建模问题,通过常规统计方法可能无法获得令人满意的结果.传统的处理机器学习和数据挖掘问题的方法都需要很强的前提假设或者大量的先验知识,而且易发性建模中也存在滑坡-非滑坡样本误差等多种问题(Hong et al., 2020).本文拟提出了SBiLSTM-CRF这一新的深度学习模型来尝试克服上述问题,并首次运用于滑坡预测数据集.该算法流程(图 1a)如下:(1)滑坡影响因子的分析和筛选:基于滑坡编录信息与基础环境因子,采用频率比法(胡涛等,2020)获得各个基础环境因子的频率比.(2)建立空间数据集:将处理好的频率比值作为模型输入变量,构建滑坡-非滑坡的空间数据集,并划分出模型训练集和测试集.(3)数据自筛选建模:通过构建一个Bi-LSTM和全连接网络的预分类自筛选网络,并对全区进行滑坡易发性预评估.设置阈值 t控制 T 1 T 0对数据集中因人工标注、数据采集误差等不定因素导致的数据集标注结果错误数据进行筛选,以降低易发性评价过程中的不确定性.再从全区预评估结果采用自然断点法获得阈值 T 1 ' T 0 '进行等量补充.(4)特征提取建模:构建级联双向LSTM网络对筛选后的数据集进行更深度地提取特征,获取更深层次的滑坡点前后的上下文信息和因子之间的关联信息.(5)序列预测建模:构建全连接二分类网络对所提取的特征进行滑坡易发性预测,并引入CRF对结果进行综合解码,获得易发性预测结果.(6)模型性能评价: 通过假阴性、假阳性、真阴性、真阳性等指标和ROC曲线衡量模型性能.

1.2 滑坡易发性预测模型

1.2.1 滑坡栅格样本自筛选

该网络的原始输入是处理后的延长县一维地理数据,即每个样本所包含的12个环境因子.通过一个Bi-LSTM和全连接层构成预分类网络.经过简单的训练之后,预分类网络对测试集(2 060个)和全研究区域的研究点(2 622 482个)进行预分类,得到相应的滑坡易发性概率.通过自然断点法获得全区易发性区间,并进行分级.本研究将滑坡易发性分为 K ( K = 5 )个等级,分别为极低、较低、中等、较高、极高5个等级.对筛选阈值引入偏度以用来度量随机变量概率分布的不对称.公式如下:

T 1 = s k × t 1 + 2 s k T 0 = 1 - T 1 ,

其中t为人为设置阈值.sk为偏度,定义为:

          s k = 1 n i = 1 n [ ( X i - μ σ ) 3 ]

其中, μ为均值, σ为标准差.当 s k < 0时表明滑坡易发性预分类整体预测分布为负偏离,即左偏态;当 s k > 0时表明整体预分类分布为正偏离,即右偏态;当 s k = 0,表明数据集整体预分类分布为正态分布.

根据阈值的自筛选规则如下:(1)由预分类网络对延长县全研究区域进行滑坡易发性预评估;(2)将人工标签为1而滑坡易发性概率小于 T 1的栅格筛除,将人工标签为0而滑坡易发性概率大于 T 0的栅格筛除;(3) 随机从延长县全研究区域滑坡易发性预评估结果中筛选滑坡易发性概率大于 T 1 '的栅格作为新的滑坡样本,筛选滑坡易发性概率小于 T 0 '的栅格作为新的非滑坡样本.其中 T 1 ' T 0 '分别是预评估中由自然间断点分级法获得的极高和极低的区间值.

本研究中筛选的阈值 t设置为0.6,计算 T 1为0.302 1,筛选正样本87个,负样本130个, T 1 ' T 0 '分别为0.659 9和0.139 1.如此筛选后等量补充,既减弱了滑坡易发性评价的不确定性,又维持了数据集数据量一致,也保证了滑坡和非滑坡的类平衡.

1.2.2 特征提取建模

特征提取部分采用 K ( K = 5 )级Bi-LSTM的级联网络和全连接的前馈神经网络.级联Bi-LSTM层能够更深层次地提取滑坡环境因子的深度特征和空间特征.网络输入层是环境因子的实矩阵 R i × j,其中行向量 i | 1 i I , i Z为栅格个数, I为研究区栅格总数,列向量 j | 1 j J , j Z为环境因子个数, J为滑坡因子总数.滑坡因子向量进入5个Bi-LSTM的级联网络,以单条LSTM链及LSTM单元为例,结构如图1b图1c所示.正向传播中处理第 k层中第 i个栅格的第 j个因子时,LSTM内部状态记忆单元计算过程可表示为:

            C ˜ k , i , j = t a n h W c h k - 1 , x i j + b C
            C k , i , j = F k , i , j × C k - 1 + I k , i , j × C ˜ k , i , j
            h k , i , j = O k , i , j × t a n h ( C k , i , j )

其中 h k , i , j表示隐藏层状态, C ˜ k , i , j表示输入门基于先前隐藏层生成的候选状态, C k , i , j是前单元状态, t a n h为激活函数, F k , i , j为遗忘门, I k , i , j为输入门, O k , i , j为输出门,计算过程:

            F k , i , j = σ W f h k - 1 , x i j + b f , I k , i , j = σ W i h k - 1 , x i j + b i , O k , i , j = σ W o h k - 1 , x i j + b o ,

其中 σ表示激活函数; W f W i W o表示LSTM单元每个门的权重矩阵; h k - 1 x i j分别表示前一个单元的隐藏状态和第 i个栅格点的第 j环境因子; b f b i b o表示相应的偏置项; F k , i , j输出介于0和1之间的数字.首先输入门产生候选状态 ,然后用遗忘门确定丢弃的信息,与输入门相加,实现LSTM单元状态更新,最后输出门根据当前单元状态输出和隐变量.Bi-LSTM为两条相反的LSTM链,公式可以表示为:

            h f k , i , j = H ( W h f h f k , i , j + x i j + b h f ) h b k , i , j = H ( W h b h b k , i , j + x i j + b h b )

其中 h f k , i , j R i × j h b k , i , j R i × j分别表示前向层和后向层的输出向量,最终输出 y k , i , j = [ h f k , i , j , h b k , i , j ]是这两部分的拼接,前向层和后向层的组合被定义为单个Bi-LSTM层.在完成一次前向传播过程中,从原始数据输入到SBiLSTM-CRF变化公式为:

y o u t = k = 1 K i = 1 M j = 1 J o k , i , j × t a n h f k , i , j × C k - 1 + i k , i , j × C ˜ k , i , j

在模型训练过程中,容易发生过拟合问题,因此非常必要对网络使用Dropout防止过拟合,来实现正则化效果.在神经网络前向传播的过程中,对每级LSTM层中的部分神经元按照预设的概率随机失效.从而实现提高神经网络模型泛化性能的效果,最终实现过拟合问题的改善,本文的Dropout设置为0.25.

1.2.3 序列预测建模

在通过K级级联的Bi-LSTM网络更深层次地提取每个栅格点的每个滑坡因子之间的多维特征后,使用一个由32个神经元组成的全连接层将所有的特征融合起来,并使用两个神经元进行滑坡预测.这一过程使用Sigmoid函数作为激活函数.由于滑坡数据在总体上具有一定的空间连续性,例如,在滑坡数据的周围子区域往往具有较大的概率滑坡.考虑邻域中标注之间的相关性是必要的.因此引入CRF对标签序列进行综合解码,而非独立解码.CRF的特征函数分为两类,第一类是定义在第 i个栅格点上的节点特征函数,它只和当前栅格点的输出滑坡易发性评估结果有关,第 i个栅格点 y i的节点特征函数记为:

            s l y i , y p r e d i , i , l = 1,2 , . . . L

其中 L是定义在该栅格点上节点特征函数的总个数.第二类是定义在 y i栅格点前后的局部特征函数,它只和当前滑坡点和上一滑坡点有关,第 i个栅格点 y i的局部特征函数记为:

            t k y i - 1 , y i , y p r e d i , i , k = 1,2 , . . . K

其中 K是定义在该栅格点的局部特征函数的总个数.无论是节点特征函数还是局部特征函数,它们的取值只能是0或1,即满足特征条件或者不满足特征条件.同时每个特征函数都被赋予一个权值,用以表达对这个特征函数的信任度.线性链条件随机场的公式可表示为:

   p y i | y p r e d i = 1 Z y p r e d i e x p i , k λ k t k y i - 1 , y i , y p r e d i , i + i , l μ l s l y i , y p r e d i , i

其中 t k μ l分别是 λ k s l的权重系数, Z y p r e d i为规范化函数,表示为:

        Z y p r e d i = y e x p i , k λ k t k y i - 1 , y i , y p r e d i , i + i , l μ l s l y i , y p r e d i , i

为了得到最优的模型,需要训练CRF,本文采用极大似然估计法,似然函数如式(13)所示.本文使用了Viterbi算法(Forney,1973)来优化CRF计算过程,得到经CRF平滑处理后的最终输出序列标签:             y = y 1 , y 2 , , y n.

                   L W = i l o g p y i | y p r e d i .

1.2.4 损失函数

滑坡环境因子原始数据差异较小,且不同环境因子对滑坡的影响不同.因此在训练过程中引入交叉熵作为损失函数计算损失以扩大数据之间的差距,减小数值计算误差,加速模型的收敛.此外,交叉熵使得优化的概率更加精确,既滑坡概率更接近1,非滑坡概率更接近0.交叉熵损失函数可以表示为:

            L c r o s s ­ e n t r o p y = - 1 n i = 1 n ( y L i l o g ( y i ) + ( 1 - y L i ) l o g ( 1 - y i ) ),

其中, y i表示数据真实标签值, y i表示预测值, n表示滑坡样本总数.

1.3 滑坡易发性预测结果评价

1.3.1 统计指标精度评价

本研究采用阳性预测率(PPR)、阴性预测率(NPR)和总准确率(Total Accuracy, TA)这几种统计指标来评价各模型的预测性能(Huang et al., 2020b).PPR通过计算预测正例在所有正例里的占比得到.NPR通过预测负例在所有负例中的占比得到.PPR和NPR分别用于评估滑坡易发性模型对滑坡和非滑坡的预测能力.TA被用来评估所有测试数据集的预测准确度.这3个统计指标的计算如下:

           T A = T P + T N T P + T N + F P + F N,

其中,真阳性(True Positive, TP)表示正确分类的滑坡栅格数;真阴性(True Negative, TN)表示正确分类的非滑坡栅格数;假阳性(False Positive, FP)表示错误分类的滑坡栅格数,即将非滑坡栅格错误的分类为滑坡栅格;假阴性(False Negative, FN)表示分类错误的费滑坡栅格数,即将滑坡栅格错误的分类为非滑坡栅格.TA表征模型总的预测精度,TA越大表示滑坡易发性预测准确度越高.

1.3.2 ROC曲线评价

接受者操作特征曲线(Receiver Operating Characteristic Curve, ROC),能反映特异性和敏感性的相互关系,被广泛应用于评价滑坡易发性模型的优劣(罗路广等,2021).特异性又称假阳率(False Positive Rate, FPR),敏感性又称真阳率(True Positive Rate, TPR),计算公式为:

           F P R = F P F P + T N,
           T P R = T P T P + F N,

ROC曲线以特异性为横坐标,以敏感性为纵坐标.通常ROC曲线在 y = x之上,因此ROC曲线下的面积(Area Under the Curve,AUC)一般取值范围位于区间[0.5, 1].ROC曲线越接近左上角,即AUC越大表示该滑坡易发性预测模型的性能越好.

1.4 深度学习预测滑坡易发性的可解释性

近年来深度学习在研究领域取得了很多成果,但由于其缺乏可解释性而降低了模型的可信度.可解释性是指以可理解的术语向人类提供解释的能力(Zhang et al., 2021).总体可分为内置可解释性和事后可解释性(Alvarez-Melis and Jaakkola,2018).

内置可解释性也称事前可解释性,是指模型本身已内置可解释性,发生在网络训练之前,主要用于较为简单的网络模型.通常直接使用自解释模型或实现网络模型的内置可解释性(Lipton,2018).事后可解释性旨在从已训练模型中提取信息,主要运用于较为复杂的网络模型,可分为全局可解释性和局部可解释性.全局可解释性是指基于整个数据集的特征空间和模型结构来解释和理解模型决策,对应的方法为全局可解释方法,通常从模型层面进行解释;局部可解释性是指基于输入样本的每一维特征变化对输出结果影响来解释和理解模型决策,对应的方法为局部可解释方法,通常从数据层面进行解释.本研究基于预测分布图和积分梯度对延长县滑坡空间数据集进行局部和全局解释(Alvarez-Melis and Jaakkola,2018).

2 研究区及滑坡编录介绍

2.1 延长县

延长县位于陕西省东北部,总面积为 2 368.7 km²,海拔高度为470.6~1 383 m;延长县属暖温带干旱大陆性季风气候,四季分明,降水量相对较少.其地势由西北向东南倾斜,南北高,中间低,呈谷峰型.河流弯曲狭窄,植被覆盖率低,丘陵沟壑交错且河谷深切重;具有黄土高原地貌,地层依次为三叠系碎屑沉积岩、上新统三趾马红土、第四纪体系.马红土分布不连续,其上层黄土抗剪强度较差.马兰黄土由于其质纯、疏松、大孔隙,属于滑坡易发地层.该区滑坡概况如图2所示,现存82处滑坡,主要类型为小型浅层覆盖滑坡.滑坡体积以中小型为主,共计81处(占比98.7%),主要分布在西部,大部分的滑坡距离河流较近、具有相对较高的地势(郭天颂等,2019).

2.2 滑坡环境因子分析

本研究用到的数据源包括:①县国土资源部门调查的滑坡编录信息和野外调查的相关资料;②30 m分辨率的DEM数据;③1:10万比例尺的延长县岩土类型分布图;④30 m分辨率的Landsat TM8遥感影像等.根据野外实际情况,综合考虑影响滑坡发育的环境因子并依据已有文献资料,最终选取高程、坡度、坡向、剖面曲率、平面曲率、地形起伏度、地表总辐射、岩性、地形湿度指数(Topographic Wetness Index, TWI)、归一化建筑物指数(Normalized Difference Building Index, NDBI)、归一化植被指数(Normalized Difference Vegetable Index, NDVI)、修正归一化差异水指数(Modified Normalized Difference Water Index, MNDWI)12个作为易发性模型的输入变量(图 3).

3 滑坡易发性建模结果

3.1 滑坡相关空间数据集

本文共获取了12个环境因子作为深度学习的输入变量,滑坡数据集中共有6 864个栅格单元,其中包含从滑坡区域中转换的3 432个滑坡栅格单元以及从非滑坡区域中随机选择的 3 432个非滑坡栅格单元.这些滑坡‒非滑坡栅格分别被以70%/30%的比例随机划分后合并为训练集和测试集(黄发明等,2020).之后SBiLSTM-CRF模型利用训练/测试数据集预测延长县的滑坡易发性,并选用LR、 RF、 SVM、 SGD等模型做对比.实验所需的硬件配置如表1所示.

3.2 延长县滑坡易发性结果

3.2.1 SBiLSTM-CRF 模型预测易发性

本文提出的SBiLSTM-CRF具有对数据的自筛选功能,且具有较深的特征提取能力.模型以Bi-LSTM和全连接层作为预测模型对输入的数据进行筛选,在以级联Bi-LSTM深度学习模型进行特征提取,利用CRF对预测结果做综合解码.模型采用Adam优化器,学习率设置为0.000 1;batch size设置为200;LSTM单元数设置为32个(即隐藏层大小设置为32),训练迭代次数为10 000次.将训练好的SBiLSTM-CRF模型用于预测延长县全研究区域的滑坡易发性得到滑坡易发性图(Landslide Susceptibility Mapping, LSM).此外,根据自然间断点分级法(Yao et al., 2008)将延长县划分为极高、高、中等、低、极低5个等级并计算出相对应的面积占比分别为:12.80%,13.21%,13.67%,19.53%和40.77%(图4a表2).

3.2.2 CPLSTM-CRF 模型预测易发性

CPLSTM-CRF模型采用Adam优化器,学习率设置为0.001,batch size设置为200,unit设置为32个且训练迭代次数为8 000次(Huang et al.,2020b).将训练好的CPLSTM-CRF模型用于预测延长滑坡易发性得到LSM图.根据自然间断点法对研究区域分为极高、高、中等、低、极低5个等级并计算出相对应的面积占比分别为:8.59%, 9.33%, 13.92%, 22.36% 和45.80% (图4b表2).

3.2.3 RF模型预测易发性

RF是基于树模型的分类器,是滑坡预发性预测的常用模型.RF精度主要采用因子特征数量m和树的数量t等参数来调整.基于袋外误差筛选法确定RF模型预测延长县滑坡易发性时,其mt的参数分别设置为3和800 (吴润泽等,2021).同样将RF模型用于预测延长县全研究区域的滑坡易发性得到LSM图.其中RF模型预测的极高、高、中等、低、极低滑坡易发区的面积占比分别为: 10.02%, 16.86%, 21.99%, 24.59% 和26.54%(图4c表2).

3.2.4 LR, SVM和SGD模型预测易发性

LR模型由线性回归模型方程与Sigmoid函数共同组成.其本质是假设数据服从某一分布,然后使用极大似然估计做参数的估计(李文彬等,2021).LR具有实现简单高效易解释、计算速度快、易并行的特点.在对LR建模时,设置L2正则惩罚项以增强抗扰动能力,惩罚系数C设置为0.5,停止标准设置为 10 - 4.LR模型预测的极高、高、中等、低、极低滑坡易发区的面积占比分别为:10.90%,16.85%,21.52%,25.53%和25.19%(图4d表2).

SVM模型的惩罚系数C设为1.0;核函数采用径向基;核函数系数γ设为0.3(Yao et al., 2008).SVM预测的极高、高、中等、低、极低滑坡易发区的面积占比分别为:14.87%,16.45%,18.76%,22.84% 和27.08%(图 4e).SGD模型是广泛使用的优化算法, SGD采用L2范数作为罚项类型,罚项系数α设置为0.000 1(Hong et al., 2020).SGD模型预测的极高、高、中等、低、极低滑坡易发区的面积占比分别为:15.20%,18.46%,20.16%,22.15%和24.03%(图4f表2).

3.3 易发性建模结果评价

3.3.1 统计指标精度

各滑坡预测模型的统计测量结果如表3所示.结果表明,SBiLSTM-CRF在阴性预测率、阳性预测率和总的预测率上均比其他传统机器学习模型和深度学习具有更好的预测性能.自筛选的方式有效去除了错误样本,为模型学习提供了高质量的数据.级联的LSTM可以捕获更深层次的因子间的交互关系,使其优于其他机器学习模型.

3.3.2 ROC曲线

ROC曲线用模型命中率和误报率来评价模型性能,AUC表示ROC曲线下的面积,主要用于衡量模型的泛化性能.ROC曲线如图 5所示.可以看出,SBiLSTM-CRF在精确率和召回率都明显优于其他模型.揭示了SBiLSTM-CRF克服了其他模型的局限性,通过级联LSTM 明显增强了模型的非线性表达能力.

4 讨论

4.1 模型迭代分析

SBiLSTM-CRF训练损失值和测试准确率随迭代次数增加的变化曲线如图 6所示.可以看出迭代500次内,准确率停滞在0.5没有上升,但这并不意味着模型没有更新.相反,模型在停滞过程中loss急速下降.模型迭代次数在2 000次内,损失值从4迅速下降到0.5,而后缓慢降低,并趋于平稳.同时,准确率迅速从0.5上升至0.8,而后逐渐达到稳定,并趋于平稳.这表明模型具有较快的收敛速度和稳定的收敛性能.

4.2 SBiLSTM-CRF模型分析

滑坡易发性建模结果表明,SBiLSTM-CRF模型性能优于以往的CPLSTM-CRF和传统的RF、LR、SVM、SGD等机器学习模型.这是因为SBiLSTM-CRF模型在易发性建模过程中表现出了诸多优点.比如该模型使用自筛选模块以解决人工标注错误、数据采集误差等不定因素带来的偏差;建模时提出使用Bi-LSTM以增加网络宽度,并以级联的方式增加网络的深度;CRF能进一步分析栅格点之间的双能量关系使得滑坡预测概率更平滑.SBiLSTM-CRF能更充分地拟合数据以便学习环境因子间的非线性关系,具有自动筛选错误数据、特征提取能力强的优势.SBiLSTM-CRF模型同时还具有自筛选的能力和良好的可解释性.然而在网络拥有良好的特征提取能力和优秀的分类能力的同时,SBiLSTM-CRF和其他的深度学习和机器学习网络相比更为复杂.因此,是否能在尽量不牺牲精度的前提下对模型进行剪枝和优化,将成为下一步改进的方向.

4.3 SBiLSTM-CRF的易发性建模可解释性

本文分别从单因子影响滑坡易发性、双因子交互作用以及因子贡献度等领域出发对深度学习预测滑坡易发性进行解释(Linardatos et al., 2020).

4.3.1 单因子

通过将滑坡样本输入到网络中获得滑坡易发性概率,统计环境单因子的预测分布图可解释性,可以从自然成因层面直观揭示出不同单因子对滑坡易发性预测结果的影响(曾春艳等,2021).对测试集中2 060个样本进行统计可以得出各个环境因子在各区间的分布,如图 7所示.以坡度为例,根据坡度的分布,对每个样本进行统计,得到坡度在各个区间的预测分布如图所示.上半部分的箱型图表示各区间滑坡易发性概率的分布情况,箱型图中的数字表示该区间概率统计的二分位数(Q2);下半部分的柱状图表示该区间内样本点的数量统计情况,柱状图中的数字表示该区间样本个数.

图 7a可以看出,坡度在0°~8.8°和8.8°~12.1°区间内的样本量较少,分别为140例和221例,分别约占总量的6.8%和10.7%;21.9°~41°区间内的样本量最大,为582例,约占总量的28.3%.坡度在0°~12.1°呈现出非常低的滑坡易发性概率,均小于0.2,两个区间内的Q2都为0.085;坡度在19.1°~21.9°和41.0°~50.3°区间内的滑坡易发性概率集中在0.5~0.9,Q2为0.671;坡度在21.9°~41°时,滑坡易发性概率集中在0.6~0.9,Q2为0.845,表现出了具有较高的滑坡易发性概率 (郭果等,2013).坡度作为易发性评价中重要的环境因子,其大小直接影响了滑坡的发生,在坡度为0°~41.0°内,研究区域内的滑坡易发性概率随坡度增大而增大,而在41.0°~50.3°区间内滑坡易发性概率较21.9°~41.0°内有所下降.这是因为坡度较小通常坡体比较稳定,而坡度大通常滑坡风化层不易累计、人类活动影响较小、坡体排水良好,反而不易发生滑坡.

图 7b可看出,NDVI在0~0.099、0.449~1区间的数据较少,样本数为3例,占比约0.15%;NDVI在0.113~0.122、0.237~0.243、0.259~0.270、0.347~0.398之间的数据量同样较少,样本数为118例,占比约5.7%.在随着NDVI的增大,并没有呈现出较强的规律性,NDVI在0.113~0.122、0.237~0.243、0.259~0.270、0.347~0.398之间时,超过一半的滑坡易发性概率都落在了0~0.5,其Q2为0.397;而在0.157~0.197区间内,超过一半的滑坡易发性概率都落在了0.5~0.9,Q2为0.599.植被覆盖度是生态环境的一个重要参数(Moragues et al., 2020),影响着斜坡体表面土体的流失速率和土壤侵蚀程度.NDVI较低时,通常为水系、城市和裸地,通常没有滑坡发育的条件;NDVI较高时,边坡抗剪强度和抗渗透性较好,人类工程活动减少,不利于滑坡,同时较高的植被也不利于人类观测,因此有记录的滑坡频次较少.

4.3.2 双因子交互作用

在单因子的统计上,进一步统计双因子交互作用,以下选取相关性较高的6个结果做分析.以DEM和Slope为例,根据DEM和Slope分别的结果进行统计,得到DEM和Slope双因子交互如图8a所示,图中展示每个各因子每个区间的分布情况,圆中的数字分别表示当前区间下的样本量和平均滑坡易发性概率,圆的大小表征样本量的多少,圆的颜色深浅表征滑坡易发性概率的大小(成科扬等,2020).

图 8a可知,当坡度在0°~12.1°时堆积物抗滑性能大于下滑性能,形成不了滑坡.在高程不变的情况下,滑坡易发性概率随着坡度的增大先增后减,并在21°~41.0°达到了最大;在同一坡度下随着高程越大增大先增后减,并在866.6~979.4 m区间达到了最大.在高程为866.6~979.4 m,Slope在 21°~41.0°区间内的滑坡易发性概率(0.855)达到最大.说明高程在866.6~979.4 m区间内利于滑坡堆积成物质发育,容易接受一些坡积物和洪积物的沉积.岩石经过风化以后,容易从高程为979.4~ 1 369.8 m的区域通过坡积过程搬运到高程为866.6~979.4 m的区域,此时再遇到19.1°~50.3°的坡度即沉积下来的堆积物就容易发育成滑坡.如图 8b所示,在地形起伏度在18.0~84.6 m且不变的情况下,滑坡易发性概率随着地形湿度的增大先增大后减小.在地形起伏度为33.1~84.6 m和地形湿度为0~0.123时,平均滑坡易发性概率(0.757)达到最大.在地形湿度较大的区域边坡堆积层含水量较高且坡体抗剪强度较低,在合适的地形起伏度下,容易发育成滑坡(冯霄等,2022).然而,当地形湿度过大时通常为水系发达地区,该区域由于水体的冲刷作用,使得坡积物和洪积物无法堆积反而不利于滑坡发育.

4.3.3 滑坡环境因子贡献度解释

本文对逐条样本根据各滑坡环境因子做积分梯度并取期望值,获得各因子贡献度.为简化计算基线设置为0,近似方法使用的步数设置为50.最后基于积分梯度计算的滑坡环境因子对SBiLSTM-CRF做决策的贡献度总和结果显示:(1) 地形地貌和基础地质对滑坡贡献度较大,约为0.31和0.18.(2) 地表覆盖和水文环境对滑坡的贡献度较小,约为-0.03和0.02.(3) 坡度、岩性、高程对滑坡影响起主要作用,分别约为0.14, 0.12和0.08,这也与前面的结果吻合.(4) NDVI为负贡献度(约-0.04),MNDWI的贡献度几乎为0,NDBI的贡献度不足0.01.上述结果表明 NDVI、MNDWI和NDBI并不是造成延长县滑坡发育的主要相关因子.具有黄土高原地貌的延长县的滑坡受坡度、岩性、高程、坡向和地形起伏度的影响较为明显.

5 结论

本文提出了一种基于Bi-LSTM的新型自筛选级联双向LSTM-CRF网络模型开展滑坡易发性预测建模.模型与CPLSTM-CRF和传统的机器学习 (RF, SVM, SGD, LR)模型相比表明,模型具有显著的优越性,建模结果均优于其他模型.本文使用滑坡自然原理可解释性和深度学习网络可解释性,使SBiLSTM-CRF从以往的黑盒子开始白盒化.结果表明就滑坡易发性数据集而言,坡度、高程、岩性、地表起伏度和坡向等滑坡因子控制了延长县堆积层滑坡发育.在海拔为866.6~979.4 m,坡度为21.9°~41°,地形起伏度为33.1~84.6 m,岩性为 T 3 y,地形湿度为0~0.123时利于滑坡发育.总之,SBiLSTM-CRF模型因为其非线性表征能力和可解释性而拥有显著的滑坡易发性预测建模实用性.

参考文献

[1]

Alvarez-Melis, D., Jaakkola, T. S., 2018. Towards Robust Interpretability with Self-Explaining Neural Networks. Advances in Neural Information Processing Systems 31 (NeurIPS 2018). https://arxiv.org/abs/1806.07538

[2]

Bhattacharya, P., Tanwar, S., Bodke, U., et al., 2021. BinDaaS: Blockchain-Based Deep-Learning as-a-Service in Healthcare 4.0 Applications. IEEE Transactions on Network Science and Engineering, 8: 1242-1255.

[3]

Cheng, K.Y., Wang, N., Shi, W. X., et al., 2020. Research Advances in the Interpretability of Deep Learning. Journal of Computer Research and Development, 57(6): 1208-1217 (in Chinese with English abstract).

[4]

Eiras, C., Souza, J., Freitas, R., et al., 2021. Discriminant Analysis as an Efficient Method for Landslide Susceptibility Assessment in Cities with the Scarcity of Predisposition Data. Natural Hazards, 107: 1427-1442.

[5]

Fang, R. K., Liu, Y. H., Su, Y. C., et al., 2021. A Early Warning Model of Regional Landslide in Qingchuan County, Sichuan Province Based on Logistic Regression. Hydrogeology & Engineering Geology, 48(1): 181-187 (in Chinese with English abstract).

[6]

Feng, X., Wang, Y., Liu, Y., et al., 2022. Susceptibility Assessment of a Translational Rockslide Considering the Control Mechanism and Spatial Uncertainty of a Weak Interlayer: Application Study in Tiefeng Township, Wanzhou District. Bulletin of Geological Science and Technology, 41(2): 254-266 (in Chinese with English abstract).

[7]

Forney, G.D., 1973. The Viterbi Algorithm. Proceedings of the IEEE, 61: 268-278.

[8]

Gaur, M., Faldu, K., Sheth, A., 2020. Semantics of the Black-Box: Can Knowledge Graphs Help Make Deep Learning Systems More Interpretable and Explainable?. IEEE Internet Computing, 25: 51-59.

[9]

Guo, G., Chen, Y., Li, M.H., et al., 2013. Statistic Relationship between Slope Gradient and Landslide Probability in Soil Slopes around Reservoir. Journal of Engineering Geology, 21(4): 607-612 (in Chinese with English abstract).

[10]

Guo, T. S., Zhang, J. Q., Han, Y., et al., 2019. Evaluation of Landslide Susceptibility in Yanchang County Based on Particle Swarm Optimization-Based Support Vector Machine. Geological Science and Technology Information, 38(3): 236-243 (in Chinese with English abstract).

[11]

Hong, H. Y., Tsangaratos, P., Ilia, I., et al., 2020. Introducing a Novel Multi-Layer Perceptron Network Based on Stochastic Gradient Descent Optimized by a Meta-Heuristic Algorithm for Landslide Susceptibility Mapping. The Science of the Total Environment, 742: 140549. https://doi.org/10.1016/j.scitotenv.2020.140549

[12]

Hu, T., Fan, X., Wang, S., et al., 2020. Landslide Susceptibility Evaluation of Sinan County Using Logistics Regression Model and 3S Technology. Bulletin of Geological Science and Technology, 39(2): 113-121 (in Chinese with English abstract).

[13]

Huang, F., Cao, Z., Jiang, S.H., et al., 2020a. Landslide Susceptibility Prediction Based on a Semi-Supervised Multiple-Layer Perceptron Model. Landslides, 17: 2919-2930.

[14]

Huang, F., Zhang, J., Zhou, C., et al., 2020b. A Deep Learning Algorithm Using a Fully Connected Sparse Autoencoder Neural Network for Landslide Susceptibility Prediction. Landslides, 17: 217-229.

[15]

Huang, F. M., Ye, Z., Yao, C., et al., 2020. Uncertainties of Landslide Susceptibility Prediction: Different Attribute Interval Divisions of Environmental Factors and Different Data-Based Models. Earth Science, 45(12): 4535-4549 (in Chinese with English abstract).

[16]

Jia, G., Gariano, S.L., Tang, Q., 2021. Advancing Rainfall-Induced Landslide Detection Using Homogeneous Slope Units and Distributed Rainfall Thresholds. EGU General Assembly Conference Abstracts, EGU21-6145.

[17]

Khan, R., Yousaf, S., Haseeb, A., et al., 2021. Exploring a Design of Landslide Monitoring System. Complexity, 2021: 5552417. https://doi.org/10.1155/2021/5552417

[18]

Li, W. B., Fan, X. M., Huang, F. M., et al., 2021. Uncertainties of Landslide Susceptibility Modeling under Different Environmental Factor Connections and Prediction Models. Earth Science, 46(10): 3777-3795 (in Chinese with English abstract).

[19]

Luo, L. G., Pei, X. J., Huang, R. Q., et al. 2021. Evaluation of Landslide Susceptibility in Jiuzhaigou Scenic Spot by CF and Logistic Regression Coupled with GIS. Journal of Engineering Geology, 29:526-535 (in Chinese with English abstract).

[20]

Linardatos, P., Papastefanopoulos, V., Kotsiantis, S., 2020. Explainable AI: A Review of Machine Learning Interpretability Methods. Entropy (Basel, Switzerland), 23(1): 18. https://doi.org/10.3390/e23010018

[21]

Lipton, Z.C., 2018. In Machine Learning, the Concept of Interpretability is Both Important and Slippery. Queue, 16: 28.

[22]

Moragues, S., Lenzano, M.G., Lanfri, M., et al., 2020. Analytic Hierarchy Process Applied to Landslide Susceptibility Mapping of the North Branch of Argentino Lake, Argentina. Natural Hazards, 105: 915-941.

[23]

Pradhan, B., 2013. A Comparative Study on the Predictive Ability of the Decision Tree, Support Vector Machine and Neuro-Fuzzy Models in Landslide Susceptibility Mapping Using GIS-Science Direct. Computers & Geosciences, 51: 350-365.

[24]

Tian, N. M., Lan, H. X., Wu, Y. M., et al., 2020. Performance Comparison of BP Artificial Neural Network and CART Decision Tree Model in Landslide Susceptibility Prediction. Journal of Geo-Information Science, 22(12): 2304-2316 (in Chinese with English abstract).

[25]

Wei, Z.J., 2020. Multi-Stage Series Deep Convolutional Neural Network Medical Image Registration Method (Dissertation). Hunan University, Changsha (in Chinese with English abstract).

[26]

Wu, R. Z., Hu, X. D., Mei, H. B., et al., 2021. Spatial Susceptibility Assessment of Landslides Based on Random Forest: A Case Study from Hubei Section in the Three Gorges Reservoir Area. Earth Science, (1): 321-330 (in Chinese with English abstract).

[27]

Xu, M., Feng, Q., Mei, Q., et al., 2018. Deep Type: On-Device Deep Learning for Input Personalization Service with Minimal Privacy Concern. Proceedings of the ACM on Interactive Mobile Wearable and Ubiquitous Technologies, 2: 1-26.

[28]

Yao, J., Qin, S., Qiao, S., et al., 2022. Application of a Two-Step Sampling Strategy Based on Deep Neural Network for Landslide Susceptibility Mapping. Bulletin of Engineering Geology and the Environment, 81: 1-20.

[29]

Yao, X., Tham, L., Dai, F., 2008. Landslide Susceptibility Mapping Based on Support Vector Machine: A Case Study on Natural Slopes of Hong Kong, China. Geomorphology, 101: 572-582.

[30]

Zeng, C.Y., Yan, K., Wang, Z.F., et al., 2021. Survey of Interpretability Research on Deep Learning Models. Computer Engineering and Applications, 57(8): 1-9 (in Chinese with English abstract).

[31]

Zhang, Y., Tino, P., Leonardis, A., et al., 2021. A Survey on Neural Network Interpretability. IEEE Transactions on Emerging Topics in Computational Intelligence, 5: 1-17.

[32]

Zhao, H. B., Liu, R., Liu, Y. H., et al., 2022. Research on Classification and Identification of Mine Microseismic Signals Based on Deep Learning Method. Journal of Mining Science and Technology, 7(2): 166-174 (in Chinese with English abstract).

[33]

Zhou, T., Wu, W., Peng, L., et al., 2022. Evaluation of Urban Bus Service Reliability on Variable Time Horizons Using a Hybrid Deep Learning Method. Reliability Engineering and System Safety, 217(3):108090.

[34]

Zhu, L., Huang, L. H., Fan, L. Y., et al., 2020. Landslide Susceptibility Prediction Modeling Based on Remote Sensing and a Novel Deep Learning Algorithm of a Cascade-Parallel Recurrent Neural Network. Sensors (Basel, Switzerland), 20(6): 1576. https://doi.org/10.3390/s20061576

[35]

成科扬, 王宁, 师文喜, 等, 2020. 深度学习可解释性研究进展. 计算机研究与发展, 57(6): 1208-1217.

[36]

方然可, 刘艳辉, 苏永超, 等, 2021. 基于逻辑回归的四川青川县区域滑坡灾害预警模型. 水文地质工程地质, 48(1): 181-187.

[37]

冯霄, 王禹, 刘洋, 等, 2022. 考虑软弱夹层控滑机制及其空间不确定性的顺层岩质滑坡易发性评价: 万州区铁峰乡应用研究. 地质科技通报, 41(2): 254-266.

[38]

郭果, 陈筠, 李明惠, 等, 2013. 土质滑坡发育概率与坡度间关系研究. 工程地质学报, 21(4): 607-612.

[39]

郭天颂, 张菊清, 韩煜, 等, 2019. 基于粒子群优化支持向量机的延长县滑坡易发性评价. 地质科技情报, 38(3): 236-243.

[40]

胡涛, 樊鑫, 王硕, 等, 2020. 基于逻辑回归模型和3S技术的思南县滑坡易发性评价. 地质科技通报, 39(2): 113-121.

[41]

黄发明, 叶舟, 姚池, 等, 2020. 滑坡易发性预测不确定性: 环境因子不同属性区间划分和不同数据驱动模型的影响. 地球科学, 45(12): 4535-4549.

[42]

李文彬, 范宣梅, 黄发明, 等, 2021. 不同环境因子联接和预测模型的滑坡易发性建模不确定性. 地球科学, 46(10): 3777-3795.

[43]

罗路广, 裴向军, 黄润秋, 等,2021. GIS 支持下 CF 与 Logistic 回归模型耦合的九寨沟景区滑坡易发性评价. 工程地质学报, 29:526-535.

[44]

田乃满, 兰恒星, 伍宇明, 等, 2020. 人工神经网络和决策树模型在滑坡易发性分析中的性能对比. 地球信息科学学报, 22(12): 2304-2316.

[45]

魏志军,2020. 多级串联深度卷积神经网络医学图像配准方法(硕士学位论文). 长沙:湖南大学.

[46]

吴润泽, 胡旭东, 梅红波, 等, 2021. 基于随机森林的滑坡空间易发性评价: 以三峡库区湖北段为例. 地球科学, 46(1): 321-330.

[47]

曾春艳, 严康, 王志锋, 等, 2021. 深度学习模型可解释性研究综述. 计算机工程与应用, 57(8): 1-9.

[48]

赵洪宝, 刘瑞, 刘一洪, 等, 2022. 基于深度学习方法的矿山微震信号分类识别研究. 矿业科学学报, 7(2): 166-174.

基金资助

国家自然科学青年基金项目(41807285)

AI Summary AI Mindmap
PDF (10759KB)

182

访问

0

被引

详细

导航
相关文章

AI思维导图

/