基于卷积神经网络的滑坡易发性评价: 以辽南仙人洞国家级自然保护区为例

郑德凤 ,  高敏 ,  闫成林 ,  李媛媛 ,  年廷凯

地球科学 ›› 2024, Vol. 49 ›› Issue (05) : 1654 -1664.

PDF (1429KB)
地球科学 ›› 2024, Vol. 49 ›› Issue (05) : 1654 -1664. DOI: 10.3799/dqkx.2023.113

基于卷积神经网络的滑坡易发性评价: 以辽南仙人洞国家级自然保护区为例

作者信息 +

Susceptibility Assessment of Landslides Based on Convolutional Neural Network Model: A Case Study from Xianrendong National Nature Reserve in Southern Liaoning Province

Author information +
文章历史 +
PDF (1462K)

摘要

为了解决滑坡易发性评价过程中存在的滑坡编录数据不足,主观或者随机地选取非滑坡栅格单元而导致模型准确率较低等问题,以辽南仙人洞国家级自然保护区为研究区,首先,从地形地貌、地质条件、水文气象条件和人类工程活动等方面选取了12个评价因子构建滑坡评价体系;其次,利用SMOTETomek综合采样方法解决滑坡与非滑坡样本类别的比例失衡问题,进而建立滑坡易发性评价模型的数据集;最后,针对研究区东西两侧(A区和B区)的非线性滑坡数据,通过构建卷积神经网络(Convolutional Neural Networks, CNN)模型进行滑坡易发性评价,并精准绘制了研究区滑坡易发性分布图.结果表明:CNN模型具有良好的适应性,绘制的滑坡易发性分区图显示出合理的空间分布,A区和B区的测试集AUC面积分别为91.2%和94.3%;70%的滑坡数据分布在较高及以上等级的易发区,68.7%的非滑坡数据分布在较低及以下等级的易发区;滑坡高易发区主要位于研究区东北部猫岭北沟山一带、冰峪沟风景区的北部山区和碧流河水库沿岸区.研究成果为辽南仙人洞国家级自然保护区的地质灾害防治规划、应急预案制定等提供了重要的科学依据.

关键词

滑坡 / 卷积神经网络 / 综合采样方法 / 易发性 / 仙人洞国家级自然保护区 / 工程地质

Key words

landslides / convolutional neural networks / comprehensive sampling methods / susceptibility / Xianrendong National Nature Reserve / engineering geology

引用本文

引用格式 ▾
郑德凤,高敏,闫成林,李媛媛,年廷凯. 基于卷积神经网络的滑坡易发性评价: 以辽南仙人洞国家级自然保护区为例[J]. 地球科学, 2024, 49(05): 1654-1664 DOI:10.3799/dqkx.2023.113

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

滑坡是全球范围内破坏力强、对人民生命和财产安全极具威胁的典型地质灾害(Nian et al., 2013Ilmy et al., 2021;李文彬等, 2021).滑坡灾害的发育和分布不仅与区域地质环境密切相关(Habumugisha et al., 2022),而且也影响区域生态系统的稳定性(Geertsema and Pojar, 2007).因此,准确评价区域滑坡易发性并绘制易发性分区图是科学预测滑坡地质灾害空间分布、提高区域防灾减灾救灾能力的重要手段(裴振伟等,2021;闫成林等,2021).

1970年以来,伴随遥感(RS)、地理信息系统(GIS)技术的快速发展,区域滑坡易发性评价在世界各地广泛开展(Moni et al., 1991Hansen et al., 1995Pardeshi et al., 2013).目前,基于GIS和RS技术的统计学方法已经从启发式(基于知识)方法转变为数据驱动方法(统计方法),最大限度地减少权重分配过程中的主观性,从而产生更加客观的结果(Chauhan et al., 2010).滑坡易发性的统计方法可以概括为线性方法(证据权法、信息量模型、逻辑回归模型(LR)等)和非线性方法(决策树模型(Decision Tree, DT)、支持向量机模型(Support Vector Machine, SVM)、卷积神经网络模型等)两大类.关于线性方法方面, Blahut et al.(2010)将证据权法应用于意大利阿尔卑斯山中部Valtellina山谷的滑坡敏感性分析,并利用受试者工作特征曲线(Receiver Operating Characteristic, ROC)进行比较研究,得出了性能最佳模型,其曲线下面积值(Area Under Curve, AUC)为88%;Chen et al.(2014)利用信息量模型选取了10个滑坡易发性评价因子对中国宝鸡市陈仓区滑坡灾害进行了易发性评价;Meten et al.(2015)利用逻辑回归模型和频率比方法对埃塞俄比亚中部Debre Sina地区山体滑坡进行了敏感性评估,并绘制了该地区滑坡易发性图.在非线性方法方面,Zhang et al.(2017)利用随机森林模型和决策树模型,结合多源数据绘制了秭桂‒巴东地区滑坡易发性图,结果表明随机森林模型在滑坡易发性评价中具有较高精度;黄发明等(2018)为解决机器学习模型中非滑坡样本的选取问题,提出基于聚类分析和SVM的滑坡易发性评价模型;Wang et al.(2020)利用深度学习方法中的深度信念网络(Deep Belief Nets, DBN)模型绘制了区域滑坡易发性分布图,并将DBN模型评估的易发性结果与逻辑回归模型和反向传播神经网络(Back Propagation Neural Network, BPNN)模型评估的结果进行了比较,结果显示DBN模型具有更好的预测结果.

近年来,随着机器学习方法的快速发展和海量滑坡灾害数据的涌现,深度学习方法尤其是CNN模型,对滑坡灾害数据表现出了强大的分析和处理能力.尽管区域滑坡灾害的形成与演化受多方面因素影响,成因机制较为复杂,但理论上CNN模型依然能够更好地预测潜在的滑坡易发区,已有学者成功利用CNN模型完成了区域滑坡易发性评价(Fang et al., 2020Aslam et al., 2021;黄武彪等, 2022).

由于CNN模型需要大量的滑坡和非滑坡样本进行训练,而目前应用CNN模型的滑坡易发性研究大多从整个研究区或低坡度区等特定区域内随机选择非滑坡样本,往往不够准确,降低了滑坡易发性制图的可靠性.例如,周晓亭等(2022)为解决负样本选择的问题,提出基于信息量法的机器学习模型开展区域滑坡易发性建模;黄发明等(2022)针对滑坡易发性建模过程中滑坡‒非滑坡样本可能存在误差、环境因子间非线性等较复杂的问题,提出基于自筛选的双向长短时长记忆网络与条件随机场的滑坡易发性预测模型.前人对于样本失衡问题的研究存在影响模型精度或者没有考虑负样本数量对建模的影响问题,因此,本文在参考现有文献和考虑研究区滑坡样本数量的情况下,选择综合采样方法(SMOTETomek方法)对滑坡‒非滑坡样本进行综合采样并结合CNN模型,针对辽南仙人洞国家级自然保护区开展了滑坡易发性评价.

1 滑坡易发性评价理论与方法

1.1 卷积神经网络理论

卷积神经网络在非线性数据特征提取方面具有强大的学习能力(Girshick, 2015).与传统的机器学习方法相比,CNN不需要人为设定参数就能对数据进行深层次的特征提取和信息挖掘,实现分类任务.CNN模型通过迭代学习输入网络中的“图像”信息,并与给定的“图像”特征信息进行比对,当误差小于预定设置的某个阈值时,模型即可停止学习,完成对模型的训练,然后利用训练效果好的CNN模型进行区域灾害易发性预测,其结构框架如图1所示.首先,将数据集中N×1的因子向量作为输入层输入到CNN模型中,通过卷积层和池化层的操作后提取的滑坡信息输出到全连接层中;其次,通过全连接层整合出具有区分性的类别信息;最后经过非线性激活函数输出样本的标签(滑坡或非滑坡),从而预测每一个栅格单元的易发性指数,得到区域滑坡易发性评价结果.需要说明的是CNN的基本结构不同于一般神经网络结构,其中的卷积层和池化层作为隐藏层能够深层次挖掘数据特征(Pham et al., 2020).

CNN模型输入样本的入口是输入层,核心部分是卷积层,其工作原理是利用卷积核对输入数据进行矩阵点乘的运算,从而提取出数据的基本特征(Fang et al., 2020),计算公式为:

            C j = i = 1 N f ( w j x i + b j ),

式中:Cj 表示第j个卷积核的输出,j=1, 2, …, kk表示卷积核个数;N为输入评价因子个数; i为卷积层操作的位置;xii=1, 2, …, N)代表卷积窗口对应的输入滑坡数据;f代表非线性激活函数;wjbj 分别表示权重和偏差.

池化层通常是放在卷积层后面使用,作用是筛选卷积层提取的特征数据,减少特征向量的数量并保留有效信息,防止过拟合(Li et al., 2022).以二维数据的最大池化运算为例,其计算公式为:

            o i = m a x i N a i n × n,

式中:oi 为最大池化操作的输出值;i为池化的位置; a i n × n表示该次最大池化操作在位置i上对应输入数据.

输入数据经过卷积和池化操作后,连接着一层或一层以上的全连接层,全连接层中的数据与上一层中的每个数据相连,用来整合具有类别特征的局部信息,起到“分类器”的作用,并通过激励函数传递至下一层.全连接层与一般神经网络中的隐藏层作用相同,通常采用SoftMax函数进行多分类.SoftMax函数能够将输出值范围映射到[0, 1],并且约束各个输出节点的输出值之和为1.在二分类算法中,输出层由代表滑坡和非滑坡的两个神经元组成,由SoftMax激活函数得到,计算公式为:

            S r = e z r r = 1 R e z r,

式中:Sr 为SoftMax函数值;e是自然常数; e z r表示数组Z中第r个元素的指数值,r=1, 2, …, R,数组Z中共有R个元素.

反向传播算法有利于优化更新CNN层中的参数,使模型损失值达到收敛状态(Aslam et al., 2021).本文利用交叉熵损失函数来度量两个概率分布距离,交叉熵损失值越小,真实样本和预测样本的概率分布越接近.交叉熵损失函数定义如下:

L o s s = - 1 T v = 1 T y v l o g y ^ v + 1 - y v l o g 1 - y ^ v,

式中:Loss为交叉熵损失函数值; y v y ^ v分别表示第v个输入样本的真实标签和预测标签.

1.2 SMOTETomek方法

卷积神经网络需要大量样本数据训练模型,若样本不均衡会影响模型训练精度,导致过拟合或欠拟合等问题.对于样本比例不均衡的问题,可通过使用过采样方法、欠采样方法、过采样和欠采样方法相结合的综合采样法,使数据集样本比例均衡(武雪玲等, 2020;刘允, 2022).SMOTE方法是一种过采样方法,基本思想是对少数类样本进行分析并根据少数类样本合成新样本添加到数据集中.该算法首先将少数类样本中的每个样本xg 根据K近邻(K-nearest neighbor)算法计算得到m个近邻点,再随机选取M个样本点进行随机插值合成新数据样本,与原样本组成比例均衡的数据集(武雪玲等, 2020),这种采样方法容易产生过多噪声样本,影响模型分类.TomekLinks方法是常用的欠采样方法,该方法假设样本点x minx max属于不同的类别,然后计算它们之间的距离dx minx max),如果不存在另外一个样本点xl 使得dx minxl )<dx minx max)或者dx maxxl )< dx minx max)成立,则样本x minx max被称为TomekLinks对.因此,可以判定x minx max中有一个是噪声数据或者二者均为边界数据,通过删除多数类中的噪声数据或边界数据来实现数据类别平衡.TomekLinks方法的缺点是模型不能学习到全部样本的特征.

为解决数据集样本问题,本文结合SMOTE方法和TomekLinks方法,即SMOTETomek方法对少数类样本进行采样,具体步骤为:首先利用SMOTE方法对输入的样本进行过采样处理,使得少数类样本数量和多数类样本数量相同;然后利用TomekLinks方法删除滑坡类样本和非滑坡类样本中的噪声数据或者边界处数据.本文的样本均衡处理过程通过Python中的imblearn库解决.SMOTETomek方法减小了样本不均衡问题对模型精度的影响,从而促进模型对数据特征的“学习”,提高模型分类精度.

1.3 基于CNN的区域滑坡易发性评价方法

本文开展滑坡易发性评价的具体工作步骤为:首先,根据区域地质环境特征和历史滑坡数据选取12个评价因子组成初始数据集;其次,基于SMOTETomek方法随机选取70%初始数据,得到样本比例均衡的数据集,剩余的30%初始数据作为测试集测试CNN模型;最后,将新合成的数据集按照7:3的比例划分出CNN模型的训练集和验证集,并通过测试集检测CNN模型,得到区域滑坡易发性评价结果.

2 研究区概况和数据来源

2.1 研究区概况

研究区位于辽宁省南部的庄河市北部山区(图2),以仙人洞国家级自然保护区为中心,覆盖周边的天门山国家森林公园、银石滩国家森林公园、冰峪沟国家4A级风景名胜区和碧流河水库风景区,具有独特的地质环境和气候条件.研究区南北方向长约为30 km,东西方向长约为44 km,总面积约为1 311 km2,属于千山山脉的南部山区,平均海拔为500 m以上,地势呈现出西南低、东北高的特点.研究区地处北温带,以暖温带湿润大陆性季风气候为主,多年平均气温约为9.3 ℃. 1971-2020年年均降雨量约为691 mm,总体上7-8月份降雨量占全年降雨总量50.8%.区内河流均发源于北部山区,流经丘陵地区,汇入黄海.由于地处欧亚板块和太平洋板块俯冲地带,区内断裂构造较为强烈.另外,研究区内的岩浆岩分布范围较广,其面积占研究区总面积的45.8%.受复杂地质构造条件和极端气候的影响,研究区近10年来已发生过4次突发性、较大规模的山体滑坡,造成了重大经济损失,并严重危及当地居民的生命健康和财产安全.因此,开展辽南仙人洞国家级自然保护区的滑坡易发性评价和地质灾害减灾工作,已变得刻不容缓.

2.2 数据源

本文采用的主要数据源包括:(1)DEM(30 m×30 m)数据来源于地理空间数据云(https://www.gscloud.cn)平台,用于提取地貌、水文条件等数据;(2)大连市1∶250 000地质图用于提取岩性、断层等地质信息;(3)中国气象局(https: //data.cma.cn)提供的V3.0日降雨量数据集提取汛期降雨量数据;(4)水系和道路网数据下载于OpenStreetMap(https://www.openstreetmap.org);(5)土地利用类型数据来源于地理监测云平台(https://www.dsac.cn);(6)归一化植被指数(Normalized Difference Vegetation Index, NDVI)来源于资源环境科学与数据中心(https://www.resdc.cn),其分辨率是1 000 m×1 000 m.

研究区的滑坡编录数据来自于实地调查和历史编录数据,详见图2,共有30处滑坡,其中4处滑坡规模较大,其他均为小型滑坡.滑坡的坡面形态以凸形坡为主,结构特征多为土岩组合的二元介质边坡,易产生土‒岩界面滑动或沿岩体内部软弱结构面滑动.从滑坡类型上看,区内多为牵引式滑坡,滑坡前缘受人工削坡或风化侵蚀的影响,大多数呈现舌形和半圆形.受限于NDVI数据源分辨率的影响,采用1 000 m×1 000 m分辨率的栅格作为评价单元,共有1 306个栅格单元.本文以30个滑坡点作为滑坡基础样本数据,共有30个滑坡栅格单元.

2.3 评价因子选取

合理选取滑坡评价因子对于区域滑坡易发性评价具有重要影响(Wu, 2019;黄武彪等, 2022;Zhao et al., 2022).目前国内外对于滑坡评价影响因子的选择尚没有统一标准,基于相关文献、前人经验和实地条件,本文选取12个滑坡易发性评价因子,包括高程(m)、坡度(°)、坡向(°)、地形起伏度(m)、地形湿度指数(Topographic Wetness Index,TWI)、岩性、距断层距离(m)、汛期降雨量(mm/a)、距河流距离(m)、距道路距离(m)、土地利用类型、NDVI,各评价因子在研究区的分布情况如图3所示.

海拔高度是决定边坡动力大小的关键因素之一(Althuwaynee et al., 2016),不同海拔地区的植被覆盖度和土壤湿度具有差异性.海拔相对较低的区域,人类活动和工程建设较多,而高海拔地区则相反.研究区内海拔500 m以上低山丘陵地区主要分布在中部和东北部,其他区域海拔较低(图3a).坡向的不同导致阴阳坡的气候具有差异性(王朝阳, 2008),直接体现在植被、土壤性质、微地貌、含水率等多方面,进而间接影响斜坡稳定程度(图3b).坡度是影响滑坡孕育和演化的重要因素,一方面决定了水流汇聚和发散,另一方面影响坡积物的分布和聚集,研究区内斜坡最大坡度为54.43°(图3c).地形起伏度较大的地区能够为滑坡提供物源基础和动力条件,本文利用ArcGIS软件以3×3的窗口生成的地形起伏度分布如图3d所示.地形湿度指数能够综合反映区域地形地貌和土壤特性对土壤水分分布的影响(张彩霞等, 2005),TWI高值区为坡面汇流区,该区土壤水分容易饱和,产生临空面,进而诱发滑坡(图3e).

不同岩体的物理力学性质和层间结构面特征决定了斜坡的稳定程度,一般软质泥岩或软硬互层结构的层间结构岩体抗剪强度低、风化程度高、稳定性差,常会成为滑动面.参考现有研究并结合专家经验,本文将研究区28种岩性划分为5个等级:极硬、硬、较硬、较软和软(图3f).断层带附近的岩土体结构破碎,岩石易风化,有利于为滑坡提供物源基础,根据研究区断层线空间分布特征,将距断层距离划分为5个等级:<500 m、500~1 000 m、 1 000~1 500 m、1 500~2 000 m、>2 000 m(图3g).

降雨因素是导致区域滑坡产生的重要原因.降雨过程中雨水会逐渐渗入滑坡体中,当岩土体的孔隙达到饱和状态时,滑坡体的应力状态就会发生改变,降低抗剪强度,引发滑坡灾害.因此,本文采用研究区6-9月份的汛期降雨量数据来研究降雨对滑坡的影响(图3h).距离河流、水库越近,地表径流对斜坡体的冲刷作用越强,长期冲刷作用会导致斜坡坡脚的土体大量流失,增大临空面,增强斜坡的不稳定程度(图3i).

研究区内低山丘陵地貌分布较广,随着经济的快速发展,建房筑地、修路建桥等切坡填土工程不断增多,对边坡稳定性带来一定的破坏作用.本文将土地利用划分为耕地、林地、建筑用地、草地、水域、未利用地6种类型(图3j).道路、桥梁等工程建设中不合理的削山填谷、坡脚开挖等行为,容易破坏山体稳定性、影响坡脚植被生长,进而诱发滑坡灾害(图3k).NDVI能够定量估计不同时期的植被生长状况,植被覆盖度高的区域对环境具有明显的改造作用,研究区NDVI空间分布如图3l所示.

3 研究区滑坡易发性评价结果分析

3.1 滑坡评价因子多重共性检验

结合现有滑坡易发性研究(黄发明等, 2021;王毅等, 2021),如果滑坡评价因子之间具有高度的相关性,容易造成模型不能准确预测评价因子与滑坡灾害之间的关系,影响模型评价精度,故需要将冗余的因子剔除.因此,本文采用方差扩大因子(Variance Influence Factors, VIF)和容忍度(Tolerance, TOL)两个指标对滑坡易发性评价因子进行定量评价与筛选.通常VIF<10或者TOL>0.1,表明评价因子间多重共线性较低,符合评价因子的初步筛选.研究区内的滑坡评价因子的共线性检验结果列于表1,VIF值在 1~2.6,TOL值在0.3~1,共线性检验合格.

3.2 滑坡易发性评价CNN模型构建

滑坡易发性评价是通过分析每个滑坡灾害评价因子在何处容易发生滑坡,并同时考虑各因子对滑坡灾害的影响程度,从而确定滑坡可能发生的位置和难易程度的评价方法.本文将12个评价因子作为滑坡易发性评价的条件属性,与对应的滑坡属性组成初始数据集.由于研究区东西两侧的地形地貌环境差异较大,为了提升不同等级易发区范围的预测精度,将研究区细化为A和B两个子区(图2)开展研究.A区初始数据集由762个非滑坡样本和23个滑坡样本组成,B区初始数据集由514个非滑坡样本和7个滑坡样本组成.

以A区为例构建CNN模型,首先将A区的初始数据集按照7∶3比例、以随机抽样方式划分出重采样数据集和测试数据集,各子集间样本比例相同;再以Python作为编程语言,在imblearn库中调取SMOTETomek方法对重采样数据集进行采样,构建出A区的合成数据集;其次在新合成的数据集中以随机抽取数据的方式按照7∶3比例划分出训练集和验证集,训练集共有732个样本训练模型参数;验证集由314个样本组成,用来调整模型的超参数;最后利用测试数据集,共236个样本评估模型对样本的泛化性能,检验CNN模型是否存在过拟合问题,简化流程如图4所示.B区的CNN模型构建方式与A区类似.A区和B区CNN模型超参数设置见表2.

3.3 基于CNN的滑坡易发性评价结果

本文分别将A区和B区的训练集数据导入CNN网络结构中进行初始化训练,根据验证集的评价结果利用试错法对超参数进行调整,然后将训练好的模型分别应用于两个研究子区的验证集和测试集,最后将区域滑坡易发性概率值输入到ArcGIS中,根据自然断点法划分为低、较低、中等、较高和高易发区5个等级,得到辽南仙人洞国家级自然保护区滑坡易发性分级图(图5).分析可见,高易发区和较高易发区在空间分布上呈现“离散化、不连续”等特点,低易发区和较低易发区整体上以片状分布,符合区域滑坡的空间分布特征.A区的高易发区和较高易发区多分布在碧流河水库沿岸、南部边界高程较低以及路网密集的区域,说明A区人类工程活动、距河流距离以及地形条件对滑坡的分布和触发起到了关键作用.其内在机制可理解为:频繁的人类工程活动(如基础设施建设等)破坏了边坡岩土体的内部结构,在汛期连续降雨或大暴雨叠加作用下,降低了坡体岩土介质的抗剪强度,从而诱发滑坡的产生.B区的高易发区和较高易发区主要分布在东北部猫岭北沟山一带以及冰峪沟风景区的北部山区中,这些地区由于海拔高、高差大、坡度变化显著等特点,为滑坡灾害的发生提供了重力势能或动力条件;再加上区域内岩性软弱、岩体结构较为松散且风化严重,因此这些地区滑坡灾害易发性等级较高.

本文通过准确率、ROC曲线和虚警率对基于CNN模型的滑坡易发性评价结果的精度进行分析,分析结果显示:A区验证集的准确率是0.99、测试集数据的准确率为0.90,B区验证集的准确率是0.99、测试集数据的准确率是0.86.根据ROC曲线图(图6)可见,A区和B区的测试集AUC面积分别为91.2%和94.3%.本文在准确率和ROC曲线图的基础上引入虚警率,即滑坡样本被预测为非滑坡样本占总滑坡样本的比例来评价基于CNN模型的滑坡易发性评价结果的准确性,结果显示有10%的滑坡样本被划分在低和较低的滑坡易发性分区中,虚警率较小,表明CNN模型预测的易发性评价结果性能较好.综合准确率、AUC面积和与未经过样本处理测试数据集的精度结果相差较小,具有较强的泛化能力.

为了进一步验证模型结果的合理性,将滑坡灾害点信息作为验证数据进行分析.经统计得出:70%的滑坡栅格数据位于预测的高易发区和较高易发区中,68.7%的非滑坡栅格数据位于预测的低易发区和较低易发区中.研究区内高易发区和较高易发区占研究区总面积的15.3%,中等易发区占研究区总面积的16.7%,低易发区和较低易发区占研究区总面积的68%,各易发性等级所占面积是逐级增加,符合滑坡易发性评价的一般准则,表明CNN模型预测结果是合理的.

4 讨论

4.1 滑坡样本数量对CNN模型影响

本文以庄河市北部山区的30个滑坡灾害点作为滑坡样本点,而滑坡样本点的数量较少可能导致研究区的评价模型对于区域滑坡样本特征的“学习”不够准确,且由于30个滑坡样本点的空间分布不均,进而影响了CNN模型对于滑坡样本点和非滑坡样本点的判断.因此,本文在现有30个滑坡样本点的基础上,根据地理学第一定律,应用SMOTETomek方法进行综合采样,从而有效解决了滑坡‒非滑坡样本不均衡对CNN模型精度的问题.

4.2 滑坡易发性建模分析

本文应用SMOTETomek综合采样方法,减小了滑坡‒非滑坡样本不均衡问题对于模型精度的影响,同时与大多从整个研究区或低坡度区等特定区域内随机选择非滑坡样本方法不同(Fang et al., 2020Aslam et al., 2021),本文能够删除滑坡样本和非滑坡样本的边界数据或者噪声数据,进一步提高了滑坡易发性评价模型对于样本特征的“学习”和分类.CNN模型在均衡的滑坡‒非滑坡样本数据集下能够对数据特征快速“学习”并进行分类,对非线性数据具有更强的适应能力.另外,CNN模型的卷积层和池化层的操作能够深层次挖掘数据特征,具有分类准确率高和有效防止过拟合的滑坡易发性建模优势(Aslam et al., 2021;王毅等, 2021;黄武彪等, 2022).本文没有将CNN模型预测的滑坡易发性评价结果与常规的机器学习模型(支持向量机、随机森林等模型)的预测结果进行对比分析,因此,下一步研究将重点关注CNN模型与其他常规机器学习模型的对比分析,提高CNN模型预测结果的可解释性.

4.3 滑坡易发性结果分析

研究区的高易发区和较高易发区主要分布在东北部猫岭北沟山一带、冰峪沟风景区的北部山区、碧流河水库沿岸以及南部边界高程较低的区域,这些区域应在汛期加强防范,做好防灾减灾应急预案.另外,本文以辽南仙人洞国家级自然保护区为实例说明了针对特定区域开展滑坡易发性评价的重要性,并证明了卷积神经网络模型适用于类似地质地貌环境的区域滑坡易发性评价及预测工作.

5 结论

基于多源数据和ArcGIS软件,采用SMOTETomek方法和CNN模型相结合的研究手段,对辽南仙人洞国家级自然保护区进行了滑坡易发性评价.得出以下结论:

(1)在区域滑坡易发性评价中,将SMOTETomek方法和卷积神经网络模型相结合具有较好的适应性. 研究区测试集的准确率接近0.9,AUC值大于90%.

(2)滑坡易发性评价分区图显示,CNN模型取得了较为合理的分级结果,较高及以上等级的易发区占研究区总面积的15.3%,中等易发区占16.7%,较低及以下等级的易发区占68.0%;滑坡点数据的数量和占比从高易发区到低易发区逐渐减少,非滑坡点数据则相反.

参考文献

[1]

Althuwaynee, O. F., Pradhan, B., Lee, S., 2016. A Novel Integrated Model for Assessing Landslide Susceptibility Mapping Using CHAID and AHP Pair-Wise Comparison. International Journal of Remote Sensing, 37(5): 1190-1209. https://doi.org/10.1080/01431161.2016.1148282

[2]

Aslam, B., Zafar, A., Khalil, U., 2021. Development of Integrated Deep Learning and Machine Learning Algorithm for the Assessment of Landslide Hazard Potential. Soft Computing, 25(21): 13493-13512. https://doi.org/10.1007/s00500-021-06105-5

[3]

Blahut, J., van Westen, C. J., Sterlacchini, S., 2010. Analysis of Landslide Inventories for Accurate Prediction of Debris-Flow Source Areas. Geomorphology, 119(1-2): 36-51. https://doi.org/10.1016/j.geomorph.2010.02.017

[4]

Chauhan, S., Sharma, M., Arora, M. K., et al., 2010. Landslide Susceptibility Zonation through Ratings Derived from Artificial Neural Network. International Journal of Applied Earth Observation and Geoinformation, 12(5): 340-350. https://doi.org/10.1016/j.jag.2010.04.006

[5]

Chen, W., Li, W. P., Hou, E. K., et al., 2014. Landslide Susceptibility Mapping Based on GIS and Information Value Model for the Chencang District of Baoji, China. Arabian Journal of Geosciences, 7(11): 4499-4511. https://doi.org/10.1007/s12517-014-1369-z

[6]

Fang, Z. C., Wang, Y., Peng, L., et al., 2020. Integration of Convolutional Neural Network and Conventional Machine Learning Classifiers for Landslide Susceptibility Mapping. Computers & Geosciences, 139: 104470. https://doi.org/10.1016/j.cageo.2020.104470

[7]

Geertsema, M., Pojar, J. J., 2007. Influence of Landslides on Biophysical Diversity—A Perspective from British Columbia. Geomorphology, 89(1-2): 55-69. https://doi.org/10.1016/j.geomorph.2006.07.019

[8]

Girshick, R., 2015. Fast R-CNN. 2015 IEEE International Conference on Computer Vision (ICCV), Santiago, 1440-1448. https://doi.org/10.1109/ICCV.2015.169

[9]

Habumugisha, J. M., Chen, N. S., Rahman, M., et al., 2022. Landslide Susceptibility Mapping with Deep Learning Algorithms. Sustainability, 14(3): 1734. https://doi.org/10.3390/su14031734

[10]

Hansen, A., Franks, C. A. M., Kirk, P. A., et al., 1995. Application of GIS to Hazard Assessment, with Particular Reference to Landslides in Hong Kong. Geographical Information Systems in Assessing Natural Hazards. Springer, Dordrecht, 273-298. https://doi.org/10.1007/978-94-015-8404-3_14

[11]

Huang, F.M., Chen, B., Mao, D.X., et al., 2023. Landslide Susceptibility Prediction Modeling and Interpretability Based on Self-Screening Deep Learning Model. Earth Science, 48(5):1696-1710 (in Chinese with English abstract).

[12]

Huang, F. M., Chen, J. W., Tang, Z. P., et al., 2021. Uncertainties of Landslide Susceptibility Prediction due to Different Spatial Resolutions and Different Proportions of Training and Testing Datasets. Journal of Rock Mechanics and Engineering, 40(6): 1155-1169 (in Chinese with English abstract).

[13]

Huang, F. M., Yin, K. L., Jiang, S. H., et al., 2018. Landslide Susceptibility Assessment Based on Clustering Analysis and Support Vector Machine. Journal of Rock Mechanics and Engineering, 37(1): 156-167 (in Chinese with English abstract).

[14]

Huang, W. B., Ding, M. T., Wang, D., et al., 2022. Evaluation of Landslide Susceptibility Based on Layer Adaptive Weighted Convolutional Neural Network Model along Sichuan-Tibet Traffic Corridor. Earth Science, 47(6): 2015-2030 (in Chinese with English abstract).

[15]

Ilmy, H. F., Darminto, M. R., Widodo, A., 2021. Application of Machine Learning on Google Earth Engine to Produce Landslide Susceptibility Mapping (Case Study: Pacitan). IOP Conference Series: Earth and Environmental Science, 731(1): 012028. https://doi.org/10.1088/1755-1315/731/1/012028

[16]

Li, W. B., Fan, X. M., Huang, F. M., 2021. Uncertainties of Landslide Susceptibility Modeling under Different Environmental Factor Connections and Prediction Models. Earth Science, 46(10): 3777-3795 (in Chinese with English abstract).

[17]

Li, W. J., Fang, Z. C., Wang, Y., 2022. Stacking Ensemble of Deep Learning Methods for Landslide Susceptibility Mapping in the Three Gorges Reservoirarea, China. Stochastic Environmental Research and Risk Assessment, 36(8): 2207-2228. https://doi.org/10.1007/s00477-021-02032-x

[18]

Liu, Y., 2022. Research on Pre Loan Risk Control Based on Stacking Integration Method under Unbalanced Samples (Dissertation). Central China Normal University, Wuhan (in Chinese with English abstract).

[19]

Meten, M., Bhandary, N. P., Yatabe, R., 2015. GIS-Based Frequency Ratio and Logistic Regression Modelling for Landslide Susceptibility Mapping of Debre Sina Area in Central Ethiopia. Journal of Mountain Science, 12(6): 1355-1372. https://doi.org/10.1007/s11629-015-3464-3

[20]

Moni, M., Sethi, I. P. S., Sethi, S. P. S., 1991. Natural Calamities Relief Management Software. IETE Technical Review, 8(2): 64-71. https://doi.org/10.1080/02564602.1991.11438716

[21]

Nian, T. K., Feng, Z. K., Yu, P. C., et al., 2013. Strength Behavior of Slip-Zone Soils of Landslide Subject to the Change of Water Content. Natural Hazards, 68(2): 711-721. https://doi.org/10.1007/s11069-013-0647-5

[22]

Pardeshi, S. D., Autade, S. E., Pardeshi, S. S., 2013. Landslide Hazard Assessment: Recent Trends and Techniques. Springer Plus, 2(1): 523. https://doi.org/10.1186/2193-1801-2-523

[23]

Pei, Z. W., Nian, T. K., Wu, H., et al., 2021. Research Progress on Emergency Treatment Techniques for Landslide Geological Hazards. Journal of Disaster Prevention and Mitigation Engineering, 41(6): 1382-1394 (in Chinese with English abstract).

[24]

Pham, V. D., Nguyen, Q. H., Nguyen, H. D., et al., 2020. Convolutional Neural Network-Optimized Moth Flame Algorithm for Shallow Landslide Susceptible Analysis. IEEE Access, 8: 32727-32736. https://doi.org/10.1109/ACCESS.2020.2973415

[25]

Wang, C. Y., 2008. Study on the Relationship between Aspect and Slope Stability (Dissertation). Kunming University of Science and Technology, Kunming (in Chinese with English abstract).

[26]

Wang, W. D., He, Z. L., Han, Z., et al., 2020. Mapping the Susceptibility to Landslides Based on the Deep Belief Network: A Case Study in Sichuan Province, China. Natural Hazards, 103(3): 3239-3261. https://doi.org/10.1007/s11069-020-04128-z

[27]

Wang, Y., Fang, Z.C., Niu, R.Q., et al., 2021. Landslide Susceptibility Analysis Based on Deep Learning. Journal of Geo-Information Science, 23(12): 2244-2260 (in Chinese with English abstract).

[28]

Wu, C., 2019. Landslide Susceptibility Based on Extreme Rainfall-Induced Landslide Inventories and the Following Landslide Evolution. Water, 11(12): 2609. https://doi.org/10.3390/w11122609

[29]

Wu, X. L., Yang, J.Y., Niu, R. Q., 2020. A Landslide Susceptibility Assessment Method Using SMOTE and Convolutional Neural Network. Geomatics and Information Science of Wuhan University, 45(8): 1223-1232 (in Chinese with English abstract).

[30]

Yan, C. L., Zheng, D. F., Nian, T. K., et al., 2021. Fuzzy Bayesian Network Model Based on ANP and Its Application to Coastal Zone Geohazard Risk Assessment. Journal of Engineering Geology, 29(6): 1862-1868 (in Chinese with English abstract).

[31]

Zhang, C.X., Yang, Q.K., Li, R., 2005. Advancement in Topographic Wetness Index and Its Application. Progress In Geography, 24(6): 116-123 (in Chinese with English abstract).

[32]

Zhang, K. X., Wu, X. L., Niu, R. Q., et al., 2017. The Assessment of Landslide Susceptibility Mapping Using Random Forest and Decision Tree Methods in the Three Gorges Reservoir Area, China. Environmental Earth Sciences, 76(11): 405. https://doi.org/10.1007/s12665-017-6731-5

[33]

Zhao, P. X., Masoumi, Z., Kalantari, M., et al., 2022. A GIS-Based Landslide Susceptibility Mapping and Variable Importance Analysis Using Artificial Intelligent Training-Based Methods. Remote Sensing, 14(1): 211. https://doi.org/10.3390/rs14010211

[34]

Zhou, X.T., Huang, F.M., Wu, W.C., et al., 2022.Regional Landslide Susceptibility Prediction Based on Negative Sample Selected by Coupling Information Value Method. Advanced Engineering Sciences, 54(3): 25-35 (in Chinese with English abstract).

基金资助

国家自然科学基金项目(42077272;42377185)

辽宁师范大学高端科研成果培育资助计划项目(23GDL007)

AI Summary AI Mindmap
PDF (1429KB)

259

访问

0

被引

详细

导航
相关文章

AI思维导图

/