不同滑坡样本点和多边形表达模式下的易发性评价

邓明东 ,  巨能攀 ,  吴天伟 ,  文艳 ,  解明礼 ,  赵伟华 ,  何佳阳

地球科学 ›› 2024, Vol. 49 ›› Issue (05) : 1565 -1583.

PDF (17828KB)
地球科学 ›› 2024, Vol. 49 ›› Issue (05) : 1565 -1583. DOI: 10.3799/dqkx.2022.393

不同滑坡样本点和多边形表达模式下的易发性评价

作者信息 +

Evaluation of Susceptibility under Different Landslide Sample Points and Polygonal Expression Modes

Author information +
文章历史 +
PDF (18255K)

摘要

滑坡编录模式常为点和多边形面,滑坡点的定位及多边形的采样范围会给滑坡易发性评价结果产生影响.为研究不同点和多边形滑坡样本采样方式下的易发性结果差异,以四川省宁南县为例,采用滑坡多边形和陡坎缓冲区来比较不同多边形表达模式对易发性评价的影响,用滑坡陡坎点和滑坡质心点来比较不同点表达模式对易发性评价的影响,选取3种评价模型支持向量机(SVM)、随机森林(RF)和人工神经网络(ANN)进行滑坡易发性建模,采用ROC曲线、均值、标准差等分析建模的差异.结果如下:(1)在滑坡样本为多边形表达模式下,陡坎缓冲区的评价效果优于滑坡多边形.在滑坡样本为点表达模式下,滑坡质心点的评价效果优于滑坡陡坎点.(2)RF模型在不同采样方式下易发性评价效果更好,不同采样方式下基于RF模型的易发性结果差异性也较小,相比SVM和ANN模型有更好的泛化能力.(3)离散型因子是导致点表达模式下采样方式易发性结果差异的主要因素.陡坎缓冲区采样方式相比于滑坡多边形保留如岩组等离散型环境因子的空间信息,因此评价效果较好.可见在县级尺度下使用滑坡陡坎区域等精细化地形特征作为滑坡采样方式可以提高易发性评价精度.

关键词

易发性评价 / 表达模式 / 采样方式 / 滑坡 / 滑坡样本点 / 滑坡多边形 / 灾害 / 地形特征

Key words

susceptibility evaluation / expression pattern / sampling strategy / landslides / landslide sample points / landslide polygon / hazards / terrain features

引用本文

引用格式 ▾
邓明东,巨能攀,吴天伟,文艳,解明礼,赵伟华,何佳阳. 不同滑坡样本点和多边形表达模式下的易发性评价[J]. 地球科学, 2024, 49(05): 1565-1583 DOI:10.3799/dqkx.2022.393

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

作为最常见的地质灾害之一,据统计全球每年近千人在滑坡灾害中失去生命(Pardeshi et al., 2013).随着城市化的快速发展及全球气候不断变化,滑坡灾害的数量与日俱增(Ali et al., 2020).因此,有效进行滑坡易发性评价以减少潜在滑坡的危害至关重要.

滑坡编录作为滑坡易发性评价最基础也是最关键的工作,其数据质量受定位精度和采样方式的影响.对于不同滑坡样本表达模式下的易发性评价,国内外许多学者也对此进行了讨论研究.如黄发明等(2021)在江西省上犹县比较了滑坡质心点、缓冲圆及准确的滑坡边界建模的不确定性;Abraham et al.(2021)对印度的瓦亚纳德区共2 130 km2范围内运用不同机器学习模型及滑坡冠点和多边形两种采样方式进行滑坡易发性制图;Yilmaz (2010)对土耳其南部144 km2区域使用陡坎多边形、陡坎缓冲区和陡坎点进行易发性制图;Pourghasemi et al.(2020)对伊朗戈莱斯坦省齐亚拉特流域90.5 km2区域内使用基于多边形、质心、冠和趾进行滑坡易发性制图等.目前国内外基于栅格的易发性评价中,研究人员常使用单点、边界、陡坎区域等来表示滑坡灾害.

数据挖掘模型都对特定的数据配置非常敏感,滑坡易发性建模也不例外.模型的成功很大程度上取决于输入数据的准确性,滑坡的表达模式和采样方式决定了如何提取致灾因子信息.滑坡编录表达模式大多以点和多边形为主,基于点表达模式下滑坡定位方式常有滑坡冠、趾、质心等,基于多边形表达模式下滑坡采样方式有整个滑坡体或陡坎区域等.在现场调查中,由于斜坡的恢复,对于滑坡特征的前期调查会存在偏差;在卫星影像以及高程数据的分辨率限制下,也会给后期滑坡细节识别和特征信息提取带来困难.对于小比例尺地图只能标示出滑坡位置,而大比例尺地图表达更为精细,可以区分减损带和堆积区,并对不同类型的滑坡进行分类.在特定的区域尺度和数据来源等条件的影响下,不同点定位技术、多边形的采样方式会如何影响最终的易发性评价结果.而且目前使用精细化地形特征如滑坡陡坎区域的易发性建模也较少,它与目前常用的滑坡多边形和质心点采样方式评价结果有何差异.因此在县级尺度下选择不同的滑坡样本进行易发性评价是值得研究的.

滑坡易发性评价中,不同的评价模型也会给结果带来差异.近些年机器学习模型被广泛应用于滑坡易发性评价,其中代表模型包括随机森林(Sahin et al., 2020)、支持向量机(黄发明等, 2018)和人工神经网络(吴润泽等, 2021)等.选用多种评价模型综合对比,得到适合大部分区域的评价模型对滑坡易发性的精度提高具有重要意义.

因此本文采用滑坡多边形和滑坡陡坎缓冲区来比较不同多边形采样方式对易发性评价的影响,用滑坡陡坎点和滑坡质心点来比较不同点采样方式对易发性评价的影响,选用3种不同的评价模型,即支持向量机(Support Vector Machines, SVM)、随机森林(Random Forest, RF)和人工神经网络(Artificial neural networks, ANN),以宁南县为例进行不同滑坡样本点和多边形表达模式下易发性评价分析,为野外滑坡定位及易发性滑坡样本选择提供一定的参考.

1 滑坡易发性建模方法

1.1 建模思路

本文选取两种点采样方式和两种多边形采样方式进行易发性评价来探索适合县级尺度下易发性评价的滑坡点和多边形样本,相应的步骤(图1)如下:

(1)整理滑坡编录,在绘制好的滑坡边界基础上生成其他不同采样方式的滑坡样本.

(2)收集地形、水文、岩性和地表覆盖等环境因子,确定不同滑坡采样方式下环境因子的频率比值(Frequency ratio, FR).

(3)将不同采样方式下的滑坡编录和在滑坡边界外随机选取等量的非滑坡作为模型变量,依据常用7∶3划分训练集和测试集.

(4)以在不同采样方式下得到FR值作为输入值,进行RF和SVM等模型绘制全县滑坡易发性分区图.

(5)基于受试者特征曲线ROC(Receiver operating characteristic)和混淆矩阵来评价不同模型和不同采样方式的评价结果差异,采用易发性指数的均值、标准差检验各种工况下易发性指数分布的差异性.

1.2 采样方式

1.2.1 滑坡多边形

滑坡边界主要是用多边形表示,可以反映出滑坡变形的规模、形态等空间信息.滑坡包括产生破坏的上部减损带和下部滑覆堆积体(Süzen and Doyuran, 2004).采用滑坡边界为样本计算时,不考虑堆积体区域,因为它不能代表滑坡可能产生的条件.在数据精度的限制等因素下,很难完全确定滑坡中上部变形破坏区.本文采用滑坡后缘到剪出口形成的面作为滑坡多边形采样方式(图2).在野外调查的基础上,在高精度的遥感影像上绘制出滑坡边界,得到多边形的矢量文件,在GIS软件中转换成与评价所选的栅格单元大小一致的光栅格式,通过栅格转点将矢量多边形变为栅格点.基于滑坡边界的滑坡易发性建模就是以转换得到的栅格点为基础进行.本次研究中共收集到377个滑坡边界,转换为30 m×30 m的栅格点共33 331个.

1.2.2 陡坎缓冲区

主陡坎通常位于滑坡顶部和滑坡翼周围的破坏区,在滑坡上边缘其坡度和周围未变形破坏区域有显著差别.Süzen and Doyuran (2004)认为滑坡顶部和侧面周围的缓冲区是代表滑坡发生前的最佳原状地貌区.对于不稳定斜坡或者滑坡地形恢复,主陡坎并不明显.因此选用质心以上到滑坡后缘向外形成30 m缓冲区作为陡坎缓冲区的采样方式,对陡坎区域和顶部侧面周围进行圈定(图2).利用GIS转换为 24 293个栅格点作为滑坡样本进行易发性建模.

1.2.3 滑坡陡坎点

陡坎常在滑坡上边缘,与周围存在明显的坡度差异,且与下部高差较大的区域.对于不稳定斜坡或者滑坡地形恢复,加上DEM精度不足以反映部分滑坡的微地貌,区域之间的边界难以识别.因此本文选取滑坡上边缘与周围区域存在坡度差异区域内且坡度较大的点作为滑坡陡坎点进行易发性建模(图2).

1.2.4 滑坡质心点

质心法是一种基于GIS评价易发性的常用方法,用于将要素(多边形)转换为与重心相对应的单个点(图2),常位于滑坡中部,也是我们野外调查常使用的定位策略.通过前面得到的滑坡多边形转点,控制质心点在多边形边界内部.将其作为滑坡质心点进行易发性建模.

1.3 模型介绍

1.3.1 频率比法

该模型基于统计学原理,定量的描述为各因子区间内滑坡的面积与该区间面积之比.通过计算得到的FR值,可以实现滑坡环境因子的客观量化.当FR>1时,在此因子下的该区间范围有利于滑坡发生,当FR<1时,在此因子下的该区间范围对滑坡发生影响较小.计算公式如下:

            F R = n i / N m i / M ,

式中:ni 为某因子区间内滑坡的面积,N为研究区内滑坡的总面积;mi 为某因子区间的面积,M为研究区的总面积.

1.3.2 支持向量机

该算法在多维空间中用超平面对数据点进行分类.用于分析的环境因子数量决定了超平面的尺寸.对于每个数据集,可以有多个超平面,可以将点分为不同的类.因此,SVM算法应该选择一个超平面,该超平面可以最大化两类数据点之间的距离(Cortes and Vapnik, 1995).位于超平面附近的数据点决定了超平面的方向和位置,这些数据点被称为支持向量.SVM算法使用不同的核函数对目标进行分类,也会得到不同的分类结果.该算法也广泛用于滑坡易发性评价中(Zhou et al., 2021).

1.3.3 随机森林

RF是一种集成机器学习方法,由许多决策树组合而成.由于RF方法具有快速处理大数据、易于参数优化和高评价性能等优点,因此RF被广泛用于易发性制图和遥感领域.RF算法可以实现特征选择、回归、监督和非监督分类等.在RF算法中,首先将训练数据集分为两部分,即袋内(即训练)样本和袋外(即验证)样本.一部分数据用于模型训练,其余数据用于评估生成模型的成功与评价能力.然后,通过bootstrap抽样策略确定每棵树的拆分结构.然后,通过考虑多数投票制来估计最终评价值(Sahin et al., 2020).投票过程可以解释如下:

H x = a r g z m a x i = 1 k I ( h i x = Z ),

其中,Hx)是RF模型,hi 是一个单独的决策树,I是指示函数,Z是最终评价的结果.RF算法使用基尼指数计算每个变量的显著性得分.基尼指数是一种度量,它量化了每个节点不确定性的程度.通过改变树的深度、要组合的树的数量以及每个节点上考虑的特征的数量,可以对模型进行微调.每个节点选择的随机性是RF模型的主要优势,使其能完成高度准确的评价,因此适合滑坡易发性评价(Zhang et al., 2020Zhou et al., 2021).

1.3.4 人工神经网络

人工神经网络已被应用于解决包括滑坡易发性评价在内的许多现实问题(Bayat et al., 2019).它模拟人脑网络,其中函数和学习算法因其行为而不同.原则上,它的工作原理是通过几个Sigmoid函数的加权和来定义一个函数.这些Sigmoid传递函数是所有相关解释变量的组合函数.Sigmoid函数的权重取决于输入变量的影响及其相互关系,通常采用梯度搜索算法.通过多层拓扑结构使网络能够根据给定的数据拟合非线性函数,输入层对输入进行归一化和加权,隐藏层通过传递函数将非线性函数拟合数据,输出层对结果进行汇总.这些层由称为神经元的处理单元和它们之间的加权连接结构组成,构成了神经网络的拓扑结构.为了训练一个网络以适应所引入的数据以获得期望的输出,必须使用学习算法最小化目标函数.

ANN的结构由3个主要类别构成,即输入层、隐藏层和输出层,其中输入神经元表示滑坡环境因子(坡度、坡向等),输出神经元表示评价类别(滑坡或非滑坡),隐藏神经元为激活函数,用于驱动输入神经元评价输出神经元.

1.4 不确定性评价指标

滑坡易发性评价中的一个重要步骤是测试生成的地图的可靠性.本文拟采用ROC曲线、混淆矩阵、均值(Mean Value)和标准差(Standard Deviation)来评价模型的性能.ROC曲线下面积(AUC)值来评估滑坡易发性模型的精度.AUC值越接近于1,评价精度越高.混淆矩阵一般用于精度评价,可以用于比较分类结果和实际预测值.均值和标准差通过反映滑坡易发性指数的平均水平和离散度来探讨建模不确定性(黄发明等,2020).易发性指数的均值越小,更符合小概率事件发生的情况.标准差越大,表明模型评价的易发性指数更有区分度,建模不确定性更低.

2 研究区概况

2.1 宁南县简介

宁南县位于四川省凉山州东南部,总面积约为1 673 km2.地势西北高、东南低.宁南县为南亚热带季风气候,年均降雨量约为910 mm.县境内出露地层以北、西部老,主要为奥陶系白云岩、灰岩、砂页岩,寒武系白云岩、砂页岩,震旦系白云岩和二叠系玄武岩出露.根据凉山彝族自治州自然资源局地质灾害调查资料显示,截止2021年底,该县累计发生滑坡377处,占整个宁南县地质灾害总数的80.37%.以土质滑坡为主,滑体主要由以粉质粘土、含碎石粉质粘土、碎石土组成,主要集中在宁南县南部地区.研究区滑坡位置分布以及从各部门收集到的滑坡灾害点如图3所示.

2.2 滑坡编录及其环境因子分析

本研究中用于评价滑坡易发性的数据来源有:(1)滑坡编录信息及野外调查收集的资料;(2)从1∶5万地形等高线图生成分辨率为30 m的数字高程模型(DEM),用于提取地形、水文相关的因子;(3) 1∶20万比例尺的地层岩性分布图;(4) 第三次全国土地调查矢量图,用于提取土地利用类型图;(5)10 m分辨率的遥感影像(Sentinel-2A,13th April 2016),用于提取归一化植被指数(Normalized Difference Vegetation Index,NDVI).目前对于环境因子的选取缺乏统一准则.本文通过分析宁南县滑坡发育特征以及查询近年来宁南县风险评估的相关文献(毛宇昆, 2020;刘福臻等, 2021),选择出以下的地形地貌(高程、坡度、坡向、平面曲率、剖面曲率和地形粗糙指数、谷深)、基础地质 (岩土类型、距断层距离)、水文因子(地形湿度指数(Topographic Wetness Index,TWI),距河流距离)、人类工程活动(距道路距离)和土地覆盖(NDVI,土地利用)环境因子来进行易发性评价(图4).以上因子全部投影到同一坐标系下,并重采样为30 m×30 m的栅格.连续型因子采用自然断点法分级,区间最佳划分数量为8级(黄发明等, 2020),可按实际建模过程中修改级数.各环境因子的FR值如表1所示.

2.2.1 地形地貌因子

本文的地形因子主要是基于DEM提取.以高程和坡度为例,如表1所示,在 575~1 774 m 的高程范围内4种滑坡采样方式下计算出的FR值均大于1,表明宁南县中低海拔区利于滑坡发育,1 774~2 113 m区间因为滑坡陡坎采样点相对于其他采样方式海拔较高,所以该区间内只有陡坎点计算的FR>1.在坡度8°~29°范围内4种滑坡采样方式下计算出的FR值均大于1;在该坡度范围内更利于滑坡的发生.在大于34°的坡度区间内,FR值越来越小.这说明在该区域内随着坡度增大,滑坡发生的可能在变小.

2.2.2 工程地质

岩性以及断裂带的分布决定了斜坡岩体的应力分布、强度及变形破坏特征.当边坡有松散物质堆积或者有软弱结构面的岩体时,极易发生滑坡.该区域内岩性为软弱松散岩岩组是最有利于滑坡发育的,与该区域内多为覆盖层沿基覆界面失稳的滑坡形成机制相对应.滑坡距离断层越近的区域,滑坡也更容易发生.

2.2.3 地表覆被和人类活动

土地利用类型实际上也是人类对地表岩土体改造的一种表现迹象,同时也表征不同的地表水和地下水作用.山区道路在施工过程中的坡脚开挖、弃方堆积等都改变了地质环境,直接或间接影响了地质灾害的发生.因此,对研究区内的道路网络进行缓冲区分析.越靠近道路施工的区域,更利于滑坡的发生.从土地利用类型来看,农村居住地、公路、园地这些区域滑坡更容易发生,一大部分原因是切坡造成边坡应力条件改变,在降雨等因素的影响下演化成滑坡.

3 滑坡易发性评价结果及分析

3.1 环境因子相关性分析和重要性

本文通过计算在显著性小于0.05情况下如果环境因子间的相关系数小于0.3,表明各环境因子之间存在较弱的相关性,以此来解决环境因子间的共线性问题.在不同采样方式下的各环境因子的相关系数如图5所示.在显著性小于0.05情况下,滑坡多边形样本采样方式多个环境因子存在一定的相关性,综合考虑剔除谷深、NDVI、地形粗糙指数、TWI.陡坎缓冲区采样方式下剔除NDVI、地形粗糙指数、TWI.滑坡陡坎点采样方式下剔除NDVI、地形粗糙指数.滑坡质心点采样方式下剔除谷深、NDVI、地形粗糙指数、TWI.各采样方式下其余的因子用来参与滑坡易发性建模.

本文通过RF中的准确率平均值减少值(Permutation Importance)和不纯度平均值减少值(Features Importance)来获取各工况下的环境因子重要性(黄发明等,2022).综合得到不同采样方式下环境因子重要性排序如图6.

3.2 滑坡易发性评价制图

在滑坡边界2 km外随机选择和各采样方式下滑坡点等量的非滑坡点,与滑坡编录数据组合成数据集输入到目前国内外比较流行的Sklearn库和Keras库来实现机器学习建模.将数据集随机地分为两部分,其中70%的样本集用于模型训练,剩余30%的样本集用于验证模型的性能(周超等,2020).如滑坡多边形采样方式下,将计算得到的各因子的FR值作为输入数据导入机器学习库中.在RF模型中,循环迭代计算不同随机森林袋外误差,在决策树个数为800,最优特征数为3,其他参数保持默认值时袋外误差最小.在SVM模型中,选择径向基核函数.在10折交叉验证得到最优参数C、gamma为6、0.3.在ANN模型中,建立三层网络结构,循环迭代得到隐藏层神经元个数为14个,采用梯度下降算法进行优化,权重衰减系数为0,最大迭代次数为 3 000,其他参数采用默认值.然后利用训练好的模型进行滑坡易发性制图,如图7所示.根据模型得到每个栅格单元的滑坡易发性指数.其值越大,表示发生滑坡的概率越大.相反,其值越小,表明发生滑坡的概率越小.然后根据易发性指数分布规律和自然间断点法进行级别划分 :极高、高、中、低和极低易发区(胡涛等,2020).

3.3 易发性建模结果分析

3.3.1 ROC曲线

在机器学习模型精度评价中ROC曲线越向左上方靠近,表明模型的准确率越高.各模型的ROC曲线和AUC值如图8所示.陡坎缓冲区-RF组合下AUC值最高,其次是滑坡多边形-RF、滑坡质心点-RF和滑坡陡坎点-RF.陡坎区域采样的滑坡用于易发性建模也是有很好的效果.综合可知在不同评价模型下,RF模型相比于SVM和ANN模型有更好的训练和评价性能,SVM模型相比于ANN 模型略好.在不同滑坡表达模式下,多边形表达模式的AUC值优于点表达模式.在滑坡样本为多边形表达模式下,陡坎缓冲区的评价精度优于滑坡多边形.在滑坡样本为点表达模式下,滑坡质心点的评价精度优于滑坡陡坎点.多边形表达模式下的两种采样方式在3种模型下精度差异更小.

3.3.2 混淆矩阵

本文基于混淆矩阵来反映模型分类在数据集上应用的效果.如下的2×2矩阵可以汇总正确和不正确评价的数量(表2).准确率反映的是评价正确的结果占总样本的比例.以RF模型的混淆矩阵为例,滑坡多边形-RF组合下 33 331个滑坡栅格点中有32 633个正确分类,等量的非滑坡栅格有33 097个正确分类,模型的准确率为0.986.在滑坡样本为多边形表达模式下,陡坎缓冲区的准确率优于滑坡多边形.在滑坡样本为点表达模式下,滑坡质心点的准确率大都优于滑坡陡坎点,与ROC曲线反映的大致相同.

3.3.3 易发性指数分布规律

本文采用均值和标准差分别来反映滑坡易发性指数分布的平均水平和离散程度(图9).三种模型的易发性指数分布规律较相似,均在低易发性指数区间分布较集中,评价效果较良好.以RF模型为例,均值从小到大依次为陡坎缓冲区、滑坡多边形、滑坡质心点和滑坡陡坎点;标准差从大到小依次为陡坎缓冲区、滑坡多边形、滑坡质心点和滑坡陡坎点,另外两种模型下也表现出相似的规律.按易发性指数和均值标准差,可知多边形表达模式能实现较少的高易发性指数反映尽可能多的滑坡编录信息,其中陡坎缓冲区采样方式更好;在点表达模式下滑坡质心点-ANN组合的易发性指数分布更优.

3.3.4 易发性分区结果

易发性分级是易发性评价最终结果的展示,也是指导防治工作最重要的依据之一.本文为比较不同采样方式下的分区结果差异,采用基于GIS软件的自然间断法进行易发性结果分级.不同模型及不同采样方式的分区面积及滑坡占比如表3~表5所示.在多边形表达模式下,由于非滑坡点与滑坡点以1:1随机选取,因此在低易发区的面积相较于点表达模式下会更大.以RF模型下的易发性分区结果为例,陡坎缓冲区相比于滑坡多边形在高和极高易发区面积更小,滑坡占比更大.滑坡质心点分区效果也优于滑坡陡坎点.自然断点法分级只考虑数据间的差异性,实际工作应选择合适的易发性分级方案,更好地贴近调查结果.

4 讨论

4.1 不同采样方式提取的因子信息差异

不同采样方式为易发性建模提供不同的滑坡样本量,在本文中反映为不同的滑坡栅格数.滑坡多边形和陡坎缓冲区使用的滑坡栅格数分别为33 331个和24 293个,滑坡陡坎点和滑坡质心点仅使用377个.将滑坡以多边形表达模式绘制时,能够提供更多的滑坡细节,收集到更多关于致灾因子的信息,有助于模型更有效地识别滑坡发生的位置.因此,基于多边形的表达模式在空间上比单点更能代表滑坡,随着滑坡采样策略从单个质心增加到整个多边形,滑坡易发性评价的精度也有增加.在多边形表达模式下的滑坡多边形和陡坎缓冲区采样方式下,滑坡样本量增加,但采样策略之间的总体模型性能和预测差异不大.这说明能代表滑坡形成的采样方式更适合易发性评价.陡坎缓冲区没有包含在滑坡后阶段形成的堆积带,更多地反映滑坡发生前的边界条件,相比滑坡多边形用于易发性评价精度就略高.

通过统计该县377个滑坡边界提取到的因子数据分布可以发现如下规律,以本文中的离散型因子和连续性因子工程岩组、土地类型、坡度和高程为例.将滑坡多边形和陡坎缓冲区利用GIS的分区统计功能,得到该县滑坡在多边形表达模式下的平均坡度、高程.图10展示出该县部分滑坡坡度面平均值和点坡度值的对比以及典型滑坡的坡度空间分布.如377个滑坡中,陡坎缓冲区提取到的坡度平均值普遍大于滑坡多边形.在滑坡多边形采样方式下,连续性因子的重要性排序靠前,在陡坎缓冲区则离散型因子重要性占比大.这说明在滑坡多边形下易发性结果中地形因子权重较大,对岩性和土地利用等因子考虑较少,合理性欠佳.而陡坎缓冲区更合理地考虑影响滑坡发生的环境因子.同理对点表达模式下的坡度进行比较发现陡坎点的坡度也大于质心点提取的坡度.高程也呈现这种规律.对于离散型因子,通过FR计算对比表可以发现:多边形表达模式的FR值差异并不大,而点表达模式下更容易受离散型因子的影响从而FR值有明显差异.且陡坎点提取到的坡度值最大,会给整体评价滑坡的坡度值也偏大.因此评价效果也会稍低于质心点.

本文的研究皆基于栅格点进行滑坡易发性建模,用数个栅格点来表现整个滑坡空间信息确实欠妥.栅格点之间并没有联系,独立存在.如何划分出合理的斜坡单元用来进行滑坡易发性建模或许更重要.另外,滑坡边界提取到环境因子的信息是否与野外实际调查相符合,是否和实际发生滑坡的地形特征吻合以及这种误差是否会对滑坡易发性评价结果带来影响,也是值得思考的问题.

4.2 非滑坡样本的采样方式的影响

本文只考虑了不同点和多边形表达模式下的滑坡样本,对于非滑坡点的选择则采用滑坡边界缓冲区外随机选取.非滑坡样本的位置选择,非滑坡与滑坡样本的数据比例等对滑坡易发性建模也会带来许多的不确定性.滑坡样本可以通过卫星影像、现场调查获得,而非滑坡样本则更困难,对易发性结果也更为重要.选择好非滑坡样本可以抑制滑坡易发性结果的上限,使模型泛化能力更强(Zhu et al., 2018).目前国内外常用生成非滑坡样本的方法有两类:一种是覆盖整个研究区域,仅排除滑坡发生区域随机选择(李文彬等,2021);另一种是缓冲区控制采样,通常用于界定非发生样本与发生样本之间的最小距离(Xie et al., 2018).本文基于等量非滑坡点选择,对于多边形表达模式下的易发性评价而言,相比于点表达模式下有更多的限制条件,低易发区面积占比也相对较大.因此在多边形表达模式下的滑坡样本,对于选择好非滑坡区对于易发性结果的泛化能力有重要意义.

4.3 滑坡识别和绘制前沿技术

滑坡识别和绘制受个人主观经验的影响,不同机构或个人绘制出来的效果会存在差异.本文对于滑坡陡坎区域的采样方式与实际滑坡的形态特征依然是存在较大差别,这或许也是影响易发性结果的主要原因之一.对于目前调查的大部分滑坡点,大都处于蠕滑阶段.对于已经发生的滑坡点,由于地形恢复或改造,在DEM上也存在时间差及精度等问题,这些都会给滑坡易发性评价工作带来困难.获取准确的滑坡编录及制图对防灾减灾有重要指导意义.高分辨率光学遥感与InSAR技术,机载LiDAR技术等对历史变形破坏区和正在变形区而言是很好的识别手段,航空‒半航空物探技术对于潜在不稳定斜坡调查也能提供一定的帮助(许强等,2022).基于InSAR技术也可以得到DEM数据,对于得到滑坡变形破坏时期的地形特征信息提取有重要意义.高分辨率的DEM也是滑坡边界和地表特征描述的基础.高分遥感与对地观测等技术的进步对于滑坡易发性评价工作也会有极大的促进作用.

5 结论

本文以四川省凉山州宁南县区为案例区,采用点和多边形表达模式下各两种滑坡样本采样方式,选取相同因子分级与易发性分级方法,对比分析不同模式下滑坡易发性评价结果.主要得出以下结论:

(1)在滑坡样本为多边形表达模式下,陡坎缓冲区的评价效果优于滑坡多边形.在滑坡样本为点表达模式下,滑坡质心点的评价效果优于滑坡陡坎点.

(2)RF模型在不同采样方式下易发性分区效果更好,相比SVM和ANN模型有更好的泛化能力;不同采样方式下基于RF模型的易发性结果差异性也较小.

(3)多边形表达模式的FR值差异并不大,而点表达模式下更容易受离散型因子的影响从而FR值有明显差异,离散型因子是导致点表达模式下采样方式易发性结果差异的主要因素.岩组等离散型因子在陡坎缓冲区采样方式下相比于地形因子等连续性因子重要性差异不大,能保留更多的因子信息;相比于地形因子权重过大的滑坡多边形有更好的评价效果.

(4)本文采用点与多边形表达模式下进行易发性评价.由于斜坡恢复或者滑坡处于初始变形阶段,目前分辨率的环境因子下对于地形特征的精细表达仍有一定缺陷.在高精度的环境因子和滑坡边界下利用精细地形特征对提高易发性评价精度有重要帮助.

参考文献

[1]

Abraham, M. T., Satyam, N., Lokesh, R., et al., 2021. Factors Affecting Landslide Susceptibility Mapping: Assessing the Influence of Different Machine Learning Approaches, Sampling Strategies and Data Splitting. Land, 10(9): 989. https://doi.org/10.3390/land10090989

[2]

Ali, R., Kuriqi, A., Kisi, O., 2020. Human-Environment Natural Disasters Interconnection in China: A Review. Climate, 8(4): 48. https://doi.org/10.3390/cli8040048

[3]

Bayat, M., Ghorbanpour, M., Zare, R., et al., 2019. Application of Artificial Neural Networks for Predicting Tree Survival and Mortality in the Hyrcanian Forest of Iran. Computers and Electronics in Agriculture, 164: 104929. https://doi.org/10.1016/j.compag.2019.104929

[4]

Cortes, C., Vapnik, V., 1995. Support-Vector Networks. Machine Learning, 20(3): 273-297. https://doi.org/10.1007/BF00994018

[5]

Hu, T., Fan, X., Wang, S., et al., 2020. Landslide Susceptibility Evaluation of Sinan County Using Logistics Regression Model and 3S Technology. Bulletin of Geological Science and Technology, 39(2): 113-121 (in Chinese with English abstract).

[6]

Huang, F.M., Cao, Y., Fan, X.M., et al., 2021. Influence of Different Landslide Boundaries and Their Spatial Shapes on the Uncertainty of Landslide Susceptibility Prediction. Chinese Journal of Rock Mechanics and Engineering, 40(S2): 3227-3240 (in Chinese with English abstract).

[7]

Huang, F.M., Hu, S.Y., Yan, X.Y., et al., 2022. Landslide Susceptibility Prediction and Identification of Its Main Environmental Factors Based on Machine Learning Models. Bulletin of Geological Science and Technology, 41(2): 79-90 (in Chinese with English abstract).

[8]

Huang, F.M., Ye, Z., Yao, C., et al., 2020. Uncertainties of Landslide Susceptibility Prediction: Different Attribute Interval Divisions of Environmental Factors and Different Data-Based Models. Earth Science, 45(12): 4535-4549 (in Chinese with English abstract).

[9]

Huang, F.M., Yin, K.L., Jiang, S.H., et al., 2018. Landslide Susceptibility Assessment Based on Clustering Analysis and Support Vector Machine. Chinese Journal of Rock Mechanics and Engineering, 37(1): 156-167 (in Chinese with English abstract).

[10]

Li, W.B., Fan, X.M., Huang, F.M., et al., 2021. Uncertainties of Landslide Susceptibility Modeling under Different Environmental Factor Connections and Prediction Models. Earth Science, 46(10): 3777-3795 (in Chinese with English abstract).

[11]

Liu, F.Z., Wang, L., Xiao, D.S., et al., 2021. Evaluation of Landslide Susceptibility in Ningnan County Based on Fuzzy Comprehensive Evaluation. Journal of Natural Disasters, 30(5): 237-246 (in Chinese with English abstract).

[12]

Mao, Y.K., 2020. Stability Evaluation of Landslide Based on Machine Learning and System Development (Dissertation). University of Electronic Science and Technology of China, Chengdu (in Chinese with English abstract).

[13]

Pardeshi, S. D., Autade, S. E., Pardeshi, S. S., 2013. Landslide Hazard Assessment: Recent Trends and Techniques. Springer Plus, 2(1): 523. https://doi.org/10.1186/2193-1801-2-523

[14]

Pourghasemi, H. R., Kornejady, A., Kerle, N., et al., 2020. Investigating the Effects of Different Landslide Positioning Techniques, Landslide Partitioning Approaches, and Presence-Absence Balances on Landslide Susceptibility Mapping. CATENA, 187: 104364. https://doi.org/10.1016/j.catena.2019.104364

[15]

Sahin, E. K., Colkesen, I., Kavzoglu, T., 2020. A Comparative Assessment of Canonical Correlation Forest, Random Forest, Rotation Forest and Logistic Regression Methods for Landslide Susceptibility Mapping. Geocarto International, 35(4): 341-363. https://doi.org/10.1080/10106049.2018.1516248

[16]

Süzen, M. L., Doyuran, V., 2004. Data Driven Bivariate Landslide Susceptibility Assessment Using Geographical Information Systems: A Method and Application to Asarsuyu Catchment, Turkey. Engineering Geology, 71(3/4): 303-321. https://doi.org/10.1016/S0013-7952(03)00143-1

[17]

Wu, R.Z., Hu, X.D., Mei, H.B., et al., 2021. Spatial Susceptibility Assessment of Landslides Based on Random Forest: A Case Study from Hubei Section in the Three Gorges Reservoir Area. Earth Science, 46(1): 321-330 (in Chinese with English abstract).

[18]

Xie, P., Wen, H. J., Ma, C. C., et al., 2018. Application and Comparison of Logistic Regression Model and Neural Network Model in Earthquake-Induced Landslides Susceptibility Mapping at Mountainous Region, China. Geomatics, Natural Hazards and Risk, 9(1): 501-523. https://doi.org/10.1080/19475705.2018.1451399

[19]

Xu, Q., Lu, H.Y., Li, W.L., et al., 2022. Types of Potential Landslide and Corresponding Identification Technologies. Geomatics and Information Science of Wuhan University, 47(3): 377-387 (in Chinese with English abstract).

[20]

Yilmaz, I., 2010. The Effect of the Sampling Strategies on the Landslide Susceptibility Mapping by Conditional Probability and Artificial Neural Networks. Environmental Earth Sciences, 60(3): 505-519. https://doi.org/10.1007/s12665-009-0191-5

[21]

Zhang, Y., Wu, W. C., Qin, Y. Z., et al., 2020. Mapping Landslide Hazard Risk Using Random Forest Algorithm in Guixi, Jiangxi, China. ISPRS International Journal of Geo-Information, 9(11): 695. https://doi.org/10.3390/ijgi9110695

[22]

Zhou, C., Yin, K.L., Cao, Y., et al., 2020. Landslide Susceptibility Assessment by Applying the Coupling Method of Radial Basis Neural Network and Adaboost: A Case Study from the Three Gorges Reservoir Area. Earth Science, 45(6): 1865-1876 (in Chinese with English abstract).

[23]

Zhou, X. T., Wu, W. C., Lin, Z. Y., et al., 2021. Zonation of Landslide Susceptibility in Ruijin, Jiangxi, China. International Journal of Environmental Research and Public Health, 18(11): 5906. https://doi.org/10.3390/ijerph18115906

[24]

Zhu, A. X., Miao, Y. M., Yang, L., et al., 2018. Comparison of the Presence-Only Method and Presence-Absence Method in Landslide Susceptibility Mapping. CATENA, 171: 222-233. https://doi.org/10.1016/j.catena.2018.07.012

基金资助

四川省科技计划资助项目(2022YFG0183)

地质灾害防治与地质环境保护国家重点实验室自主课题项目(SKLGP2020Z006)

AI Summary AI Mindmap
PDF (17828KB)

186

访问

0

被引

详细

导航
相关文章

AI思维导图

/