多特征空间自适应下的公路临水区地质灾害易发性评价

苏燕 ,  付仲洋 ,  赖晓鹤 ,  陈耀鑫 ,  付家源 ,  林川 ,  贾敏才 ,  翁锴亮

地球科学 ›› 2025, Vol. 50 ›› Issue (10) : 3823 -3843.

PDF (21341KB)
地球科学 ›› 2025, Vol. 50 ›› Issue (10) : 3823 -3843. DOI: 10.3799/dqkx.2025.140

多特征空间自适应下的公路临水区地质灾害易发性评价

作者信息 +

Geohazard Susceptibility Assessment of Riverside Highway Zones under Multiple Feature Spaces Adaptation Network

Author information +
文章历史 +
PDF (21852K)

摘要

公路临水区因邻近水体、地形陡峭及频繁人类活动,常面临滑坡等地质灾害的高风险.然而,当前基于单源域的迁移学习方法面临源域与目标域在临水区特有的水文条件(如河流密度、降雨集中度)及工程活动(如公路建设)等特征差异较大时,易引发负迁移问题,难以准确预测目标区域的地质灾害易发性.运用一种基于多特征空间自适应网络(Multiple Feature Spaces Adaptation Network,MFSAN)的多源域迁移学习框架,以福建省3个公路临水地区为例,提取9个相关环境因子(含公路密度、河流密度等临水区核心特征)建立滑坡空间数据库,将安溪县(源域1)和德化县(源域2)两个易发性模型迁移至无标签样本的尤溪县(目标域)进行预测,实现多源域跨区域滑坡易发性评价.与无迁移预测模型(Non-Transferable Learning Model,NTL)以及单源域迁移预测模型(Domain Adaptive Neural Network,DANN)进行精度比对,结果显示:(1)相比于单源域地质灾害易发性迁移模型,MFSAN模型的跨区域预测精度为0.851,其准确率提高3.61%,AUC值提高1.91%,综合评估指标OA提高了9.64%;(2)通过历史滑坡验证其落入高、极高易发性区间的滑坡频率比占比最高(79.2%);(3)MFSAN模型对临水区特有的水文-地质耦合效应捕捉能力更强,如公路3 km范围内隐患点集中现象(占比70%~83%)在预测结果中得以精准反映.可见MFSAN模型能够整合不同源域数据的空间特征和灾害发育规律,更全面捕捉区域异质性特征,为跨区域地质灾害预测提供了更优的解决方案,具备更强的泛化能力.

Abstract

Riverside highway zones are prone to high risks of geohazards such as landslides due to proximity to water bodies, steep terrain, and frequent anthropogenic activities. However, current single-source domain transfer learning methods face limitations in geohazard susceptibility prediction when significant discrepancies exist between source and target domains in hydrogeological conditions (e.g., river density, rainfall intensity) and engineering disturbances (e.g., highway construction), often leading to negative transfer issues and reduced model generalizability. This study proposes a multi-source domain transfer learning framework based on a multiple feature spaces adaptation network (MFSAN). Focusing on three riverside highway zones in Fujian Province, China, nine environmental factors (including highway density and river density as core hydrogeological features) were extracted to construct a landslide spatial database. The susceptibility models from Anxi County (source domain 1) and Dehua County (source domain 2) were transferred to Youxi County (target domain) with unlabeled samples for cross-regional landslide susceptibility evaluation. Comparative analyses were conducted against non-transferable learning models (NTL) and single-source domain adaptive models (domain adaptive neural network, DANN). The results demonstrate: (1) The MFSAN model achieved a cross-regional prediction accuracy of 0.851, outperforming single-source transfer models with improvements of 3.61% in accuracy, 1.91% in AUC, and 9.64% in overall assessment metric (OA). (2) Historical landslide validation revealed that 79.2% of landslides occurred within high-to-extreme susceptibility zones predicted by MFSAN, the highest among all models. (3) MFSAN exhibited superior capability in capturing hydrogeological coupling effects unique to riverside environments. For instance, the concentration of hazard-prone sites within 3 km of highways (70%-83%) was accurately reflected in predictions. The MFSAN framework effectively integrates spatial features and disaster development patterns from multiple source domains, comprehensively capturing regional heterogeneity and providing an optimized solution for cross-regional geohazard susceptibility prediction. This approach demonstrates enhanced generalization capability and practical value for mitigating landslide risks in complex engineering environments.

Graphical abstract

关键词

地质灾害易发性 / 多特征空间自适应 / 公路临水区 / 数据缺失 / 工程地质学.

Key words

geohazard susceptibility / multi-feature spatial adaptation / riverside highway zones / data scarcity / engineering geology

引用本文

引用格式 ▾
苏燕,付仲洋,赖晓鹤,陈耀鑫,付家源,林川,贾敏才,翁锴亮. 多特征空间自适应下的公路临水区地质灾害易发性评价[J]. 地球科学, 2025, 50(10): 3823-3843 DOI:10.3799/dqkx.2025.140

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

福建省公路网络密集穿越山地丘陵地带,其中临水区域如沿河公路、水库周边道路因水文条件复杂、岩土体饱水软化效应显著,成为滑坡灾害的高发区(乔晓霞,2006).据统计,研究区公路3 km范围内地质灾害隐患点占比超70%(安溪县82.56%,德化县83.46%),凸显临水区公路灾害防治的迫切性.滑坡灾害不仅威胁着道路的安全运行,还给居民生活和区域经济带来极大的风险.因此,滑坡灾害的防治成为区域发展与交通安全保障的重大课题.

随着机器学习的兴起,诸如随机森林(Random Forest)(吴润泽等,2021)、逻辑回归(李成林等,2024)、支持向量机(Support Vector Machine,SVM)(Yao et al.,2022)、集成学习(邬礼扬等,2024)等方法开始应用于滑坡易发性预测中,这些算法通过训练大量数据,能够从中提取复杂的非线性特征,进而进行高效的预测(马彦彬等,2022).尽管这些方法在一些研究中取得了较好的成果,但在面对无样本、少样本或高维度数据时,仍然存在较大局限性.为了克服这一瓶颈,近年来,迁移学习方法在地质灾害隐患风险的评估与预测中得到广泛应用(付智勇等,2023).迁移学习能够有效利用源域的丰富数据,并将其知识迁移到目标域,特别是在无样本或少样本的情境下具有显著优势.例如,Chen et al. (2022)则利用元学习和对抗机制的迁移学习,建立了基于少样本的滑坡易发性预测模型.Wang et al. (2023)将迁移学习引入滑坡易发性评价,实现了样本丰富区域到样本匮乏区域的模型迁移;苏燕等(2024)也针对完全无样本区域,提出基于特征的迁移学习模型,开展库岸区的跨区域滑坡易发性评价模型,显著提升了预测精度与泛化能力.

目前大多数应用在滑坡易发性评估中的迁移学习模型主要以单一源域为主,即通过在单源域-目标域间构建的浅层地灾预测知识完成跨区域滑坡易发性评估.这类模型的有效性前提是源域与目标域间的特征分布需要存在较高的相似性.然而,随着研究区域的扩大,区域内滑坡灾害的空间分布和触发条件呈现出更加复杂和多样化的机制,这会导致源域和目标域间的特征分布差异加剧.更重要的是,基于单一源域构建的浅层知识体系在这种固有特征差异较大的目标域上可能具有较高的负迁移风险,难以支撑可靠的滑坡易发性图的绘制.Wang et al. (2022)对比了两种滑坡敏感性建模的迁移学习策略——基于案例推理(CBR)和领域自适应(DA),并评估了单源和多源CBR、DA以及CBR-DA策略的性能,实现了对无样本区域的滑坡易发性评价.研究发现,尽管单源域方法能够缓解数据稀缺问题,但其依赖于单一源域特征分布,难以有效捕捉致灾因子对滑坡灾害的综合影响,容易引发负迁移现象.

鉴于单源域迁移学习的局限性,多源无监督域自适应(MUDA)方法被提出作为一种解决方案,旨在通过整合多个源域的特征知识来提升模型的适应性和鲁棒性.杨胜康等(2022)提出的基于多源域深度迁移学习的机械故障诊断方法,通过深度域适应的迁移学习网络模型,克服了负迁移和模型泛化能力不足的问题.吕丞辉等(2022)针对多源域和目标域的域分类不匹配问题,提出了具有多核MMD的多源域适应方法,进一步提升了故障分类的精度.传统的多源域方法通常要求所有源域共享一个统一的特征空间进行知识迁移,这在源域特征差异较大时可能导致模型学习到模糊或矛盾的判别规则,从而影响其在复杂目标域上的泛化能力.针对这一局限,Zhu et al. (2019)提出了多特征空间自适应网络(MFSAN),其核心突破在于不再强制所有源域使用同一个特征空间,通过允许每个源域拥有独立的特征表示,避免了源域间特征分布的冲突,进而提升了模型的迁移能力和精度.

针对公路临水区地质灾害受水文动态与人类活动双重驱动、致灾因子时空异质性显著的问题,本研究旨在构建一种面向公路临水区的多源域迁移学习框架,突破数据稀缺与区域差异的协同制约.以福建省的3个县域公路临水区域为研究对象,将多源域自适应网络(MFSAN)引入公路临水区灾害评价,通过多特征空间对齐与域分类器集成,解决区域环境异质性导致的模型退化问题,通过对比无迁移学习模型和单源域迁移学习模型的精度表现,探讨多源域迁移学习模型在公路临水区灾害评价中的优越性和有效性.本文的技术路线如图1所示.

1 研究区概况与数据集建立

1.1 研究区概况

本研究以中国福建省的具有相似地形地貌、气候环境的3个县域公路临水区域为研究区,安溪县位于福建中南部(117°36′E~118°17′E,24°50′N~25°26′N),地势西北高东南低,分内、外安溪,西北部山势陡峻,东南部相对平缓.属南、中亚热带海洋性季风气候,内、外安溪气候差异明显,外安溪年均温19~21 ℃,年降雨量约1 600 mm;内安溪年均温16~18 ℃,年降雨量约1 800 mm,汛期4月至10月,降雨集中且强度大.安溪县地质构造复杂,岩石破碎,风化强烈,属地质灾害高发区;德化县位于福建中部(117°55′E~118°32′E,25°23′N~25°26′N),地势高,地形复杂,属中亚热带季风气候,年均温约19.5 ℃,年降雨量约1 769 mm,降水集中3~9月,是台风强降雨诱发地质灾害的高发区(叶龙珍,2011).且其地质构造发育,以断裂为主,残坡积土广泛分布,结构松散,易引发地质灾害;尤溪县位于福建中部(117°48′E~118°40′E,25°50′N~26°26′N),以中低山地和丘陵为主,属中亚热带季风性湿润气候,年均温约19.2 ℃,年降雨量约1 650 mm,降雨集中4~9月,地质构造相对稳定,但地下水流动可能导致岩土体失稳(黄俊宝等,2013).三县均处于地质灾害易发区域(苏兴来,2009),上述地理特征为这些地区所发生的滑坡发生模式与发生机制提供了差异性和相似性.

1.2 致灾因子数据源

表1所示,在研究区地质灾害隐患点信息的统计分析过程中发现,地质灾害集中发生在公路区域的一定范围内,越靠近公路,滑坡发生越频繁(Sun et al.,2023),尤其是在公路3 km范围内(安溪县3 km范围内的地质灾害隐患点数量为整个县域82.56%,德化县3 km范围内的地质灾害隐患点数量为整个县域的83.46%,尤溪县的3 km范围内的地质灾害隐患点数量为整个县域的70.64%).因此,本文选取3个县域公路两侧各3 km范围的区域作为研究区范围,统一选用60 m×60 m栅格分辨率的栅格单元,如图2所示.这样有助于全面考虑水体流域范围和地势变化对公路稳定性的综合影响,涵盖不同水体特性和地质条件下的可能灾害风险.

本文通过综合考虑区域特性以及过往学者的研究(黄发明等,2020;薛蒙蒙,2020),同时考虑影响因子的代表性、科学性以及可操作性原则,选取了高程、坡度、坡向、归一化植被覆盖指数(Normalized Difference Vegetation Index,NDVI)、河流密度、公路密度、断层密度、地表覆盖与降雨量共9个致灾因子(图3~5).

其中,高程、坡度、坡向均根据DEM数据利用ArcGIS10.6软件相应功能提取计算得出;NDVI基于Landsat8OLI_TIRS 影像与ENVI 5.3软件对云量小于2%的遥感影像进行辐射定标、大气校正,经NDVI工具计算得到;河流密度、公路密度与降雨量来自全国地理信息资源目录服务系统中的基础地理资料,河流密度与公路密度通过ArcGIS10.6软件线密度统计工具分析研究区内河流矢量数据与公路矢量数据,将每个栅格像元的邻域半径设置为3 km,计算落在邻域半径范围内的河流长度与公路长度;降雨量通过ArcGIS10.6软件的栅格计算器进行多年(2018—2022年)平均降雨量计算;断层密度基于全国地质资料馆地质图资料,通过ArcGIS10.6 软件将地质图中的研究区域断层进行矢量化后,利用线密度统计工具,将每个栅格像元的邻域半径设置为 3 km,计算落在邻域半径范围内断层的长度;地表覆盖基于全国地理信息资源目录服务系统资料,通过ArcGIS10.6软件拼接与裁剪工具处理GlobeLand30m全球地表覆盖数据2020版中的N50_20与N50_25图幅后,获得3个研究区的地表覆盖数据(黄健豪,2020);地质灾害隐患点来源于福建省地质调查研究院提供的地质灾害隐患点编录数据.将地质灾害隐患点与非隐患点的比例设为1∶1(艾骁,2021),在地质灾害隐患点500 m缓冲区范围外随机选取非隐患点(孙德亮,2019).表2列出了文章数据源的具体来源信息.

2 方法论

2.1 多特征空间自适应网络

多特征空间自适应网络(multiple feature spaces adaptation network,MFSAN)是一种具有两个对齐阶段的MUDA框架(Zhu et al., 2019),利用特定领域特征提取器将不同源域的特征提取到不同特征映射空间,分别实现与目标域的特征分布的匹配,然后再利用特定域的决策边界对齐分类器输出,设置一致性的正则化项,约束多个特定领域分类器对同一个样本的输出,使得它们更加接近,MFSAN原理如图6所示,MFSAN流程如图7所示.

特定领域特征提取器的目标是将不同的源域和目标域数据分别映射到特定的特征空间并提取他们的独特特征.MFSAN模型中构建了N个不共享的领域特定提取器Hj,给定j个源域Xsj 的一批数据xsj和来自目标域Xt的一批数据xt,将它们输入第j个特定领域特征提取器HjxsjHjxt,这些特征提取器并行工作,具有不同的权重.本文采用两个特定领域特征提取器H1H2是由4层简单的神经网络结构组成,有两个全连接层以及两层激活函数层.将基于致灾因子组合的样本数据输入到H网络中,9维度的致灾因子数据经前向传播特征提取后输出256维度的特征数据,并利用ReLU函数激活增强其表达能力,然后再经过线性特征提取将256维度的特征数据转换至128维度数据,并在ReLU函数激活后输出.

特定领域分类器C是由N个领域特定分类器Cjj=1N组成的多输出网络.每个分类器Cj都由一个softmax分类器组成,其输入数据是经过第j个源域的特定领域特征提取器Hx处理后的特定域不变特征.本文采用两个特定领域分类器C1C2同样由4层简单的神经网络结构组成,与特定领域特征提取器不同的是,特定领域分类器的输入为特定领域特征提取器输出的128维度的特征数据,经过ReLU函数激活再进行同维度的特征变化,最终输出具有2个输出类别的分类结果.在每个分类器中使用交叉熵损失作为分类损失,N个源域的交叉熵损失函数总和公式为:

Losscls=j=1NExt,xsjJ(Cj(Hj(xisj)),yisj),

式中:Losscls为源域分类损失;Hjxsj为特定域特征提取器;Cjxsj为特定域分类器;J为交叉熵损失函数.

MFSAN使用最大均值差异(Maximum Mean Discrepancies,MMD)损失度量估计两个域之间分布差异,以实现第1个阶段对齐不同源域和目标域的分布.MMD是一种基于核方法的非参数统计检验,其核心思想在于:如果两个概率分布p(源域)和q(目标域) 相同,那么它们所有在再生核希尔伯特空间 (Reproducing Kernel Hilbert Space, RKHS) H中函数的期望值也应相同.在数学上,MMD定义了以下分布间度量距离:

DHp,q=ΔEpφxs-EqφxtH2,

式中:H为赋予特征核k的再生核Hillbert空间(Reproducing Kernel Hilbert Space,RKHS),φ表示将原始样本映射到RKHS的某个特征映射,核k表示kxs,xt=φxs,φxt,其中,表示向量的内积.Gretton et al. (2012)表明当且仅当p=qDHp,q=0.在实际应用中,笔者无法获得真实的分布,只能基于有限样本进行估计.给定第i个源域样本集Ds和第j个目标域样本集Dt,MMD的无偏估计量计算如下:

D^Hp,q=1nsxiDsφxi-1ntxjDtφxjH2 .

D^Hp,qDHp,q的无偏估计量.公式(4)是每个源域与目标域差异的估计.MMD损失表述为:

Lossmmd=1Nj=1ND^Hjxisj,Hjxit .

通过反向传播最小化Lossmmd,网络驱动每个域特定特征提取器Hj 学习到的特征表示,使得源域和目标域的数据在其专属的特征空间内的分布尽可能接近,从而获得针对该特定源域-目标域迁移任务的域不变特征表示.总的来说,调试好的 MFSAN 模型首先根据输入的数据(源域样本与目标域样本)分别将数据映射至子空间1(源域1)和子空间2(源域2),并经特定领域特征提取器H1H2提取特征后,计算源域和目标域之间MMD损失,对于不同的源域和目标域,通过保证最小化MMD损失以得到域不变表示.然后将提取的特征分别输入到C1C2线性层进行分类得到预测结果,同时生成分类损失.最终MFSAN的损失由两个部分组成,包括分类损失和MMD损失.具体而言,通过最小化分类损失,网络可以准确分类源域数据;通过最小化MMD损失可以减少源域和目标域的特征分布来学习域不变表示.然后,返回分类损失和MMD损失,以及两个分类器得到的分类结果pred1和pred2.基于两种损失的平均结果,最终得到目标域的分类结果为两个预测结果的加权平均数.总损失的公式如下:

Losstotal=Losscls+γLossmmd
γ=21+e-10*iiteration-1

式中:Losstotal为总损失,Losscls为源域分类损失,Lossmmd为MMD损失,γ为可变超参数,iteration表示用于训练的迭代总数.

本研究旨在系统评估基于多特征空间自适应网络(MFSAN)构建的多源域迁移学习模型在跨区域滑坡易发性预测任务中的性能表现,重点探究其在预测精度、模型鲁棒性及区域适应性方面相较于传统单源域迁移模型与非迁移机器学习方法的优越性.为确保实验设计的规范性与结论的可比性,本研究采用迁移成分分析(Transfer Component Analysis,TCA)和域对抗神经网络(Domain Adversarial Neural Network,DANN)作为单源域迁移学习的基准模型,同时选取K近邻算法(K-Nearest Neighbors,KNN)、逻辑回归(Logistic Regression,LR)以及高斯朴素贝叶斯分类器(Gaussian Naive Bayes,GNB)构建无迁移对照模型.

2.2 余弦相似度

成功的跨区域地质灾害易发性预测不仅取决于模型的优越性,同时源域与目标域之间的相似性也是至关重要的,迁移学习是以数据、任务或模型之间的相似性为基础,将先前学习过的模型和知识应用于新领域、新问题上,因此来自不同领域之间的代表性样本与特征之间的相似程度决定了跨区域地质灾害预测能否成功.余弦相似度(Cosine Similarity)是n维空间中两个n维向量之间角度的余弦,是一种度量两个向量之间相似性的方法(孙小琳等,2022),可以用于衡量两个研究区内对应影响因子之间概率分布的相似程度,计算余弦相似度的公式如下:

SimilarityA,B=ABA×B=i=1nAi×Bii=1nAi2×i=1nAi2,

式中:AB是两个向量,AB表示它们的范数(即向量的长度),而A·B表示它们的内积(即对应元素相乘后求和).当两个向量的夹角越接近0°(即夹角越小),余弦相似度越接近1,表示它们越相似.当夹角接近180°(夹角越大),余弦相似度越接近-1,表示它们越不相似.如果两个向量夹角为90°(垂直),余弦相似度为0,表示它们之间没有相关性.

3 结果与分析

3.1 相似性分析

致灾因子间的余弦相似度分布如图8所示,除断层密度外,均大于0.70.德化县与尤溪县的余弦相似度总体上高于安溪县与尤溪县的余弦相似度,表明德化县与尤溪县的致灾因子更具相似性,断层密度由于区域的不同,断裂带的分布以及对地质灾害发育造成的影响存在较大差异,两个源域与目标域断层密度的相似度较小,而NDVI对于不同区域的地质灾害的发育具有更普遍的相似特征,植被覆盖度高的地方往往不易发生地质灾害,植被覆盖低的地方往往容易形成潜在的致灾体,进而产生地质灾害,因此两个源域与目标域尤溪县NDVI 相似度极大.而其余的致灾因素也有着较大的相似性,这种相似性为地质灾害的跨区域预测提供了基础.

为了更好地观察源域和目标域的样本点数据在高维空间整体分布的差异性情况,引入分布随机邻域嵌入(t-distribution stochastic neighbor embedding,t-SNE)降维可视化方法(Wattenberg et al., 2016),结合置信椭圆,绘制出两个源域样本点数据与目标域样本点数据的分布得图9.可以看出,绘制的置信椭圆能够覆盖大部分的样本.两个源域与目标域的样本数据分布的MMD距离存在较为显著的差异,德化县与尤溪县的隐患点和非隐患点之间的MMD距离(0.091、0.119)显著大于安溪县与尤溪县的隐患点和非隐患点之间的MMD距离(0.067、0.041).基于上述分析,不同源域与目标域之间样本数据分布存在较大差异,这种显著的数据分布差异性为多源域迁移学习的分类效果提供了更为鲜明和具体的展现,使得其效能得以更为明确地凸显出来.

3.2 模型性能评估

为探究不同方法下跨区域地质灾害易发性的模性性能与评价精度,运用混淆矩阵,以及基于混淆矩阵计算得到的评估指标如表3所示,并通过ROC曲线、AUC值来评判各个模型的综合性能,如图10图11以及表4所示.

图10混淆矩阵的结果表明,没有应用迁移学习方法的跨区域地质灾害易发性评价模型——NTL模型尽管对非隐患点的判定准确率较高,但对于隐患点判定的正确率不足50%,这对于地质灾害易发性的评价是致命的,这说明将一个区域的地质灾害易发性评价模型直接应用在不同区域的做法存在较大缺陷;而基于单源域迁移学习的跨区域地质灾害易发性模型中,TCA模型与DANN模型对于地质灾害隐患点的识别精度大幅度提升(较KNN提升96.2%);考虑到单个源域样本与目标域样本的相似性存在一定局限性,在增加了安溪公路临水区样本数据后,采用MFSAN模型得到的目标域公路临水区的地质灾害隐患点与非隐患点的分类精度较单源域迁移模型有了进一步的提升,非隐患点的分类精度提升15.5%.

通过表4图11的指标对比结果,可以看出MFSAN模型的综合评价指标OA值最大,为2.297,除了召回率外,其他所有评价指标均为跨区域模型中最优(Acc=0.802,Precesion=0.814,F1=0.799,Mcc=0.696,AUC值=0.851).NTL-Bayes模型取得了最优召回率,得益于其对非隐患点近乎完美的判别,而隐患点几乎无法判别,造成其召回率值异常的高.基于单源域迁移的DANN模型其各项评估指标仅次于MFSAN模型,其AUC值达到了0.835,综合评估指标OA为2.095.综合上述分析,相较于未使用迁移方法的NTL模型,两种单源域迁移模型通过迁移学习提高了目标区域的预测精度,验证了迁移方法在跨区域地质灾害评价中的有效性.在此基础上,MFSAN模型通过多源域协同迁移机制,进一步整合不同源域数据的空间特征和灾害发育规律,其综合评估指标OA较单源域迁移模型提升9.64%,表明MFSAN模型能够更全面捕捉区域异质性特征,为跨区域地质灾害预测提供了更优的解决方案.

3.3 易发性制图

易发性指数分布的实际模式对于迁移模型是否能在实际意义上取得成功起着决定性作用.尽管许多模型在通过指标评估时表现出较小的差异,但最终生成的易发性图(LSM)却展现出显著的不同.在本文中,运用自然间断点法来划分易发性区划图,以便更准确地反映不同区域的易发性特征.

将训练好的模型对目标域公路临水区进行易发性预测,得到各栅格点的易发性指数,模型输出的易发性指数分布绘制于图12中,对比不同模型得到的易发性指数分布,无迁移模型的易发性指数平均值均高于0.5(分别为0.590、0.590、0.620),表明其预测结果普遍偏向高值区间,导致易发性指数分布过于集中,难以可靠区分隐患区与非隐患区.相比之下,单源迁移模型(TCA、DANN)显著优化了指数分布特征:TCA模型平均值降至0.431(较KNN降低26.9%),DANN模型进一步降至0.407(降低31.0%),MFSAN模型的易发性指数分布呈现更合理的双峰特征,低值区(0~0.3)与高值区(0.6~0.9)界限分明,中值区间(0.3~0.6)占比压缩.其平均值最低(0.388,较KNN降低34.2%),标准差为0.229,与DANN(0.221)接近,表明模型在抑制高估倾向的同时保持了预测稳定性.

将模型预测的易发性指数导入栅格单元中,通过自然间断点法(Ayalewet et al.,2005)将区域的易发性指数划分为5个区间:极高易发区、高易发区、中易发区、低易发区与极低易发区,并生成尤溪县公路临水区的地质灾害易发性区划图(图13)以及易发性分区频率比表(表5).

模型间对比显示:无迁移模型(NTL)的中易发区面积占比普遍较高(24.79%~26.51%),而迁移模型显著降低了该比例,其中单源迁移模型TCA和DANN分别降至22.79%和18.85%,多源迁移模型MFSAN进一步降至16.66%.在高风险区识别方面,NTL-KNN的高易发区频率比仅为0.89,迁移模型则大幅提升至1.82(TCA)和2.05(DANN);MFSAN虽将高易发区面积压缩至17.48%,仍保持2.01的频率比.尤为突出的是,MFSAN的极高易发区频率比达3.50(全模型最高),且高/极高易发区合计捕获79.20%的历史滑坡点(优于DANN的74.24%).低风险区控制上,MFSAN的极低和低易发区频率比分别降至0.05和0.22,为最优水平.空间分布上,所有模型均呈现“近公路高、远公路低”的格局.

迁移学习模型,尤其是MFSAN的性能提升体现在3个核心维度:首先,中易发区面积的大幅压缩(MFSAN较NTL减少32.8%)显著降低了预测结果的模糊性,意味着模型能更清晰地区分灾害隐患区与非隐患区,提升了风险决策效率.其次,MFSAN在高风险识别上实现双重优化——其高/极高易发区不仅以79.20%的历史滑坡捕获率为全模型最高,且频率比(3.50)的显著提升表明对隐患核心区的锁定更精准可靠,这对重点防控区域的靶向部署具有关键价值.最后,MFSAN在低风险区的优异表现(频率比最低)优化了隐患与非隐患区的判别边界,有助于工程资源的高效配置.这种性能优势源于MFSAN对公路临水区致灾机制的深刻解析:模型精准捕捉到工程扰动与水文侵蚀的耦合效应,使公路3 km内的高风险区聚集现象(70%~83%)与历史隐患分布高度吻合.相较于单源域模型,MFSAN通过多源域融合将滑坡捕获率提升4.96%、极高易发区频率比提升9.7%,印证了其在破解区域异质性和提升泛化能力方面的先进性,为地质灾害精细化防控提供了更优解决方案.

综合上述滑坡易发性分布分析可知,经过迁移后的易发性分区结果更具规律性,其中MFSAN规律性最强,其次是DANN、TCA,未运用迁移方法的NTL-LOG与NTL-Bayes表现较为一般,NTL-KNN的效果最低.

4 讨论

4.1 基于公路临水区的滑坡易发性评价探讨

公路临水区地质灾害的发育机制与普通区域存在显著差异,其易发性受水文动态与工程活动的双重驱动.本研究发现,公路临水区滑坡隐患点分布呈现强烈的空间聚集性,公路3 km范围内隐患点占比高达70%~83%(表1),这一发现与孙德亮(2019)关于公路区周边滑坡研究结论一致, 这种趋势与公路建设直接相关,尤其是在临水区,其易发性受水文动态与工程活动的双重驱动.

具体而言,公路建设显著改变了局部地质结构和水文环境,例如在高坡度、低NDVI值及高断层密度区域,会对原始地形稳定性造成严重破坏.基于水文与地质因素的综合分析表明,公路建设对滑坡的诱发效应在空间上呈现明显的衰减规律,即距离公路越近的区域,滑坡发生频率越高.在紧邻公路的区域,频繁的水位波动、集中降雨以及河流侵蚀等水文作用显著降低了岩土体的抗剪强度,导致滑坡更易发生(Sun et al., 2023).相比之下,在远离公路的区域,尽管水文变化的影响依然存在,但由于公路建设带来的直接扰动效应显著减弱,滑坡发生的概率则相对较低.因此,公路建设对滑坡发生的影响范围具有明确的空间衰减特征,其影响强度在3 km范围内最为显著,并随距离增大而逐渐减弱.这一现象表明,公路建设,特别是在临水区,对滑坡的诱发作用具有显著的空间边界性和区域差异性.因此,深入理解公路临水区滑坡机理,必须综合考虑水文与地质因素的耦合作用,并结合致灾因子的具体贡献进行分析.各致灾因子贡献度如图14所示.

结合致灾因子贡献度分析,植被覆盖(NDVI)和地表覆盖是最突出的影响因素.植被覆盖稀疏区域水土保持能力显著减弱,地表固土作用降低,导致坡面稳定性下降.值得注意的是,公路密度大的区域往往伴随着植被覆盖的减少(即NDVI值较低),进一步加剧了这些区域的滑坡风险.而地表特性直接影响水分渗透和土体抗蚀能力,其中裸露地表区域滑坡风险尤为突出;地形特征方面,高程和坡度是主要的易发性控制因子,高海拔区域的重力势能积累使其更易发生滑移变形,而陡峭地形加速降水径流,缩短土体饱和时间,导致抗剪强度骤降.坡向对滑坡也有一定影响,但相对较弱;水文因素中,降雨量是主要触发因子,水文因素的核心作用主要体现在频繁的水位波动、强降水事件及河流侵蚀过程.水位波动通过引发边坡的周期性饱水软化,降低了岩土体的抗剪强度,这使得滑坡发生的风险显著增加.此外,降雨集中时,强降水引起的水土流失进一步加剧了坡面不稳定性,尤其是在坡度较大的区域.这些水文变化不仅在一定程度上促进了岩土体的软化和流失,还加剧了区域内水分的积聚,导致坡体的承载能力下降,增加了滑坡的发生几率(Lv et al.,2024).传统的单源域迁移模型(如DANN)因未充分解耦多源域特征,难以精准捕捉此类耦合效应,而MFSAN通过特征空间自适应策略,使极高易发区频率比提升至3.50,且隐患点聚集现象与历史数据吻合度达79.2%(表5).这一结果验证了水文-地质耦合作用对公路临水区灾害发育的主导性,以及多特征空间自适应方法对复杂孕灾机制的表征能力,也为类似区域的工程防护提供了针对性依据.

4.2 多源域迁移模型的性能提升机制探讨

本研究提出的多特征空间自适应网络(MFSAN)在公路临水区地质灾害预测中取得显著性能提升(AUC=0.851,OA=2.297),其优势源于对多源域异质性特征的协同对齐与分类器一致性约束机制.相较于传统单源域迁移模型(如DANN)和非迁移模型(NTL),MFSAN通过特征空间解耦与自适应融合策略克服了前人研究中“单源域特征表征不足”的缺陷(Du et al., 2020).具体而言,DANN等单源域方法(Ghifary et al., 2014)仅依赖单一源域进行全局特征对齐,难以适应公路临水区水文-地质耦合作用产生的复杂分布差异,例如,安溪县与德化县在断层密度、降雨集中度等特征上存在显著差异(图8),单一源域的特征表征无法覆盖目标域(尤溪县)的异质性特征空间.本研究采用构建双源域特征提取器,通过MMD距离约束(公式(4))分别对齐安溪、德化两源域与目标域的特征分布,使源域-目标域特征差异从单源模型的0.119降至0.091(图9),有效缓解了单源域模型因特征覆盖不足导致的负迁移问题.其次,分类器一致性约束(公式(1))通过强制多个源域分类器对同一目标域样本输出一致的概率分布,抑制了区域异质性因子(如安溪县断裂带发育与德化县台风降雨差异)的干扰.实验表明,该约束使模型在目标域的准确率较单源域DANN模型提升3.61%(表5).此外,多源域协同优化整合了两源域的互补特征,例如安溪县的高公路密度特征与德化县的高河流密度特征(图34),通过特征空间解耦与联合映射,模型能够更全面地捕捉临水区水文-工程耦合效应.如表5所示,MFSAN在极高易发区的频率比达3.50,较单源模型提升9.7%,且隐患点聚集区与公路3 km范围的空间分布高度吻合(占比79.2%),验证了多源域特征融合对复杂致灾机制解析的有效性.

4.3 区域相似性探讨

迁移学习模型在滑坡易发性评估中的效果与源域和目标域之间特征集的相似度有很大的关系,不同区域环境相似性对迁移学习效果以及滑坡易发性评价具有重要影响,本文分析了德化县与尤溪县、安溪县与尤溪县在相似性上的差异,包括具体致灾因子的余弦相似度以及样本数据分布的最大均值差异.结果表明德化县致灾因子的相似度整体上优于安溪县,而样本数据分布的最大均值差异安溪县优于德化县.样本的数据分布实际上是多个致灾因子非线性拟合的结果,可以代表区域性地质灾害总体特点,而不同区域地质灾害的特点有其特异性,单纯从数据分布上去理解其相似性是较为片面的,而致灾因子对地质灾害的发育至关重要,因此需要综合考虑这两种相似性度量的结果.本节对两个源域德化县公路临水区与安溪县公路临水区数据的相似性也进行了度量.图15为两个源域之间致灾因子的余弦相似度,可以看到两个源域的断层密度余弦相似度较小,而NDVI相似度极大,其余的致灾因素也有着较大的相似性,这表明本文所选择的3个公路临水区域的致灾因素具有足够的相似性,为实现基于多源域的地质灾害易发性预测提供了基础.

图16为两个源域样本数据分布的最大均值差异的可视化图,可以看出安溪县与德化县的地质灾害非隐患点的分布距离总体上小于隐患点的分布距离,两个区域的样本数据分布的最大均值差异较大,表明两个区域的地质灾害特点是有一定区别的,因此两个区域在进行多源域的地质灾害易发性评价过程中可以作为各自的补充源域,利用补充源域的样本分布差异,增加有效的分类信息,提高对目标域尤溪县公路临水区的地质灾害易发性预测的准确性与效率.

5 结论

本文针对公路临水区地质灾害易发性评价中数据稀缺与区域异质性导致的模型泛化难题,提出了一种基于多特征空间自适应网络(MFSAN)的多源域迁移学习框架.通过整合安溪县与德化县多源域数据,实现对尤溪县公路临水区的地质灾害易发性的评价.具体结论分析如下:

(1)基于MFSAN框架的多源域迁移模型在目标域(尤溪县)的预测精度与泛化能力全面优于单源域迁移模型及无迁移模型:其准确率(0.802)较单源域最优模型DANN(0.774)提升3.61%,AUC值(0.851)提升1.91%,综合评估指标OA值(2.297)提升9.64%.有效缓解了源域与目标域在公路密度、河流密度等临水区核心特征上的分布差异,降低负迁移风险.

(2)MFSAN对公路临水区特有的水文-地质耦合效应解析能力显著:公路3 km范围内极高易发区频率比(3.50)较单源模型DANN(3.19)提升9.7%,且隐患点聚集现象与历史滑坡分布高度吻合(高/极高易发区隐患点合计占比79.20%),实现了隐患区与非隐患区的精准划分,对实际工程具有指导意义.

(3)研究区致灾因子对地质灾害的发育至关重要,两个源域与目标域尤溪县致灾因素有着一定的相似性,这种相似性为地质灾害的跨区域预测提供了基础.而不同源域与目标域之间样本数据分布又存在较大差异,这种显著的数据分布差异性为多源域迁移学习的分类效果提供了更为鲜明和具体的展现.

参考文献

[1]

Ai, X., 2021. Construction of Earthquake Landslide Susceptibility Assessment Model Based on Machine Learning: A Case Study of Beijing Mountainous Area(Dissertation). Institute of Engineering Mechanics, China Earthquake Administration, Harbin (in Chinese with English abstract).

[2]

Ayalew, L., Yamagishi, H., 2005. The Application of GIS-Based Logistic Regression for Landslide Susceptibility Mapping in the Kakuda-Yahiko Mountains, Central Japan. Geomorphology, 65(1-2): 15-31. https://doi.org/10.1016/j.geomorph.2004.06.010

[3]

Chen, L., Ding, Y. L., Pirasteh, S., et al., 2022. Meta-Learning an Intermediate Representation for Few-Shot Prediction of Landslide Susceptibility in Large Areas. International Journal of Applied Earth Observation and Geoinformation, 110: 102807. https://doi.org/10.1016/j.jag.2022.102807

[4]

Du, J., Glade, T., Woldai, T., et al., 2020. Landslide Susceptibility Assessment Based on an Incomplete Landslide Inventory in the Jilong Valley, Tibet, Chinese Himalayas. Engineering Geology, 270: 105572. https://doi.org/10.1016/j.enggeo.2020.105572

[5]

Fu, Z. Y., Li, D. Q., Wang, S., et al., 2023. Landslide Susceptibility Assessment Based on Multitemporal Landslide Inventories and TrAdaBoost Transfer Learning. Earth Science, 48(5): 1935-1947 (in Chinese with English abstract).

[6]

Ghifary, M., Kleijn, W. B., Zhang, M. J., 2014. Domain Adaptive Neural Networks for Object Recognition. PRICAI 2014: Trends in Artificial Intelligence. Springer International Publishing, Cham: 898-904. https://doi.org/10.1007/978-3-319-13560-1_76

[7]

Gretton, A., Borgwardt, K.M., Rasch, M.J., et al., 2012. A Kernel Two-Sample Test. Journal of Machine Learning Research, 13(1): 723-773. https://doi.org/10.5555/2503308.2188410

[8]

Huang, F. M., Ye, Z., Yao, C., et al., 2020. Uncertainties of Landslide Susceptibility Prediction: Different Attribute Interval Divisions of Environmental Factors and Different Data-Based Models. Earth Science, 45(12): 4535-4549 (in Chinese with English abstract).

[9]

Huang, J. B., 2013. Preliminary Studying of Landslide Critical Rainfall in Dehua County. Geology of Fujian, 32(1): 65-69 (in Chinese with English abstract).

[10]

Huang, J. H., 2020. Research on Data Mining Methods and Application of Main Control Factors of Collapse, Landslide and Debris Flow (Dissertation). Chongqing University, Chongqing(in Chinese with English abstract).

[11]

Li, C. L., Liu, Y. S., Lai, S. H., et al., 2024. Landslide Susceptibility Analysis Based on the Coupling Model of Logistic Regression and Support Vector Machine. Journal of Natural Disasters, 33(2): 75-86 (in Chinese with English abstract).

[12]

Lv, J. C., Zhang, R., Shama, A., et al., 2024. Exploring the Spatial Patterns of Landslide Susceptibility Assessment Using Interpretable Shapley method: Mechanisms of Landslide Formation in the Sichuan-Tibet Region. Journal of Environmental Management, 366: 121921. https://doi.org/10.1016/j.jenvman.2024.121921

[13]

Lyu, C. H., Cheng, J. J., Hu, Y. G., et al., 2022. Online Fault Diagnosing of Rudders Based on Multi-Source Domain Deep Transfer Learning. Journal of Ordnance Equipment Engineering, 43(9): 60-67 (in Chinese with English abstract).

[14]

Ma, Y. B., Li, H. R., Wang, L., et al., 2022. Application of Machine Learning Method in Landslide Susceptibility Evaluation. Journal of Civil and Environmental Engineering, 44(1): 53-67 (in Chinese with English abstract).

[15]

Qiao, X. X., 2006. GIS-Based Geological Hazard Risk Assessment along Complex Mountainous Highways: A Case Study of the Ankang-Ziyang Section of GZ40 Expressway(Dissertation). Changan University, Xi’an (in Chinese with English abstract).

[16]

Su, X. L., 2009. Discussion on the Environmental Factors of Geologic Hazards Caused by a Creep Landslip in Youxi County. Geology of Fujian, 28(4): 335-340 (in Chinese with English abstract).

[17]

Su, Y., Huang, S. X., Lai, X. H., et al., 2024. Evaluation of Trans-Regional Landslide Susceptibility of Reservoir Bank Based on Transfer Component Analysis. Earth Science, 49(5): 1636-1653 (in Chinese with English abstract).

[18]

Sun, D. L., 2019. Study on Landslide Susceptibility Zoning and Rainfall-Induced Landslide Prediction and Early Warning Based on Machine Learning(Dissertation). East China Normal University, Shanghai (in Chinese with English abstract).

[19]

Sun, D. L., Gu, Q. Y., Wen, H. J., et al., 2023. Assessment of Landslide Susceptibility along Mountain Highways Based on Different Machine Learning Algorithms and Mapping Units by Hybrid Factors Screening and Sample Optimization. Gondwana Research, 123: 89-106. https://doi.org/10.1016/j.gr.2022.07.013

[20]

Sun, X. L., Ji, W. D., Wang, X., 2022. Natural Computation Method Based on Cosine Similarity Opposition Strategy. Information and Control, 51(6): 708-718 (in Chinese with English abstract).

[21]

Wang, H. J., Wang, L., Zhang, L. M., 2023. Transfer Learning Improves Landslide Susceptibility Assessment. Gondwana Research, 123: 238-254. https://doi.org/10.1016/j.gr.2022.07.008

[22]

Wang, Z. H., Goetz, J., Brenning, A., 2022. Transfer Learning for Landslide Susceptibility Modeling Using Domain Adaptation and Case-Based Reasoning. Geoscientific Model Development, 15(23): 8765-8784. https://doi.org/10.5194/gmd-15-8765-2022

[23]

Wattenberg, M., Viégas, F., Johnson, I., 2016. How to Use T-SNE Effectively. Distill, 1(10): e2. https://doi.org/10.23915/distill.00002

[24]

Wu, L. Y., Zeng, T. R., Liu, X. P., et al., 2024. Landslide Susceptibility Assessment Based on Ensemble Learning Modeling. Earth Science, 49(10): 3841-3854 (in Chinese with English abstract).

[25]

Wu, R. Z., Hu, X. D., Mei, H. B., et al., 2021. Spatial Susceptibility Assessment of Landslides Based on Random Forest: A Case Study from Hubei Section in the Three Gorges Reservoir Area. Earth Science, 46(1): 321-330 (in Chinese with English abstract).

[26]

Xue, M. M., 2020. Evaluation Model of Random Forest and Support Vector Machine for Landslide Prone along Mountain Road (Dissertation). Chongqing University, Chongqing (in Chinese with English abstract).

[27]

Yang, S. K., Kong, X. G., Wang, Q. B., et al., 2022. Mechanical Fault Diagnosis Based on Multi-Source Domain Deep Transfer Learning. Journal of Vibration and Shock, 41(9): 32-40 (in Chinese with English abstract).

[28]

Yao, J. Y., Qin, S. W., Qiao, S. S., et al., 2022. Application of a Two-Step Sampling Strategy Based on Deep Neural Network for Landslide Susceptibility Mapping. Bulletin of Engineering Geology and the Environment, 81(4): 148. https://doi.org/10.1007/s10064-022-02615-0

[29]

Ye, L. Z., 2011. Characteristics of Geo-Hazards and Their Influence Factors in Anxi, Fujian Province. Journal of Geological Hazards and Environment Preservation, 22(2): 46–49(in Chinese with English abstract).

[30]

Zhu, Y.C., Zhuang, F.Z., Wang, D.Q., 2019. Aligning Domain-Specific Distribution and Classifier for Cross-Domain Classification from Multiple Sources. In:Proceedings of the 33rd AAAI Conference on Artificial Intelligence. AAAI Press, Honolulu, Hawaii, USA, 5989-5996. https://doi.org/10.1609/aaai.v33i01.33015989.

基金资助

国家自然科学基金项目(42301002)

福建省水利科技项目(MSK202455)

福建省水利科技项目(MSK202524)

AI Summary AI Mindmap
PDF (21341KB)

54

访问

0

被引

详细

导航
相关文章

AI思维导图

/