融合多源遥感数据和改进后Mask R⁃CNN深度学习模型的复杂高原地形区冰湖智能识别

张世殊 ,  李青春 ,  黎昊 ,  向新建 ,  董傲男 ,  窦杰

地球科学 ›› 2025, Vol. 50 ›› Issue (08) : 3132 -3143.

PDF (4514KB)
地球科学 ›› 2025, Vol. 50 ›› Issue (08) : 3132 -3143. DOI: 10.3799/dqkx.2025.041

融合多源遥感数据和改进后Mask R⁃CNN深度学习模型的复杂高原地形区冰湖智能识别

作者信息 +

Intelligent Glacial Lake Identification in Complex Plateau Terrain Regions Using Multi⁃Source Remote Sensing Data and Mask R⁃CNN Deep Learning Model

Author information +
文章历史 +
PDF (4622K)

摘要

冰湖识别是了解冰湖对气候变化的响应和评估冰湖溃决洪水潜在危险的先决条件. 虽然遥感技术使全球冰湖演变的持续监测和评估成为可能,但准确可靠地提取复杂高原地形区的冰湖仍然具有挑战性.提出了融合多源遥感数据和改进后Mask R⁃CNN深度学习模型的复杂高原地形区冰湖智能识别方法,在Mask R⁃CNN模型基础上,通过在骨干网络ResNet⁃50的高层特征(Conv4和Conv5)、FPN 的每个特征图以及 Mask Head 中引入注意力机制. 利用Sentinel⁃2高分辨遥感影像、ALOS⁃DEM及NDWI数据组成多波段数据集,并在青藏高原东南部的林芝市进行测试,并进一步比较了改进后Mask R⁃CNN、U⁃Net、SegNet和DeepLab V3模型在冰湖识别中的性能.改进后的Mask R⁃CNN模型具有更高的准确率,模型的精确度、召回率和准确度值分别达到了91.25%、93.69%、92.89%.它有效地降低了山体阴影、湖水浊度和冻融湖水条件对冰湖识别的影响,并显著提高了小冰湖的识别效率. 为地形复杂高原地形区冰湖识别提供了可靠解决方案,为深度学习与多源遥感数据结合的智能化冰湖提取提供了新的框架和可能性.

Abstract

The identification of glacial lakes is a prerequisite for understanding their response to climate change and assessing potential risks of glacial lake outburst floods (GLOFs). Although remote sensing technology enables continuous monitoring and assessment of global glacial lake evolution, accurately and reliably extracting glacial lakes in complex plateau terrain regions remains challenging. This study proposes an intelligent glacial lake identification method for complex plateau terrain based on multi-source remote sensing data and an improved Mask R⁃CNN deep learning model. Building upon the original Mask R⁃CNN framework, we introduce attention mechanisms at three key components: the high⁃level features (Conv4 and Conv5) of the ResNet⁃50 backbone network, each feature map in the Feature Pyramid Network (FPN), and the Mask Head. Utilizing a multi⁃band dataset composed of Sentinel⁃2 high⁃resolution imagery, ALOS⁃DEM, and Normalized Difference Water Index (NDWI) data, we conducted tests in Nyingchi City, southeastern Tibetan Plateau. Comparative analyses were performed between the enhanced Mask R⁃CNN model and three other models (U⁃Net, SegNet, and DeepLab V3) for glacial lake identification. Results demonstrate that the improved Mask R⁃CNN achieves superior accuracy, with precision, recall, and accuracy values reaching 91.25%, 93.69%, and 92.89% respectively. The enhanced model effectively mitigates interference from mountain shadows, lake turbidity, and freeze⁃thaw conditions on glacial lake identification while significantly improving detection efficiency for small glacial lakes. This research provides a reliable solution for glacial lake identification in complex plateau terrain regions and establishes a novel framework combining deep learning with multi⁃source remote sensing data for intelligent glacial lake extraction, offering new possibilities for related studies.

Graphical abstract

关键词

冰湖 / 复杂高原地形区 / 智能识别 / Mask R⁃CNN模型 / 多源遥感数据.

Key words

Glacial lake / complex plateau terrain / intelligent recognition / mask R⁃CNN model / multi⁃source remote sensing data

引用本文

引用格式 ▾
张世殊,李青春,黎昊,向新建,董傲男,窦杰. 融合多源遥感数据和改进后Mask R⁃CNN深度学习模型的复杂高原地形区冰湖智能识别[J]. 地球科学, 2025, 50(08): 3132-3143 DOI:10.3799/dqkx.2025.041

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

冰湖是由冰川作用形成的或以冰川融水补给为主的湖泊(尹力辰等,2024),是高原地区独特的水体,承载着重要的生态和气候信息. 随着全球气候变化的加剧,冰川融化退缩,冰湖面积和体积不断扩张,至冰碛坝不能承受湖水压力时会发生溃坝现象,引发的洪水或滑坡泥石流等地质灾害对下游居民的生命财产安全带来极大威胁(李宇宸等,2021). 我国的冰湖大部分分布在高海拔、难以到达的高山区域,冰湖的识别和提取面临诸多困难(杨泞滔和聂勇,2024). 首先,冰湖的大小、形状和类型差异显著,导致传统遥感方法难以有效捕捉其细微变化. 其次,山体阴影、浊度、光照和季节变化等环境因素显著影响冰湖的光谱特征,尤其是在冰雪消融季节,云雨和积雪的干扰使得检测误差和遗漏现象普遍存在(李晓恩等,2024). 这对动态冰湖制图和监测,研究冰湖与冰川之间的相互作用,评估冰川融化和下游地区的水资源有效性,以及冰湖溃决灾害的评估和监测预警至关重要(李梦帆等,2024).

传统的冰湖识别方法费时费力,人工成本高,而且对于大尺度范围来说识别起来相对困难(杨成德等,2019). 近年来,基于多源遥感数据的集成方法逐渐成为研究热点(马劲松,2022;蒋紫云,2023;赵航,2023;李晓恩等;2024). 目前,有四种方法被广泛应用于遥感影像的传统大型冰湖识别研究,分别是目视解译、光谱指数阈值法、面向对象制图法以及深度学习. 目视解译法的准确度高,但需要依赖于专家知识和经验,时间和人力成本较高,并且适用范围相对较小,无法快速进行解译(Bhardwaj et al., 2015Tom et al., 2020;陈浩文,2022;Liu et al., 2023;邹强等,2024). 光谱阈值法主要是利用归一化水体指数(NDWI)融合数字高程模型(DEM)衍生的坡度和阴影信息等光谱增强技术,构建最佳阈值,然后对提取的冰湖进行人工检查和校正,该方法的适用性仅限于局部区域,需要人工进行提取后校正(曹昱,2022). 面向对象制图法综合利用冰湖的形态特征和纹理特征,将相似光谱纹理特征的对象分为一类,但由于地物光谱的复杂性,在对象分割过程中会产生许多细小的噪声,自动提取冰湖仍存在不少的错分和漏分(赵航,2023). 在多源遥感数据获取方面,Sentinel⁃2搭载的多光谱成像仪以及其10 m的空间分辨率和较短的重访周期(胡家瑜,2024),ALOS⁃DEM广泛的覆盖区域和12.5 m的空间分辨率,是目前能够免费获取的最高质量数据,更能够较好地支持复杂高原地形区的冰湖识别工作.

随着计算机影像识别技术的快速发展,深度学习领域与冰湖识别领域交叉融合已经成为当前研究热点之一,利用其强大的目标检测和分割能力(Dou et al., 2020),实现对冰湖的精确提取. 一些学者采用卷积神经网络在原理上进行创新提出了一些新的算法模型,如U⁃Net、DeepLab V3+、Faster R⁃CNN、Mask R⁃CNN、YOLO(曹昱,2022;鲁鸣,2022;成顺等,2024)等. 另一些学者则在前人的基础上对算法模型进行改进,优化模型结构或者是与其他算法相结合,提高模型特征提取能力,从而提高识别效率(李均力等, 2011;赵航,2018). 还有一些学者认为深度学习网络模型在多个尺度上提取特征方面仍然存在不足,需要在设计上添加约束条件进行改进(陈方等,2023;郭慧琳等,2024;刘帅琪等,2024). 而Mask R⁃CNN通过目标检测网络提取目标区域,再利用分割网络可对每一个目标区域完成轮廓提取,实现了高分遥感影像目标实例分割(苏步宇等,2024). Mask R⁃CNN能够有效提取局部信息,但缺乏整合全局信息的能力,引起底层特征信息丢失的问题,影响检测与分割的精度(魏翠婷等,2024). 模型的优化策略主要考虑给模型增加自注意力机制(Jin et al., 2022Yun et al., 2023Yu et al., 2024),能够包含全局特征,一方面降低因遮挡导致的目标漏检误检概率,另一方面优化复杂环境下目标丢失的漏检问题. 该方法能够较好地解决传统方法中存在的问题,成为冰湖识别的新方向.

在过去的40年里,全球气候有明显的变暖趋势. 亚洲高山地区的气温上升速度高于全球平均水平和北半球. 喜马拉雅地区分布着1 600多个面积大于0.02 km2的冰湖,其中高危冰湖有207个(邹强等,2024). 冰湖溃决洪水风险最高的地区集中在喜马拉雅山东部,目前的风险水平至少是邻近地区的两倍(车彦军等,2024). 在此基础上,本研究以西藏东南部林芝市为研究区,基于Sentinel⁃2高精度遥感影像数据,引入了Mask R⁃CNN深度学习模型并在骨干网络ResNet⁃50 的高层特征(Conv4和Conv5)、FPN的每个特征图以及Mask Head中引入注意力机制,融合归一化水体指数(NDWI)和DEM衍生的坡度信息的方法进行遥感解译. 该方法采用数据层的堆叠和关键信息捕捉,有效地从数据中提取特征,提高了冰湖识别精度和准确度,对复杂高原地形区冰湖具有良好的识别能力(Zhang et al., 2018). 首先,基于已知的冰湖资料建立冰湖识别样本数据集;然后,基于样本库和多源遥感数据融合信息训练识别模型,并通过识别模型对所有影像数据自动提取出冰湖;最后,基于样本库和多源遥感数据对改进的Mask R⁃CNN、U⁃Net、SegNet和DeepLab V3四种深度学习模型进行训练和测试,比较各算法模型的识别精度. 该识别方法利用多源遥感数据和改进的Mask R⁃CNN深度学习模型,为高原复杂地形区动态冰湖的高精度识别和监测提供了可靠解决方案,并为冰湖溃决灾害风险识别研究提供了技术支持.

1 研究区概况与数据来源

1.1 研究区概况

林芝市地处青藏高原东南部(图1),北部为念青唐古拉山,南部属喜马拉雅山东段,西北部为冈底斯山余脉,东部系横断山脉,海拔在150~7 782 m之间,岭谷高差为1 384~4 596 m,平均海拔为3 100 m左右,位于喜马拉雅山脉附近的峡谷部分属高山峡谷区(陈宫燕等,2023). 该区南邻印度洋,属海洋性季风气候,印度洋的温湿气流沿雅鲁藏布江大峡谷北上,形成了夏季丰富的降水,年降雨量最高可达2 500 mm,常年冰川积雪面积高达6 728.2 km2,占该区土地总面积的5.7%. 河谷地区大多是冬无严寒,夏无酷热. 林芝地区的年均气温呈逐年增加的趋势,在过去30年间,气温上升超过1 ℃,促使冰川大量消融,冰湖数量和规模迅速增加(刘美,2020).

1.2 数据来源

本文主要采用的数据为Sentinel⁃2高分辨率遥感影像. 为提升对冰湖边界提取精度,本文结合ALOS⁃DEM数据,提取相关坡度数据,根据影像数据绿波段与近红外波段计算NDWI. 其中林芝市全域共计26景遥感影像,其空间分辨率为10 m,选取2023年10—11月秋季云雪覆盖量较小的时间段,云量覆盖率小于10%. ALOS⁃DEM数据,其空间分辨率为12.5 m. 本文还使用2017年亚洲高山区30 m分辨率冰湖数据集作为训练样本的补充.

2 研究方法

本文提出的基于多源遥感数据和改进的Mask R⁃CNN深度学习模型的复杂高原地形区冰湖智能识别方法(图2)分为3个阶段:

(1)数据预处理:对Sentinel⁃2的L1C和L2A多光谱遥感数据进行辐射定标、大气校正、图像拼接裁剪、NDWI计算处理. 对ALOS⁃DEM进行坡度提取和重采样. 最终进行波段合成,得到一个六通道的数据集.

(2)训练改进的Mask R⁃CNN深度学习模型:从2023年10—11月的合成训练数据集中随机选择588个样本,将其分为训练和验证数据集来训练模型. 同时对输入图像进行均值标准差归一化处理以提高模型的收敛速度.

(3)模型精度评价:通过精确度、召回率和准确度三项二级评价指标评估识别模型的精度.

2.1 数据预处理

本文使用到的Sentinel⁃2多光谱遥感卫星数据包含L1C和L2A两种级别产品,L1C级数据是经过正射校正和几何精校正的大气表观反射率产品,未经大气校正. L2A级数据主要包含经过大气校正的大气底层反射率数据产品. 为此,ESA发布了专门生产L2A级数据的插件Sen2cor,为L1C级产品进行大气校正.

将经过辐射定标、几何校正、正射校正、大气校正的影像数据进行图像拼接. 使用绿(Green)和近红外(NIR)波段的图像计算NDWI=[(Green-NIR)/(Green+NIR)]数据. 坡度数据利用ALOS⁃DEM进行提取,由于DEM数据与影像数据分辨率不一致,借助ArcGIS进行重采样至10 m. 最后将Sentine⁃2的红、绿、蓝、近红外与NDWI、坡度数据进行波段合成,形成一个六通道的数据集.

2.2 深度学习模型架构

Mask R⁃CNN是一种先进的实例分割算法,基于Faster R⁃CNN改进而成,可同时实现目标检测和语义分割任务. 其主要模块包括骨干网络、区域候选网络(RPN)、ROI Align 和检测头网络(Head),并通过卷积神经网络提取图像特征,构建特征金字塔以提升检测精度. 在Mask R⁃CNN中,ResNet和feature pyramid networks (FPN)被用作骨干网络,对输入图像进行处理并生成特征金字塔以进行进一步的特征提取(Zhang et al., 2020). 通过RPN在特征金字塔上生成不同大小和比例的候选区域,并对这些潜在目标进行分类和边界框生成. Mask R⁃CNN采用RoI Align层来保持图像和掩膜之间的空间对应关系,从而实现精确的像素级掩膜预测. 最后,每个RoI的对齐特征映射提供两个分支:一个用于目标分类和边界框回归,另一个用于分割掩膜的预测(Dell et al., 2022). Mask R⁃CNN采用多任务的训练方式,综合考虑了目标分类损失、边界框回归损失和分割掩膜损失. 这些损失函数共同推动着模型的优化和学习过程,以提高目标检测和分割的性能.

L=Lcls+Lbox+Lmask,
Lmask=Sigmoidmaskk,

其中:Lcls为目标分类损失;Lbox为边界框回归损失;Lmask为第k个掩膜损失. Lmask定义为第k个掩码上的平均二进制交叉熵,并由掩膜上的每像素Sigmoid计算.

本文提出的Mask R⁃CNN的改进方法,通过在骨干网络ResNet⁃50的高层特征(Conv4和Conv5)、FPN的每个特征图以及Mask Head中引入CBAM(convolutional block attention module)注意力机制,进一步提升了模型的性能. CBAM模块通过对通道和空间两个维度上的注意力增强,使得模型能够更好地捕捉关键信息,特别是在复杂背景中的表现(Wang et al., 2023). 在骨干网络和FPN中加入CBAM,有助于提升高层次特征与多尺度特征的鲁棒性,从而优化目标检测和分割任务. 具体来说,骨干网络中的高层特征图经过CBAM强化,使得模型在处理具有丰富语义的高层特征时更加敏感. 而在FPN中的每个特征图上加入CBAM,有助于提升多尺度特征的融合能力,使得模型在不同大小的冰湖检测上具有更高的精度. 最后,在Mask Head中引入CBAM,进一步优化了掩膜分支的细节处理能力,提高了像素级分割的精度(Dong et al., 2024).

ResNet50为骨干网络用于提取图像特征,结合FPN将位置精确的顶层特征和语义丰富的底层特征进行融合处理. 其核心思想是通过恒等映射[fx)+x]提升特征提取速度,同时减少梯度消失问题. 在引入CBAM后,ResNet不仅保留了其快速提取特征的能力,还增强了对通道和空间信息的感知能力. 本文研究中使用的ResNet50是一个具有50层的深度残差网络,并结合CBAM模块的改进,使得其特征提取能力得到增强.

FPN(feature pyramid network)网络充分利用了各个阶段提取得到的特征,通过对上层特征图进行升采样并与下一层特征相加,得到融合后的新特征层. 在本文的改进中,每个特征层的输出通过CBAM进一步强化,提升了对不同尺度冰湖的检测精度. FPN在保持较低计算量的同时,通过引入CBAM进一步提高了多个尺度下冰湖的检测准确性和快速检测能力.

RPN(region proposal network)是基于卷积神经网络结构对前面经过ResNet和FPN得到的特征层进行进一步的判定,筛选出可能存在冰湖目标的位置,将挑选候选区域的操作集成到目标检测框架中. ROI Align通过双线性插值优化了ROI Pooling带来的空间位置错位问题. 经过ROI Align得到的统一大小的感兴趣区域,分别进入分类回归分支和掩膜分支. 分类回归分支通过两个大小为1 024的全连接层进一步对目标类别和边界框进行精确判断与回归. 在本文的改进中,Mask Head也引入了CBAM模块,使得分割掩膜的预测更加准确,特别是在进行小型冰湖分割任务时表现出色.

2.3 实验设计

为了训练和验证模型,本研究从2023年10—11月的合成训练数据集中随机选择了588个样本(表2),冰湖标记为1,背景用0表示. 为了符合改进后Mask R⁃CNN模型的输入要求,每个样本使用256×256(像素)的切片窗口,将带合数据和相应的标签划分为大小相同的图像切片. 图像块之间的重叠设置为16像素. 最终,不包含冰湖像素的图像切片被排除在外. 为了扩充样本数量,采用随机裁剪和四方向旋转的方法进行样本增强. 共生成2 352个图像切片及其对应的标签,将其随机分为训练数据集(90%)和验证数据集(10%)(张轩宇等,2025). 对输入图像切片进行归一化处理可以显著提高模型的收敛速度,本研究采用均值标准差法对所有输入图像块进行归一化(公式3). 最后,均使用以上基本方法运用训练数据集对改进的Mask R⁃CNN、U⁃Net、SegNet和DeepLab V3进行训练,并使用训练的模型对测试数据集进行识别,对比其精度.

xi'=xi-xminxmax-xmin,

其中:xi表示第i个原始数据点;xmin是原始数据集中的最小值;xmax是原始数据集中的最大值;xi'是对应的第i个原始数据点归一化值.

2.4 精度评价方法

本文采用二级评价指标精确度、召回率和准确度作为识别模型的精度评价. 精确率(Precision)表示正确识别为冰湖与识别为冰湖的实例个数的比例;召回率(Recall)表示正确识别为冰湖占实际冰湖实例数量的比例;准确度(Accuracy)表示预测为冰湖占预测正确的比例.

Precision=TPTP+FP,
Recall=TPTP+FN,
Accuracy=TP+TNTP+FN+TP+FN,

其中:TP为真阳性,它代表应用方法准确描述的冰湖区域; FP为假阳性,它被定义为应用方法检测到的非冰湖区域作为图像中的冰湖区域; FN为假阴性,它显示应用方法未检测到的实冰湖坡区域; TN为真阴性,它显示应用方法检测到的非冰湖区域.

3 结果与分析

3.1 深度学习模型训练结果

根据测试数据集的预测结果,随机选择4个典型冰湖识别样区,对比改进的Mask R⁃CNN、U⁃Net、SegNet和DeepLab V3四种模型对冰湖提取结果的差异性. 如图4所示,展示了4个典型样区的Sentinel⁃2假彩色影像及样区的标记标签和各模型的识别结果. 总体来看,4个模型对冰湖的识别的效果均较好,但在细小冰湖和冰湖边界提取上有部分差异. 改进的Mask R⁃CNN模型与参照标签数据的匹配度最好,其次为U⁃Net模型,SegNet和DeepLab V3的冰湖提取效果相对较差. 结果表明,与改进的Mask R⁃CNN相比,U⁃Net在描述冰湖上存在一定的局限性,如忽略了小型湖泊,低估了冰湖的范围. U⁃Net模型也倾向于合并相邻的冰湖,当湖泊位于图像块的角落时,改进的Mask R⁃CNN的性能明显优于U⁃Net. SegNet和DeepLab V3在一些小冰湖的提取上同样存在遗漏问题,同时SegNet在阴影的处理上明显更弱. 改进的Mask R⁃CNN在对于阴影和冰湖浑浊带来的异常反射光谱的处理上具有更好的识别效果. 因此,改进的Mask R⁃CNN在应对与冰湖识别相关的挑战,如小型冰湖和阴影或冰川等因素的影响等方面表现出更强的能力.

图5展示了4个模型的训练平均损失变化. 改进后Mask R⁃CNN在epoch=1时就显示出收敛迹象,在epoch=5后其平均损失降至0.1以下,此后保持稳定状态. 相比之下,U⁃Net和DeepLab V3的收敛开始于epoch=5,其平均损失在epoch=12后降至0.1以下. SegNet在epoch=10时开始收敛,其平均损失在epoch=15后降至0.1以下. 经过20次的训练,我们观察到改进后Mask R⁃CNN表现出的平均损失值相对低于其他3个模型. 因此,与U⁃Net、SegNet和DeepLab V3模型相比,改进后的Mask R⁃CNN模型表现出更强的学习能力,需要更少的训练迭代和更少的时间. 此外,一旦达到收敛状态,改进后Mask R⁃CNN的训练损失也会减少.

3.2 精度评价

基于测试数据集,分别使用精确度、召回率和准确度评估改进后Mask R⁃CNN、U⁃Net、SegNet和DeepLab V3四种模型对冰湖提取的准确性. 模型对比结果如表3所示,改进后Mask R⁃CNN模型的精确度、召回率和准确度值分别为:0.912 5、0.936 9、0.928 9. 对比U⁃Net、SegNet和DeepLab V3模型,改进后Mask R⁃CNN模型在识别性能上优于其他3个模型,在各个精度评估指标上都取得了显著的提升. 相较于U⁃Net模型,在精确率、召回率和准确度上分别提升了4.94%、9.15%、4.6%. 相较于SegNet和DeepLab V3模型在各项指标中均有10%左右的提升.

4 结论与讨论

4.1 讨论

在气候变化的背景下,冰川湖的动态性日益明显,其数量和规模的波动显著. 因此,迫切需要精确的冰湖识别方法,以有效地捕捉这些湖泊所表现出的复杂动态. 不同于传统的耗时的人工数字化方法和半自动方法,本文采用的基于改进的Mask R⁃CNN深度学习模型的冰湖识别方法,与一些关于冰湖提取的深度学习研究(窦杰等,2023;刘帅琪等,2024;杨泞滔和聂勇,2024;尹力辰等,2024)相比,改进的Mask R⁃CNN模型需要的输入数据集层数更少,训练迭代次数更少,收敛速度更快,并且保持稳定.

冰湖识别面临多重挑战,包括目标小且分散使得传统遥感方法难以捕捉. 当冰湖与被碎屑覆盖的冰川相连时,冰川碎屑和浑浊的水经常与湖泊背景混合在一起,在融化季节,其颜色受到水体中溶解有机物、悬浮颗粒物、天气、季节、光照等条件因素影响较大,阴影、反射等现象会导致冰湖特征发生变化,增加识别难度. 另外,受光照条件影响,山体背阴面产生的阴影区域在纹理上表现出光滑、颜色均一等特征,在多光谱影像上也与冰湖较难区分,即使在人工数字化过程中也很难划定湖泊边界.

为减少以上冰湖识别问题,本文提出的改进的Mask R⁃CNN深度学习模型冰湖识别方法,融合了高分辨率ALOS⁃DEM高程数据生成的坡度数据和NDWI,显著减少了水体浑浊度以及山体阴影对冰湖识别的影响与误判. 但在整个融化季节,当冰湖在整个消融季节都被冰川碎屑覆盖时,仍然有小区域的冰川碎屑被错误地归类为非湖泊. 同时,本文选用的低于10%云量的遥感影像在局部区域仍然对冰湖识别具有干扰,要充分解决冰川碎屑和云量覆盖对湖泊圈定的影响仍然具有挑战性. SAR 数据具有全天时、全天候的观测能力,且对地表的穿透能力较强,能够获取到被碎屑和云量部分遮挡的冰湖信息,是本文未来的研究方向.

目前的一些冰湖溃决灾害研究结果表明:小冰湖(<0.05 km2)的形成和演化是冰川灾害发生的重要前兆,及时监测和分析小冰湖的变化,有助于预测和预防冰川坍塌、冰湖溃决等灾害的发生. 因此小冰湖的提取能力是评价冰湖提取方法有效性的重要标准. 本研究使用的Sentinel⁃2数据具有较高的空间分辨率,对小冰湖的识别与提取具有更高的实用性. 同时,本研究的冰湖标注数据依据中国冰川第二次编目数据结合人工标注,数据集包含了大量小冰湖样本,使训练的深度学习模型结果对小冰湖更加友好,并提取更精确的冰湖边界. 林芝市共识别出3 015个冰湖,其中1 658个为小冰湖. 根据2017年亚洲高山区30 m分辨率冰湖数据集,该区域小冰湖数据为1 157个,本识别方法对小冰湖的识别效率提高约45%. 因此,本研究提出的冰湖识别方法在准确识别和绘制小型冰湖方面表现出色,有助于提高湖泊提取的整体准确性.

冰湖的存在及动态变化可能引发滑坡或冰湖溃决事件,导致下游洪水灾害,对基础设施工程构成严重威胁(Dou et al., 2025). 因此,在高原复杂地形中准确、及时地识别冰湖对重大水利水电工程具有重要应用价值. 通过提升冰湖识别精度,可开展灾害风险评估并建立有效预警系统,从而降低灾害发生概率. 此外,高原地区冰湖的空间分布特征为基础设施选址提供了关键参考依据,精确识别冰湖位置有助于规避潜在风险区域的工程建设,进而提升工程安全性与运行可靠性.

4.2 结论

本研究提出了一种适用于复杂高原地形区的冰湖智能识别方法,融合了多源遥感数据与改进的Mask R⁃CNN 深度学习框架,主要结论如下:

(1)提出多层级注意力融合机制,通过将通道-空间注意力模块嵌入ResNet⁃50骨干网络(Conv4/5层)、特征金字塔网络(FPN)及Mask Head,实现了局部细节与全局特征的协同优化. 该优化使模型在标记数据需求低、精度高、训练时间短、模型轻量化的情况下,能够快速收敛,减少训练迭代次数,仅需少量训练样本即可达到92.89%的总体精度,且训练迭代次数减少约一倍.

(2)构建了融合Sentinel⁃2多光谱影像、NDWI水体指数与ALOS⁃DEM地形参数的多维特征数据集,通过光谱-空间-地形特征联合解析,显著提升复杂场景下的识别鲁棒性. 改进模型对山体阴影、冻融期冰面及浑浊水体的误判抑制效果突出,其混淆矩阵显示阴影区域虚警率得到有效降低.

(3)在藏东南林芝地区的验证表明,改进模型综合性能指标(Precision=93.25%,Recall=94.69%)较U⁃Net等主流模型提升约5~8个百分点,特别是对小冰湖(<0.05 km2)的识别能力相比历史数据集提高约45%.

本研究提出的冰湖识别方法在精度、稳定性和计算效率方面表现优越,能够可靠、有效地提取复杂高原地形区的冰川湖泊. 未来可结合SAR 数据增强云层穿透能力,进一步提升冰湖在云覆盖及冰川碎屑覆盖环境下的识别能力. 此外,引入时序分析可构建冰湖动态变化模型,为冰湖溃决灾害预警提供更精准的数据支撑.

参考文献

[1]

Bhardwaj, A., Singh, M. K., Joshi, P. K., et al., 2015. A Lake Detection Algorithm (LDA) Using Landsat 8 Data: a Comparative Approach in Glacial Environment. International Journal of Applied Earth Observation and Geoinformation, 38: 150-163. https://doi.org/10.1016/j.jag.2015.01.004

[2]

Cao, Y., 2022. Automatic Detection of Himalayan Glacial LakesUsing Deep Convolutional Neural Network (Dissertation). University of Electronic Science and Technology of China, Chengdu (in Chinese with English abstract).

[3]

Che, Y.J., Chen, L.H., Wu, J.K., et al., 2024. Progress in the Study on The Interaction Between Proglacial Lake and Lake⁃Terminating Glacier Over the Qinghai⁃Tibet Plateau. Climate Change Research, 20(5):519-533 (in Chinese with English abstract).

[4]

Chen, F., Wang, J.X., Zhang, M.M., et al., 2023. Comparative Study on the Extraction Methods of Himalayan Glacial Lakes Based on Historical Boundaries. Journal of Glaciology and Geocryology, 45(4):1413-1427 (in Chinese with English abstract).

[5]

Chen, G.Y., Li, T., Chen, J., et al., 2023. Primary Establishment of an Early Warning Model of Debris Flow Hazards In Nyingchi City of Tibetan Autonomous Region Based on Raster Runoff Simulation. The Chinese Journal of Geological Hazard and Control, 34(1):110-120 (in Chinese with English abstract).

[6]

Chen, H.W., 2022. Study on Vulnerability Assessment and Risk Prediction of Glacier Lake Outburst Floods in Tibetan Plateau (Dissertation). Chengdu University of Technology, Chengdu (in Chinese with English abstract).

[7]

Cheng, S., Li, J.R., Wang, Z.Q., et al., 2024. Lightweight Underwater Optical Image Recognition Algorithm Based on YOLOv8. Laser & Optoelectronics Progress, 62(4): 402-412 (in Chinese with English abstract).

[8]

Dell, R.L., Banwell, A.F., Willis, I.C., et al., 2022. Supervised Classification of Slush and Ponded Water on Antarctic Ice Shelves Using Landsat 8 Imagery:CORRIGENDUM. Journal of Glaciology, 68(268):415-416. https://doi.org/10.1017/jog.2022.15.

[9]

Dong, A. N., Dou, J., Li, C. D., et al., 2024. Accelerating Cross⁃Scene Co⁃Seismic Landslide Detection through Progressive Transfer Learning and Lightweight Deep Learning Strategies. IEEE Transactions on Geoscience and Remote Sensing, 62: 4410213. https://doi.org/10.1109/TGRS.2024.3424680

[10]

Dou, J., Xing, K., Wang, L.Z., et al., 2025. Air⁃Space⁃Ground Synergistic Observations for Rapid Post⁃Seismic Disaster Assessment of 2025 Ms6.8 Xigaze Earthquake, Xizang. Journal of Earth Science, 1-18. https://doi.org/10.1007/s12583⁃025⁃0160⁃2

[11]

Dou, J., Yunus, A. P., Merghadi, A., et al., 2020. Different Sampling Strategies for Predicting Landslide Susceptibilities Are Deemed less Consequential with Deep Learning. Science of the Total Environment, 720: 137320. https://doi.org/10.1016/j.scitotenv.2020.137320

[12]

Dou,J., Xiang, Z.L., Xu, Q., et al.,2023. Application and Development Trend of Machine Learning in Landslide Intelligent Disaster Prevention and Mitigation. Earth Science, 48(5): 1657-1674 (in Chinese with English abstract).

[13]

Guo, H.L., Xie, Y.L., Hu, L.F., et al., 2024. Water Body Extraction from Remote Sensing Images Based on Improved HarDNet⁃MSEG. Journal of GeoInformation Science, 26(7): 1745-1762 (in Chinese with English abstract).

[14]

Hu, J.Y., 2024. Evolution of a Typical Moraine Lake and Simulation of Potential GLOF in Southeastern Tibet (Dissertation). Northwest Normal University, Lanzhou (in Chinese with English abstract).

[15]

Jiang,Z.Y.,2023.Study on Kyagar Glacier Movement and Its Influence on Glacial Lake Variation Under Climate Change (Dissertation). Xinyang Normal University, Xinyang (in Chinese with English abstract).

[16]

Jin, S. Z., Dai, H. J., Peng, J., et al., 2022. An Improved Mask R⁃CNN Method for Weed Segmentation. 2022 IEEE 17th Conference on Industrial Electronics and Applications (ICIEA). December 16-19, 2022, Chengdu, China. IEEE, 1430-1435. https://doi.org/10.1109/ICIEA54703. 2022.10006300

[17]

Li, J.L., Sheng, Y.W., Luo, J.C., 2011. Automatic Extraction of Himalayan Glacial Lakes with Remote Sensing. Journal of Remote Sensing, 15(1): 29-43 (in Chinese with English abstract).

[18]

Li, M.F., Zheng, J.H., Qian, A.L., et al., 2024. Research on the Extraction Method of Tianshan Glacier Lake Based on Decision Tree. Arid Zone Research, 41(10):1699-1707 (in Chinese with English abstract).

[19]

Li,X.E.,Liu,Y.,Jiang,L.M.,et al.,2024.A Review on Remote Sensing Monitoring of Glacial Lake Change and Glacial Lake Outburst Floods in Mountain Glacier Regions. Journal of GeoInformation Science,26(4):1019-1039 (in Chinese with English abstract).

[20]

Li,Y.C.,Zhang,Jun.,Liu,C.L.,2021.Extraction Method of Alpine Small Glacial Lake in Qianhu Mountain Area of Yunnan Province Based on Sentinel⁃2 Image. Science of Surveying and Mapping,46(4):114-120 (in Chinese with English abstract).

[21]

Liu, B.X., Wang, W., Li, W.P., 2023. A Lake Extraction Method Combining the Object⁃Oriented Method with Boundary Recognition. Land, 12(3):545.https://doi.org/10.3390/land12030545

[22]

Liu, M., 2020. Glacial Lake Outburst Flood/Debris Flow Disaster Mechanism and Hazards Assessment in Bhote Koshi Basin (Dissertation). University of Chinese Academy of Sciences (Institute of Mountain Hazards and Environment, Chinese Academy of Sciences), Chengdu (in Chinese with English abstract).

[23]

Liu, S.Q., Li, J.L., Li, R.N., et al., 2024. Mapping and Spatial Distribution Characteristics of Glacial Lakes in Xinjiang Based on Sentinel⁃2 Imagery. Journal of Glaciology and Geocryology, 46(2):513-524 (in Chinese with English abstract).

[24]

Lu, M., 2022. Research on Water Extraction Method of High⁃Resolution Remote Sensing Images by Using Restricted Labeling (Dissertation). Hunan University, Changsha (in Chinese with English abstract).

[25]

Ma, J.S., 2022. Spatially and Temporally Resolved Monitoring of Global Glacial Lake Changes Based on Multi⁃Source Remote Sensing (Dissertation). Nanjing University of Information Science and Technology, Nanjing (in Chinese with English abstract).

[26]

Su, B.Y., Du, X.P., Mu, H.W., et al., 2024. Coupling Mask R⁃CNN and Attention Mechanism for Building Extraction and Post⁃Processing Strategy. Remote Sensing Technology and Application, 39(3):620-632 (in Chinese with English abstract).

[27]

Tom, M., Prabha, R., Wu, T.Y., et al., 2020. Ice Monitoring in Swiss Lakes from Optical Satellites and Webcams Using Machine Learning. Remote Sensing, 12(21):3555.https://doi.org/10.3390/rs12213555

[28]

Wang, H.R., Wei, J.W., Gao, X.Y., et al., 2023. Enhanced Mapping of Supraglacial Lakes Through Dual⁃Attention Deep Neural Network. Proceedings of the 31st ACM International Conference on Advances in Geographic Information Systems, 1-4.https://doi.org/10.1145/3589132. 3629972

[29]

Wei, C.T., Zhao, W.J., Sun, B.C., et al., 2024. Intelligent Rebar Inspection Based on Improved Mask R⁃CNN and Stereo Vision. Journal of Zhejiang University (Engineering Science), 58(5):1009-1019 (in Chinese with English abstract).

[30]

Yang,C.D.,Wang,X.,Wei,J.F.,et al.,2019.Chinese Glacial Lake Inventory Based on 3S Technology Method. Acta GeographicaSinica, 74(3):544-556 (in Chinese with English abstract).

[31]

Yang,N.T.,Nie,Y.,2024.An Improved Deep Learning Method for Mapping Glacial Lakes Using Satellite Observation and Its Application. Spacecraft Recovery & Remote Sensing 45(1): 41-52(in Chinese with English abstract).

[32]

Yin,L.C.,Wang,X.,Yin,Y.S.,et al.,2024.Automatic Extraction of Glacial Lakes Based on Deep Learning and Sentinel⁃2 Imagery. Remote Sensing Technology and Application,39(6):1319-1329 (in Chinese with English abstract).

[33]

Yu, C., Sun,Y., Cao, Y., et al., 2024. Log Volume Measurement and Counting Based on Improved Cascade Mask R⁃CNN and Deep SORT. Forests, 15(11): 1884. https://doi.org/10.3390/f15111884

[34]

Yu, C.J., Sun, Y.K., Cao, Y., et al., 2024. Log Volume Measurement and Counting Based on Improved Cascade Mask R⁃CNN and Deep SORT. Forests, 15(11):1892.

[35]

Yun, L., Zhang, X.X., Zheng, Y.X., et al., 2023. Enhancing the Accuracy of Landslide Detection in UAV Images Using an Improved Mask R⁃CNN Model: A Case Study of Sanming, China. Sensors, 23(9):4287.https://doi.org/ 10.3390/s23094287

[36]

Zhang, W.X., Witharana, C., Liljedahl, A.K., et al., 2018. Deep Convolutional Neural Networks for Automated Characterization of Arctic Ice⁃Wedge Polygons in Very High Spatial Resolution Aerial Imagery. Remote Sensing, 10(9):1487.https://doi.org/10.3390/rs10091487

[37]

Zhang, X.W., Jin, J.J., Lan, Z.Z., et al., 2020. ICENET: A Semantic Segmentation Deep Network for River Ice by Fusing Positional and Channel⁃Wise Attentive Features. Remote Sensing, 12(2): 221.https://doi.org/10.3390/rs12020221

[38]

Zhang, X.Y., Zhou, S.H., Huang, J., et al., 2025. High⁃Order Spatial Feature Extraction Based Small Target Detection for UAV Aerial Photographs. Computer Engineering and Applications. (in Chinese with English abstract).

[39]

Zhao, H., 2018. The Research of Glacial Lake Extraction Based on Landsat⁃8 OLI Imagery in High Mountain Region of Asian (Dissertation). University of Chinese Academy of Sciences (Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences), Beijing (in Chinese with English abstract).

[40]

Zhao,H.,2023.The Research of Detection and Risk Evaluation of Glacial Lakes Based on Feature⁃Learning Methods across High Mountain Asia (Dissertation). University of Chinese Academy of Sciences (Xi'an Institute of Optics and Precision Mechanics, Chinese Academy of Sciences), Beijing (in Chinese with English abstract).

[41]

Zou, Q., Zhou, B., Yang, T., et al., 2024. Spatio⁃Temporal Differentiation Characteristics of Glacial Lake Outburst in the Himalayas. Earth Science, 49(11):4047-4062 (in Chinese with English abstract).

基金资助

国家自然科学基金重大项目(42090054)

国家自然科学基金面上项目(42477170)

AI Summary AI Mindmap
PDF (4514KB)

25

访问

0

被引

详细

导航
相关文章

AI思维导图

/