采用空谱特征自适应融合网络的军事地质土体分类方法

李雪嫚 ,  魏海平 ,  张志军 ,  张靖玉

信息工程大学学报 ›› 2025, Vol. 26 ›› Issue (05) : 617 -623.

PDF (2507KB)
信息工程大学学报 ›› 2025, Vol. 26 ›› Issue (05) : 617 -623. DOI: 10.3969/j.issn.1671-0673.2025.05.016
测绘科学与技术

采用空谱特征自适应融合网络的军事地质土体分类方法

作者信息 +

Military Geological Soil Classification Method Based on Spatial-Frequency Feature Adaptive Fusion Network

Author information +
文章历史 +
PDF (2566K)

摘要

针对非抵近地区土体要素提取中多源特征融合效率低和土体边界特征表征差等问题,提出采用空谱特征自适应融合网络的军事地质土体分类方法(SFAM-Net)。在编码器—解码器结构上,引入空间和光谱注意力机制,构建双分支特征提取模块来提取影像中土体的空间、光谱特征;通过卷积块注意力模块融合提取特征,并采用自适应融合机制优化特征权重分配。实验结果显示,SFAM-Net能对夹石土、硬土和普通土这3种典型土体类型及其边界信息进行有效区分,平均交并比(mIoU)、平均像素精度(mPA)分别为71.16%和84.60%,较基线模型最佳结果分别提升5.46个百分点和8.11个百分点,验证该方法能够提高军事地质土体分类精准度。

Abstract

To address issues such as low efficiency in multi-source feature fusion and poor characterization of soil boundary features during soil element extraction in non-close-range areas, a military geological soil classification method based on spatial-frequency feature adaptive fusion network (SFAM-Net) is proposed. The spatial and spectral attention mechanisms are introduced in the encoder-decoder architecture, and a dual-branch feature extraction module is constructed to capture both spatial and spectral characteristics of soil in imagery. Features are extracted through the fusion of convolutional block attention modules, and an adaptive fusion mechanism is adopted to optimize the distribution of feature weights. Experimental results demonstrate that SFAM-Net can effectively distinguish three typical soil types, namely rocky soil, hard soil and ordinary soil, and their boundary information. The mean intersection over union (mIoU) and mean pixel accuracy (mPA) are 71.16% and 84.60% respectively, which are 5.46 percentage points and 8.11 percentage points higher than the best result of the baseline model. It is verified that the accuracy of military geological soil classification are improved by using the method.

Graphical abstract

关键词

军事地质土体 / 自适应融合 / 空谱特征 / 注意力机制 / 遥感影像

Key words

military geological soil / adaptive fusion / spatial-frequency feature / attention mechanism / remote sensing images

引用本文

引用格式 ▾
李雪嫚,魏海平,张志军,张靖玉. 采用空谱特征自适应融合网络的军事地质土体分类方法[J]. 信息工程大学学报, 2025, 26(05): 617-623 DOI:10.3969/j.issn.1671-0673.2025.05.016

登录浏览全文

4963

注册一个新账户 忘记密码

土体是由地表上存在地质或工程性质差异的多个土层按照一定的垂直次序排列组合的地质体[1-2],其物理性质和力学性质是军事地质调查的核心内容之一[3]。作为承载陆域综合过程模拟的关键载体,其类型及空间分布信息对于军事装备通行评估具有重要意义[4]。军队物资、兵员投送在和平时期可依托陆地道路机动,而战争时期则需依托越野机动来完成相应任务。精准的军事地质要素和地理要素信息可辅助越野通行建模,其中土体类型是影响军用车辆越野机动性的主要因素[2,5]。因此,高效、精准地获取非抵近区域的土体数据已经成为现代军事行动与决策重点考虑的因素之一。
传统土体类型调查依赖人工采样和实验室分析,成本高且适应性差,难以满足交通欠发达或复杂地形等非抵近地区军事地质调查需求[6]。遥感卫星技术可以非破坏性地获取地表影像,辅助识别和获取不同地质要素的类别和空间分布信息,为非抵近区域土体调查提供新的技术范式[7]。与建筑物、道路等地理环境要素不同,土体受其发育环境和属性渐变性影响,存在光谱特征混淆效应和类间可分性较差。
通过深度学习挖掘遥感影像中地质要素的光谱和空间特征进行遥感地质土体要素解译成为高精度地质要素识别与分类的研究热点,在土体水分、容重等属性反演取得显著进展[8]。然而,针对土体类别分类的研究相对较少。Lu等[9]提出隐式知识引导的自适应特征融合网络用于地质土体解译,解译精度显著提升,但需要人工选择隐式知识。Han等[10]通过自适应多源数据融合网络综合解译多种典型地质要素,但土体要素解译精度较低,难以满足大尺度场景应用需求。魏锦山等[11]通过卷积神经网络和长短时记忆网络两种模型对多种土体进行分类,验证了深度学习结合近红外光谱在土体分类研究中的可行性。冯文康等[12]结合卷积神经网络—随机森林算法构建土体分类回归预测模型,结果发现组合模型分类精度优于单一模型。Padmapriya等[13]使用多堆栈集成学习模型进行土体分类,其在土体多分类任务中性能优于机器学习模型。Jalapur等[14]评估多种深度学习模型在土体分类任务中的性能差异,强调根据任务选择合适模型的重要性。
尽管上述方法验证了深度学习在提升土体分类精度方面的有效性,但实际应用过程中,受遥感数据采集方式因素影响,导致空谱异构特征融合时面临复杂的数据结构和信息差异,融合效率较低;同时,土体渐变边界区域特征变化细微复杂,传统方法难以精准捕捉和表征这些特征。针对上述问题,提出采用空谱特征自适应融合网络的军事地质土体分类方法(Military Geological Soil Classification Method Based on Spatial-Frequency Feature Adaptive Fusion Network, SFAM-Net)。该方法构建空间注意力与频域注意力双分支模块,从Landsat 8和Sentinel 2影像数据中捕捉土体空间结构及光谱特征,并结合自适应特征融合模块优化特征权重,实现非抵近大尺度场景下军事地质土体类型分类。最后,开展消融实验和对比实验评估分析网络的分类精度与性能,验证所提方法的有效性。

1 SFAM-Net方法介绍

SFAM-Net整体框架如图1所示。该网络采用与DeepLab V3+相似的编码器—解码器结构,其中:编码器由多源特征提取模块和自适应数据融合模块组成,能够学习并提取不同类型土体的空谱特征信息并进行有效融合;解码器将网络骨干层输出的浅层特征与自适应数据融合模块输出的强化特征进行拼接,并进行逐步上采样操作,将特征图还原至输入分辨率大小,并作为最终的分类输出结果。

1.1 多源特征提取

多源特征提取主要由基于ResNet 50骨干层构建的两个特征提取分支(融合空间注意力分支与融合频域注意力分支)组成。

首先,两个分支分别从Landsat 8和Sentinel 2数据中提取空间、光谱的浅层特征(如土体边界、颜色及纹理等)和深层特征。

其次,将深层特征传入对应的空间注意力模块(Spatial Attention Module, SAM)和频域注意力模块(Frequency Domain Attention Module, FDAM)获得高级特征。

最后,通过空洞空间金字塔池化模块(Atrous Spatial Pyramid Pooling, ASPP)中的基础卷积、扩展卷积和全局平均池化对输入高级特征依次处理形成强化特征。强化特征可以捕捉土体多尺度的上下文信息,通过与浅层特征互补来识别土体类别之间的细微差别。

1.1.1 空间注意力模块

SAM通过学习特征图中每个空间位置的重要性,使网络聚焦分类任务中的相关区域。由于土体呈现连续状空间分布特征,SAM可对不同空间区域赋予不同的权重来增强图像中的重要区域,从而精确地对目标土体进行分类提取,其结构如图2所示。

首先,SAM通过常规卷积对输入特征图通道数进行压缩,以减少冗余信息。其次,在压缩通道上进行最大池化和平均池化操作,形成新的二维特征图。再次,将特征图按照通道进行拼接并通过卷积操作生成相应的权重图,利用Sigmoid激活函数对权重图进行激活形成空间注意力图。最后,将空间注意力图与原始特征逐元素相乘,得到加权输出特征图。其计算公式如式(1)所示:

Ms(F)=σf7×7[Favg;Fmax]

式中:Ms(F)表示空间注意力权重矩阵;F表示输入特征图;σ()表示Sigmoid激活函数;f7×7表示一个7×7的卷积核的卷积操作;Favg表示平均池化特征图;Fmax表示最大池化特征图;[;]表示连接操作。

1.1.2 频域注意力模块

在图像识别中,高频域用于识别要素边缘细节,而低频域反映要素的均匀区域。频域注意力模块可通过加权不同频域来强化影像中的细节特征,增强对土体边界空间特征的识别能力。FDAM还可以抑制地表覆盖物造成的干扰噪声,提升网络对土体特征提取能力,其结构如图3所示。

首先,FDAM初始化阶段需配置离散余弦变换(Discrete Cosine Transform, DCT)中频率截断阈值和通道缩减比例等关键参数,并基于频率选择策略生成DCT滤波器。其次,将输入特征图经自适应平均池化调整至目标尺寸,再传入DCT滤波器逐元素相乘来提取关键频域特征。再次,通过全连接层压缩通道并加权特征,生成通道注意力权重。最后,使用Sigmoid激活函数对通道注意力权重进行归一化后扩展到原始图像大小,再与原始输入相乘,得到加权输出特征图。其计算公式如式(2)所示:

Wi=σgSelectBasesDCTXi,mx,my

式中:Wi表示第i个通道的注意力权重;g()表示全连接层序列;SelectBases[]表示特定频率分量选择操作;DCT()表示离散余弦变换;Xi表示第i个通道的空间域;mxmy是二维索引,对应DCT变换后的频域特征图中水平和垂直方向的频域分量位置。

1.2 自适应特征融合

直接对特征进行串联操作会导致特征维度剧增,进而影响网络效率。引入卷积块注意力模块(Convolutional Block Attention Module, CBAM)[15],对提取的强化特征进行自适应融合。CBAM在卷积神经网络中被广泛应用,通常用于增强特征提取能力。利用该模块的特性,对特征的通道维度和空间维度进行自适应关注并完成特征融合,从而提升土体分类效果,其结构如图4所示。

首先,使用通道注意力模块(Channel Attention Module, CAM)对接收的强化特征进行通道维度的全局最大池化和平均池化,并将输出结果输入全连接层,再通过元素相加和维度扩展得到相应的特征图。其次,将通道特征图传入SAM进行空间维度的全局最大池化和平均池化操作,再通过全连接层进行连接和Sigmoid激活函数操作,生成空间注意力权重图。最后,将空间注意力权重图与通道注意力权重图逐元素相乘,实现通道与空间维度上特征的自适应融合,并输出自适应融合后的特征图。该方式可根据不同通道和空间位置上特征重要性对特征动态调整,提升特征融合效果。

2 实验与分析

2.1 实验数据

受军事地质土体分类体系不统一、数据保密性高以及数据地理依赖性强等问题影响,目前缺乏足够的数据集支撑全域军事地质土体分类任务。以军事地质要素调查土体定义为基础,结合特定区域土体粒径尺寸、越野通行能力评估和车辆通行适应场景等应用需求[16],划分夹石土、硬土和普通土这3种军事地质土体类型,如表1所示。

实验数据集是在领域专家指导下,以高分辨率遥感影像为参考,以Landsat 8和Sentinel 2遥感影像数据为数据源,结合目视判读、人工标注和数据增强等方式对研究区土体类型进行解译,并制作的真值标签数据。将数据集按照7∶2∶1划分为训练集、验证集和测试集。为弥补样本数据量不足,采用图像翻转、旋转及亮度调整等数据增强方法扩充训练数据集。数据集内容主要包括:研究区范围Landsat 8影像图、Sentinel 2影像图,尺寸均为256×256;普通样本数据集(2 501张×2个遥感影像)及数据增强部分数据集(1 364张×2个遥感影像);样本真值标签及标签介绍。真值标签数据文件为“.tif”格式,其灰度值对应关系为:夹石土1,硬土34,普通土51,水体0,背景255。标签介绍包含数据集中的相关元数据,存储格式为“.txt”。部分数据集展示如图5所示。

2.2 实验环境与设置

实验环境中采用Python 3.8.19和PyTorch 2.2.2搭建深度学习框架,由Intel i7-11700F处理器和NVIDIA GeForce RTX 4090 D显卡提供算力。为优化模型训练过程,SFAM-Net采用Adam算法优化器,通过自适应调整学习率使模型快速收敛,避免陷入局部最优解;选用交叉熵损失函数衡量预测结果与真实标签之间的差异。实验相关参数设置如下:训练批次大小为48,训练迭代次数为100个epochs,初始学习率设置为10-4

2.3 实验评价指标

土体分类本质上属于图像语义分割中的多分类任务,旨在对每个像素进行土体类别判定。为全面评估模型表现,选取4个常用的评估指标:1)像素精度(Pixel Accuracy, PA)通过计算正确分类像素占总像素的比例,反映模型整体准确度。2)平均像素精度(Mean Pixel Accuracy, mPA)通过对每类土体的像素精度取平均值,避免类别不均衡的偏差。3)交并比(Intersection over Union, IoU)通过计算预测结果与真实标签的交集与并集比值,评估土体边界准确性。4)平均交并比(Mean Intersection over Union, mIoU)是对所有类别IoU值计算的平均值,也用于反映模型的整体性能。通过这4个指标的联合评估,可从不同角度全面评估模型在土体分类任务中的效果,其计算公式如下:

APA=RTP+RTNRTP+RTN+RFP+RFN
AmPA=1Ni=1NAPAi
UIoU=RTPRTP+RFP+RFN
UmIoU=1Ni=1NUIoUi

式中:RTPRTNRFPRFN分别表示分类结果中真正例、真反例、假正例、假反例的像素个数;N表示类别数;APAi表示第i类的像素精度;UIoUi表示第i类的交并比。

2.4 结果与分析

2.4.1 消融实验

为评估SFAM-Net中不同模块组件对网络的贡献程度,通过配置Landsat 8和Sentinel 2两种数据进行消融实验。SFAM-Net与DeepLab V3+[17]采用类似的解码器—编码器结构和ASPP模块,故以DeepLab V3+为基线模型进行消融对比。消融实验结果如表2所示。

DeepLab V3+在Landsat 8和Sentinel 2数据上mIoU分别为65.25%和65.70%,表明单源数据下DeepLab V3+模型在分类精度上差异较小。SFAM-Net在融合Landsat 8和Sentinel 2数据后,其mIoU提高至67.70%,表明融合多源数据能够提供更多的土体特征信息,从而改善模型在分类任务中的精度表现。SFAM-Net分别单独加入SAM和FDAM后,mIoU由67.70%分别提升至70.27%、68.48%,mPA由76.18%分别提升至82.35%、80.29%,表明SAM能够有效增强空间特征信息,FDAM能够通过提取光谱特征来提高分类精度。在联合使用SAM和FDAM后,SFAM-Net分类精度显著提升,mIoU和mPA分别提升至71.16%和84.60%。

2.4.2 对比实验

为评估不同模型和单一数据源/多源数据组合的分类精度表现,选择DeepLab V3+、U-Net、SegNet、PSPNet和SegFormer[13-17]进行对比实验。图6展示SFAM-Net与5种经典图像分割模型在Landsat 8和Sentinel 2数据上的整体性能表现。SFAM-Net在多源数据上分类效果表现最佳,mIoU为71.16%,mPA为84.60%。SegFormer凭借全局上下文建模使其分类效果表现较为稳健,mIoU分别为69.28%和69.42%,mPA分别为82.04%和80.19%,但整体性能低于SFAM-Net。DeepLab V3+的ASPP模块使其具有较强的鲁棒性,mIoU分别为65.25%和65.70%,mPA分别为76.49%和66.73%。U-Net在Landsat 8数据上分类精度稳定,但在Sentinel 2数据上mIoU仅为50.03%,鲁棒性较差,可能与其局部特征提取能力不足有关。SegNet在两组数据源下表现一致相近,其分类精度受数据源影响较小。PSPNet整体表现较差,其整体mIoU和mPA均低于70%,可能其固定尺度的池化层无法适应不同数据源中的特征变化。总体来看,U-Net呈现显著样本数据依赖性,PSPNet在土体分类中适用性较差,而DeepLab V3+、SegNet和SegFormer在单一输入的数据源上分类表现较为稳定。SFAM-Net在多源数据上优势突出,且在多尺度特征处理、全局与局部信息平衡及上下文信息整合方面表现优异。

SFAM-Net与5种经典图像分割模型对各类土体类型的分类精度如表3所示。实验结果表明,模型与数据源的不同组合对分类效果具有显著的影响。SFAM-Net的分类性能表现最为突出,在识别夹石土和硬土上均优于其他网络。DeepLab V3+在两种数据源中分类精度基本相同,表现出较强的鲁棒性,但对普通土分类精度表现一般,可能是其对地物纹理特征提取能力较弱导致的。U-Net与Landsat 8组合时的分类效果相对稳定,但在与Sentinel 2组合中的分类精度下降显著,表明U-Net在结合多光谱遥感数据进行土体分类时的鲁棒性较差。SegNet在两种数据源下表现稳定,但在普通土分类精度上略低于SFAM-Net。PSPNet的分类效果表现一般,该网络在土体分类中适用性较差,无法对不同土体类型进行精准分割。SegFormer凭借其全局上下文建模能力,在不同数据源下展现较好的分类效果,对3种类型土体的分类精度也较为接近。

根据测试数据集预测结果,随机选择5个区域进行可视化,对比SFAM-Net与基线模型的土体分类结果的差异性,如图7所示。SFAM-Net对不同类型土体分类效果较好,预测结果与标签数据更为接近。结合单源图像和DeepLab V3+土体分类结果与标签数据误差较大,表明多源遥感数据融合对提升土体分类精度具有一定优势。SFAM-Net网络预测下的土体边界较为清晰,整体轮廓与标签数据相吻合,但在狭长谷地区域存在断裂情况,可能是山体阴影遮蔽影像中的地物特征导致存在分类偏差。DeepLab V3+& Landsat 8的预测结果中对普通土的边界识别效果最差,可能是普通土的光谱特征在Landsat 8的波段间区分度不够,仅通过光谱信息难以精准区分土体类型。而DeepLab V3+& Sentinel 2对夹石土的识别不敏感,可能是夹石土纹理复杂,仅依赖多光谱数据难以完整表征该类型的土体,导致识别效果较差。

3 结束语

针对多源遥感数据空间光谱异构特征融合效率低以及传统卷积网络对土体质地渐变边界特征表征不足等问题,以面向不同车辆越野通行性的土体分类为研究目标,结合空间、频域和卷积块注意力机制构建SFAM-Net,以Landsat 8和Sentinel 2数据为数据源开展相关实验,验证所提方法在复杂非抵近区域土体分类任务中的有效性。实验结果表明,SFAM-Net在两种数据源组合下的分类精度均优于经典图像分割网络,其中夹石土类型的土体分类效果最佳。消融实验验证SFAM-Net中SAM与FDAM模块协同效应能提升分类精度,且对在夹石土与硬土两类土体之间渐变区域的边界区分效果显著提升,验证多模态影像数据特征融合互补的有效性。但当前土体标注数据缺乏,未来研究中需考虑将小样本学习与跨域迁移策略与现有网络进行结合,进一步提升模型在样本数据缺乏条件下的分类效果,提高模型整体泛化能力。

参考文献

[1]

张栋,葛良胜,王卫兵,.军事地质数据的标准化处理与应用[J].地质论评202571(3):814-826.

[2]

李显巨,吴春明,陈伟涛,.军事地质体遥感智能解译技术[M].北京:科学出版社,2019:44-49.

[3]

詹纯,杨虎,梁军,.军事地质土体要素影响军事行动制胜机理研究[J].地质论评202571(3):741-753.

[4]

孙红政,李宏伟,徐哲,.地质要素在工程构筑选址中的影响特性分析[J].测绘与空间地理信息201740(10):199-201.

[5]

PUNDIR S KGARG R D. Development of rule based approach for assessment of off-road trafficability using remote sensing and ancillary data[J]. Quaternary International2021575/576:308-316.

[6]

刘晓煌,孙兴丽,刘玖芬,.陆域军事地质要素的提取及成果表达[J].西北地质201649(3):193-203.

[7]

李爱迪.地形因素影响下重庆市主要土壤的质地类型空间分布预测研究[D].重庆:西南大学,2019:6-13.

[8]

于德浩,龙凡,杨清雷,.现代军事遥感地质学发展及其展望[J].中国地质调查20174(3):74-82.

[9]

LU YHE KXU H Ret al. Remote-sensing interpretation for soil elements using adaptive feature fusion network[J]. IEEE Transactions on Geoscience and Remote Sensing2023,61:No.4505515.

[10]

HAN WLI JWANG Set al. Geological remote sensing interpretation using deep learning feature and an adaptive multisource data fusion network[J]. IEEE Transactions on Geoscience and Remote Sensing2022,60:No.4510314.

[11]

魏锦山,陈争光.基于深度学习与近红外光谱的土壤质地分类模型研究[J].现代农业研究202329(1):8-13.

[12]

冯文康,梁忠伟,刘晓初,.基于CNN-RF模型的广州地区土壤质地识别方法[J].节水灌溉2023(1):47-54.

[13]

PADMAPRIYA JSASILATHA T. Deep learning based multi-labelled soil classification and empirical estimation toward sustainable agriculture[J]. Engineering Applications of Artificial Intelligence2023,119:No.105690.

[14]

JALAPUR SPATIL N. An integrated deep learning framework for soil type classification[J]. SN Computer Science20256(3):251.

[15]

WOO S, PARK JLEE J Yet al. CBAM: convolutional block attention module[C]∥Proceedings of the European Conference on Computer Vision 2018. Cham, Switzerland: Springer, 2018:3-19.

[16]

郭宏伟.顾及军事地质要素的越野路径规划研究[D].郑州:信息工程大学,2022:8-15.

[17]

CHEN L CZHU Y KPAPANDREOU Get al. Encoder-decoder with atrous separable convolution for semantic image segmentation[C]∥Proceedings of the European Conference on Computer Vision 2018. Cham, Switzerland: Springer, 2018:833-851.

AI Summary AI Mindmap
PDF (2507KB)

70

访问

0

被引

详细

导航
相关文章

AI思维导图

/