0 引言
获取森林树种组成、分布情况是森林多样性监测的基础,也是森林保护、森林可持续经营的前提。树种多样性作为森林生物多样性的核心指标,可为所有其他森林物种提供栖息地和资源而显得尤为重要。然而,气候变化与人类活动的影响导致全球森林树种多样性正在以前所未有的速度遭受损失
[1-2]。因此,监测森林树种分布与多样性已成为生态保护与森林资源管理的重要基础和关键前提。基于野外调查的森林树种分布与多样性监测方法虽然精度较高,但存在成本高、效率低等缺点
[3],而遥感技术能提供多平台数据,包括多光谱、高光谱和激光雷达数据,能够获取森林植被的空间分布、结构和光谱信息,从而更全面地了解森林树种分布以及多样性的动态变化,可为森林生态系统的保护和可持续管理提供更科学、更精准的支持
[4-5]。
利用遥感数据监测森林树种空间分布的方法通常是提取特征参数,并将获取的参数通过机器学习算法进行树种分类或识别。通过这种方法,进而可以实现对森林的树种多样性估测、生物量反演等目标。如Dong等
[6]基于机器学习的自适应模糊C均值聚类算法对机载激光雷达和高光谱数据在单木尺度实现了对亚热带乔木物种多样性的监测。刘鲁霞等
[7]利用高分二号遥感数据和随机森林模型监测亚热带天然林的多样性,结果表明,Pielou均匀性指数的估测精度最高(
R²=0.61),而Shannon-Wiener和Simpson多样性指数的估测精度的
R²均超过0.45。吴倩
[8]基于机载的高光谱数据对比了随机森林、多元线性回归以及支持向量3种机器学习模型对森林乔木多样性的遥感估测能力,通过验证得出随机森林模型具有最强且最稳定的估测能力。衣海燕等
[9]基于机载激光雷达和高光谱数据,通过机器学习聚类方法构建森林树种多样性遥感估算模型,在古田山自然保护区开展了森林乔木物种多样性监测,估测结果显示,Shannon-Wiener指数和Simpson指数的
R²都超过了0.8。Pak-Kagan等
[10]基于机载高光谱数据和实地调查的树冠纹理特征,通过支持向量机算法实现了树种识别,并基于识别结果计算了森林乔木树种多样性,进而实现了树种多样性制图。Kayet等
[11]基于Hyperion遥感图像通过支持向量机算法实现了森林树种识别(模型的总体精度为85.16%、Kappa系数为0.78)。Ma等
[12]基于激光雷达的衍生特征,随后利用机器学习方法的随机森林和支持向量回归实现了森林地上生物量反演。总之,基于遥感技术结合机器学习算法,在森林树种监测方面得到了广泛应用,为森林资源的评估提供了可靠的技术手段。然而,遥感数据的高维特性和复杂性可能导致特征选择过程中的计算量大,增加模型训练的时间和资源消耗;同时,特征筛选过程中可能会遗漏一些微小但重要的特征,导致模型无法全面反映森林树种的特征。最后,在特征选择方面还需要进行大量的试验和验证,以确定最佳的特征组合和模型参数,这需要研究者具备专业的知识和丰富的经验。
随着人工智能和大数据的发展,深度学习
[13]成为遥感领域新的研究热点。与传统的机器学习方法相比,深度学习的特点是神经层的数量显著增加,从而获得更高级别的属性,并揭示更复杂的层次关系
[14]。这使得深度学习在处理遥感数据时,表现出更强的学习能力和更高的预测精度
[15]。卷积神经网络(convolutional neural network,CNN)是一种广泛应用的深度学习算法,可以自动学习和识别数据中的复杂特征,其在林业遥感领域已经得到了广泛的应用
[16]。Xi等
[17]基于OHS-1高光谱数据利用卷积神经网络实现了对中国东北地区的森林树种分类,总体准确率达到了85.04%。Bai等
[18]基于星载的Sentinel-1和Sentinel-2数据集合多季节遥感植被特征通过卷积神经网络实现了对森林类型的分类,其分类准确率达到了97.41%,该研究表明结合多源遥感数据和CNN,可以提升分类精度。徐志扬等
[19]探究了激光雷达单木分割辅助条件下无人机可见光图像树种识别应用潜力,提出联合卷积神经网络(CNN)和集成学习(ensemble learning,EL)的树种识别方法,验证了可见光图像联合激光雷达数据可以实现树种识别精度的提高。Timilsina等
[20]基于对象的卷积神经网络,通过使用卫星、谷歌地球图像和光探测与测距(LiDAR)数据集绘制2005—2015年的城市树木覆盖变化图。Lee等
[21]基于双季节的高分辨率无人机光学和雷达数据对比了不同CNN模型的树种识别精度,并绘制了研究区树种图。Fricker等
[22]基于卷积神经网络模型识别了针阔混交林的树种,识别的平均F-score为0.87。综上所述,基于卷积神经网络的树种识别或分类在效率和精度方面已经取得了较好的效果,但是卷积神经网络模型在处理不同类型的森林遥感数据时,不具有通用适应性。由于不同数据集在光谱分辨率、空间分辨率等方面存在显著差异,这就需要对卷积神经网络模型进行优化调整,以充分挖掘遥感数据的特征变量,进一步提升模型的精度和效率。
目前,对森林树种分布研究大多是在星载以及机载平台上实现,而无人机凭借其成本低、机动灵活性强,以及更易获取高精度遥感数据等技术优势在提取森林结构参数方面应用广泛,为精细尺度的物种多样性监测提供了平台支撑
[23]。通过无人机获取的高分辨率激光雷达点云数据可以实现精确的森林单木分割,高分辨率的高光谱数据能捕捉到更多的细节,从而提高树种识别的精度。同时,联合激光雷达与高光谱影像等多源遥感数据比单一遥感数据源更有利于对森林树种的识别
[24]。最后,卷积神经网络模型网络结构的改进,如增加网络的结构与深度、采用注意力机制等可以提高树种识别和分类能力。因此,为探究利用无人机高光谱和激光雷达数据联合改进的卷积神经网络提升森林树种识别的精度、效率以及实现树种多样性的估测,本研究以中国东北地区的针阔混交林为研究对象,通过无人机获取研究区高分辨率的激光雷达点云和高光谱数据,以单木尺度为研究对象,结合高效通道注意力机制网络(efficient channel attention network,ECA-Net)构建改进的卷积神经网络(CNN)模型CNN-EGNet,用其进行研究区的树种识别与制图。同时基于树种识别结果,计算研究区的树种多样性指数,以期为东北地区的针阔混交林的树种多样性监测与保护管理提供技术支持与决策参考。
1 研究区与数据获取
1.1 研究区域概况
研究区位于黑龙江省尚志市帽儿山地区(127°35′—127°38′E,45°22′—45°24′N),地势较为平缓,面积约为174 000 m2。该区域属于温带大陆性季风气候,年平均温度为3.1℃,平均年降水量为629 mm,为东北东部山区较为典型的针阔混交林,平均树高约为16 m,森林郁闭度在0.7以上,主要树种包括落叶松(Larix gmelinii)、榆树(Ulmus pumila)、胡桃楸(Juglans mandshurica)和白桦(Betula platyphylla)等。
1.2 数据获取
1.2.1 无人机激光雷达
激光雷达数据采集于2023年9月13日,目标区域天气晴朗无云,风速小于3.0 m/s。该任务使用了飞马D2000无人机,配备了双频GPS导航模块。无人机航高80 m,航速5 m/s,采用交叉航线,旁向重叠度50%,搭配D-LiDAR2000激光模块,精度范围5 cm@50 m,点频240 kpts/s,回波强度8 bits,点云的平均点密度为312.5个/m2。
1.2.2 无人机高光谱
高光谱数据的获取时间与LiDAR数据相同,高光谱影像由飞马D20多旋翼无人机平台搭载高光谱相机(DV-HSPC20)航拍获得。无人机飞行高度200 m,航速13.5 m/s,重叠度80%。高光谱相机光谱范围为400~1 000 nm,112个光谱波段,空间像素1 024,光谱分辨率为2.68 nm。
1.2.3 样地调查
2023年9月,对研究区树木信息进行了实地调查。通过实时动态定位(real time kinematic,RTK)在样地内获取每棵树的位置信息。然后,将获取的树种和位置信息标记在RGB图像上,同时结合目视解译的方法获取了480棵树木的信息。其中包括白桦152棵、胡桃楸104棵、落叶松55棵、榆树59棵、红松59棵,以及其他数量较少的树种归为一类总共51棵(黄菠萝、蒙古栎和水曲柳等)。
2 研究方法
首先,使用无人机获取研究区域的高光谱数据和激光雷达数据。基于冠层高度模型(canopy height model,CHM)实现对激光雷达点云数据的单木分割,得到单木的树冠轮廓多边形数据,然后用获取单木轮廓多边形对高光谱数据进行分割,获得单木的高光谱图像数据。随后,提取单木级别的点云特征和光谱特征,并融合这两类特征构建模型数据集。在同一数据集上,比较本研究提出的CNN-EGNet与其他3种典型的CNN模型(VGG16、VGG19、GoogLeNet)的树种识别性能,选择表现最佳的模型来对研究区域内的所有树种进行识别。最后,基于树种识别结果对研究区进行森林树种多样性计算。
2.1 激光雷达单木分割以及特征提取
利用LiDAR360软件对无人机激光雷达原始的点云数据进行预处理,包括去噪、分离地面点等,随后分别生成点云数据的数字高程模型与数字表面模型,并基于数字高程模型生成归一化的点云数据,最后通过数字表面模型减去数字高程模型得到冠层高度模型(CHM)。随后基于CHM生成种子点,并利用这些种子点对归一化的点云数据进行单木分割,同时根据马金超等
[25]提出的公式对单木分割精度进行评估。随后,提取单木级别点云数据的树冠轮廓投影,并生成多边形标记文件。同时,提取包括高度变量、强度变量等95个点云特征参数。其中,高度变量包括高度平均绝对差、冠层起伏率、高度百分位数、均值和标准差等,强度变量包括平均绝对偏差、强度百分位数、均值、标准差和累计百分位数等
[24]。
2.2 高光谱单木分割以及特征提取
在无人机数据采集过程中,尽管通过全球导航卫星系统(global navigation satellite system,GNSS)和惯性测量单元(inertial measurement unit,IMU)确保了空间精度,但由于本研究使用不同无人机获取的激光雷达数据和高光谱数据,为提高高光谱数据的单木分割精度,仍需进一步优化。将经过预处理后的高光谱数据通过Arcgis软件的地理配准样条函数功能与激光雷达同步获取的RGB图像进行配准。然后,将配准后的图像与激光雷达数据提取的树冠轮廓多边形标记矢量文件进行图像融合,并通过Arcgis的基于矢量文件的分割功能得到单木高光谱数据。为充分挖掘不同树种在高光谱波段中的信息差异,利用Envi5.6软件提取单木级别的高光谱数据的中心像元光谱波段信息,最终提取112个光谱波段(光谱范围400~1 000 nm)的特征。不同树种的波段曲线存在差异,如
图1所示。本研究区的主要树种在波段500~600 nm以及700~1 000 nm存在差异。这些差异为后续的树种识别提供重要的特征。
2.3 数据集构建
基于提取的整个研究区域内的单木高光谱和点云树种特征信息,构建高光谱联合点云特征数据集,并根据森林调查结果对数据集进行标注,并将带有标注的数据集划分为训练集(80%)与验证集(20%),剩余未标注的数据最后通过模型进行树种识别。
2.4 卷积神经网络模型改进
卷积神经网络(CNN)在自动特征学习方面的性能使其广泛地应用于图像和序列数据等领域的特征学习和分类
[26-27]。典型的CNN模型主要由卷积层、池化层、全连接层组成。
CNN模型通过卷积层以卷积核捕捉数据的局部特征,并通过权重共享减少参数量,同时通过下采样策略(如最大或平均池化层)减少特征尺寸,保留关键信息并增强模型的平移不变性。最后,全连接层将特征图展平,将抽象特征关联到具体类别,完成分类或回归任务
[28]。
2.4.1 VGG16模型
VGG16 是一种深度卷积神经网络(CNN)架构
[29],如
图2所示,包含13个卷积层,并且在每2个或者3个卷积层之后配置一个2×2的最大池化层,共有5个池化层;然后,网络通过3个全连接层组成,所有的隐藏层均采用RelU激活函数;最终,通过soft-max生成分类识别结果。但其全连接层参数繁多,导致内存和计算资源消耗巨大,限制其效率。此外,VGG16的单一架构在处理更复杂任务时性能较差,且易受梯度消失或爆炸影响。因此,需要对VGG16模型进行改进,以提高模型的精度和效率。
2.4.2 高效通道注意力网络
高效通道注意力网络(ECA-NET)于2020年由Wang等
[30]提出,其模块结构简单、参数和计算损耗极少,能够有效提升网络的性能,特别是在分类识别等任务中表现优异。同时,其易于集成的特点可以使其方便地嵌入到现有的各种卷积神经网络架构中。因此,本研究将ECA-NET应用于VGG16网络结构中的每一个卷积层后面,如
图3所示,提高模型的特征提取能力,进而提升模型的树种识别能力。
2.4.3 全局平均池化层
传统的卷积神经网络模型通常有1个或者2个完全连接层,但这种结构会引入大量的参数,容易导致过拟合现象。因此,本研究采用全局平均池化层(global average pooling,GAP)
[31-32]代替VGG16网络结构中的前2个全连接层,这样不仅减少模型的参数数量、降低过拟合的风险,同时可以提高模型的泛化能力。同时,这种改进还能加快模型的训练速度,提高计算效率。
2.4.4 CNN-EGNet模型
本研究在VGG16模型的架构基础上,为适应构建的高光谱联合点云特征的数据集,对传统的VGG16模型进行改进和网络结构调整及优化。本研究所提出的模型采用Adam优化器,以二次交叉熵作为损失函数,对网络层数卷积核大小与数量、池化核大小和数量等超参数进行反复调整和优化。在模型中添加高效通道注意力网络(ECA-Net),提高模型捕捉不同树种关键特征的能力,从而提高模型的性能。添加批归一化处理(batch normalization,BN),加速模型收敛并提高泛化能力。用一个全局平均池化层代替VGG16模型中的2个全连接层来减少参数,对特征信息进行压缩,减小特征网络计算复杂度。为避免过拟合、提高泛化性能,随着网络的加深,在每个池化层后面依次添加应用比例为0.1~0.5的随机失活(Dropout)。为进行多树种识别,输出层采用多分类Soft-Max结构输出。本研究提出的CNN-EGNet模型,如
图4所示。
2.5 模型训练与树种识别精度评估
在进行模型训练时,将epoch设置为150,batch size设置为32,学习率设置为0.001。模型评估采用损失函数和模型训练运行时间作为评估标准。
为评估不同模型对树种识别的能力,同时针对在类别不平衡的情况下,如某些类别的样本数可能远多于其他类别,普通的指标可能会被多数类别主导,忽略少数类别的性能。因此,基于传统的精确度、召回率、F1评分计算加权精确度(precision)、召回率(recall)和F1评分(F1-score)作为模型的主要评价指标
[33]。此外,使用总体精度(overall accuracy,OA)和Kappa系数来评估模型的整体分类能力。
2.6 树种多样性指数计算
基于得到的树种识别结果按照40 m×40 m的窗口对研究区内的森林树种多样性进行计算。本研究所采用Shannon-Wiener、Simpson、Pielou以及物种丰富度等常用的物种多样性指数作为树种多样性评价指标
[34]。
3 结果与分析
3.1 单木分割结果
3.1.1 点云单木分割结果
基于冠层高度模型(CHM)的研究区点云单木分割结果如
图5(a)所示。
图5(b)中的黑点表示实地测量的树木位置,共计52棵,点云检测到45棵,其中正确分割32棵,单木分割准确率为71.11%,单木识别率为61.54%。从
图5(b)右上部分可以看出部分区域的树木存在欠分割现象,可能是因为研究区域为针阔混交林,林分结构复杂、冠层重叠导致。
3.1.2 高光谱单木分割结果
基于获取的点云单棵树的树冠轮廓投影矢量文件,对高光谱图像进行分割,从而获得单木高光谱数据,如
图6所示。由
图6(c)可知,矢量文件基本完整地包括单棵树木的高光谱图像,进而可以实现对高光谱图像的单木分割,但同时也存在如
图6(b)所示的情况,矢量文件包括多棵树木的高光谱图像。
3.2 模型与精度评估结果
3.2.1 不同模型损失函数
图7为不同模型之间在训练数据集和验证数据集损失函数的对比(其中,Train_Loss为模型训练损失,Val_Loss为验证损失)。由
图7可知,随着模型训练的进行,所有模型的损失函数数值开始逐渐下降,这表明模型开始从训练数据中学习到有用的特征。CNN-EGNet模型在训练达到120个epoch时,训练数据集和验证数据集的损失函数趋于收敛,训练集和验证集的曲线逐渐拟合在一起,说明模型已经达到了拟合状态,取得了良好的训练效果。然而,VGG16和VGG19的损失函数在训练过程中出现了剧烈的波动,而GoogLeNet的损失函数下降至0.5左右时陷入了停滞,因此针对本研究,VGG16、VGG19、GoogLeNet模型结构不够适应数据特性,或者训练策略需要进一步调优。
3.2.2 不同模型树种识别精度
CNN-EGNet模型与其他3种CNN模型的树种识别能力结果,见
表1。从模型的Precision、Recall和F1-score来看,CNN-EGNet在所有指标上均表现最佳,其Precision、Recall和F1-score值均达到或接近0.9。VGG19紧随其后,表现出相比于CNN-EGNe稍差,各个指标数值也都在0.85左右。VGG16的表现略逊于VGG19,但仍优于GoogLeNet,后者在3个指标上均表现最差,其精度、召回率和F1分数均为最低。CNN-EGNet模型训练总耗时为240.10 s,而VGG16和VGG19的训练时间分别为518.10 s和548.44 s,远高于CNN-EGNet模型,GoogLeNet模型在总时间上最为高效,只用了93.75 s。总体而言,CNN-EGNet在识别任务中表现最为出色,其他模型表现相对均衡,但GoogLeNet需要进一步优化。
由
图8可知,传统CNN模型在树种识别任务中存在精度较低的问题,而CNN-EGNet模型则在不同树种的识别方面表现出优异的识别能力。尤其是在识别榆树、胡桃楸和白桦时,CNN-EGNet模型相较于其他传统CNN模型取得了显著的提升。这表明CNN-EGNet模型不仅在整体分类准确率上表现优异,而且在区分特定树种方面也具有更高的辨识能力。
图9为各个模型的总体精度(OA)和Kappa系数。由
图9可知,CNN-EGNet模型表现出良好的性能,其OA为0.895 8,传统模型VGG16、VGG19和GoogLeNet的OA分别为0.802 1、0.843 8和0.750 0,CNN-EGNet的OA相较于传统的模型(VGG16、VGG19和GoogLeNet)分别提升9.37%、5.20%和4.58%。此外,CNN-EGNet模型的Kappa系数为0.866 1,相较于传统模型的Kappa系数分别提高了0.117 5、0.065 2、0.189 6。这表明CNN-EGNet模型的分类结果与实际情况的一致性更高,预测结果更为可信。
3.2.3 消融试验
为验证模型的改进效果,本研究设计了消融试验。在相同条件下分别训练不同的网络结构,包括仅添加高效通道注意力机制模型(ECA-Net)、仅添加全局平均池化层模型(GAP),采用加权精确度(precision)、召回率(recall)和F1评分(F1-score)作为主要评价指标。消融试验结果见
表2。通过对比
表1和
表2的试验结果可知,CNN-EGNet在Precision、Recall和F1-score上均表现最佳。相比之下,仅添加GAP模块的模型也表现出较高的性能,Precision、Recall和F1-score分别为0.87、0.86和0.86,表明GAP模块对模型性能的提升效果显著。而仅添加ECA-Net模块的模型和VGG16的性能较低,尤其是增加ECA-Net模块,表明ECA-Net模块对模型性能的贡献不如GAP模块明显。总体而言,消融试验结果清晰地表明,同时添加GAP和ECA-Net模块对提升模型性能具有重要作用,而ECA-Net模块的效果相对较弱。
为验证模型改进的有效性,对比全局平均池化层替换VGG16网络结构中的两个全连接层后发现最后一个全连接层的参数量减少了21 504个,说明改进后模型的参数量得到降低,同时结合
表1可知模型的效率得到提高。
3.3 CNN-EGNet模型鲁棒性分析
CNN-EGNet模型在树种分类任务中表现出良好的性能。为验证CNN-EGNet模型的鲁棒性,采用5折交叉验证法进行验证和评估,见
表3。由
表3可知,模型平均总体精度达到84.78%,平均卡帕系数达到0.808 9。除第5个子集外,每个子集的树种分类总体精度都在82%以上,进一步验证CNN-EGNet模型在树种分类任务中的可靠性和稳定性。
3.4 树种识别结果
在评估不同模型的树种识别能力之后,采用本研究提出的CNN-EGNet模型对研究区域内的所有树种进行预测识别。树种识别结果如
图10所示。由
图10可知,研究区内的树种呈现集群分布的特点,主要优势树种为落叶松、白桦、胡桃楸、榆树4种,其他树种则相对分布较少。白桦的分布范围最广,落叶松则主要分布在研究区左上部分,榆树以及胡桃楸主要集中在研究区右下部分。
3.5 树种多样性计算结果
在研究区内(累计划分95个样地)开展树种多样性指数的计算,以便全面地了解该区域树种多样性情况(
图10)。最终得到的多样性指数如
图11所示,该区域的Shannon-Wiener指数大致在0.8~1.4,物种丰富度大多在3~5种。结果表明,样地内的树种丰富度指数与树种的Shannon-Wiener指数呈正相关关系。此外,Pielou指数则普遍落在0.7~0.95,说明研究区大部分样地内的树种较为均匀分布。Simpson指数值多集中在0.5~0.7,反映出多数样地内的优势树种较多,多样性程度不高。
4 结论
本研究联合无人机获取的高光谱数据和激光雷达点云数据,基于构建的改进卷积神经网络模型CNN-EGNet对中国东北地区的针阔混交林实现树种的准确识别,同时基于树种识别结果评估研究区的树种多样性指数。通过对比改进的CNN-EGNet模型与VGG16、VGG19、GoogLeNet模型树种识别能力发现,改进的CNN-EGNet模型效果最优。将高效通道注意力机制网络与GAP等网络结构应用于卷积神经网络模型,可以提升卷积神经网络对高光谱和点云特征的提取能力,进而提高对森林树种的识别能力。构建的CNN-EGNet树种识别模型,利用端到端学习策略,不需要分离特征提取和分类,从而在模型训练过程中自动学习到最优的特征。总之,本研究探究无人机高光谱数据联合激光雷达数据,通过卷积神经网络在森林树种识别和森林树种多样性评估中的应用,研究结果可为森林资源与生物多样性调查提供技术参考。