基于主成分分析下贝叶斯优化卷积神经网络模型人工林树种识别的研究

王晓红 ,  辛守英 ,  张薇 ,  焦琳琳

森林工程 ›› 2025, Vol. 41 ›› Issue (02) : 298 -311.

PDF (8702KB)
森林工程 ›› 2025, Vol. 41 ›› Issue (02) : 298 -311. DOI: 10.7525/j.issn.1006-8023.2025.02.009
森林资源建设与保护

基于主成分分析下贝叶斯优化卷积神经网络模型人工林树种识别的研究

作者信息 +

Study on Tree Species Identification of Planted Forests Based on PCA-BO-CNN Model

Author information +
文章历史 +
PDF (8910K)

摘要

为探究基于主成分分析(Principal Component Analysis,PCA)下贝叶斯优化(Bayesian Optimization,BO)卷积神经网络(Convolutional Neural Network,CNN)算法(PCA-BO-CNN)模型对人工林树种识别的方法,以提高遥感技术在人工林树种识别中的准确率和鲁棒性。以塞罕坝机械林场为研究区域,利用Sentinel-1遥感数据、Sentinel-2遥感数据、数字高程模型(digital Elevation Model,DEM)数据及森林资源二类调查数据和PCA-BO-CNN算法模型结合,并与其他不同算法模型对比分析,以提高人工林树种识别的准确性。结果表明,1)相比PCA算法处理前,PCA算法处理后多源数据特征的PCA1—PCA39共计39个特征的标准差和特征间的区分性明显提升。因此,PCA算法处理有利于提升对华北落叶松、白桦、樟子松、蒙古栎和云杉主要优势树种及非林地的识别精度;2)在PCA算法处理前,BO-随机森林(random forest,RF)算法模型对主要优势树种及非林地识别的总体准确度(OA)和Kappa系数精度,分别为81.87%,0.754 5。在PCA算法处理后,PCA-BO-CNN算法模型对主要优势树种及非林地识别的OA和Kappa系数精度相对提高,分别为83.10%,0.770 3;3)相比PCA算法处理前的BO-RF算法模型,PCA算法处理后的PCA-BO-CNN算法模型对塞罕坝林场主要优势树种及非林地识别的调和平均数(F1)、OA和Kappa系数的整体精度相对较高。具体,相比BO-RF算法模型PCA-BO-CNN算法模型的OA提升了1.24%,且相比PCA算法处理前PCA-BO-CNN算法模型OA提升了3.71%。与其他算法模型相比,基于PCA-BO-CNN算法模型的人工林树种识别方法具有很强的准确性和鲁棒性,为掌握塞罕坝林场人工林的树种分布,进而了解森林碳储量、森林对气候变化的响应、制定碳减排政策以及推动森林可持续发展提供重要的理论依据。

Abstract

To explore the identification method of tree species in planted forests based on the Bayesian optimization convolutional neural network (PCA-BO-CNN) algorithm model based on principal component analysis, to improve the accuracy and robustness of remote sensing technology in tree species identification in planted forests. In this study, the Sahanba Mechanical Forest Farm was selected as the study area. Sentinel-1 remote sensing data, Sentinel-2 remote sensing data, DEM data, and the forest resource category 2 survey data were combined with the PCA-BO-CNN algorithm model, and compared with other algorithm models, to improve the accuracy of tree species identification in planted forests. The results showed that: (1) Compared with the pre-PCA algorithm, the standard deviation of 39 features of PCA1-PCA39 of multi-source data features after PCA algorithm processing and the differentiation among features were significantly improved. Therefore, PCA was beneficial to improve the identification accuracy of the dominant species of Larix gmelinii var. principis-rupprechtii (Mayr) Pilger, Betula platyphylla Sukaczev, Pinus sylvestris var. mongholica Litv., Quercus mongolica Fisch. ex Ledeb. and Picea asperata Mast. as well as non-forest land. (2) Before PCA algorithm, the overall accuracy (OA) and Kappa coefficient accuracy of the BO-random forest (BO-RF) algorithm model for the identification of dominant tree species and non-forest land were 81.87% and 0.754 5, respectively. After PCA algorithm processing, the accuracy of OA and Kappa coefficients of the PCA-BO-CNN algorithm model for the identification of dominant tree species and non-forest land was relatively improved, which were 83.10% and 0.770 3, respectively. (3) Compared with the BO-RF algorithm model before PCA algorithm processing, the overall accuracy of the PCA-BO-CNN algorithm model after PCA algorithm processing was relatively higher for the identification of the F1, OA and Kappa coefficients of the main dominant tree species and non-forest land in Saihanba Forest Farm. Specifically, compared with the BO-RF algorithm model, the OA of the PCA-BO-CNN algorithm model increased by 1.24%. In addition, the OA of the PCA-BO-CNN algorithm model before PCA algorithm was improved by 3.71%. Compared with other algorithm models, the tree species identification method based on the PCA-BO-CNN algorithm model had strong accuracy and robustness, which can help us grasp the tree species distribution of the planted forests in Saihanba Forest Farm. Further, it provides an important methodological and theoretical basis for understanding forest carbon storage, forest response to climate change, formulating carbon emission reduction policies, and promoting forest sustainable development.

Graphical abstract

关键词

PCA-BO-CNN模型 / 塞罕坝林场 / 人工林 / 遥感技术 / 树种识别

Key words

PCA-BO-CNN model / Saihanba Forest Farm / the planted forest / remote sensing technology / tree species identification

引用本文

引用格式 ▾
王晓红,辛守英,张薇,焦琳琳. 基于主成分分析下贝叶斯优化卷积神经网络模型人工林树种识别的研究[J]. 森林工程, 2025, 41(02): 298-311 DOI:10.7525/j.issn.1006-8023.2025.02.009

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

森林作为陆地生态系统的重要组成部分,拥有巨大的碳储能力1-3。人工林在森林中扮演着重要角色,特别是我国人工林面积居全球首位,对于维持森林碳循环、缓解全球气候变化具有深远意义4。因此,了解人工林碳储量对于掌握我国森林碳汇储量、应对气候变化、制定碳减排政策以及推动森林可持续发展至关重要5。然而,人工林碳储量的估算与森林树种类型息息相关。不同森林树种类型之间的储碳能力存在明显差异,仅靠统一森林含碳率估算无法提供准确的人工林碳储量信息6。因此,准确的人工林树种识别变得越来越重要,成为获取可靠森林碳储量信息的关键。

目前,人工林树种识别的方法主要包括样地清查法和基于遥感技术的树种识别方法7。相比传统人工对森林树种识别的样地清查法,基于遥感技术的树种识别方法因遥感数据和计算机图像解译算法的不断发展,逐渐成为人工林树种识别的首选途径8。特别是图像解译深度学习算法的发展,如卷积神经网络(convolutional neural network,CNN)模型作为一种深度学习的图像处理和识别方法,在基于遥感技术的林分、树种结构图像识别领域取得了显著成果9-10。而在人工林树种识别方面,CNN模型仍有很大的提升空间。此外,与以往的基于遥感技术的树种识别方法相比,CNN模型不再需要人工对遥感数据进行深层参数特征的提取11,而是通过卷积运算自主学习到遥感数据的参数特征,从而提高人工林树种识别的效率和准确性。然而,CNN模型作为人工林树种识别模型具有不易调整的模型超参数,且仅靠人工经验进行模型超参数调整存在很大的局限性12。为此,引入贝叶斯优化超参数(Bayesian optimization,BO)算法对CNN人工林树种识别模型的超参数进行调整。相比其他模型超参数的优化算法,BO算法是一种全局优化的手段,在超参数调整、机器学习模型选择和神经网络架构搜索等方面表现出色13,在一定程度上能够提高树种识别的准确率和鲁棒性。此外,多源数据特征的特征选择是树种识别中面临的又一难题,为了解决这一难题,引入了主成分分析算法对遥感数据进行特征优选,从而提高树种识别的准确率。因此,通过主成分分析算法对多源数据特征进行优选,利用BO算法对CNN模型的超参数进行优化是提高CNN模型人工林树种识别性能和准确度的基础14

塞罕坝机械林场(以下简称为塞罕坝林场)作为我国典型的人工林国有林场之一15,是京津冀乃至华北地区重要的森林碳库。为了准确估算该林场的森林碳储量,亟须提高人工林树种识别的准确率和鲁棒性。因此,本研究选择了塞罕坝林场作为研究区域,旨在探究一种基于主成分分析下的贝叶斯优化卷积神经网络(PCA-BO-CNN)算法模型的人工林树种识别方法,以提高其实用性和准确性。PCA-BO-CNN算法模型将主成分分析算法、贝叶斯优化算法与CNN算法相结合,通过自动筛选多源数据特征并调整CNN模型的超参数,从而提高人工林树种识别的效率和准确性,该方法不仅为局地区域人工林树种识别提供了高效和准确的方法,还为掌握森林碳储量、了解气候变化的影响、制定碳减排政策以及推动森林可持续发展提供了重要的理论依据。

1 研究区概况与数据

1.1 研究区概况

塞罕坝林场位于河北省承德市最北部,地处冀蒙边界,地理位置为:116°51′~117°39′ E,41°02′~42°36′ N,如图1所示。林场南北向长为58.6 km,东西向宽为65.6 km,林场总面积92 634.7 hm2。地势中部高,东南、西北低,由中部分别向东南、西北倾斜,海拔1 010~1 940 m,平均坡度在20°。年均降水日数134 d,年均降水量452 mm,主要集中在6—8月,占全年降水量的67.6%。林场属于寒温带大陆性季风气候区,冬、春季较长,气温低且多风;夏季短,日照强,温差大。林场拥有丰富的土壤类型和复杂的气候条件,孕育了多种多样的植物种群,有森林、草原、草甸和灌丛等。其中,森林覆盖率达80%以上,主要优势树种包括:华北落叶松(Larix gmelinii var. principis-rupprechtii)、白桦(Betula platyphylla)、樟子松(Pinus sylvestris var. mongholica)、蒙古栎(Quercus mongolica)和云杉(Picea asperata)等。

1.2 数据与预处理

1.2.1 Sentinel-1/2和数字高程模型数据

Sentinel系列卫星是欧洲航天局(European space agency,ESA)哥白尼计划发射的卫星,主要提供Sentinel-1合成孔径雷达遥感数据(synthetic aperture radar,SAR)和Sentinel-2光学多光谱遥感数据(multi-spectral imagery,MSI)等。其中,Sentinel-1遥感卫星是由A和B双星组成,同时搭载C波段SAR传感器16,具有条带模式、干涉宽幅模式、超宽幅模式和波浪模式4种成像模式,能够全天候作业、不受气候条件的限制,支持交叉极化(VH)和垂直极化(VV)两种常见的极化方式,Sentinel-1遥感数据具体的参数见表1

Sentinel-2遥感卫星同样由A和B双星组成,双星的重访周期为5 d,搭载MSI成像仪17,提供可见光、红外和近红外波段在内的13个光谱波段,空间分辨率从10、20 m到60 m,Sentinel-2遥感数据具体的参数见表2。根据ESA官方网站公布的相关信息,Sentinel-2遥感数据包括2A和1C 2种等级,其中2A级数据是经过大气校正的遥感数据能够直接用于试验,1C级数据是需要采用官方网站提供的Sen2Cor插件进行大气校正后得到2A级数据用于试验18。本研究使用的Sentinel-1_IW(IW为干涉宽幅模式数据)和Sentinel-2_MSIL2A(MSIL2A为多光谱影像)遥感数据均是通过ESA哥白尼哨兵科学数据中心(https://browser.dataspace.copernicus.eu/)进行免费下载,并且采集时间与地面调查的森林资源二类调查数据相接近,云含量小于5%的2020年的6月、8月、10月遥感数据,且每期数据包括1景Sentinel-1_IW数据和3景Sentinel-2_MSIL2A遥感数据。此外,数字高程模型(digital elevation model,DEM)数据即DEM数据是一种常用于反映地表森林植被等地貌特征的数据。DEM数据是从地理空间数据云官方网站(https://www.gscloud.cn/)进行2020年数据的免费下载,并按照6月、8月、10月分成同样的3份DEM数据。

数据预处理包括:1)Sentinel-1遥感数据,由于SAR数据受地形起伏和斑点噪声影响引起几何和辐射畸变,为此利用ESA的开源SNAP软件对其进行轨道校正、辐射定标、热噪声去除、Deburst处理、多视处理、滤波处理、地理编码和按照塞罕坝林场边界进行裁剪,获得后向散射系数(Sigma0_VV_db、Sigma0_VH_db)雷达特征。2)Sentinel-2遥感数据,通过SNAP软件的Sen2Cor大气校正处理器进行大气校正得到2A级遥感数据,以及辐射定标、拼接、重采样和按照塞罕坝林场边界进行裁剪,获得13个波段遥感数据(B1,B2,…B8,B8A,B9,…B12)。在此基础上,去除3个用于监测大气的B1、B9和B10波段,剩下的10个波段,即B2、B3、B4、B5、B6、B7、B8、B8A、B11和B12波段均能用于反映森林资源参数的特征。因此,本研究选取Sentine1-2遥感数据的B2、B3、B4、B5、B6、B7、B8、B8A、B11和B12波段光谱特征用于树种识别。3)DEM数据,利用ArcGIS软件对其重投影、重采样、坡度、坡向分析和塞罕坝林场区域裁剪,提取高程(Elevation)、坡向(Aspect)和坡度(Slope)地形特征。为了便于后续塞罕坝林场的主要优势树种及非林地的分类识别,将Sentinel-1、Sentinel-2和DEM全部数据的空间分辨率均重采样为统一像元大小20 m的栅格数据。塞罕坝林场提取的多源数据特征见表3

1.2.2 地面调查数据

根据2020年完成的森林资源二类调查矢量数据(以下简称为二调数据),塞罕坝林场的华北落叶松(HBLYS)、白桦(BH)、樟子松(ZZS)、蒙古栎(MGL)和云杉(YS)主要优势树种及非林地(FLD)在塞罕坝林场二类调查矢量数据的具体空间分布情况,如图2所示。

根据图2的塞罕坝林场主要优势树种及非林地的空间分布状况,使用ArcGIS软件采集主要优势树种及其非林地的分类识别样本。为了获取准确的分类识别样本,通过Google Earth提供的高分辨率数据进行分类识别样本相对位置的验证,以确保分类识别样本的数量和精度。塞罕坝林场的主要优势树种及其非林地分类识别样本的空间分布,如图3所示。

塞罕坝林场主要优势树种及非林地有效的分类识别样本总计有7 278个。其中,华北落叶松样本数最多为3 088个,云杉样本数最少为263个。为保证样本数的充足性,以样点最多的华北落叶松为基准数,将其他类别的分类识别样本进行袋内重复采样至3 088个,使各树种的分类识别样本具有相似的权重。塞罕坝林场主要优势树种及非林地分类识别样本的具体数量见表4

2 研究方法

2.1 主成分分析特征选择

主成分分析算法(principal component analysis,PCA)是一种常用的特征降维算法,在实践中广泛地应用于遥感数据的特征优选19,尤其是高光谱、多光谱遥感数据。其中,多光谱遥感数据含多个波段,利用PCA算法,可以对其进行多维正交线性转换,使原始重复冗余的数据生成新的组分不相关的数据,降低了数据的重复和冗余程度,因此PCA算法对遥感数据具有分离信息、减少相关、突出不同地物特征的作用。本研究使用PCA算法对多源数据特征(表3)进行特征优选。其中,PCA算法的具体计算为

Y=AX

式中:Y为主成分变换后的遥感数据; A 为将X转换到Y的变换矩阵;X为主成分变换前的遥感数据。

2.2 贝叶斯优化算法

常见的算法模型中超参数优化的方法有粒子群优化算法、遗传优化算法和贝叶斯优化算法(Bayesian optimization algorithm,BO)等。其中,BO算法是一种以概率贝叶斯原理为基础的全局优化算法,其在对一组超参数进行运算的同时,也考虑了先前的超参数集合,以此得到模型的最优超参数组合。BO算法相较于其他超参数优化算法,能够在较短的迭代计算时间内获得最优超参数组合20。贝叶斯定理公式为

PfD1:t=PD1:tfPfPD1:t
D1:t=x1,y1,x2,y2,,xt,yt
yt=fxt+εt

式中:f为含超参数的黑箱函数;t为观测集合总数;D1:t 为已观测点集合; xt 为决策向量;yt 为观测值;εt 为观测误差;PD1:tf)为y的似然函数分布;Pf)为目标函数f的先验函数分布;PD1:tf)为f的边际似然函数分布,用来优化可变参数;PfD1:t)为f的后验函数分布,表示修正先验函数分布后未知目标函数的置信度。此外,BO算法由先验函数与采集函数2个重要部分组成21。本研究以高斯过程(Gaussian Process)先验函数和改进概率函数采集函数提高树种识别模型的泛化能力。BO算法的具体流程如图4所示。

2.3 卷积神经网络

卷积神经网络(convolutional neural network,CNN)是一种典型深度学习算法模型,具有多层网络结构,在图像识别领域得到广泛的应用22。CNN模型包括特征提取和特征映射两层主要结构,根据功能又可分为输入层、卷积层、池化层、展平层、全连接层和输出层23,如图5所示。本研究CNN算法模型是2D CNN算法,其输入层是获取栅格数据特征并将图像的像素值转换成对应的像素二维矩阵,传递给卷积层;卷积层是利用卷积核对像素二维矩阵进行卷积操作,得到一个新的像素二维矩阵即特征图像;池化层是对特征图像进行特征扫描,将其最具代表性的特征提取出来,起到减少模型参数数量的同时,保留了原图像的重要特征、有效防止过拟合;全连接层是将提取的所有像素二维矩阵特征图进行“展平”处理,变为一维特征向量,为输出层提供基础数据;输出层是将全连接层得到的一维向量经过线性或非线性的计算得到不同类别的识别概率,这概率一般是在每一种分类位置都会得到一个概率值,取最大的概率值,得到最终树种的识别结果。

2.4 PCA-BO-CNN树种识别模型

PCA特征优选下贝叶斯优化卷积神经网络(PCA Bayesian optimization convolutional neural network,PCA-BO-CNN)是一种通过PCA算法对多源数据特征进行优选和BO算法优化CNN超参数的方法。本研究PCA-BO-CNN树种识别模型的具体流程:数据预处理即对Sentinel-1遥感数据、Sentinel-2遥感数据、DEM数据和二调数据进行预处理,得到多源数据的特征组合并进行归一化与识别样本数据的像元行列数相同;同时,将树种识别样本数据随机划分成70%的训练集和30%的测试集,用于识别模型的训练和精度评估;PCA算法对多源数据特征进行优选,BO算法在超参数搜索空间中迭代选择配置超参数,并在训练集上进行训练。然后根据测试集的性能评估结果,更新模型的先验知识,收敛到更好的模型超参数组合,完成塞罕坝林场优势树种的识别任务,如图6所示。同时,与贝叶斯优化随机森林算法(BO-RF)、贝叶斯优化人工神经网络算法(BO-ANN)和经典的卷积神经网络算法(AlexNet、GoogLeNet和VGGNet)对比分析,以验证PCA-BO-CNN算法对树种识别的准确性和鲁棒性。

2.5 树种分类识别后精度评价

为了定量评估PCA-BO-CNN等不同算法模型对树种识别中的表现性能,本研究采用混淆矩阵法进行树种识别精度的评价。其中,评价指标主要包括制图精度(producer accuracy,PA,式中记为PA)、用户精度(user accuracy,UA,式中记为UA)、总体精度(overall accuracy,OA)和Kappa系数(Kappa)24。而在实际分类中,PA和UA又相互制衡,不能准确判断分类的优劣,所以引入PA和UA的调和平均值(F1)评价分类效果25。其中,F1的计算公式为

F1=2×PA×UAPA+UA

式中:F1的取值范围是[0,1]。

3 结果与分析

3.1 多源数据特征优选及可分性分析

通过ArcGIS软件波段组合工具将塞罕坝林场6月、8月和10月的Sigma0_VV_db、Sigma0_VH_db、B2、B3、B4、B5、B6、B7、B8、B8A、B11、B12、Elevation、Aspect和Slope多源数据特征进行组合成一张栅格数据,如图7(a)所示;通过ArcGIS软件多值提取至点的工具,按照华北落叶松、白桦、樟子松、蒙古栎和云杉主要优势树种及非林地分类识别样本将6月、8月和10月多源数据特征的像元值提取至各分类识别样本点,并经过归一化处理后绘制优势树种及非林地的多源数据特征分布及标准差曲线,结果如图7(b)和如图7(c)所示。此外,通过PCA算法,对塞罕坝林场6月、8月和10月的多源数据特征进行特征优选处理(累积贡献率达100%),如图8所示,并筛选出PCA1—PCA39共计39个特征,结果如图8(a)所示;同理,按照华北落叶松、白桦、樟子松、蒙古栎和云杉主要优势树种及非林地分类识别样本将PCA算法处理后的多源数据特征的像元值提取至各主要优势树种及非林地的分类识别样本点,并经过归一化后绘制不同树种的多源数据特征分布及标准差曲线,结果如图8(b)和如图8(c)所示。

根据图7图8可知,相比PCA算法处理前6月、8月和10月多源数据特征,PCA算法处理后6月、 8月和10月多源数据特征的PCA1—PCA39标准差明显高于PCA算法处理前的多源数据特征的标准差,同时,PCA算法处理后多源数据特征的区分性相对较大。即塞罕坝林场的华北落叶松、白桦、樟子松、蒙古栎和云杉优势树种及非林地能够更好地通过PCA算法处理后6月、8月和10月多源数据的PCA1—PCA39进行主要优势树种及非林地的区分识别。因此,通过PCA算法处理多源数据特征有利于提升对华北落叶松、白桦、樟子松、蒙古栎和云杉主优势树种及非林地的识别精度。

3.2 多源数据特征树种识别及精度分析

通过BO-RF、BO-ANN、BO-CNN、AlexNet、Goog-LeNet和VGGNet不同算法模型,对塞罕坝林场PCA处理前的多源数据特征进行华北落叶松、白桦、樟子松、蒙古栎和云杉主要优势树种及非林地的识别,不同算法模型对塞罕坝林场主要优势树种及非林地的识别结果,如图9所示。同时,通过ArcGIS软件创建随机点工具随机生成2 184个随机测试样本点用于主要优势树种及非林地识别精度的评价。即随机生成总分类识别样本数的30%的随机样本,用于不同算法模型对塞罕坝林场PCA处理前多源数据特征主要优势树种及非林地的识别结果进行混淆矩阵的计算,并基于此混淆矩阵进行F1、OA和Kappa系数指标的计算,结果见表5

根据图9表5可知,在经过PCA算法处理前 6月、8月和10月多源数据特征进行华北落叶松、白桦、樟子松、蒙古栎和云杉主要优势树种及非林地的识别中,BO-RF算法模型对塞罕坝林场主要优势树种及非林地的识别的OA精度相对较高,其次是AlexNet、BO-ANN、BO-CNN、VGGNet和GoogLeNet。

此外,通过BO-RF、BO-ANN、BO-CNN、AlexNet、GoogLeNet和VGGNet不同算法模型,对塞罕坝林场PCA算法处理后的多源数据特征PCA1—PCA39进行主要优势树种及非林地的识别,不同算法模型对塞罕坝林场主要优势树种及非林地的识别结果,如图10所示。同样,通过上述随机生成的2 184个随机测试样本点用于PCA算法处理后多源数据特征主要优势树种及非林地的识别结果进行混淆矩阵的计算进而对F1、OA和Kappa系数指标的计算,结果见表6

根据图10表6可知,相比经过PCA算法处理前6月、8月和10月多源数据特征的BO-RF、BO-ANN、BO-CNN、AlexNet、GoogLeNet和VGGNet不同算法模型对塞罕坝林场主要优势树种及非林地识别的F1、OA和Kappa系数的精度,经过PCA算法处理后的多源组合数据的不同算法使主要优势树种及非林地识别的F1、OA和Kappa系数的精度得到了提升。此外,在经过PCA算法处理后多源数据特征的PCA1—PCA39树种识别中,BO-CNN算法对塞罕坝林场主要优势树种及非林地的识别的OA精度相对较高,即PCA-BO-CNN算法模型OA精度相对较高,其次是AlexNet、BO-RF、GoogLeNet、VGGNet和BO-ANN。

3.3 多源数据特征PCA前后最优模型对比分析

通过将在PCA算法处理前多源数据特征的不同算法模型在塞罕坝林场主要优势树种及非林地识别中,精度最高的BO-RF算法模型以及将在PCA算法处理后多源数据特征PCA1—PCA39的不同算法模型对塞罕坝林场主要优势树种及非林地识别中,精度最高的BO-CNN算法模型(PCA-BO-CNN)的F1、OA和Kappa系数的精度绘制成图,结果如图11所示。

根据图11可知,相比在经过PCA算法处理前多源数据特征的BO-RF算法模型对塞罕坝林场主要优势树种及非林地的识别精度,经过PCA算法处理后多源数据PCA1—PCA39的PCA-BO-CNN算法模型对塞罕坝林场主要优势树种及非林地的识别的F1、OA和Kappa系数的整体精度相对较高。具体,相比BO-RF算法模型PCA-BO-CNN算法模型的OA提升了1.24%,且相比PCA算法处理前PCA-BO-CNN算法模型OA提升了3.71%。

4 结论与讨论

基于Sentinel-1遥感数据、Sentinel-2遥感数据和DEM数据的共计有45个多源数据特征以及二调数据的主要优势树种分类识别样本特征,通过使用BO-RF、BO-ANN、BO-CNN、AlexNet、GoogLeNet和VGGNet不同算法模型对PCA算法处理前后的多源数据特征进行主要优势树种的识别及精度评价,以此验证PCA-BO-CNN算法模型对主要优势树种识别的准确性和鲁棒性。主要结论:1)相比PCA算法处理前,PCA算法处理后多源数据特征的PCA1—PCA39的标准差和特征间的区分性明显提升。因此,通过PCA算法处理多源数据特征有利于提升对华北落叶松、白桦、樟子松、蒙古栎和云杉主优势树种及非林地的识别精度;2)在PCA算法处理前,BO-RF算法模型对主要优势树种及非林地识别的OA和Kappa系数精度相对较高,分别为81.87%,0.754 5。在PCA算法处理后,PCA-BO-CNN算法模型对主要优势树种及非林地识别的OA和Kappa系数精度相对较高,分别为83.10%,0.770 3;3)相比PCA算法处理前的BO-RF算法模型,经过PCA算法处理后的PCA-BO-CNN算法模型对塞罕坝林场主要优势树种及非林地识别的F1、OA和Kappa系数的整体精度相对较高。具体,相比BO-RF算法模型PCA-BO-CNN算法模型的OA提升了1.24%,且相比PCA算法处理前PCA-BO-CNN算法模型OA提升了3.71%。

塞罕坝林场是非常典型的人工林区域之一26,在一定程度上加强了PCA-BO-CNN算法模型的泛化能力和实用性,但本研究在进行泛化能力验证时,受客观条件限制,只选取了Sentinel系列数据和DEM数据,可能不够充分,为此可以再选取其他不同人工林研究区、不同分辨率、不同时相的遥感数据,进行丰富的泛化能力测试验证试验。此外,训练数据集存在样本不平衡的情况,样本不平衡会使得PCA-BO-CNN算法模型偏向样本较多的类别,导致模型对于样本较少的类别分类精度不高,日后可以尝试一些其他方式,如迁移学习,以期在新的遥感数据中获得更佳的人工林树种识别效果。此外,可以探索将PCA-BO-CNN算法模型应用于其他领域,如森林健康监测、树木生长状况评估等诸多方面的研究应用。

参考文献

[1]

马学威,熊康宁,张俞,森林生态系统碳储量研究进展与展望[J].西北林学院学报201934(5):62-72.

[2]

MA X WXIONG K NZHANG Y,et al.Research progresses and prospects of carbon storage in forest ecosystems[J].Journal of Northwest Forestry University201934(5):62-72.

[3]

张颖,孟娜,姜逸菲.中国森林碳汇与林业经济发展耦合及长期变化特征分析[J].北京林业大学学报202244(10):129-141.

[4]

ZHANG YMENG NJIANG Y F.Coupling and long-term change characteristics analysis of forest carbon sequestration and forestry economic development in China[J].Journal of Beijing Forestry University202244(10):129-141.

[5]

ZHANG D NZHAO Y HWU J S.Assessment of carbon balance attribution and carbon storage potential in China's terrestrial ecosystem[J].Resources,Conservation and Recycling2023189(2):106748.

[6]

梅梦媛,雷一东.我国人工林新时代发展形势分析[J].世界林业研究201932(3):73-77.

[7]

MEI M YLEI Y D.Analysis on development trend of China's plantation in new era[J].World Forestry Research201932(3):73-77.

[8]

刘晓曼,王超,高吉喜,服务双碳目标的中国人工林生态系统碳增汇途径[J].生态学报202343(14):5662-5673.

[9]

LIU X MWANG CGAO J X,et al.Approaches to carbon sequestration enhancement in China's plantation ecosystem for carbon peaking and carbon neutrality goals[J].Acta Ecologica Sinica202343(14):5662-5673.

[10]

涂宏涛,周红斌,马国强,基于第九次森林资源清查的云南森林碳储量特征研究[J].西北林学院学报202338(3):185-193.

[11]

TU H TZHOU H BMA G Q,et al.Characteristics of forest carbon storage in Yunnan based on the ninth forest inventory data[J].Journal of Northwest Forestry University202338(3):185-193.

[12]

陈永富,陈巧,刘华.基于遥感图像的林况因子提取研究进展[J].世界林业研究202235(2):53-58.

[13]

CHEN Y FCHEN QLIU H.Research progress in forest condition factors extraction based on remote sensing images[J].World Forestry Research202235(2):53-58.

[14]

李华玉,陈永富,陈巧,基于遥感技术的森林树种识别研究进展[J].西北林学院学报202136(6):220-229.

[15]

LI H YCHEN Y FCHEN Q,et al.Research progress of forest tree species identification based on remote sensing technology[J].Journal of Northwest Forestry University202136(6):220-229.

[16]

江涛,王新杰.基于卷积神经网络的高分二号影像林分类型分类[J].北京林业大学学报201941(9):20-29.

[17]

JIANG TWANG X J.Convolutional neural network for GF-2 image stand type classification[J].Journal of Beijing Forestry University201941(9):20-29.

[18]

刘嘉政,王雪峰,王甜.基于多特征融合和CNN模型的树种图像识别研究[J].北京林业大学学报201941(11):76-86.

[19]

LIU J ZWANG X FWANG T.Image recognition of tree species based on multi feature fusion and CNN model[J].Journal of Beijing Forestry University201941(11):76-86.

[20]

周维勋.基于深度学习特征的遥感影像检索研究[J].测绘学报202352(1):167-179.

[21]

ZHOU W X.Research on remote sensing image retrieval based on deep learning features[J].Acta Geodaetica et Cartographica Sinica202352(1):167-179.

[22]

李红宇,黄志鹏,张广玲,动态权重证据推理规则的CNN超参数质量评估[J].小型微型计算机系统202142(5):1015-1021.

[23]

LI H YHUANG Z PZHANG G L,et al.Quality assessment of CNN hyper-parameters based on dynamic weight evidential reasoning rule[J].Journal of Chinese Computer Systems202142(5):1015-1021.

[24]

崔佳旭,杨博.贝叶斯优化方法和应用综述[J].软件学报201829(10):3068-3090.

[25]

CUI J XYANG B.Survey on Bayesian optimization methodology and applications[J].Journal of Software201829(10):3068-3090.

[26]

邓帅.基于改进贝叶斯优化算法的CNN超参数优化方法[J].计算机应用研究201936(7):1984-1987.

[27]

DENG S.Hyper-parameter optimization of CNN based on improved Bayesian optimization algorithm[J].Application Research of Computers201936(7):1984-1987.

[28]

常伟强.塞罕坝机械林场森林资源动态变化分析[J].林业资源管理20181(6):13-17.

[29]

CHANG W Q.Analysis on dynamic changes of the forest resources in Saihanba Mechanized Forest Farm[J].Forest Resources Management20181(6):13-17.

[30]

TORRES RSNOEIJ PGEUDTNER D,et al.GMES Sentinel-1 mission[J].Remote Sensing of Environment2012120(5):9-24.

[31]

DRUSCH MDEL BELLO UCARLIER S,et al.Sentinel-2: ESA's optical high-resolution mission for GMES operational services[J].Remote Sensing of Environment2012120(5):25-36.

[32]

SU WZHANG M ZJIANG K P,et al.Atmospheric correction method for Sentinel-2 satellite imagery[J].Acta Optica Sinica201838(1):0128001.

[33]

BARSHAN EGHODSI AAZIMIFAR Z,et al.Supervised principal component analysis: Visualization,classification and regression on subspaces and submanifolds[J].Pattern Recognition201144(7):1357-1371.

[34]

周旭,王认卓,代亚勋,基于BO-XGBoost的煤自燃分级预警研究[J].煤炭工程202254(8):108-114.

[35]

ZHOU XWANG R ZDAI Y X,et al.Classified early warning of coal spontaneous combustion based on BO-XGBoost[J].Coal Engineering202254(8):108-114.

[36]

王媛彬,李媛媛,韩骞,基于PCA-BO-XGBoost的矿井回采工作面瓦斯涌出量预测[J].西安科技大学学报202242(2):371-379.

[37]

WANG Y BLI Y YHAN Q,et al.Gas emission prediction of the stope in coal mine based on PCA-BO-XGBoost[J].Journal of Xi'an University of Science and Technology202242(2):371-379.

[38]

范迎迎,张姗姗.基于深度主动学习的高光谱遥感图像分类方法[J].东北师大学报(自然科学版)202254(4):64-70.

[39]

FAN Y YZHANG S S.Hyperspectral remote sensing image classification method based on deep active learning[J].Journal of Northeast Normal University (Natural Science Edition)202254(4):64-70.

[40]

胡越,罗东阳,花奎,关于深度学习的综述与讨论[J].智能系统学报201914(1):1-19.

[41]

HU YLUO D YHUA K,et al.Overview on deep learning[J].CAAI Transactions on Intelligent Systems201914(1):1-19.

[42]

张开放,苏华友,窦勇.一种基于混淆矩阵的多分类任务准确率评估新方法[J].计算机工程与科学202143(11):1910-1919.

[43]

ZHANG K FSU H YDOU Y.A new multi-classification task accuracy evaluation method based on confusion matrix[J].Computer Engineering & Science202143(11):1910-1919.

[44]

刘灵,张加龙,韩雪莲,基于GEE和Sentinel时序影像的优势树种识别研究[J].森林工程202339(1):63-72.

[45]

LIU LZHANG J LHAN X L,et al.Dominant species classification based on Google Earth Engine and Sentinel time-series data[J].Forest Engineering202339(1):63-72.

[46]

李斌,李崇贵,李煜.基于Sentinel-2数据的塞罕坝机械林场落叶松人工林提取[J].林业资源管理20211(2):117-123.

[47]

LI BLI C GLI Y.Research on larch extraction in Saihanba Mechanical Forest Farm based on Sentinel-2 data[J].Forest Resource Management20211(2):117-123.

基金资助

中央引导地方科技发展资金项目(246Z5901G)

河北省自然科学基金青年基金(D2019209322)

唐山市科技局应用基础研究计划(20130202b)

华北理工大学博士专项经费(BS201818)

AI Summary AI Mindmap
PDF (8702KB)

289

访问

0

被引

详细

导航
相关文章

AI思维导图

/