基于深度学习的降水降尺度方法构建及优化

牛子贤 ,  陈杰 ,  熊立华 ,  李爽 ,  柏雄风

地球科学 ›› 2025, Vol. 50 ›› Issue (09) : 3506 -3520.

PDF (5460KB)
地球科学 ›› 2025, Vol. 50 ›› Issue (09) : 3506 -3520. DOI: 10.3799/dqkx.2025.095

基于深度学习的降水降尺度方法构建及优化

作者信息 +

Improvement of Deep Learning Method for Daily Precipitation Downscaling

Author information +
文章历史 +
PDF (5590K)

摘要

为了提高深度学习方法对全球气候模式(GCMs)日降水的降尺度效果,以长江流域为研究对象,基于20种GCMs输出的日降水数据,构建了4种深度学习降尺度模型,并与日偏差校正方法(DBC)结合,提出一种混合降尺度方法(DL-DBC).4种深度学习方法对GCMs日降水的降尺度表现接近;与日偏差校正方法相比,其降尺度后的多年平均日降水的平均绝对相对误差(MARE)更低,但多年平均月降水和多年平均年降水的MARE略高,与深度学习方法相比,DL-DBC得到的多年平均年降水的MARE降低了6.7%~11.3%,多年平均月降水的MARE降低了6.3%~7.6%,且在降水量频率分析等方面同样表现更好.混合方法DL-DBC能提高深度学习模型对GCMs日降水数据的降尺度效果,进一步减小GCMs日尺度降水数据的偏差.

Abstract

To improve the downscaling effectiveness of deep learning methods for daily precipitation from global climate models (GCMs). Targeting at the Yangtze River basin, we constructed four deep learning downscaling models based on historical daily precipitation outputs from 20 GCMs. A hybrid method (DL-DBC) was proposed by integrating these models with the daily bias correction method. The four deep learning models exhibited comparable performance in daily precipitation downscaling. Compared to DBC, they achieved lower mean absolute relative error (MARE) for multi-year average daily precipitation but slightly higher MARE for multi-year average monthly and annual precipitation. The DL-DBC method outperformed standalone deep learning models, reducing MARE for multi-year average annual precipitation by 6.7%-11.3% and monthly precipitation by 6.3%-7.6%, while also demonstrating superior performance in precipitation frequency analysis. The DL-DBC method enhances the downscaling effectiveness of deep learning models and further reduces biases in daily precipitation data from GCMs.

Graphical abstract

关键词

降尺度 / 深度学习 / 降水 / 全球气候模式 / 长江流域 / 气候变化.

Key words

downscaling / deep learning / precipitation / global climate models / Yangtze River basin / climate change

引用本文

引用格式 ▾
牛子贤,陈杰,熊立华,李爽,柏雄风. 基于深度学习的降水降尺度方法构建及优化[J]. 地球科学, 2025, 50(09): 3506-3520 DOI:10.3799/dqkx.2025.095

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

全球变暖已成为学术界广泛关注的议题,暴雨等极端水文事件更为频发(张仲石等, 2022)不仅影响自然生态系统,还对人类社会产生了深远的影响.由全球气候模式(global climate models,GCMs)提供的降水等气候变量涵盖过去和未来时期,已成为科学界探测未来气候变化信息的有效工具(Meehl et al., 2007Taylor et al., 2012).然而,GCMs输出的气象数据往往分辨率较低,难以直接与流域水文模型相结合,且与同一网格尺度的观测气象要素相比,GCMs模拟数据通常具有较大的偏差,不能直接应用于流域水文模型开展水文响应评估(Mearns et al., 2012Sillmann et al., 2013Cannon, 2018),降尺度是解决气候模式输出与响应模型输入之间尺度不匹配以及偏差等问题的重要手段.

常用的降尺度方法可以分为动力降尺度、统计降尺度以及动力和统计相结合的降尺度方法(陈杰等, 2016).动力降尺度,即区域气候模型(regional climate models, RCMs),是一套建立在大气动力学方程基础之上,基于GCMs提供的初始和侧边界条件,通过动力学方程之间的关系,推导高分辨率的气候变化情景的方法(Dickinson et al., 1989Yang et al., 2010).统计降尺度是一种通过建立气候模式输出的历史时段网格尺度气候变量与站点或局地观测的气象要素之间的统计关系,然后将这种关系应用于气候模式输出的未来时段网格数据,从而获得站点或区域尺度未来气候变化情景的方法.相比动力降尺度,统计降尺度计算简单,模型易于构建(刘永和等, 2011),灵活度更高,因此得到了更广泛的应用(Bennett et al., 2011Eden and Widmann, 2014Wang and Chen, 2014Pierce et al., 2015Monjo et al., 2016Eum and Cannon, 2017Guo et al., 2019).目前,统计降尺度方法包括从简单的空间分解偏差校正 (Wood et al., 2004)到分位数校正(如分位数映射QM、分位数增量映射QDM等)到机器学习方法,如:人工神经网络 (Wilby et al., 1998Schoof and Pryor, 2001)、随机森林等(He et al., 2016Pour et al., 2016Mei et al., 2020Legasa et al., 2022).

目前,机器学习已经在水文的各个领域得到了运用(刘杰等,2024),但以往的研究表明,与传统统计降尺度方法相比,机器学习方法所获得的改进甚微(He et al., 2016Yang et al., 2018Sachindra and Kanae, 2019Vandal et al., 2019).作为机器学习的一种进化,深度学习能够构建更复杂的层次结构,在提取数据的高级特征上有更好的表现,有助于捕获复杂的非线性关系,处理高维数据,因此逐渐被应用于降尺度研究.尤其是卷积神经网络(CNN)在气候模式输出 (Rodrigues et al., 2018Liu et al., 2020Pan et al., 2021Wang and Tian, 2022)、再分析数据 (Baño⁃Medina et al., 2020Sun and Lan, 2021)和气象预报模型输出 (Harris et al., 2022Li et al., 2022)等的降尺度中被成功应用.具体而言,基于深度学习的降尺度方法相比过去的统计降尺度方法能够更好地优化降水发生的时间结构.

然而,深度学习方法在针对GCMs日降水的降尺度中应用仍然较少,主要是由于GCMs模拟降水与观测值在时间上并不存在同步关系,因此具体到每日的降水偏差较大,使得模型输入的样本与实测数据无法一一对应.然而,现有部分研究采用深度学习方法直接针对GCMs日降水数据进行降尺度,如Sharma et al.(2024)在印度基于超分辨率残差神经网络(super resolution deep residual network, SRDRN)和偏差校正神经网络(convolutional neural network for bias correction, CNNBC)两种深度学习方法对GCMs日降水开展降尺度研究,结果表明两种深度学习方法的一致性指数(index of agreement,IOA)并不优于简单的QDM方法,从理论上而言,这种降尺度忽略了GCMs数据与实测数据之间的非对应关系.

与来自GCMs的降水数据相比,再分析数据可能更适用于深度学习模型的训练,这是因为再分析数据集通过同化多元观测数据,降低了与实际地表观测数据的偏差,因此基于深度学习模型的降尺度方法在再分析数据中的降尺度表现往往更好,例如Sun and Lan(2021)对再分析降水数据的降尺度测试中,CNN模型取得了比广义线性回归更好的降水降尺度效果,对比训练期和测试期的降尺度效果,也展现出了更好的稳定性.然而,GCMs数据与再分析数据之间的偏差往往较大,在将基于再分析数据训练的深度学习模型应用于GCMs数据时,需要对GCMs数据进行偏差校正.

基于以上背景,本研究选择20种GCMs输出的历史日降水数据,并以长江流域为对象,构建了4种深度学习(CNN、SRDRN、ConvNext、DenseNet)降尺度模型,评估了其在GCMs降水降尺度方面的表现,作为常用的降水偏差校正方法,日偏差校正方法(daily bias correction, DBC)能考虑干湿频率并基于分位数进行校正,具有较为稳定的效果,研究选择DBC与深度学习降尺度方法结合,并引入ERA5再分析日降水数据作为训练数据提出了一种混合降尺度方法(DL⁃DBC);并与传统的线性缩放(linear scaling, LS)偏差校正和DBC方法进行对比验证,从降水的整体偏差、降水频率分布特征、降水时间序列和空间结构等方面对多种降尺度方法进行综合比较分析.

1 数据与方法

1.1 研究流域与数据

本研究选择的区域为长江流域,范围从90°E到122°E,24°N到36°N,如图1所示.长江流域是世界第三大流域,源区地处高原气候区,中下游则主要是丘陵和盆地,降水量从上游到下游呈现出明显的梯度变化,其中四川盆地和长江中下游平原是降水最多的区域,部分地区超过 1 500 mm,上游地区降水量较少,一般在500 mm以下.长江流域地处东亚季风区,降水量在时间上分配不均匀,降水主要集中在夏季,占全年降水量的50%以上,冬季降水量仅占全年的10%左右,且长江流域是夏季大范围旱涝灾害发生频繁且严重的地区(张琼和吴国雄, 2001).

本研究同时使用来源于国际模式第六次比较计划(CMIP6)的20种GCMs模拟的降水数据以及ECMWF发布的第五代大气再分析数据集ERA5降水数据,20种GCMs的模式、分辨率及开发机构见表1.大多数GCMs包含1850-2014年历史条件驱动下的降水序列.由于ERA5降水数据在1979年之前的质量较差,因此为了将数据的时间范围保持一致,研究的时间范围选择1979-2014年.

本研究采用CN05.1的网格降水数据作为观测数据.CN05.1是一个基于中国2 416个气象站观测数据的插值建立的网格数据集(吴佳和高学杰, 2013),其分辨率为0.25°×0.25°,在本研究区域内共有48×128个栅格.CN05.1包含中国境内1961-2014年的多种气象变量,为了与模拟降水数据保持一致,本研究仅使用1979-2014年的日降水数据序列.

1.2 研究方法

1.2.1 偏差校正方法

本研究选择了两种偏差校正方法作为基准方法,分别是基于均值的线性缩放法LS和基于分布的日偏差校正DBC(Chen et al., 2013).

LS校正是一种基于均值的偏差校正方法,通过将GCMs的历史模拟数据与观测数据在各月份的差异确定为各月的修正因子,用于修正测试期GCMs各月的日降水量,公式如下:

           Pcor,cali,m=Pobs,mPcali,m×Pcali,m
           Pcor,vali,m=Pobs,mPcali,m×Pvali,m

其中,下标obscali vali分别表示训练期观测数据、训练期待校准数据和验证期待校准数据;m表示月份,cor表示校正后的数据.

DBC校正是一种基于分布的偏差校正方法,它能够考虑逐日降水频率分布的不同,并修正降水的雨日频率.DBC方法的步骤是基于历史时期的观测数据对相应时期的GCMs模拟数据进行雨日频率校正和分位数校正,然后基于历史时期的校正因子对验证期或未来GCMs的降水分别进行雨日频率和分位数校正.DBC校正的公式如下所示:

           Pcor,cali,m,p=Pobs,m,pPcali,m,p×Pcali,m,p
           Pcor,vali,m,p=Pobs,m,pPcali,m,p×Pvali,m,p

其中, p为校正因子对应分位数.

1.2.2 深度学习降尺度方法

本研究构建了4种基于监督学习的深度学习降尺度方法,均由深度学习主干部分和上采样部分构成.模型需要一组配对的高分辨率观测数据和低分辨率模拟数据作为输入,并划分为训练期与验证期,利用主干部分的卷积层提取训练期低分辨率数据的特征,训练模型参数,并在上采样部分生成高分辨率数据;通过计算损失函数衡量模型在验证期输出的高分辨率数据与观测数据的接近程度,并不断调整参数权重,逐渐优化模型的模拟效果.

研究选择的4种模型主干如图2a所示,该部分用于提取低分辨率数据的特征.CNN(a)是基础的卷积神经网络,由标准卷积块构成,本研究构建的CNN由4个标准卷积块组成,每个卷积块包括两个卷积层(3×3的卷积核)和批归一化层(batch normalization);SRDRN(b)通过引入残差块,能够避免普通CNN网络容易出现的梯度消失/爆炸和退化等问题,在更深的情况下也无法减少训练损失的缺点(Pan et al., 2019),主要包括16个残差块以及其余卷积层(Wang et al., 2021);ConvNext(c)由Liu et al. (2022)提出,借鉴了vision transformer(ViT)的设计理念,旨在提高其在计算机视觉任务中的表现,同时保持CNN本身良好的局部特征学习能力和高效的推理速度,包含8个ConvNext风格的卷积块;DenseNet(d)通过在残差网络的基础上建立密集连接进一步解决网络退化问题,并增加对每层特征的利用(Huang et al., 2017),包含8个密集连接块.本研究构建的CNN、SRDRN、DenseNet均选择修正线性单元ReLU(rectified linear unit)作为激活函数,归一化方法均为批归一化,ConvNext(c)采用高斯误差线性单元GeLU作为激活函数,并选择了更大的卷积核尺寸(7×7)及层归一化方法(layer normalization).

研究选择的上采样方法为次像素卷积法 (sub⁃pixel convolution, SPC),该部分模型由次像素卷积块组成(Lim et al., 2017),如图2b所示,每个上采样块由一个卷积层和一个上采样层组成,后面是参数化ReLU激活函数.上采样块接收到模型主干输出的低分辨率特征图,并通过重排通道的方式生成高分辨率的输出,其中每个上采样块负责2倍的分辨率放大倍数,本研究中分辨率放大倍数为4倍,因此该部分由两个上采样块组成.

研究中所有深度学习模型的训练损失函数为平均绝对误差MAE,使用Adam优化算法(Kingma and Ba, 2014)对网络进行训练,学习率初始值设置为0.000 5,随着轮数的增加,学习率会按一定比例减少,最小值为0.000 1.所有深度学习模型的epoch数量均设置为200,这意味着在训练时所有的样本均会通过模型200次,其中每个epoch中的batch size被设置为16,即每批进入模型的样本数量为16,每处理完一批样本,模型参数就会进行一次更新.

在使用深度学习模型进行降尺度前,笔者对GCMs降水数据进行了简单的数据增强,即通过减去平均值(μ)并除以标准差(σ)的方法对降水数据集进行归一化,并通过旋转和水平/垂直翻转来提高样本的多样性,以增强模型在面对未知时期的适应能力.为了减小噪声,降低模型训练的难度,在训练模型时将GCMs降水数据和观测降水进行3日滚动平均,而在对测试期降水进行模拟时,依旧采用原始的GCMs降水数据作为输入数据.

1.2.3 多源数据混合降尺度方法(DL⁃DBC)

DL⁃DBC方法首先采用ERA5降水数据作为深度学习模型的训练数据,然后根据训练期的ERA5和GCMs降水数据的差异,采用DBC方法对测试期的GCMs数据进行偏差校正,并作为深度学习降尺度模型测试期的输入.该方法考虑了ERA5与GCMs降水数据之间的差异,在使用GCMs数据之前,先以ERA5降水数据为基本,采用DBC对其进行偏差校正,同时,通过ERA5数据提高模型的训练效果,并可用于未来时期的GCMs模拟降水数据的降尺度.

对于不同降尺度和偏差校正方法,采用表2中的编号表示.A1和A2分别是LS方法与DBC方法,B1~B4为直接使用GCMs训练的几种深度学习模型降尺度方法,B1A2~B4A2分别为基于4种深度学习模型的混合DL⁃DBC方法.

1.3 降尺度实验设计

在进行偏差校正和降尺度之前,首先使用双线性插值法将所有GCMs降水数据重新网格化为统一的1°×1°,目标分辨率是与观测数据集相同的0.25°纬度×0.25°经度,同时在DL⁃DBC中,为了与模拟用的GCMs数据的分辨率一致,训练用的ERA5数据被重采样到1°×1°.针对少数缺失值,采用反距离加权法进行插值,为了避免极小数据影响训练效果,在训练期设置的阈值为0.1 mm,低于阈值的数据被视为无降水;在使用基于深度学习算法的降尺度方法时,为了尽可能提高测试期的长度,同时保证训练数据足够多,基于GCMs直接训练的深度学习降尺度方法(B1~B4)和引入ERA5数据训练的DL⁃DBC(B1A2~B4A2)将1979-1989年作为模型监督学习的训练期,而1990-2000年作为监督学习的验证期,测试期选择1997-2014年,经过分析,以上三个时期均具有较好的代表性,不存在降水量非常极端的年份;在进行LS和DBC偏差校正时,选择1979-2000作为训练期,2001-2014作为测试期,从而与两种偏差校正方法的测试期一致.

本研究基于测试期的降尺度结果,从降水的偏差、降水量的频率分布、流域多年平均月降水序列、降水空间偏倚结构等维度衡量了几种降尺度方法.

在偏差和降水量频率分析中,分别采用了MAREMAE作为评估指标,其中MAE计算公式如下:

       MAE=1X×Y×Tx=1Xy=1Yt=1T|pi-p^i|

MARE计算公式如下:

   MARE=1X×Y×Tx=1Xy=1Yt=1T|pi-p^ipi|

其中,pi为观测降水,p^i为模拟结果,XY为空间维度长度,T为时间维度长度.

在分析模拟降水偏差时,采用一致性指数IOA作为分析指标,以衡量模拟降水与观测值的一致性(Sharma et al., 2024).IOA计算公式如下:

          IOA=1-i=1n|y^i-yi|i=1n(y^i-y¯+|yi-y¯|)

其中,y^iyi分别是模拟和观测降水序列,y¯是观测降水均值.

在流域多年平均月降水序列分析中,分别使用了均方根误差(root mean square error, RMSE)和皮尔逊相关系数(Pearson correlation coefficient, r)作为评估指标,均方根误差RMSE如下:

          RMSE=1ni=1n(yi-y^i)2

其中,yi为观测降水,y^i为模拟结果,n为降水数据的总数.

皮尔逊相关系数的计算公式如下:

          r=i=1n(xi-x¯)(yi-y¯)i=1n(xi-x¯)2 i=1n(yi-y¯)2 

其中,xiyi分别是模拟和观测降水,x¯y¯分别是模拟和观测降水的均值.

笔者通过比较观测降水和模拟降水的空间半变异函数图,评估降尺度方法还原降水空间偏倚关系的效果.空间半变函数曲线γs可计算如下:

          γshs=12Ij+hs-Ij2

其中,Ij)代表位置j处的数据,hs是一个位移向量(即四个方向网格单元之间的间距).

2 研究结果

2.1 整体偏差分析

研究将几种降尺度方法得到的测试期模拟降水及GCMs直接插值到对应分辨率的结果,以格点为单位,分别计算了多年平均降水、多年平均月降水和多年平均日降水的MARE(图3).

根据图3可知,所有降尺度方法得到的降水MARE均优于直接对GCMs进行双线性插值(bilinear interpolation, BL)的结果,4种深度学习方法的整体表现接近.在多年平均年降水的分析中,LS方法得到的20种GCMs模拟降水的MARE均值为19.4%,DBC方法得到的结果为8.9%,4种深度学习直接对GCMs进行降尺度(B1~B4)的结果为14.0%~18.7%,4种DL⁃DBC的多年平均降水的MARE为7.1%~7.5%.而在多年平均月降水的分析中,LS方法的结果为60.1%,DBC方法为27.3%,直接对GCMs进行降尺度的4种深度学习降尺度的结果为33.1%~34.3%,4种DL⁃DBC的结果为26.1%~26.5%,表现优于其他方法.而在多年平均日降水的分析中,原始数据的MARE达到了186%,直接对GCMs进行降尺度的深度学习方法得到的结果为75%~81%,优于LS方法的122%和DBC方法的93%,DL⁃DBC的结果为71%~75%,同样优于其他方法.

偏差分析的结果表明,与DBC方法相比,LS方法的结果整体偏差更大,而两种方法在均值上的校正效果本应该比较接近,这很可能是因为日降水数据分布高度偏态,而LS方法仅关注整体均值,而忽略极端值的局部偏差.直接使用GCMs训练的深度学习模型(B1~B4)得到的多年平均降水以及多年平均月降水MARE指标相比DBC方法同样略差,但多年平均日降水的MARE指标相比DBC方法略优,证明基于深度学习的降尺度方法在较小的时间尺度下能更有效地缩小偏差,而基于分布的DBC方法在较大的时间尺度下表现更好,混合方法DL⁃DBC进一步提升了深度学习降尺度的效果,在不同时间尺度下均能更多地缩小模拟降水的偏差.

为了分析降水降尺度结果在不同季节的偏差分布情况,以MPI⁃ESM1的降尺度结果为例,绘制了降水偏差的季节空间分布(图4).结果显示,在长江上游的高原区域,由于降水本身较少,所有降尺度方法的结果偏差均较小,除高原区域以外,LS方法在各季节的表现均不稳定,4种基于GCMs训练的深度学习降尺度表现优于LS方法,但仍略差于DBC方法,具体而言,在降水较高的季节,DBC方案的结果在大多数地区的偏差均较小,对长江中下游区域的部分地区存在一定的高估,而基于GCMs训练的深度学习模型则在多数地区存在低估,下游部分区域略有高估,在冬季也展现出对中下游降水的略微低估;对比之下,4种DL⁃DBC得到的降水在各个季节的偏差均更小,但雨季仍存在对长江中下游流域降水的高估.

进一步,对流域每个网格点的一致性指数IOA进行了评估.首先对测试期所有年份的降水序列进行每日平均,得到流域每个网格点的年平均日降水序列,然后分别计算各网格点的IOA指标.图5a展示了20种GCMs的模拟结果在各网格点的IOA均值;图5b统计了20种GCMs降尺度降水的流域平均IOA.总体而言,4种基于GCMs训练的深度学习降尺度降水的IOA均值为0.775~0.784,高于LS方法的0.689,与DBC方法的结果0.778接近,从图4可以看出DBC方法在降水更低的长江上游表现更好,而在长江中下游,基于 GCMs训练的深度学习降尺度模型的效果更好.混合方法DL⁃DBC的整体表现更好一些,IOA均值为0.791~0.795.从图5a可知,DL⁃DBC相比较深度学习降尺度,在下游地区的IOA指标略有提升.考虑到长江流域下游的降水量高于中上游,DL⁃DBC在降水量较高的区域可能会展现出更好的效果.

2.2 降水量频率分析

为了分析降尺度降水与观测降水分布的同步性,绘制了分位数‒分位数(quantile⁃quantile, Q⁃Q)图(图6).将训练期观测数据的多年平均日降水大于2 mm的格点作为高降水地区,低于2 mm则作为低降水区域,分别绘制了Q⁃Q图.如图6所示,与LS和DBC方法相比,4种基于GCMs训练的深度学习降尺度方法(B1~B4)对极端降水存在普遍的低估,无论是在降水偏高还是偏低的地区均展现出局限性.而4种引入ERA5降水数据训练的DL⁃DBC与实测数据的Q⁃Q曲线更接近1∶1线,这表明DL⁃DBC能改善深度学习降尺度难以模拟高降水的问题.

笔者选择了4个指标对流域的降水特征进行分析,包括年湿日(流域日平均降水量>1 mm)总数、年最长湿期、年高降水日(流域日平均降水量>10 mm)总数和年最高日降水量.逐格点计算了测试期降水的年平均日降水序列,然后计算上述4种指标,并采用MAE评估了各格点模拟降水与观测降水的指标偏差,将20种GCMs的结果取平均值展示(图7).图7a显示,4种基于GCMs训练的深度学习降尺度年湿日总数MAE为37.9~38.6 d,表现优于LS方法的51.6,但差于DBC方法的33.4 d,这可能是因为DBC方法会考虑流域的干湿频率,因此表现更好;而4种DL⁃DBC的年湿日总数MAE为32.3~32.6 d,表现与DBC方法接近.图7b中,4种深度学习降尺度的年最长湿期MAE达到了24.5~27.7 d左右,明显高于LS方法的18.4 d和DBC方法的13.8 d,这可能是因为当模型训练效果不够好时,深度学习模型的模拟曲线通常相对平缓,很容易高估湿期的长度,对比之下,DL⁃DBC年最长湿期MAE均值为13.7~14.9 d,相比基于GCMs训练的结果有明显改进,这证明DL⁃DBC的模拟效果明显更好.图7c则表明,4种深度学习降尺度的年高降水日总数MAE为5.5~6.7 d,优于LS方法的11.99 d,但略差于DBC方法的4.54 d.结合图6分析,这可能是因为深度学习降尺度对高降水存在较明显的低估,而4种DL⁃DBC的年高降水日总数MAE均值为3.64~3.77 d,表现比DBC方法更好.这可能是因为DL⁃DBC利用ERA5数据实现了较好的训练效果,因此在模拟高降水方面表现比仅使用GCMs数据训练的结果好很多,图7d同样可以验证该结论.

上述分析表明,在对GCMs日尺度降水进行降尺度时,直接利用GCMs数据和观测数据训练的4种深度学习降尺度方法在还原长江流域降水分布特征上的表现并不理想,问题主要表现在对湿期长度的高估以及高降水的低估,这是由于数据质量较差,且深度学习降尺度的模拟结果往往较为平缓导致的.混合方法DL⁃DBC有效地改善了深度学习降尺度的这些问题,并在部分指标上优于DBC方法,能够更有效地捕捉流域降水的分布特征.

2.3 时间偏差分析

笔者计算了整个流域测试期模拟降水的多年平均月降水,并评估了模拟降水与观测降水的序列偏差(图8).结果表明,20种GCMs经DBC方法后的RMSE均值为11 mm,MAE达到8.84 mm,相比校正前偏差明显缩小,LS方法的RMSEMAE表现均比DBC方法更差,但相比校正前仍有一定的改善,4种基于GCMs训练的深度学习降尺度方法稍差于DBC方法,RMSE均值在13.5~18.2 mm,MAE为11.3~15.9 mm,混合方法DL⁃DBC的表现更好,RMSE稳定在10.5~10.8 mm,MAE稳定在8.2~8.6 mm.上述分析表明,相比仅使用GCMs训练的深度学习降尺度方法,DL⁃DBC降低流域年均月降水偏差的效果明显提升,在对GCMs日降水数据进行降尺度时,能有效减少模拟降水与观测降水之间的偏差,提高模拟降水序列与观测值的相关性.

2.4 空间偏差与偏倚结构

为了更好地分析降尺度方法在细节上模拟降水的准确性,笔者分析了模拟降水与观测降水在空间偏倚结构上的差异.基于模拟降水与观测降水在流域各格点逐日计算的空间半边函数曲线,通过皮尔逊相关系数rRMSE衡量模拟降水与观测降水空间半边函数曲线的接近程度,如图9所示.

与DBC方法相比,基于GCMs训练的4种深度学习降尺度方法的模拟降水的RMSE和皮尔逊相关系数略差,但优于原始数据和LS方法后的结果.4种DL⁃DBC方法表现比DBC方法更好且更加稳定,在RMSE指标上,4种DL⁃DBC的结果为1.99~2.03,相比4种基于GCMs训练的深度学习降尺度的结果下降了0.16~0.22;皮尔逊相关系数均值达到0.91左右,相比基于GCMs训练的深度学习降尺度上升0.02.整体来说,DL⁃DBC在模拟降水的空间偏倚关系上表现优于DBC方法以及直接基于GCMs训练的深度学习降尺度模型.

表3分不同季节展示了空间半边函数曲线的RMSE和皮尔逊相关系数.可以看到,相比深度学习降尺度方法,DL⁃DBC对模拟降水的空间半边函数曲线优化最明显的是6~8月,两项指标均较好.对于降水较少的季节,如冬季和春季,DL⁃DBC的皮尔逊相关系数r同样更高,但RMSE并不明显优于其他方法.考虑到长江流域降水主要集中在夏季,因此DL⁃DBC在模拟较高降水的空间偏倚结构的整体表现比LS方法、DBC方法以及直接由GCMs训练的深度学习降尺度方法更好.

3 结论

GCMs模拟降水的空间分辨率较低,且具有较大的偏差,在使用前通常需要进行降尺度.目前,基于深度学习模型的降尺度方法已成为该领域内一种新的方向,已有许多研究证明了基于深度学习的降尺度方法的可行性.然而,对于带有较大时空偏差的粗分辨率数据(GCMs日尺度降水数据),深度学习模型的降尺度效果仍有待研究.本研究以长江流域为研究对象,基于20种GCMs模拟的日降水数据,评估了4种深度学习模型,并与常用的LS方法和DBC方法进行了对比分析,并提出了一种引入ERA5降水数据进行训练,并由基于ERA5数据进行DBC方法后的GCMs数据进行模拟的混合方法DL⁃DBC,旨在结合GCMs和ERA5数据的优势,提高模拟效果.研究得到了以下几个结论:

(1)4种基于GCMs训练的深度学习降尺度方法得到的降尺度结果的多年平均日降水MARE均值为75%~81%,表现优于LS方法与DBC方法,多年平均降水及多年平均月降水的MARE均值分别是7.1%~7.5%和33.1%~34.3%,略差于DBC方法.混合方法DL⁃DBC提升了深度学习降尺度方法的模拟效果,基于4种深度学习模型的DL⁃DBC的多年平均降水MARE相比深度学习降尺度降低6.7%~11.3%,多年平均月降水的MARE下降6.3%~7.6%,而多年平均日降水的MARE下降4.3%~8.7%.

(2)4种DL⁃DBC方法得到的流域平均IOA为0.791~0.794,略高于几种直接基于GCMs训练的深度学习方法以及LS方法和DBC方法,主要改进表现在降水较高的长江下游地区,这表明在降水较高的区域,DL⁃DBC的模拟降水整体上更接近观测数据.

(3)基于4种深度学习降尺度的DL⁃DBC方法能够较好地捕捉降水频率分布特征,有效改善了直接使用GCMs训练的深度学习降尺度方法对高降水的低估问题,能够提高模拟降水量与观测降水量频率分布的一致性.

(4)DL⁃DBC的多年平均月降水的RMSEMAE优于深度学习降尺度方法,和DBC方法相比也更加稳定,4种DL⁃DBC方法的RMSE均值相比GCMs训练的深度学习降尺度方法平均下降了2.77~7.59 mm,MAE下降了2.76~7.73 mm.主要改善在于夏季,这表明DL⁃DBC方法能够更稳定地模拟降水的年内分配情况.

(5)基于GCMs训练的深度学习降尺度方法的降水空间半边函数曲线的皮尔逊相关系数与RMSE略优于LS方法,与DBC方法接近;DL⁃DBC方法的效果更好,皮尔逊相关系数达到0.903~0.911,而RMSE指标为1.99~2.03,与基于GCMs训练的深度学习降尺度方法相比,DL⁃DBC方法的提升主要体现在降水较高的季节.

尽管过去的深度学习降尺度研究中,更高级、深层的网络往往有利于提取更高级的信息,但在本研究的分析中,几种深度学习架构对长江流域 GCMs日尺度的降水降尺度效果差异不大,这可能是因为GCMs日尺度降水数据本身巨大的时空偏差,在训练时模拟数据与观测数据无法进行有效的对应,因此使用更深的网络也难以更有效地提取数据特征,同样地,基于4种不同深度学习架构的DL⁃DBC方法之间也没有显著的效果差异,对于日尺度降水的降尺度,更复杂的网络模型是否能够展现出显著的优势仍有待进一步的测试.

参考文献

[1]

Baño⁃Medina, J., Manzanas, R., Gutiérrez, J. M., 2020. Configuration and Intercomparison of Deep Learning Neural Models for Statistical Downscaling. Geoscientific Model Development, 13(4): 2109-2124. https://doi.org/10.5194/gmd⁃13⁃2109⁃2020

[2]

Bennett, J. C, Grose, M. R., Post, D. A., et al., 2011. Performance of Quantile⁃Quantile Bias⁃Correction for Use in Hydroclimatological Projections. In: Chan, F., Marinova, D., Anderssen, R.S., eds.,19th International Congress on Modelling and Simulation. Perth. https://doi.org/10.36334/modsim.2011.f5.bennett

[3]

Cannon, A. J., 2018. Multivariate Quantile Mapping Bias Correction: An N⁃Dimensional Probability Density Function Transform for Climate Model Simulations of Multiple Variables. Climate Dynamics, 50(1): 31-49. https://doi.org/10.1007/s00382⁃017⁃3580⁃6

[4]

Chen, J., Brissette, F. P., Chaumont, D., et al., 2013. Performance and Uncertainty Evaluation of Empirical Downscaling Methods in Quantifying the Climate Change Impacts on Hydrology over Two North American River Basins. Journal of Hydrology, 479: 200-214. https://doi.org/10.1016/j.jhydrol.2012.11.062

[5]

Chen, J., Xu, C. Y., Guo, S. L., et al., 2016. Progress and Challenge in Statistically Downscaling Climate Model Outputs. Journal of Water Resources Research, 5(4): 299-313 (in Chinese with English abstract).

[6]

Dickinson, R. E., Errico, R. M., Giorgi, F., et al., 1989. A Regional Climate Model for the Western United States. Climatic Change, 15(3): 383-422. https://doi.org/10.1007/BF00240465

[7]

Eden, J. M., Widmann, M., 2014. Downscaling of GCM⁃Simulated Precipitation Using Model Output Statistics. Journal of Climate, 27(1): 312-324. https://doi.org/10.1175/jcli⁃d⁃13⁃00063.1

[8]

Eum, H. I., Cannon, A. J., 2017. Intercomparison of Projected Changes in Climate Extremes for South Korea: Application of Trend Preserving Statistical Downscaling Methods to the CMIP5 Ensemble. International Journal of Climatology, 37(8): 3381-3397. https://doi.org/10.1002/joc.4924

[9]

Guo, Q., Chen, J., Zhang, X. C., et al., 2019. A New Two⁃Stage Multivariate Quantile Mapping Method for Bias Correcting Climate Model Outputs. Climate Dynamics, 53(5): 3603-3623. https://doi.org/10.1007/s00382⁃019⁃04729⁃w

[10]

Harris, L., McRae, A. T. T., Chantry, M., et al., 2022. A Generative Deep Learning Approach to Stochastic Downscaling of Precipitation Forecasts. Journal of Advances in Modeling Earth Systems, 14(10): e2022MS003120. https://doi.org/10.1029/2022MS003120

[11]

He, X. G., Chaney, N. W., Schleiss, M., et al., 2016. Spatial Downscaling of Precipitation Using Adaptable Random Forests. Water Resources Research, 52(10): 8217-8237. https://doi.org/10.1002/2016WR019034

[12]

Huang, G., Liu, Z., Van Der Maaten, L., et al., 2017. Densely Connected Convolutional Networks. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu. https://doi.org/10.1109/CVPR.2017.243

[13]

Kingma, D., Ba, J., 2014. Adam: A method for Stochastic Optimization. The 3rd International Conference for Learning Representations, San Diego.

[14]

Legasa, M. N., Manzanas, R., Calviño, A., et al., 2022. A Posteriori Random Forests for Stochastic Downscaling of Precipitation by Predicting Probability Distributions. Water Resources Research, 58(4): e2021WR030272. https://doi.org/10.1029/2021WR030272

[15]

Li, W. T., Pan, B. X., Xia, J. J., et al., 2022. Convolutional Neural Network⁃Based Statistical Post⁃Processing of Ensemble Precipitation Forecasts. Journal of Hydrology, 605: 127301. https://doi.org/10.1016/j.jhydrol.2021.127301

[16]

Lim, B., Son, S., Kim, H., et al., 2017. Enhanced Deep Residual Networks for Single Image Super⁃Resolution. 2017 IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), Honolulu. https://doi.org/10.1109/CVPRW.2017.151

[17]

Liu, J., Chen, Q., Xu, Y., et al., 2024. Simulation of Phosphorus Inflow and Outflow Fluxes and Water Quality Prediction in Dongting Lake Area of the Yangtze River Basin: A Coupled Approach of Machine Learning and Traditional Hydrological Modeling. Earth Science, 49(11): 3995-4007 (in Chinese with English abstract).

[18]

Liu, Y. H., Guo, W. D., Feng, J. M., et al., 2011. A Summary of Methods for Statistical Downscaling of Meteorological Data. Advances in Earth Science, 26(8): 837-847 (in Chinese with English abstract).

[19]

Liu, Y. M., Ganguly, A. R., Dy, J., 2020. Climate Downscaling Using YNet: A Deep Convolutional Network with Skip Connections and Fusion. The 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. San Diego. https://doi.org/10.1145/3394486.3403366

[20]

Liu, Z., Mao, H., et al., 2022. A Convnet for the 2020s. The IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle.

[21]

Mearns, L. O., Arritt, R., Biner, S., et al., 2012. The North American Regional Climate Change Assessment Program: Overview of Phase I Results. Bulletin of the American Meteorological Society, 93(9): 1337-1362. https://doi.org/10.1175/bams⁃d⁃11⁃00223.1

[22]

Meehl, G. A., Covey, C., Delworth, T., et al., 2007. THE WCRP CMIP3 Multimodel Dataset: A New Era in Climate Change Research. Bulletin of the American Meteorological Society, 88(9): 1383-1394. https://doi.org/10.1175/bams⁃88⁃9⁃1383

[23]

Mei, Y. W., Maggioni, V., Houser, P., et al., 2020. A Nonparametric Statistical Technique for Spatial Downscaling of Precipitation over High Mountain Asia. Water Resources Research, 56(11): e2020WR027472. https://doi.org/10.1029/2020WR027472

[24]

Monjo, R., Gaitán, E., Pórtoles, J., et al., 2016. Changes in Extreme Precipitation over Spain Using Statistical Downscaling of CMIP5 Projections. International Journal of Climatology, 36(2): 757-769. https://doi.org/10.1002/joc.4380

[25]

Pan, B. X., Anderson, G. J., Goncalves, A., et al., 2021. Learning to Correct Climate Projection Biases. Journal of Advances in Modeling Earth Systems, 13(10): e2021MS002509. https://doi.org/10.1029/2021MS002509

[26]

Pan, B. X., Hsu, K., AghaKouchak, A., et al., 2019. Improving Precipitation Estimation Using Convolutional Neural Network. Water Resources Research, 55(3): 2301-2321. https://doi.org/10.1029/2018WR024090

[27]

Pierce, D. W., Cayan, D. R., Maurer, E. P., et al., 2015. Improved Bias Correction Techniques for Hydrological Simulations of Climate Change. Journal of Hydrometeorology, 16(6): 2421-2442. https://doi.org/10.1175/jhm⁃d⁃14⁃0236.1

[28]

Pour, S. H., Shahid, S., Chung, E. S., 2016. A Hybrid Model for Statistical Downscaling of Daily Rainfall. Procedia Engineering, 154: 1424-1430. https://doi.org/10.1016/j.proeng.2016.07.514

[29]

Rodrigues, E. R., Oliveira, I., Cunha, R., et al., 2018. DeepDownscale: A Deep Learning Strategy for High⁃Resolution Weather Forecast. 2018 IEEE 14th International Conference on e⁃Science (e⁃Science)., Amsterdam. https://doi.org/10.1109/eScience.2018.00130

[30]

Sachindra, D. A., Kanae, S., 2019. Machine Learning for Downscaling: The Use of Parallel Multiple Populations in Genetic Programming. Stochastic Environmental Research and Risk Assessment, 33(8): 1497-1533. https://doi.org/10.1007/s00477⁃019⁃01721⁃y

[31]

Schoof, J. T., Pryor, S. C., 2001. Downscaling Temperature and Precipitation: A Comparison of Regression⁃Based Methods and Artificial Neural Networks. International Journal of Climatology, 21(7): 773-790. https://doi.org/10.1002/joc.655

[32]

Sharma, S. C. M., Kumar, B., Mitra, A., et al., 2024. Deep Learning⁃Based Bias Correction of ISMR Simulated by GCM. Atmospheric Research, 309: 107589. https://doi.org/10.1016/j.atmosres.2024.107589

[33]

Sillmann, J., Kharin, V. V., Zhang, X., et al., 2013. Climate Extremes Indices in the CMIP5 Multimodel Ensemble: Part 1. Model Evaluation in the Present Climate. Journal of Geophysical Research: Atmospheres, 118(4): 1716-1733. https://doi.org/10.1002/jgrd.50203

[34]

Sun, L., Lan, Y. F., 2021. Statistical Downscaling of Daily Temperature and Precipitation over China Using Deep Learning Neural Models: Localization and Comparison with Other Methods. International Journal of Climatology, 41(2): 1128-1147. https://doi.org/10.1002/joc.6769

[35]

Taylor, K. E., Stouffer, R. J., Meehl, G. A., 2012. An Overview of CMIP5 and the Experiment Design. Bulletin of the American Meteorological Society, 93(4): 485-498. https://doi.org/10.1175/bams⁃d⁃11⁃00094.1

[36]

Vandal, T., Kodra, E., Ganguly, A. R., 2019. Intercomparison of Machine Learning Methods for Statistical Downscaling: The Case of Daily and Extreme Precipitation. Theoretical and Applied Climatology, 137(1): 557-570. https://doi.org/10.1007/s00704⁃018⁃2613⁃3

[37]

Wang, F., Tian, D., 2022. On Deep Learning⁃Based Bias Correction and Downscaling of Multiple Climate Models Simulations. Climate Dynamics, 59(11): 3451-3468. https://doi.org/10.1007/s00382⁃022⁃06277⁃2

[38]

Wang, F., Tian, D., Lowe, L., et al., 2021. Deep Learning for Daily Precipitation and Temperature Downscaling. Water Resources Research, 57(4): e2020WR029308. https://doi.org/10.1029/2020WR029308

[39]

Wang, L., Chen, W., 2014. A CMIP5 Multimodel Projection of Future Temperature, Precipitation, and Climatological Drought in China. International Journal of Climatology, 34(6): 2059-2078. https://doi.org/10.1002/joc.3822

[40]

Wilby, R. L., Wigley, T. M. L., Conway, D., et al., 1998. Statistical Downscaling of General Circulation Model Output: A Comparison of Methods. Water Resources Research, 34(11): 2995-3008. https://doi.org/10.1029/98WR02577

[41]

Wood, A. W., Leung, L. R., Sridhar, V., et al., 2004. Hydrologic Implications of Dynamical and Statistical Approaches to Downscaling Climate Model Outputs. Climatic Change, 62(1): 189-216. https://doi.org/10.1023/B: CLIM.0000013685.99609.9e

[42]

Wu, J., Gao, X. J., 2013. A Gridded Daily Observation Dataset over China Region and Comparison with the Other Datasets. Chinese Journal of Geophysics, 56(4): 1102-1111 (in Chinese with English abstract).

[43]

Yang, C. L., Wang, N. L., Wang, S. J., et al., 2018. Performance Comparison of Three Predictor Selection Methods for Statistical Downscaling of Daily Precipitation. Theoretical and Applied Climatology, 131(1): 43-54. https://doi.org/10.1007/s00704⁃016⁃1956⁃x

[44]

Yang, W., Andréasson, J., Phil Graham, L., et al., 2010. Distribution⁃Based Scaling to Improve Usability of Regional Climate Model Projections for Hydrological Climate Change Impacts Studies. Hydrology Research, 41(3-4): 211-229. https://doi.org/10.2166/nh.2010.004

[45]

Zhang, Q., Wu, G. X., 2001. The Large Area Flood and Drought over Yangtze River Valley and Its Relation to the South Asia High. Acta Meteorologica Sinica, 59(5): 569-577 (in Chinese with English abstract).

[46]

Zhang, Z. S., Li, S. L., Wang, H. J., et al., 2022. Introduction of Crossing Disciplines between Geology and Atmospheric Science. Earth Science, 47(10): 3569-3579 (in Chinese with English abstract).

基金资助

湖北省自然科学基金创新群体项目(2025AFA023)

国家自然科学基金长江水科学研究联合基金项目(U2240201)

AI Summary AI Mindmap
PDF (5460KB)

168

访问

0

被引

详细

导航
相关文章

AI思维导图

/