基于XGBoost的现地PGV预测模型

卢建旗 ,  王雨佳 ,  李山有 ,  谢志南 ,  马强 ,  陶冬旺

地球科学 ›› 2025, Vol. 50 ›› Issue (05) : 1861 -1874.

PDF (3140KB)
地球科学 ›› 2025, Vol. 50 ›› Issue (05) : 1861 -1874. DOI: 10.3799/dqkx.2024.142

基于XGBoost的现地PGV预测模型

作者信息 +

An XGBoost⁃Based Onsite PGV Prediction Model

Author information +
文章历史 +
PDF (3214K)

摘要

地震动峰值速度(Peak Ground Velocity, PGV)是常用于衡量地震动对建筑结构破坏潜力的参数之一,实时预测PGV大小是重大工程地震紧急处置中的关键技术.为进一步提升PGV预测准确性,提出一种基于极限梯度提升树(Extream Gradient Boosting, XGBoost)的现地PGV预测模型.该模型以台站观测到的P波前3 s的峰值加速度(Pa)、峰值速度(Pv)、峰值位移(Pd)、累计绝对速度(CAV)及卓越周期(Tpd)5种特征参数为输入,以该台站观测到的PGV为预测目标.选取日本K-NET台网记录的102次地震的6 918组加速度记录进行模型训练,89次地震的3 430组加速度记录测试模型的泛化能力.结果表明,相同数据集下,对比基于Pd的PGV预测模型和基于支持向量机的PGV预测模型,基于XGBoost的PGV预测模型的预测值与实测值更趋近1∶1比例关系,且预测误差标准差更小,预测残差均值更接近0,且在中国的实际地震震例上的运行结果良好.基于XGBoost的PGV预测模型可用于现地地震预警地震动峰值的预测.

Abstract

Peak Ground Velocity (PGV) is one of the parameter commonly used to measure the damage potential of ground shaking to building structures, and real-time prediction of PGV is a key technology in emergency response to major engineering earthquakes. To further improve the accuracy of PGV prediction, in this paper it proposes an onsite PGV prediction model based on Extreme Gradient Boosting (XGBoost). The model takes five characteristic parameters, including peak acceleration (Pa), peak velocity (Pv), peak displacement (Pd), cumulative absolute velocity (CAV), and predominant period (Tpd) in the first 3 seconds of the P-wave observed at the station as inputs, and the PGV observed at the station as the prediction target. 6 918 sets of acceleration records from 102 earthquakes recorded by the K-NET station network in Japan were used for model training, and 3 430 sets of acceleration records from 89 earthquakes were used to test the generalization ability of the model. The results show that, within the same dataset, the PGV prediction model based on XGBoost has a predictive value that is closer to a 1:1 ratio with the actual measured values compared to the PGV prediction models based on Pd and support vector machines. Additionally, the standard deviation of the prediction errors is smaller, the mean of the prediction residuals is closer to zero, and the model performs well on actual earthquake cases in China. The PGV prediction model based on XGBoost can be used for the prediction of peak ground motion in local earthquake early warning systems.

Graphical abstract

关键词

地震 / 预警 / 现地预警 / 极限梯度提升树 / 机器学习 / 地震动峰值速度 / 工程地质.

Key words

earthquakes / early warning / onsite warning / XGBoost / machine learning / peak ground velocity / engineering geology

引用本文

引用格式 ▾
卢建旗,王雨佳,李山有,谢志南,马强,陶冬旺. 基于XGBoost的现地PGV预测模型[J]. 地球科学, 2025, 50(05): 1861-1874 DOI:10.3799/dqkx.2024.142

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

地震会引起建筑物破坏、人员伤亡等直接灾害,也会因建筑物破坏而引起有毒气体泄漏、列车脱轨、火灾等次生灾害,威胁着人类的生命及财产安全,如何最大限度地预防和减轻地震灾害是防震减灾工作的核心目标.地震预警作为一种实时减灾手段,利用P波传播速度快破坏力弱、S波传播速度慢破坏力强的特点,在破坏性S波尚未到达之前为用户发送预警信息,从而使用户采取合理的紧急避险和处置措施以减少人员伤亡、避免次生灾害的发生.目前,世界上多个地震多发国家和地区已经建设了地震预警系统.如日本(Hoshiba et al., 2008)、意大利(Picozzi et al., 2015)、美国(Kohler et al., 2018)、中国(Peng et al., 2020; 李同林等, 2024; 李雨泽和杨陈, 2024; 欧阳龙斌等, 2024; 张建勇等, 2024; 张莹莹等, 2024)等.

地震预警方法可分为区域地震预警方法和现地地震预警方法(Allen et al., 2009).区域地震预警方法是一种以区域地震观测台网为基础的地震预警方法,该方法利用少数台站接收到的P波信息进行地震快速定位(金星等, 2012; 卢建旗等, 2021)、震级估算(朱景宝等, 2021);在此基础上,结合地震动预测模型预测地震可能造成的破坏范围,并在破坏尚未发生前为该区域内的用户发送预警信息以减少人员伤亡(马强,2008).区域地震预警方法需要在多台触发的条件下进行地震定位、震级估算及地震影响场预测,需要等待多台触发后才能进行地震动预测,从而增大了预警盲区.另外,震源参数估计产生的偏差(Olson and Allen, 2005)、地震动衰减关系的不确定性(Iervolino et al., 2009)、目标区域的场地条件(Hoshiba et al., 2010)等诸多因素会增大目标场点的地震动预测误差.现地地震预警方法最初是一种为重大工程地震预警及紧急处置提出的一种方法,该方法利用单台观测到的P波信息预测台站现地可能遭受的最大地震动,从而为重大工程提供预警.现地地震预警方法不需要进行地震定位和震级估算,具有更高的时效性.将现地预警与区域地震预警相方法相结合是地震预警的未来发展方向(Kanamori, 2015),能够减小区域地震预警的预警盲区,可为地震预警用户提供更多预警时间.因此,提高现地地震动预测精度不但能为重大工程现地预警提供可靠的技术支撑,也能为区域地震预警提供支撑.PGV是目前地震预警系统中用于估算地震烈度(Wald et al., 1999)及衡量建筑物可能遭受破坏等级(Faenza and Michelini, 2011)的重要参数,由此可见对 PGV 的预测也是地震预警方法研究中的重要内容之一.Wu and Kanamori(2005)发现单个台站P波前3 s的峰值位移(Pd)与该台站的PGV之间存在很高的相关性,从而建立了Pd与PGV的统计关系(以下简称为Pd⁃PGV统计模型)用于现地地震预警.除此之外,Brondi et al.(2015)利用地震破裂释放能量参数速度平方积分IV2进行PGV的预测;Kanamori(2015)分别建立了P波触发后3 s加速度幅值Pa、速度幅值Pv、位移幅值Pd与PGV的线性关系预测方程;Colombelli et al.(2015)还采用了基于PaPvPd的等权重因子W预测后续地震动PGV的新概念;刘辰等(2019)研究发现震中距对Pd⁃PGV统计模型有较大影响,从而建立了不同时窗长度及具有距离分段特征的Pd⁃PGV统计模型,进一步提高了统计模型的PGV估算精度.

尽管上述研究采用了多种手段提高统计模型的PGV估算精度,但由震源引起的场点地震动受震源类型、震源破裂模式、传播路径、场地条件等各种因素的影响,且这些因素对P、S波产生影响不同,导致仅仅考虑少量特征参数的统计模型仍然存在较大的离散性.机器学习方法相比单参数统计模型而言,其具有自动提取特征信息,并自动建立输入与输出之间的复杂模型的特点,在房屋震害快速预测(刘丽等,2023)、地质找矿勘查(黄鑫怀等,2023)、滑坡易发性预测(黄发明等,2024)、地面沉降预测(罗袆沅等,2024)等众多领域应用广泛.在现地地震预警方面,宋晋东等(2021)提出了基于最小二乘支持向量机的PGV连续预测模型.张海峰(2023)提出了基于长短时记忆神经网络的现地PGV预测模型.Liu et al.(2024)提出了基于卷积神经网络(CNN)的深度学习模型预测地震动峰值.这些机器学习模型和统计模型相比,在很大程度上提高了现地地震动的预测精度.

对实时地震预警系统而言,现地地震动预测方法的计算量也是需要考虑的一个重要因素.尽管深度学习方法可以提供更高的PGV预测精度,但也可能存在方法计算量过大,导致其难以在重大工程地震预警及地震紧急处置系统或台站端嵌入的问题.极限梯度提升(XGBoost)算法是一种集成学习算法(Chen et al., 2016),在各类机器学习竞赛中均展现了此方法的优越性能,且具有计算效率高的特点(Nielsen, 2016).因此,本文尝试构建基于XGBoost的PGV预测模型(XGBoost⁃PGV)为现地预警提供参考.

1 数据集建立

机器学习作为一种数据驱动算法,数据集的选取很大程度上决定着机器学习结果的优劣.XGBoost作为一种有监督学习算法,需要一个训练集用于确定模型参数,一个测试集用于检验模型的泛化能力.为了能够让机器学习模型从数据中学到预测峰值速度更加普适性的规律,本研究从日本强震台网(K⁃NET)选取了191次地震,震级从2级到7.4级,震中距在0~400 km,震源深度在0~70 km,共10 348组三分量加速度记录,选取地震的震中及台站位置如图1所示.为了确保所建立的模型能够适应于不同震级范围、不同距离范围内台站的现地PGV预测,确保测试集能够客观地评价模型的泛化能力,本文在分配训练集与测试集的过程中,使训练集的样本能够涵盖尽可能广的震级范围和距离范围,尽可能确保测试集与训练集具有独立同分布的特征,以便测试集能够客观地评价模型的泛化能力.同时,为了避免信息泄露,本文以地震为单元进行数据划分,确保同一次地震的数据只能出现在一个数据集.因此,从选取的191次地震中选取了102次地震的6 918组三分量加速度记录构建训练集,震级在2~7.4,震中距在0~400 km.其余89次地震的3 430组三分量加速度记录作为测试集,震级在2~7.3,震中距在1~392 km.训练集与测试集的震中距均服从极值III型威布尔分布,形状参数k与尺度参数λ图3所示.训练集地震震中位置图见图1a,测试集见图1b;训练集记录随震级震中距分布图见图2a,测试集见图2b.

2 方法

2.1 特征参数

幅值、能量、周期三个参数作为评价地震动的三个关键要素,能够更加全面地描述地震信号的特征.因此,本文选取的P波前3 s的特征参数包括:能量参数累计绝对速度(Cumulative Absolute Velocity, CAV);幅值参数峰值加速度(Peak acceleration, Pa),峰值速度(Peak velocity, Pv),峰值位移(Peak displacement, Pd);周期参数最大卓越周期(Tpd).

(1)P波触发后3 s内的竖直分量加速度峰值Pa的计算公式为:

          Pa=maxt0<t<t0+3 aud(t),

其中,audt)为竖向分量加速度时程,t为时间(s),t0为P波到达时间(s).

(2)P波触发后3 s内竖向分量速度峰值Pv的计算公式为:

          Pv=maxt0<t<t0+3 vud(t),

其中,vudt)为竖向分量速度时程,利用竖向分量加速度记录一次积分后,采用0.075 Hz的高通滤波得到.

(3)P波触发后3 s内竖向分量位移峰值Pd的计算公式为:

          Pd=maxt0<t<t0+3 dud(t),

其中,dudt)为竖向分量位移时程,利用竖向分量加速度记录两次积分获得,在每次积分后都进行了0.075 Hz的高通滤波以避免基线漂移.

(4)最大卓越周期采用了Hildyard and Rietbrock(2010)提出的卓越周期(Tpd)的计算方法,计算公式简述如下:

          Tpd=max(Tpdi),
          Tpdi=2πViDi+Ds,
          Vi=αVi-1+vi2          Di=αDi-1+xti2   ,

其中,DS 为稳定常数,vi 表示竖向分量速度时程,α为平滑因子增加.

(5)累积绝对加速度CAV的计算公式如下:

          CAV=t0t0+3a(t)dt,

其中,at)为竖向分量加速度时程,t0为P波到时.

2.2 预测目标参数PGV

PGV 是目前地震预警系统中用于估算地震烈度(Wald et al., 1999)及衡量建筑物可能遭受破坏等级(Faenza and Michelini, 2011)的重要参数.因此,本文选择PGV作为预测目标参数,其计算公式如下:

          PGV=maxv(t),
          v(t)=vew2(t)+vns2(t)+vud2(t),

其中,vewt)、vnst)、vudt)分别为东西、南北和竖直方向的速度时程.

2.3 XGBoost算法

XGBoost算法是由多颗回归树组成的.在训练过程中,后一棵回归树的生成会将前一棵树的偏差考虑在内,然后基于调整后的样本分布来训练下一棵回归树.并将每棵回归树对样本的预测值累计相加得出最终的预测值(Chen et al., 2016).

假设采用的数据集样本为:

          D=xi,yi i=1,2,3,...,n;xiRm,          yiR,

其中, xi=PdPvPaTpd, CAV}表示输入特征向量;n表示样本个数;m表示每一个样本中包含的特征个数;yi 表示预测目标参数PGV.

则XGBoost模型在输入特征xi条件下的预测值y^i可以表示为:

         y^i=ϕxi=k=1Kfkxi,fkF,            F=f(x)=wq(x)q:RmT,wRT ,

其中,wqx为叶子节点q的权重,F对应了所有k棵回归树的集合,而fx)为其中一棵回归树.每个叶子节点对应一个分数,最终将每棵树对应的分数相加即可得出该样本的预测值.

为了使模型的预测值y^i尽可能地接近预测目标yi,需要定义目标函L(ϕ)

          L(ϕ)=iloss(y^i-yi)+kΩfk lossy^i-yi=y^i-yi2                      Ωf=γT+12λw2                            ,

其中,目标函数分为损失函数项iloss(y^i-yi)和正则化项kΩ(fk)两部分;i表示训练样本个数; k表示回归树的棵数;T表示叶子节点的个数,w表示叶子权重,γλ为相关系数.损失函数用于控制模型的预测精度,损失越小,预测精度越高;正则化项用于控制模型的复杂度,正则化项的值越小,模型的复杂度越低,泛化能力越强.

2.4 超参数优化

XGBoost算法中包含多种超参数,不同的取值与组合影响着模型的复杂度以及泛化能力,超参数取值不当可能导致模型过拟合或欠拟合.本文根据超参数的性质、超参数可能的取值范围,以及相关文献中的取值经验,选定了对模型影响最大的5个超参数(如表1所示),包括:子节点最小权重、决策树的深度、决策树的数量、损失函数下降值、学习率.其中,决策树的深度和数量共同确定了模型的复杂度,决策树的深度和数量越大,模型的复杂度越高,也越容易出现过拟合;损失函数下降率和学习率决定了模型优化速度和优化效果,其值越小,优化速度越慢.采用网格搜索方法进行超参数优化,以获得最优的超参数组合.

3 结果与分析

3.1 模型超参数

根据2.4节确定的超参数范围以及优化方法,采用网格搜索对训练集进行5折交叉验证,从而确定出最终模型的超参数,超参数取值结果如表2所示.

3.2 模型评估

4a和4b展示了XGBoost⁃PGV模型在数据集上的预测值和实测值的分布情况以及残差分布情况.由图可知,预测残差在训练集和测试集上均呈正态分布,残差均值μ在训练集和测试集上分别为0.303和0.319,标准差σ分别为0.000 1和0.006 4,训练集和测试集上的残差均值和标准差接近,表明模型没有出现过拟合或欠拟合.模型预测PGV与实测PGV整体符合1∶1线性关系,没有出现系统性偏差,对于6.5级及以上地震出现轻微低估现象,这可能是由于大地震事件具有较长的震源破裂过程,与3 s的预测时间窗不匹配造成的(Murphy and Nielsen, 2009),大震级事件包含多个破裂阶段与不同破裂机制,3 s的预测时间窗不能完全铺捉到全部的地震能量释放,从而出现偏差.

图5展示了模型对不同震级、不同距离台站数据的预测效果.由图5a和5c可以看出,模型在不同距离处的PGV预测残差均值接近于0,没有出现系统性偏差;由图5b和5d可以看出,模型对3级以下小震出现了一定程度的高估,对6.5级以上地震出现了一定程度的低估.另外,残差随震级和震中距的变化特征在测试集与训练集上的结果一致,说明模型学到了输入特征与预测目标之间存在的普适性规律,没有出现过拟合或欠拟合,利用测试集评价模型的结果是客观的.

为了评价XGBoost⁃PGV模型的预警能力,本文根据PGV与潜在破坏之间的经验关系(Wald et al., 1999)(如表3所示),分别选取了在可能产生轻微及以上破坏情况下,以及可能发生中等及以上破坏情况下,分析本文模型的预警成功率.

对于可能产生轻微破坏的工况(PGV≥8.1 cm/s),测试集中实测PGV大于等于8.1 cm/s的样本占比为49.85%,如果模型对这些样本的预测PGV大于等于8.1 cm/s则为成功预警,否则定义为漏报;反之,如果对PGV小于8.1 cm/s的样本预测结果也小于8.1定义为成功不报警,否则定义为误报.统计结果表明,成功预警的比例占82.98%,漏报比例为17.02%;成功不报警的比例为81.45%,误报比例为18.55%.

同样,对于可能产生中等破坏的工况(PGV≥16 cm/s),测试集中实测PGV大于等于16 cm/s的样本占比为33.73%.统计结果表明,成功预警的比例占78.39%,漏报比例为21.61%;成功不报警的比例为90.67%,误报比例为9.33%.

3.3 特征重要性分析

XGBoost作为一种高复杂度的集成学习算法,模型具有黑箱的特征,模型的回归过程不易解释.为解决此问题,Lundberg and Lee(2017)提出了机器学习的可解释方法,即TreeSHAP(Tree SHapley Additive exPlanations)方法.该法通过计算输入特征参数的SHAP值表示其对模型性能影响的大小,从而展示同一特征对不同样本预测输出的影响程度.TreeSHAP方法中展示了模型中每棵回归树的预测输出结果,并将其解释为基础SHAP值与各特征的SHAP值的和,具体表达式如:

          f(x)=g(z')=0+i-1mizi',

其中,f(x)表示样本在每棵回归树中的预测结果,g(z')为解释模型的函数形式,0为基础SHAP值,即所有训练样本的预测均值;m为参与决策特征的数量,i表示第i个特征对于预测结果的贡献度,即第i个特征的 SHAP 值(Lundberg and Lee, 2017);zi'为简化特征,zi'0,1m,若i特征存在于m中,则对此棵树的预测结果有贡献(zi'=1),否则(zi'=0),表示i特征未参与预测,不考虑其贡献.

本文计算了训练集中每个特征参数的 SHAP值来评估其对模型的总体贡献(如图6所示).SHAP图本质反映的是当某个特征从模型中去除后,模型输出的平均变化幅度,并以此得知该特征对模型输出的贡献.由参数的重要性排序可知,卓越周期Tpd对模型的贡献最大,其余依次为PvPdPa、CAV.由此可见,PGV作为一种幅值参数,并非与P波的幅值参数存在最优的映射关系,而是与P波的周期存在更好的映射关系.这可能是由于PGV一般情况下来自于S波或面波的中频段,受震源破裂特征和场地的影响较大.地震的破裂过程和断层的几何特性可能产生特定频率的地震波,且地震波包含多种频率成分,Tpd通常与地震波中能量最集中的频率相对应.因此,Tpd对PGV有影响作用可能更突出.

3.4 与Pd⁃PGV模型对比

利用单台P波前3 s峰值位移(Pd)建立与该台站观测PGV之间的对数线性统计模型(Pd⁃PGV模型)是目前地震预警系统中常用的现地PGV预测方法(Wu and Kanamori, 2005),本文选择了与Pd⁃PGV模型进行对比.考虑到前人提出的Pd⁃PGV模型采用不同地区的强震动观测数据建立,而不同区域的地震动存在区域性差异.因此,本文利用训练集数据重新回归了Pd⁃PGV预测模型系数(如公式(14)图7所示).图7中黑色实线代表本文回归的Pd⁃PGV模型在给定Pd条件下的预测PGV均值,黑色虚线为预测PGV正负1倍标准差.

          lg(PGV)=0.884×lg(Pd)+1.739±                         0.431

8a~8d显示了 XGBoost⁃PGV模型与Pd⁃PGV模型在测试集上的预测结果的对比,图8a和8b展示了XGBoost⁃PGV模型的预测结果,图8c和8d展示了Pd⁃PGV模型的预测结果,圆点表示每一个台站的预测结果,颜色不同表示震级的不同.就散点的整体分布而言,XGBoost⁃PGV模型更贴近预测PGV与实测PGV的1∶1线性比例关系;从残差分布直方图及概率密度分布可以看出,两者均呈现正态分布,Pd⁃PGV模型预测PGV的标准差为 0.401, XGBoost⁃PGV模型预测PGV的标准差为 0.319;从预测PGV残差随震级和震中距散点图(图8b和8d)可以看出,Pd⁃PGV模型存在明显的大震低估和小震高估的现象较严重,且存在近场PGV高估和远场PGV低估的现象.而XGBoost⁃PGV模型的PGV预测残差不论在震级还是震中距方面均未出现系统性偏差.

3.5 与SVM⁃PGV模型对比

目前,宋晋东等(2021)建立了基于支持向量机(Support Vector Machines, SVM)及多特征参数的PGV预测模型(下文简称SVM⁃PGV模型),取得了较好的预测效果.为了进一步对比本文模型的预测效果,本文提取了和SVM⁃PGV模型采用的相同特征参数(加速度幅值Pa、速度幅值Pv、位移幅值Pd、速度平方积分IV2、破坏烈度DI、累积绝对速度CAV、阿里亚斯烈度Ia),采用了和宋晋东等(2021)SVM⁃PGV模型相同的模型超参数设置,利用训练集数据重新训练了SVM⁃PGV模型.

9a和9b显示了XGBoost⁃PGV模型在测试集上的预测结果,图9c和9d显示了SVM⁃PGV模型在测试集上的预测结果.就散点的整体分布而言,二者的预测PGV与实测PGV均符合1∶1线性比例关系,残差分布直方图和概率密度分布可以看出,预测PGV残差均呈正态分布,XGBoost模型的标准差为0.319,SVM模型的标准差为0.365,表明二者的整体预测精度相当.由残差随震级和震中距散点图(图9b和9d)可以看出,SVM模型的预测残差在近场 100 km范围内出现了大震PGV高估现象,而XGBoost模型则没有出现大震PGV高估现象.

3.6 甘肃积石山MS6.2地震震例分析

根据中国地震台网正式测定,北京时间2023年12月18日23时59分,在甘肃省临夏回族自治州积石山县发生了一次MS6.2地震,地震震中位于35.70°N,102.79°E,震源深度10 km.积石山地震发生于拉脊山断裂带东段,是一次逆冲型地震事件,此次地震已造成151人遇难,979人受伤(华思博等, 2024).本文收集了震中距150 km范围内239组三分量强震动观测记录,其中强震仪记录57条,烈度计记录182条,震中距最小5.8 km,最大 140.8 km,震中及台站分布情况如图10所示.

为验证XGBoost⁃PGV模型在我国的适用性,本文提取了记录前3 s的特征参数和PGV,利用本文模型进行了PGV预测,图11为XGBoost⁃PGV模型预测PGV与实测PGV对比图;图中实线表示预测值等于实测值1∶1比例关系直线,两条虚线为模型在测试集上的正负1倍标准差(0.319).可以看出预测值与实测值接近于1∶1线性比例关系,大部分数据分布在1倍标准差的范围内.然而,由残差统计直方图可以看出,残差均值为-0.054,标准差为0.290,表明模型在此次地震中出现了一定程度的系统性低估,这可能是由于不同地区地震动特征存在区域性差异的原因所致.若需要进一步提高模型在中国区域的适用性与实用价值,还需引入迁移学习来进行进一步的优化,以提高模型的泛化能力.

4 讨论

4.1 S波的影响

由于本文在建立XGBoost⁃PGV模型时利用了P波前3 s的信息作为输入,数据集中存在一些近源台站,使得P波到达3 s内S波已经到达,P波S波时间间隔不足3 s,故单独提出此类记录数据进行分析.训练集中共358条地震记录,其中震源距最大为25.198 km,最小为3.006 km;测试集中共212条数据记录,其中震源距最大为25.148 km,最小为2.625 km,且震级均分布在2到7.3级之间.图12展示了P波S波时间间隔不足3 s的数据预测结果,其中1∶1的实线表示预测值等于实测值,虚线表示基于数据集所得到的1倍标准差,可以看出大部分数据分布在1倍标准差的范围内,由此说明在实际中发生此类情况时,本模型能较好应对.

4.2 不同地震类型的预测效果

日本位于欧亚板块与太平洋板块的交界地带,构造活动强烈,地震活动性强.受太平洋板块的向下俯冲,形成了俯冲带地震、浅地壳地震等不同地震类型.地震动衰减规律研究表明,不同类型地震产生的地震动存在显著差异(Zhao et al., 2015).因此,为了分析本文模型对不同类型地震的预测效果,本文根据Zhao et al.(2015)提出的分类准则对选取的191次地震进行了分类,其中浅地壳地震171次共8 717条记录,俯冲带地震20次共1 631条记录.图13a展示了模型对浅地壳地震PGV的预测效果,图中虚线为模型在测试集上的1倍标准差,图13b展示了模型对俯冲带地震PGV的预测效果.由图13可知,俯冲带地震的预测PGV分布符合1∶1关系,和浅地壳地震的PGV结果基本一致,说明本文模型同样适用于俯冲带地震.

4.3 预测偏差较大的样本分析

本文对测试集中残差最大的记录进行单独提取,发现该条记录为7.3级地震中的一条记录,大地震事件具有较长的震源破裂过程及复杂的破裂阶段与破裂机制(Murphy and Nielsen, 2009),在3 s的预测时间窗里,不能完全捕捉到后续全部的地震动能量释放,因而模型预测的结果偏差较大.且大震级事件数量有限,因此训练集中7级以上的地震数据有限,不可避免地在大震级事件中存在此类偏差较大的样本.

为了对其进行具体剖析,特将 7.3级地震共207条地震记录进行分析,图14分别展示了不同预测偏差值样本的五个特征参数随震中距变化的分布图,在同一地震事件中,预测偏差大的地震记录与预测偏差较小的地震记录相比,其P波特征参数,如周期参数、能量参数都偏小.

5 结论

利用少量P波信息快速预测现地PGV是重大工程地震紧急处置中的一项关键技术.本文以P波前3 s的幅值参数(PaPvPd)、能量参数(CAV)和周期参数(Tpd)为输入特征,以三分向矢量合成的峰值速度PGV为预测目标,利用日本K⁃NET强震动观测台网记录的191次地震的 10 348条三分量加速度记录,建立了现地PGV预测的XGBoost⁃PGV模型,得到如下结论:

(1)通过与目前常用的Pd⁃PGV统计模型及SVM⁃PGV机器学习模型对比结果表明,在相同数据集下,和Pd⁃PGV模型相比, XGBoost模型的PGV预测残差标准差由0.401提高到0.319;并且,Pd⁃PGV模型存在的“小值高估、大值低估”的问题有明显改善;与SVM⁃PGV模型相比,残差标准差由0.365提高到0.319说明XGBoost在现地PGV预测方面具有更好的性能.

(2)通过对俯冲带地震和浅地壳地震的分别统计分析结果表明,该模型可用于不同类型地震;同时,对近源前3 s数据中包含S波干扰的样本进行了对比分析,结果表明,本文模型可以忽略S波干扰.

(3)对于可能产生中等破坏的工况(PGV≥16 cm/s),本文模型成功预警的比例占78.39%,漏报比例为21.61%;成功不报警的比例为90.67%,误报比例为9.33%,说明模型具有较高的可靠性.

(4)甘肃积石山MS6.2地震震例分析表明,绝大多数预测样本分布在测试集1倍标准差(0.319)范围内,仅少数样本出现了低估,表明XGBoost⁃PGV模型对于我国地震有一定的适用性.

参考文献

[1]

Allen, R. M., Gasparini, P., Kamigaichi, O., et al., 2009. The Status of Earthquake Early Warning around the World: An Introductory Overview. Seismological Research Letters, 80(5): 682-693. https://doi.org/10.1785/gssrl.80.5.682

[2]

Brondi, P., Picozzi, M., Emolo, A., et al., 2015. Predicting the Macroseismic Intensity from Early Radiated P Wave Energy for On⁃Site Earthquake Early Warning in Italy. Journal of Geophysical Research: Solid Earth, 120(10): 7174-7189. https://doi.org/10.1002/2015jb012367

[3]

Chen, T. Q., Guestrin, C., Chen, T. Q., et al., 2016. XGBoost. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Francisco, 785-794. https://doi.org/10.1145/2939672.2939785

[4]

Colombelli, S., Caruso, A., Zollo, A., et al., 2015. A P Wave⁃Based, On⁃Site Method for Earthquake Early Warning. Geophysical Research Letters, 42(5): 1390-1398. https://doi.org/10.1002/2014gl063002

[5]

Faenza, L., Michelini, A., 2011. Regression Analysis of MCS Intensity and Ground Motion Spectral Accelerations (SAs) in Italy. Geophysical Journal International, 186(3): 1415-1430. https://doi.org/10.1111/j.1365⁃246X.2011.05125.x

[6]

Hildyard, M. W., Rietbrock, A., 2010. TPD, a Damped Predominant Period Function with Improvements for Magnitude Estimation. Bulletin of the Seismological Society of America, 100(2): 684-698. https://doi.org/10.1785/0120080368

[7]

Hoshiba, M., Kamigaichi, O., Saito, M., et al., 2008. Earthquake Early Warning Starts Nationwide in Japan. EOS, Transactions American Geophysical Union, 89(8): 73-74. https://doi.org/10.1029/2008eo080001

[8]

Hoshiba, M., Ohtake, K., Iwakiri, K., et al., 2010. How Precisely can We Anticipate Seismic Intensities? A Study of Uncertainty of Anticipated Seismic Intensities for the Earthquake Early Warning Method in Japan. Earth, Planets and Space, 62(8): 611-620. https://doi.org/10.5047/eps.2010.07.013

[9]

Hua, S. B., Xu, C. Y., Zhou, J. C., et al., 2024. Source Characteristics and Disaster Mechanisms of the 2023 Gansu Jishishan Mw6.0 Earthquake. Chinese Journal of Geophysics, 67(7): 2625-2636 (in Chinese with English abstract).

[10]

Huang, F.M., Ouyang, W.P., Jiang, S.H., et al., 2024. Landslide Susceptibility Prediction Considering Spatio⁃Temporal Division Principle of Training/Testing Datasets in Machine Learning Models. Earth Science, 49(5): 1607-1618 (in Chinese with English abstract).

[11]

Huang, X.H., Li, Z.H., Deng, T., et al., 2023. Uranium Potential Evaluation of Zhuguangshan Granitic Pluton in South China Based on Machine Learning. Earth Science, 48(12): 4427-4440 (in Chinese with English abstract).

[12]

Iervolino, I., Giorgio, M., Galasso, C., et al., 2009. Uncertainty in Early Warning Predictions of Engineering Ground Motion Parameters: What Really Matters?. Geophysical Research Letters, 36(5): 2008GL036644. https://doi.org/10.1029/2008gl036644

[13]

Jin, X., Zhang, H. C., Li, J., et al., 2012. Research on Continuous Location Method Used in Earthquake Early Warning System. Chinese Journal of Geophysics, 55(3): 925-936 (in Chinese with English abstract).

[14]

Kanamori, H., 2015. Earthquake Hazard Mitigation and Real⁃Time Warnings of Tsunamis and Earthquakes. Pure and Applied Geophysics, 172(9): 2335-2341. https://doi.org/10.1007/s00024⁃014⁃0964⁃y

[15]

Kohler, M. D., Cochran, E. S., Given, D., et al., 2018. Earthquake Early Warning ShakeAlert System: West Coast Wide Production Prototype. Seismological Research Letters, 89(1): 99-107. https://doi.org/10.1785/0220170140

[16]

Li, T. L., Jiang, P., Jin, Y. X., et al., 2024. Construction and Application of China Earthquake Early Warning Technology Testing Platform. Earthquake Research in China, 40(1): 69-84 (in Chinese with English abstract).

[17]

Li, Y. Z., Yang, C., 2024. Overall Design of Customized Software for the National Seismic about the National Seismic Intensity Rapid Reporting and Early Warning Project. Earthquake Research in China, 40(1):85-96 (in Chinese with English abstract).

[18]

Liu, C., Li, X.J., Jing, B.B., et al., 2019. The Distance Segmentation Characters of PGV⁃Pd Relationship Parameters for Earthquake Early Warning. Chinese Journal of Geophysics, 62(4): 1413-1426 (in Chinese with English abstract).

[19]

Liu, L., Shen, J.K., Zhang, L.X., 2023. A Machine Learning⁃Based Method for Rapid Prediction of Earthquake Damage in Brick Masonry Houses. Earth Science, 48(5): 1769-1779 (in Chinese with English abstract).

[20]

Liu, Y. Q., Zhao, Q. X., Wang, Y. W., 2024. Peak Ground Acceleration Prediction for On⁃Site Earthquake Early Warning with Deep Learning. Scientific Reports, 14(1): 5485. https://doi.org/10.1038/s41598⁃024⁃56004⁃6

[21]

Lu, J. Q., Li, S. Y., Xie, Z. N., et al.,2021.Real⁃Time Evolutionary Earthquake Location Method and Its Uncertainty Analysis. Journal of Natural Disasters, 30(3):52-62 (in Chinese with English abstract).

[22]

Lundberg, S. M., Lee, S. I., 2017. A Unified Approach to Interpreting Model Predictions. Proceedings of the 31st International Conference on Neural Information Processing Systems, New York, 21889700. https://doi.org/10.48550 /arXiv.1705.07874

[23]

Luo, H. Y., Xu, Q., Jiang, Y. N., et al., 2024. The Prediction Method of Large⁃Scale Land Subsidence Based on Multi⁃Temporal InSAR and Machine Learning. Earth Science, 49(5):1736-1745 (in Chinese with English abstract).

[24]

Ma, Q., 2008. Study and Application on Earthquake Early Warning (Dissertation). Institute of Engineering Mechanics, China Earthquake Administration, Harbin (in Chinese with English abstract).

[25]

Murphy, S., Nielsen, S., 2009. Estimating Earthquake Magnitude with Early Arrivals: A Test Using Dynamic and Kinematic Models. Bulletin of the Seismological Society of America, 99(1): 1-23. https://doi.org/10.1785/0120070246

[26]

Nielsen, D., 2016. Tree Boosting with XGBoost-Why does XGBoost Win “Every” Machine Learning Competition? (Dissertation). Norwegian University of Science and Technology, Norway.

[27]

Olson, E. L., Allen, R. M., 2005. The Deterministic Nature of Earthquake Rupture. Nature, 438(7065): 212-215. https://doi.org/10.1038/nature04214

[28]

Ouyang, L. B., Su, Z. J., Liu, J., et al., 2024. Construction of Decision⁃Making Platform Fused in China Earthquake Early Warning Network. Earthquake Research in China, 40(1):24-39 (in Chinese with English abstract).

[29]

Peng, C. Y., Ma, Q., Jiang, P., et al., 2020. Performance of a Hybrid Demonstration Earthquake Early Warning System in the Sichuan⁃Yunnan Border Region. Seismological Research Letters, 91(2A): 835-846. https://doi.org/10.1785/0220190101

[30]

Picozzi, M., Zollo, A., Brondi, P., et al., 2015. Exploring the Feasibility of a Nationwide Earthquake Early Warning System in Italy. Journal of Geophysical Research: Solid Earth, 120(4): 2446-2465. https://doi.org/10.1002/2014jb011669

[31]

Song, J. D., Yu, C., Li, S. Y., 2021. Continuous Prediction of Onsite PGV for Earthquake Early Warning Based on Least Squares Support Vector Machine. Chinese Journal of Geophysics, 64(2):555-568 (in Chinese with English abstract).

[32]

Wald, D. J., Quitoriano, V., Heaton, T. H., et al., 1999. Relationships between Peak Ground Acceleration, Peak Ground Velocity, and Modified Mercalli Intensity in California. Earthquake Spectra, 15(3): 557-564. https://doi.org/10.1193/1.1586058

[33]

Wu, Y. M., Kanamori, H., 2005. Experiment on an Onsite Early Warning Method for the Taiwan Early Warning System. Bulletin of the Seismological Society of America, 95(1):347-353. https://doi.org/10.1785/0120040097

[34]

Zhang, H. F., 2023. A Study of Real⁃Time PGV Prediction Method with Regional and Onsite Integration (Dissertation). Institute ofEngineering Mechanics China Earthquake Administration, Harbin (in Chinese with English abstract).

[35]

Zhang, J. Y., Xi, N., Xu, T. R., et al., 2024. The Center Technology Platform for National Earthquake Intensity Quick Reporting and Early Warning. Earthquake Research in China, 40(1):54-68 (in Chinese with English abstract).

[36]

Zhang, Y. Y., Miao, C. L., Chen, J. L., et al., 2024. Design and Construction of the Earthquake Waveform Comprehensive Analysis System for National Seismic Intensity Rapid Reporting and Early Warning Project. Earthquake Research in China, 40(1): 40-53 (in Chinese with English abstract).

[37]

Zhao, J. X., Zhou, S. L., Gao, P. J., et al., 2015. An Earthquake Classification Scheme Adapted for Japan Determined by the Goodness of Fit for Ground⁃Motion Prediction Equations. The Bulletin of the Seismological Society of America, 105(5): 2750-2763. https://doi.org/10.1785/0120150013

[38]

Zhu, J. B., Song, J. D., Li, S. Y., 2021. Rapid Magnitude Estimation for Earthquake Early Warning Based on SVM. Journal of Vibration and Shock, 40(7): 126-134 (in Chinese with English abstract).

基金资助

中国地震局工程力学研究所基本科研业务费专项资助项目(2024C27)

AI Summary AI Mindmap
PDF (3140KB)

221

访问

0

被引

详细

导航
相关文章

AI思维导图

/