青藏高原东南缘PmP波数据集构建及识别模型训练

李澍辰; 孙安辉; 李天觉; 童平; 房立华; 安艳茹; 张莹莹; 赵盼盼; 杨峰

doi:10.3799/dqkx.2025.128

地球科学 ›› 2026, Vol. 51 ›› Issue (03) : 1169 -1181. DOI: 10.3799/dqkx.2025.128

青藏高原东南缘PmP波数据集构建及识别模型训练

李澍辰 ¹ ,
孙安辉 ¹ ,
李天觉 ² ,
童平 ² ,
房立华 ¹ ,
安艳茹 ³ ,
张莹莹 ³ ,
赵盼盼 ¹ ,
杨峰 ¹

作者信息 +

Constructing and Training of a Deep Learning Dataset for PmP Waves in the Southeastern Tibetan Plateau

Author information +

文章历史 +

PDF (2125K)

摘要

莫霍面反射波PmP的射线路径与初至Pg波、Pn波不同，其传播特性与发震构造环境密切相关，可为研究地壳深部结构与莫霍面不连续性提供关键信息.识别PmP波的主要挑战是它们的稀缺性，且人工拾取需要耗费大量的人力.为改善这一问题，利用青藏高原东南缘的固定台站（2009—2022年）和流动台阵（2011—2013年）记录的波形，通过手动拾取和振幅比值检验得到了1 713个PmP震相，结合半自动拾取流程（基于振幅阈值筛选和质点运动检验）提取1 536个PmP震相，构建了高质量PmP数据集.对基于深度神经网络的PmPNet进行重新训练，构建了适配青藏高原东南缘的新模型PmPNet-SET_V1.0和PmP-traveltime-Net-SET_V1.0，其中PmPNet-SET_V1.0模型的F1分数为0.863 7，精确率为86.6%，召回率为84.8%，并将该区域内高质量PmP波数量增加至6 268个.所有PmP拾取结果通过严格的人工检验并与理论走时对比，确保了可靠性.研究表明，训练参数对采集波形的数量和质量具有显著影响.此外，基于所构建的PmP数据集，本研究初步获得了青藏高原东南缘区域莫霍深度分布，其呈现西北深，东南浅的趋势，与前人反演结果的样式相近.

Abstract

The Moho-reflecting PmP wave with a different ray path to Pg wave and Pn wave, whose propagation characteristics are closely related to the seismogenic tectonic environment, provides crucial information for studying the deep crustal structure and the discontinuity of the Moho discontinuity. The main challenge in PmP waves identification is their rarity, and the significant manpower required for manual picking. To address this issue, we firstly obtained 1 713 PmP waves through manual picking and amplitude-ratio validation, and applied a semi-automatic workflow (screening of seismic amplitude threshold and testing of particle motion) to pick 1 536 PmP waves from waveforms recorded by permanent (2009—2022) and temporary (2011—2013) stations in the southeastern (SE) Tibetan Plateau, and then we constructed a high-quality PmP dataset using these waves. We retrained PmPNet, a deep neural network-based algorithm, to construct two new models PmPNet-SET_V1.0 and PmP-traveltime-Net-SET_V1.0, among which PmPNet-SET_V1.0 achieved a high F1-score of 0.863 7, with a precision of 86.6% and a recall of 84.8%, and we tripled the number of the high-quality PmP database in the study region to 6 268. All PmP picking results underwent rigorous manual inspection and were compared with the theoretical travel time to ensure the reliability. The study shows several hyper-parameters play a key role in determining both the quantity and quality of the picks. Furthermore, based on the constructed PmP dataset, the study preliminarily obtained the regional Moho depth, which displayed a similar pattern to previous inversion findings, showing deeper depths in the northwest and shallower depths in the southeast.

Graphical abstract

关键词

青藏高原东南缘 / PmP震相 / 深度学习 / 地震学数据集 / PmPNet / 地震学.

Key words

southeastern Tibetan Plateau / PmP wave / deep learning / seismic dataset / PmPNet / seismology

引用本文

引用格式 ▾

李澍辰,孙安辉,李天觉,童平,房立华,安艳茹,张莹莹,赵盼盼,杨峰. 青藏高原东南缘PmP波数据集构建及识别模型训练[J]. 地球科学, 2026, 51(03): 1169-1181 DOI:10.3799/dqkx.2025.128

登录浏览全文

4963

注册一个新账户忘记密码

0 引言

青藏高原东南缘（图1a）构造活动强烈，断层系统复杂，主要包括金沙江断裂带（Jinshajiang fault， JSF）、红河断裂带（Red River fault， RRF）、丽江‒小金河断裂带（Lijiang⁃Xiaojinhe fault， LXF）、鲜水河断裂带（Xianshuihe fault， XSF）和小江断裂带（Xiaojiang fault， XJF）.它们将扬子克拉通划分为四川盆地和滇中亚地块、中印地块和一部分松潘‒甘孜地体（Han et al.， 2020）.近三十年来，川滇块体在区域应力场作用下地震活动异常频繁，多次强震相继发生，例如1996年丽江7.0级地震、1998年宁蒗6.2级地震、2001年宁蒗5.8级地震、2014年盈江6.1级地震、2021年漾濞6.4级地震等，中小地震更是不计其数（图1a）（史翔宇等，2020；郭畅等，2025）.

前人研究发现青藏高原东南缘地区地壳内广泛存在低速体（马宏生等，2008； Liu et al.， 2023； Li et al.， 2024b），或与地壳流模式下的低速异常有关（Clark and Royden， 2000； Royden et al.， 2008）.低速体可能在区域构造演化及孕震环境中发挥重要作用，然而它们在地壳深部的空间分布和形成机制仍然存在争议.此外，莫霍面不连续性也可能与发震构造、孕震环境密切相关，对应力分布和地震活动情况有着重要影响（高原等，2020）.莫霍面反射波由于传播路径穿越中下地壳，可反映地壳深部结构特征和莫霍面起伏特征，较直达波具有独特优势（图1c），是探索构造演化及孕震环境的重要数据.比如，添加莫霍面反射波数据可以显著提高下地壳结构的分辨率（Zhao et al.， 2005； Xia et al.， 2007； Sun et al.， 2008），从而更好地解析地壳深部低速异常特征.

与直达波（Pg/Sg）相比，来自莫霍面的反射波（如PmP/SmS）在地震波形中识别难度较高，因此人工拾取的数量相对较少（Sun et al.， 2008； Sun et al.，2019）.目前深度学习技术蓬勃发展，已被广泛应用于地震事件检测、精定位、震相识别等工作（Beroza et al.， 2021； Ahmed et al.， 2023），并能高效自动拾取地震波走时，例如MyShake （Kong et al.， 2016）、PhaseNet （Zhu and Beroza， 2019）、PickNet （Wang et al.， 2019）、PhaseLink （Ross et al.， 2019）、PickerXL （Chai et al.， 2025）等算法.然而多数方法多应用于直达波的震相识别及走时拾取.

本研究采用了青藏高原东南缘区域在2011—2013年间373个流动台站及该地区2009—2022年间352个固定台站的波形数据.首先，应用半自动的PmP波拾取流程（Li et al.， 2022）筛选出高质量PmP数据，创建区域的PmP波数据集，基于PmPNet（Ding et al.， 2022）重新训练，构建适配青藏高原东南缘区域PmP波拾取的优化模型PmPNet⁃SET_V1.0；最后，利用该模型从原始波形中拾取更多的PmP数据，形成最终的PmP波数据集.文中评估了拾取结果的可靠性，并讨论了速度模型、PmPNet训练参数等因素对结果的影响.

1 数据与方法

1.1　数据

本研究中使用的波形源自两个数据集.第一个是CREDIT⁃X1local，可用于机器学习的地震学参考数据集.该数据集收集了中国大陆探测台阵计划（ChinArray）于2011—2013年在中国西南地区观测的105 455个震级2.0及以上地震事件数据（Li et al.， 2024a）. ChinArray I期于2011—2013年在南北地震带南段地区（20°~32° N， 95°~110° E）部署了355个流动地震台站，平均站间距约为35 km（图1b）. 对于震中距小于 1 000 km的台站，按事件分组收集了原始100 Hz采样的三分量波形，每个波形都包含了至少200 s的记录.笔者仅使用了手动标记的震相数据，其中包括5 999个震级≥2.0的事件，有66 507个Pg震相、 42 310个Sg震相、12 823个Pn震相、546个Sn震相.

第二个数据集是由中国地震台网中心（China Earthquake Networks Center， CENC）和31个省级地震机构单位联合制作的中国测震站网完备数据集（Comprehensive Dataset of Chinese Seismic Network， CSNCD）（Dai and An， 2020；安艳茹等，2023；An et al.， 2023； An， 2024）.波形最小记录时间为200 s，最大记录时间为 3 000 s，数据采样率为50 Hz. CSNCD具有很高的可信度，可为深度学习算法提供海量标注完备的高质量学习样本，从而有效支撑高精度机器学习模型的构建.其中笔者只使用了青藏高原东南缘地区的数据，这一部分包含了来自2 213个事件的2 815个人工拾取的Pg和PmP震相的波形.

此外，为了计算Pg和PmP的理论走时，本文也采用了中国西南地区速度模型V2.0（SWChinaCVM⁃2.0； Liu et al.， 2023）及其莫霍面模型SWChinaCVM⁃MOHO⁃1.0 （Chen et al.， 2021； Figure 1b） .

1.2　研究方法

1.2.1　PmP半自动拾取流程

CSNCD已经包含人工拾取的Pg波和PmP波标记，可直接用于构建深度学习数据集.然而，CREDIT⁃X1local只有人工拾取的Pg波，需要准确标出它的PmP波到时.基于前人的研究，Li et al.（2022）开发了一种用于拾取PmP波的半自动工作流程.他们总结了以下识别PmP波的标准：（1）在局部浅层地壳的地震波形中较为明显；（2）振幅一般比初至 P 波要大，在临界震中距以远更为明显；（3）与P波相似，其质点运动方式均为压缩波；（4）P波和PmP波通常存在低振幅区域；（5）当从莫霍面反射产生的PmP波可观测时，通常也能观测到SmS波.

PmP的半自动拾取流程有三个主要步骤（图2）：（1）波形预处理与筛选：将波形数据从P波到时之前的2 s到P波到时之后的5 s截取出来.本研究使用的X1数据集的初至P波到时都是手动标记的.波形被以40 Hz的采样率进行重新采样，并以1到7 Hz的频段进行带通滤波，这是P和PmP波的主频段.然后，将垂直分量波形按观测到的初至P波到时对齐，筛选出信噪比大于10的波形.每个垂直分量波形的信噪比被定义为P波到达时间之前0.1 s到之后0.4 s的信号峰值与P波到时之前2 s到之前0.15 s的噪声峰值之比.

（2）基于振幅比的自动检测：使用一系列改进后的SWChinaCVM⁃2.0速度模型，基于PmP⁃P走时之差自动搜索PmP波.首先，将PmP波在莫霍面上的反射点近似为震源和台站之间的中点.基于初始莫霍模型SWChinaCVM⁃MOHO⁃1.0和速度模型SWChinaCVM⁃2.0，利用网格搜索法选择莫霍深度，每个波形基于独立的速度模型分别计算P波和PmP波的理论走时，记为

T p

和

T p m p

测量每个归一化垂直分量波形包络中三个不重叠窗区的振幅.第一个窗区用于筛选初至P波的振幅，窗区范围为初至P波到时的前0.1 s到后0.4 s.第二个窗区用于筛选PmP波，窗区范围为PmP波和P波的理论走时之差（

T p m p ⁃ T p

）之前的0.05 s到之后的0.2 s，如果

T p m p ⁃ T p

接近真实走时之差，那这一窗区应该包含PmP波. 第三个窗区用于提取P波和PmP波之间低振幅区的振幅极值，窗区范围为初至P波到时后0.1 s到PmP到时前0.1 s.如果第三个窗区不存在，则剔除该波形.最后，仅当同时满足以下三个条件时，才认为该波形可能包含可拾取的PmP波：（a）第三个窗区中包络振幅极值小于P波的振幅极值；（b）第三个窗区中包络振幅极值小于PmP波的振幅极值；（c）PmP波的振幅大于P波的振幅.

一旦满足上述条件，归一化后的包络数据将会通过筛选并得到用于计算P波和PmP波的理论到时莫霍深度.如图2所示，PmP窗区（红色）中具有强信号的波形包络，并且P波窗区（蓝色）和PmP窗区中间有明显的低振幅区域.

（3）多震相与质点运动验证：检查三分量波形上PmP和SmS波的共存情况，以进一步确认所识别的PmP波确实源于莫霍面反射.使用SWChinaCVM⁃2.0中的S波速度模型，计算初至S波与初至P波的理论到时之差，以及SmS波与初至P波的理论到时之差，并在上一步中标记了莫霍面深度.随后在三分量波形上的两个理论到时周围搜索可见的S波和SmS波.同时通过主成分分析得出极化图中质点运动的变化，并绘制P波（蓝色曲线）和PmP波（红色曲线）在垂直和径向平面上的主极化方向.这一过程中只保留具有可识别的P、PmP、S和SmS波，以及P和PmP波的主极化方向彼此相近的波形.通过这个过程将波形数据分为PmP质量好和差两类.

1.2.2　用于PmP检测的深度学习模型

Ding et al.（2022）开发了PmPNet，一种基于卷积残差连接（He et al.， 2016）的自编码器框架（Rumelhart and McClelland， 1987）的深度学习算法，可有效提升PmP震相的识别效率.该算法能够应对成像和其他应用中不平衡训练数据集导致的问题（Johnson and Khoshgoftaar， 2019）.基于南加州10 192个人工拾取震相的高质量PmP数据集，PmPNet能够在处理大量地震数据时，自动识别PmP震相并实现高精度和高召回率.

PmPNet的输入包括三个部分：波形包络、震中距和震源深度.波形包络来自地震波形的垂直分量.该分量经归一化以40Hz重新采样，时间窗为初至P波到时前2 s至后5 s.

PmPNet输出也有三个部分：（a）恢复后的输入波形，（b）PmP走时t，（c）PmP存在概率p，［0，1］中的实数，表示输入波形包含PmP震相的概率.

2 研究结果

2.1　在CREDIT⁃X1local中筛选高质量PmP震相

为尽量减少主观误差，本研究首先利用PmP半自动流程第二步中的振幅判别标准来过滤CSNCD中的波形，从中筛选出了1 713个位于青藏高原东南缘、同时包含人工拾取的P和PmP波的可靠波形.然而，这些PmP数据量仍不足训练一个可靠的PmP检测模型.另一方面，CREDIT⁃X1local数据仅包含人工拾取的Pg震相，因此本研究采用PmP半自动流程，继续拾取与分析CREDIT⁃X1local中的PmP波震相.

经过上述步骤，从CREDIT⁃X1local中筛选出 1 536个同时包含人工拾取Pg到时和高质量机器拾取的PmP到时的波形.图3b显示滇西南和滇川黔交界处反射点最密集.大多数PmP波的震中距在60~250 km之间，PmP波与P波的到时差平均约为1.25 s，最大值在5 s以内（图3c）.对筛选出的波形进行的人工复核，证实了拾取结果的高精度（图3d和3e）.另一方面，垂直分量波形上PmP和P波的振幅比值主要集中在2.5左右（图3f）.总之，与P波相比，较大的PmP振幅表明它是一个来源于波阻抗强烈的界面，如莫霍不连续性界面（Ding et al.，2022）.

最终，从CREDIT⁃X1local 和CSNCD数据集中共收集到3 249个高质量PmP震相数据.为了模拟真实情况下高质量PmP波的稀缺性，本研究还额外收集了三万多个不包含明显PmP波的波形.按PmP数据质量好∶差=1∶5的比值构建了训练数据集.在输入PmPNet训练之前，对每个输入波形的包络数据进行归一化，使其最大值一致，并独立地标准化至均值为零、方差为一.

2.2　PmPNet训练与评估

2.2.1　PmPNet的训练

早期研究表明，在人工拾取的PmP波数据集帮助下，可以将PmP震相检测问题表述为监督分类问题，其最终目标是训练一个二元分类器，使笔者能够将给定的地震波形数据集分为具有PmP震相的一类波形数据和没有PmP震相信号的另一类数据（Ding et al.， 2022）.训练分类器的主要难点在于，训练数据集中没有PmP震相的波形（多数类别）数量要远多于具有PmP震相（少数类别）的波形数量.数据集的这种不平衡是一个固有的问题，因为PmP波不如P波和S波丰富，或者两者可能同样丰富但PmP波被人工拾取的数量较少.由于两类数据样本的过度差异，用这种不平衡数据集训练的朴素分类器通常会对多数类别的数据进行过度分类.这意味着，对于用不平衡数据集训练的分类器来说，常用的预测准确性不是一个合适的性能指标，因为模型将所有波形分为好和坏类别的比率会接近笔者在训练数据集中设置的比率.举个例子，如果用只有0.1% PmP震相的数据集进行训练，任何朴素的PmP分类器都可以通过将所有波形标记为非PmP来实现99.9%的准确率.

因此有必要引入其他指标，如精确度和召回率.根据地震波形进行PmPNet预测有四种可能的情况：真阳性（True Positive， TP）、假阳性（False Positive， FP）、真阴性（True Negative， TN）和假阴性（False Negative， FN）.它们的定义如下.TP表示PmPNet预测波形具有PmP震相并且预测正确的事件.FP表示PmPNet预测波形具有PmP震相，但预测不正确（即波形实际上没有PmP震相）的事件.TN表示PmPNet预测波形没有PmP震相并且预测正确的事件.FN表示PmPNet预测波形没有PmP震相，但预测不正确（意味着波形实际上具有PmP震相）的事件.基于这四个值，使用精度（Precision， P）来衡量PmPNet所有预测为PmP震相的波形数据样本中实际包含PmP震相的比例：

P = T P T P + F P .

(1)

召回率（Recall， R）则用于衡量PmPNet正确预测为PmP的波形占预测PmP正确情况的比例：

R = T P T P + F N .

(2)

最后使用F1分数来平衡描述精度和召回率：

F 1 = 2 × P × R P + R .

(3)

在训练过程中，数据x的概率值

p t r u e

只会是0或1.笔者要求p（x）的值在0和1之间，这表示编号x的波形具有PmP震相的概率.

在训练过程开始之前，随机选择一批没有替换的数据点，并将数据输入PmPNet.PmPNet将输出相应的再现波形以及具有当前可训练参数θ的（p，t）对.在计算损失后，应用自适应矩估计的方法来更新可训练参数θ.然后随机选择另一批不进行替换的数据点，以向前推进另一个训练步骤.这个过程一直持续到遍历整个训练数据集.上述训练过程通常被称为一个“迭代”.接下来调整学习率，以在另一次迭代中重复该过程.当达到预定数量的最大迭代次数时，训练过程完成.PmPNet的训练过程如图4所示.

为了进行PmP的分类，本研究设置了一个概率阈值

p t h r e s h o l d

，即所有p值大于等于

p t h r e s h o l d

的波形会被PmPNet判别为含有PmP.否则，它会被判别为不含有PmP.给定一个概率阈值就可以计算出对应的精确度和召回率.为了确定设置的最佳学习率，还用不同的学习率训练了判别模型.

2.2.2　PmPNet训练表现评估

为了系统地描述PmPNet训练出的模型性能，本文为验证数据集构建了精度召回曲线，评估与每个分类阈值概率

p t h r e s h o l d

对应的精度和召回率，选择最佳的

p t h r e s h o l d

来计算F1分数.不同学习率的PmPNet训练情况如图5所示.最终训练出的PmPNet模型可以同时达到高精度和高召回率.高学习率训练模型的预测值和真实值之间的PmP走时残差更接近正态分布，损失函数也更小（图5c），但低学习率训练模型F1分数要更大（图5d）.最终采用联合高低学习率训练的策略，得到PmPNet⁃SET_V1.0模型，并用于拾取PmP震相.训练结果和验证性能表明，它结合了两种学习率的优点，包含更高的F1分数、更小的损失函数和更接近正态分布的PmP走时残差（图5g~5i），其F1分数达0.863 7，精确率86.6%，召回率84.8%.

为了获得更准确的PmP走时拾取模型，本文使用相同的数据集开展PmP⁃traveltime⁃Net训练，过程与PmPNet相似（图6）.经过180次迭代后，总的训练损失函数趋于稳定（图6a）.PmP走时残差接近正态分布，超过75%的PmP走时残差在±0.2 s内（图6b），模型预测的PmP走时相对于震中距呈线性增加（图6c），并最终得到适配研究区域拾取PmP走时的模型PmP⁃traveltime⁃Net⁃SET_V1.0.

2.3　模型应用

针对青藏高原东南缘区域，本文经PmP⁃traveltime⁃Net⁃SET_V1.0模型拾取PmP走时后，再次使用PmPNet⁃SET_V1.0模型给出PmP震相在波形中的存在概率，如概率参数大于阈值0.8，将视作该波形包含PmP震相，最终本研究成功获得了6 268个含PmP的波形.

为确保PmP半自动流程拾取结果的可信度，本研究对该流程产出的PmP震相全部进行了人工核验.对比两种方法拾取到的PmP震相，如图7b和图7d所示，当地震事件的震中距离大于50 km时，PmPNet⁃SET_V1.0拾取的PmP走时与PmP半自动流程选取的PmP走时基本接近.这两种方法判别一致的波形约占半自动结果的66%，且两者走时相差几乎都小于0.5 s，其中63%判别一致的波形走时相差小于0.2 s.此外，笔者还对PmPNet⁃SET_V1.0和PmP⁃traveltime⁃Net⁃SET_V1.0的结果进行了人工再检验，结合振幅阈值筛选和质点运动检验，充分保障了这两个模型在研究区域宽频带地震台记录的地震数据中识别PmP震相和拾取PmP走时的高性能.

3 讨论

3.1　拾取PmP波的速度模型构建

为保障PmP波的拾取质量，本文构建了区域的一维速度模型来计算理论走时.构建方式有两种：第一种是选择SWChinaCVM⁃2.0中反射点处的一维速度模型（图8a）.发现局部地区的理论走时与Taup（Crotwell et al.， 1999）计算值存在较大差异.第二种是采用SWChinaCVM⁃MOHO⁃1.0中PmP波反射点处的莫霍深度作为初始值，然后压缩或拉伸SWChinaCVM⁃2.0中的反射点处的速度模型（图8b）.

合理设置反射点的莫霍深度模型和速度模型非常重要，决定了PmP震相的走时残差及PmP波在波形中的估计位置.结果表明，第二种模型构建方式可使与Taup的走时残差质量显著提升，即理论走时更接近PmP半自动流程得到的走时（图9b）.此外，莫霍深度范围的设置决定了目标波形窗区的位置和可选范围.莫霍深度范围的选择过大将增加符合判别标准的波形数量，导致其他波形易被误分类为PmP.

图10显示，当震中距小于150 km时，PmP⁃P理论走时差随着震中距的增加而减少.在人工查验波形的过程中，笔者发现当震中距小于80 km时，除Pg以外的高振幅近震震相可能会比PmP更早到达该站，落在PmP的选取范围之内，从而干扰PmP窗区选取的准确性.为此，本研究优化了当震中距小于80 km时的筛选条件.然而，由于PmP数据在不同震中距上的分布不平衡，PmPNet⁃SET_V1.0在小震中距上识别PmP波能力有限（图7b和图7d），这需要在未来增加相应的波形训练数据加以改进.

3.2　PmPNet的训练参数影响

2.2.2节表明学习率对于训练PmPNet有着不小的影响：学习率越小，损失函数的下降速率也会随之减小，那么要更多的迭代次数才能训练出对应的模型.虽然小学习率训练模型所得到的精度-召回率曲线更好，但它的预测值和实际值之间的PmP走时残差有增大的趋势.如果增大学习率，PmP走时残差更趋近于正态分布，但是精度-召回率曲线质量下降、F1分数减小.本研究表明，学习率过大可能会出现过拟合现象，交替使用不同的学习率进行迭代将有助于获取性能均衡的PmPNet模型.

在未来的研究中，可以考虑使用多种学习率来进行训练.在迭代的早期阶段使用较大的学习率来增加损失函数的收敛速度，并根据不同阶段的训练情况逐渐降低学习率，在算法收敛的同时避免过拟合.此外，训练的迭代次数也应严格控制，因为过多的迭代也易导致过拟合.

3.3　基于PmP半自动流程的莫霍深度估计

本研究在识别PmP震相的半自动流程的第二步中，通过正向建模初步确定了所选波形的莫霍深度（图11a）.在研究区域内，莫霍深度通常在西北部较厚，并向东南部减小，与SWChinaCVM⁃Moho⁃1.0的趋势相似（图11b），表明了本研究结果的稳定性.莫霍面深度比SWChinaCVM⁃Moho⁃1.0平均值要浅.此外发现一些断层带（如RRF）的地壳厚度存在显著变化，且一些断层面沿垂直于莫霍面深度的梯度方向发展，如LXF和XJF.

下一步，将基于本研究新拾取的PmP波和更多的相关数据迭代更新区域PmPNet⁃SET和PmP⁃traveltime⁃Net⁃SET模型，进一步约束青藏高原东南缘的地壳厚度.

3.4　PmP震相识别模型应用前景

在国内，大量的波形数据会由各省地震局收集并处理，再由CENC进行统一编目，形成权威的编目产品（韩雪君等，2023）.震相拾取的准确性存在主观影响，CENC会定期进行审核，并安排学科组专家按照《地震编目规范》（DB/T66-2016）和《省级地震编目资料评比规则》进行严格复审.对于初次震相，复审的差异小于0.2 s，则认为这一震相的拾取结果是准确的.对于后续到达的震相，如PmP，复审差异阈值会增大到为0.5 s.超过相关阈值，CENC则会纠正更新数据.本文在收集和识别高质量PmP震相的过程中同样实施了严格的鉴别准则，按照CENC设定的类似要求来选择震相窗区，还人工检查了每个选定的波形及其到时标记.

数据筛选的标准越高，质量也将提高，但得到的数据就将越少.这也是机器学习中的一个常见问题，需要在数据的质量和数量之间找到平衡.未来基于人工智能技术提取其他震相，可以遵循类似的过程，开发相应的震相提取算法.

本研究中产出的PmP数据集为进一步改进PmPNet模型的自动识别，以及PmP震相拾取的质量和数量打下了宝贵的基础，有助于提升青藏高原东南缘中下地壳结构反演的分辨率和约束的地壳厚度，深入了解地壳深部结构变形在构造演化及孕震环境发挥的作用.

4 结论

本文使用半自动PmP拾取工作流程从青藏高原东南缘固定台站（2009—2022年）和流动台站（2011—2013年）的数据中新识别了1 536个高质量的PmP波并标记了它们的到时，结合固定台站中1 713个含Pg和PmP到时的波形，构建了一个PmP波训练集，通过深度学习模型PmPNet训练了一个适配区域的PmPNet⁃SET_V1.0模型，可自动识别PmP波并拾取到时.结果（精度86.6%、召回率84.8%、F1值0.857）验证了本研究的可靠性.将PmPNet⁃SET_V1.0模型应用于CREDIT⁃X1local，本研究将青藏高原东南缘的PmP数据量增加了近两倍，达到6 268个样本，这将进一步改进PmPNet模型的自动识别和PmP震相拾取的质量和数量，为下一步开展地下结构反演研究提供宝贵的数据基础.

数据来源： CREDIT⁃X1local来源于中国地震局地球物理研究所国际地震科学数据中心（www.esdc.ac.cn）.CSNCD由中国地震台网中心，国家地震数据中心（https：//data.earthquake.cn）提供.CENC 历史地震目录来源于https：//news.ceic.ac.cn/（最后一次访问于2025年3月17日）.用于识别PmP阶段的开发工作流程/代码可以在https：//github.com/Seismic-Data-imaging-the-Earth/PmPWorld找到.

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	Ahmed, S. M. S., Guneyli, H., 2023. Robust Multi⁃Output Machine Learning Regression for Seismic Hazard Model Using Peak Crust Acceleration Case Study, Turkey, Iraq and Iran. Journal of Earth Science, 34(5): 1447-1464. https://doi.org/10.1007/s12583⁃022⁃1616⁃2

[2]	An, Y. R., 2024. Introduction to a Recently Released Dataset Entitled CSNCD: A Comprehensive Dataset of Chinese Seismic Network. Earthquake Research Advances, 4(1): 100255. https://doi.org/10.1016/j.eqrea.2023.100255

[3]	An, Y. R., Zhang, Y.Y., Miao, C.L., et al, 2023. CSNCD: A Comprehensive Dataset of Chinese Seismic Network. Online (in Chinese). https://doi.org/10.12080/nedc.11.ds.2023.0001

[4]	Beroza, G. C., Segou, M., Mostafa Mousavi, S., 2021. Machine Learning and Earthquake Forecasting—Next Steps. Nature Communications, 12: 4761. https://doi.org/10.1038/s41467⁃021⁃24952⁃6

[5]	Chai, C. P., Rose, D., Stewart, S., et al., 2025. PickerXL, a Large Deep Learning Model to Measure Arrival Times from Noisy Seismic Signals. Seismological Research Letters, 96(4): 2394-2404. https://doi.org/10.1785/0220240353

[6]	Chen, L. Y., Wang, W. L., Zhang, L., 2021. Crustal Thickness in Southeast Tibet Based on the SWChinaCVM⁃1.0 Model. Earthquake Science, 34(3): 246-260. https://doi.org/10.29382/eqs⁃2021⁃0010

[7]	Clark, M. K., Royden, L. H., 2000. Topographic Ooze: Building the Eastern Margin of Tibet by Lower Crustal Flow. Geology, 28(8): 703. https://doi.org/10.1130/0091⁃7613(2000)28703:tobtem>2.0.co;2

[8]	Crotwell, H. P., Owens, T. J., Ritsema, J., 1999. The TauP Toolkit: Flexible Seismic Travel⁃Time and Ray⁃Path Utilities. Seismological Research Letters, 70(2): 154-160. https://doi.org/10.1785/gssrl.70.2.154

[9]	Dai, G. H., An, Y. R., 2020. China Earthquake Administration: Chinese Seismic Network. Summary of the Bulletin of the International Seismological Centre, 54: 28-40. https://doi.org/10.31905/xwivrbri

[10]	Ding, W., Li, T. J., Yang, X., et al., 2022. Deep Neural Networks for Creating Reliable PmP Database with a Case Study in Southern California. Journal of Geophysical Research: Solid Earth, 127(4): e2021JB023830. https://doi.org/10.1029/2021JB023830

[11]	Gao, Y., Shi, Y. T., Wang, Q., 2020. Seismic Anisotropy in the Southeastern Margin of the Tibetan Plateau and Its Deep Tectonic Significances. Chinese Journal of Geophysics, 63(3): 802-816 (in Chinese with English abstract).

[12]

Guo, C., Li, J. L., Wu, W. W., et al., 2025. A New⁃ Generation Source Mechanism Catalogue for Historical Moderate⁃to⁃Strong Earthquakes in the Sichuan⁃ Yunnan Region Constrained by a Topographic High⁃ Resolution 3D Velocity Model and Seismic Waveform Matching. Scientia Sinica (Terrae), 55(12): 4297-4320 (in Chinese with English abstract).

[13]	Han, C. R., Xu, M. J., Huang, Z. C., et al., 2020. Layered Crustal Anisotropy and Deformation in the SE Tibetan Plateau Revealed by Markov⁃Chain⁃Monte⁃Carlo Inversion of Receiver Functions. Physics of the Earth and Planetary Interiors, 306: 106522. https://doi.org/10.1016/j.pepi.2020.106522

[14]	Han, X. J., Chen, H. F., Zhao, G. F., et al., 2023. Arrangement of Waveform Data from China Earthquake Networks and Construction of Service Platform. Earthquake Research in China, 39(2): 412-424 (in Chinese with English abstract).

[15]	He, K., Zhang, X., Ren, S., et al., 2016. Deep Residual Learning for Image Recognition. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas. https://doi.org/10.1109/CVPR.2016.90.

[16]	Hunter, J. D., 2007. Matplotlib: A 2D Graphics Environment. Computing in Science & Engineering, 9(3): 90-95. https://doi.org/10.1109/MCSE.2007.55

[17]	Johnson, J. M., Khoshgoftaar, T. M., 2019. Survey on Deep Learning with Class Imbalance. Journal of Big Data, 6(1): 27. https://doi.org/10.1186/s40537⁃019⁃0192⁃5

[18]	Kong, Q. K., Allen, R. M., Schreier, L., et al., 2016. MyShake: A Smartphone Seismic Network for Earthquake Early Warning and beyond. Science Advances, 2(2): e1501055. https://doi.org/10.1126/sciadv.1501055

[19]	Li, L., Wang, W. T., Yu, Z. Y., et al., 2024a. CREDIT⁃X1local: A Reference Dataset for Machine Learning Seismology from ChinArray in Southwest China. Earthquake Science, 37(2): 139-157. https://doi.org/10.1016/j.eqs.2024.01.018

[20]	Li, L., Wang, X., Hou, G. B., et al., 2024b. Two Thin Middle⁃Crust Low⁃Velocity Zones Imaged in the Chuan⁃Dian Region of Southeastern Tibetan Plateau and Their Tectonic Implications. Science China Earth Sciences, 67(5): 1675-1686. https://doi.org/10.1007/s11430⁃023⁃1256⁃0

[21]	Li, T. J., Yao, J. Y., Wu, S. C., et al., 2022. Moho Complexity in Southern California Revealed by Local PmP and Teleseismic Ps Waves. Journal of Geophysical Research: Solid Earth, 127(2): e2021JB023033. https://doi.org/10.1029/2021JB023033

[22]

Liu, Y., Yu, Z. Y., Zhang, Z. Q., et al., 2023. The High⁃Resolution Community Velocity Model V_2.0 of Southwest China, Constructed by Joint Body and Surface Wave Tomography of Data Recorded at Temporary Dense Arrays. Science China Earth Sciences, 66(10): 2368-2385. https://doi.org/10.1007/s11430⁃022⁃1161⁃7

[23]	Ma, H. S., Zhang, G. M., Wen, X. Z., et al., 2008. 3⁃D P Wave Velocity Structure Tomographic Inversion and Its Tectonic Interpretation in Southwest China. Earth Science, 33(5): 591-602 (in Chinese with English abstract).

[24]	Ross, Z. E., Yue, Y. S., Meier, M. A., et al., 2019. PhaseLink: A Deep Learning Approach to Seismic Phase Association. Journal of Geophysical Research: Solid Earth, 124(1): 856-869. https://doi.org/10.1029/2018JB016674

[25]	Royden, L. H., Burchfiel, B. C., van der Hilst, R. D., 2008. The Geological Evolution of the Tibetan Plateau. Science, 321(5892): 1054-1058. https://doi.org/10.1126/science.1155371

[26]	Rumelhart, D. E., McClelland, J. L., 1987. Learning Internal Representations by Error Propagation. Parallel Distributed Processing: Explorations in the Microstructure of Cognition: Foundations. MIT Press, Cambridge.

[27]	Shi, X. Y., Wang, X. Q., Qiu, Y. R., et al., 2020. Analysis of the Minimum Magnitude of Completeness for Earthquake Catalog in China Seismic Experimental Site. Chinese Journal of Geophysics, 63(10): 3683-3697 (in Chinese with English abstract).

[28]	Sun, A. H., Zhao, D. P., Gao, Y., et al., 2019. Crustal Seismic Imaging of Northeast Tibet Using First and Later Phases of Earthquakes and Explosions. Geophysical Journal International, 217: 405-421. https://doi.org/10.1093/gji/ggz031

[29]	Sun, A. H., Zhao, D. P., Ikeda, M., et al., 2008. Seismic Imaging of Southwest Japan Using P and PmP Data: Implications for Arc Magmatism and Seismotectonics. Gondwana Research, 14(3): 535-542. https://doi.org/10.1016/j.gr.2008.04.004

[30]	Wang, J., Xiao, Z. W., Liu, C., et al., 2019. Deep Learning for Picking Seismic Arrival Times. Journal of Geophysical Research: Solid Earth, 124(7): 6612-6624. https://doi.org/10.1029/2019JB017536

[31]	Xia, S. H., Zhao, D. P., Qiu, X. L., et al., 2007. Mapping the Crustal Structure under Active Volcanoes in Central Tohoku, Japan Using P and PmP Data. Geophysical Research Letters, 34(10): 2007GL030026. https://doi.org/10.1029/2007GL030026

[32]	Zhao, D. P., Todo, S., Lei, J. S., 2005. Local Earthquake Reflection Tomography of the Landers Aftershock Area. Earth and Planetary Science Letters, 235(3-4): 623-631. https://doi.org/10.1016/j.epsl.2005.04.039

[33]	Zhu, W. Q., Beroza, G. C., 2019. PhaseNet: A Deep⁃Neural⁃Network⁃Based Seismic Arrival Time Picking Method. Geophysical Journal International,: 216(1): 261-273. https://doi.org/10.1093/gji/ggy423

基金资助

中国地震局地震预报重点实验室专项基金项目(2023030104)

国家自然科学基金项目(42474134)

国家自然科学基金项目(41974050)

国家自然科学基金项目(42374081)

AI Summary AI Mindmap

PDF (2076KB)

访问

被引

详细

导航

Received	Accepted	Published
2025-06-04
Issue Date
2026-05-13

摘要

Abstract

Graphical abstract

关键词

Key words

引用本文

0 引言

1 数据与方法

1.1 数据

1.2 研究方法

1.2.1 PmP半自动拾取流程

1.2.2 用于PmP检测的深度学习模型

2 研究结果

2.1 在CREDIT⁃X1local中筛选高质量PmP震相

2.2 PmPNet训练与评估

2.2.1 PmPNet的训练

2.2.2 PmPNet训练表现评估

2.3 模型应用