基于WaveNet和全波形的地震反方位角智能估计模型

肖卓; 莫金卫; 张皓哲; 黄华娟; 张莹莹; 徐敏

doi:10.3799/dqkx.2025.184

地球科学 ›› 2026, Vol. 51 ›› Issue (01) : 90 -103. DOI: 10.3799/dqkx.2025.184

基于WaveNet和全波形的地震反方位角智能估计模型

肖卓 ¹ ,
莫金卫 ¹ ,
张皓哲 ¹ ,
黄华娟 ¹ ,
张莹莹 ³ ,
徐敏 ²

作者信息 +

Seismic Back-Azimuth Estimation Model Based on WaveNet and Full Waveform Data

Author information +

文章历史 +

PDF (3822K)

摘要

地震定位是地震预警和地球深部结构研究的核心，但其精度仍面临挑战.本研究基于中国大陆测震台网的三分量波形数据，采用深度学习技术，构建了单台地震反方位角估算方法，对比分析了标准卷积神经网络与WaveNet模型在P波、面波和全波形输入下的性能差异.结果显示，WaveNet结合全波形输入的表现最优，其借助扩张卷积与残差连接结构增强了对长时间序列特征的提取能力，反方位角平均偏差仅为0.04°，拟合优度（R²）达到0.99.独立测试结果表明，该模型具备良好的泛化能力，平均绝对偏差和方差相较于传统面波偏振方法分别降低了58.70%和28.21%.基于全波形输入的深度学习方法可显著提高单台定位精度，为地震预警及极端环境下的地震监测提供有效技术支撑.

Abstract

Earthquake location is fundamental to both early warning systems and studies of the Earth’s deep structure, yet its accuracy remains challenging to be improved. Using three-component waveform data from the China National Seismic Network, this study develops a single-station back-azimuth estimation method based on deep learning. We compare the performance of a standard convolutional neural network with that of a WaveNet architecture under three input settings: P-wave only, surface-wave only, and full-waveform input. Results show that WaveNet combined with full-waveform input performs best, benefiting from dilated convolutions and residual connections that enhance its ability to extract long-range temporal features. The model achieves an average back-azimuth deviation of only 0.04°, with a coefficient of determination (R²) of 0.99. Independent tests demonstrate strong generalization capability, with the mean absolute deviation and variance reduced by 58.70% and 28.21%, respectively, compared with the traditional surface-wave polarization method. The findings indicate that deep learning with full-waveform input can substantially improve single-station location accuracy, offering effective technical support for earthquake early warning and seismic monitoring in challenging environments.

Graphical abstract

关键词

地震定位 / 反方位角 / WaveNet / 深度学习 / 全波形 / 地震学.

Key words

earthquake location / back⁃azimuth / WaveNet / deep learning / full waveform / seismology

引用本文

引用格式 ▾

肖卓,莫金卫,张皓哲,黄华娟,张莹莹,徐敏. 基于WaveNet和全波形的地震反方位角智能估计模型[J]. 地球科学, 2026, 51(01): 90-103 DOI:10.3799/dqkx.2025.184

登录浏览全文

4963

注册一个新账户忘记密码

0 引言

地震定位是地震科学研究和地震防灾减灾的核心技术之一，其精度和时效性直接决定了地震预警系统的效能以及对地球深部结构认知的可靠性（田玥和陈晓非， 2002）.通过准确测定震源参数，地震定位不仅为地震、火山、冰川和核试验监测提供了基础支撑，还为壳幔结构成像研究提供了关键数据支持（Lomax and Savvaidis， 2022）.传统地震定位方法利用初至波走时数据和地下介质速度结构来确定地震事件的时间与空间信息（Thurber and Rabinowitz， 2000）.通过对地震观测信息的进一步挖掘，基于程函方程（劳高月等， 2024）和波动方程（Tong et al.， 2014；Li et al.， 2020）的方法有效提升了地震定位精度.尽管如此，当前地震定位技术仍面临诸多挑战（张风雪等， 2025）.一方面，地震观测站的空间分布不均，尤其在深海或偏远地区台站密度较低，限制了定位精度（Zang et al.， 2024）；另一方面，区域地形和深部构造的复杂性增加了震源参数测定的难度（Wagner et al.， 2013）.此外，随着地震数据存档规模的不断扩大，传统定位技术已难以满足海量数据处理的效率需求（Mousavi and Beroza， 2023）.因此，在复杂环境下，传统方法难以兼顾高精度与实时性要求，亟需引入新技术手段以提升地震定位的整体性能（侯新荣等， 2024）.

根据数据来源的不同，地震定位方法可分为多台定位与单台定位两类.多台定位利用地震台阵的走时或波形数据获取震源的时间和空间信息，精度较高（Li et al.， 2020）.单台定位则通过分析地震波的偏振特性及其传播规律等特征推断震源的方位和距离，适用于地震台站分布稀疏的海洋或行星地区（Sun et al.， 2024）.单台定位具备时效性优势，能够实现数据的快速处理与结果迅速输出，为地震实时预警系统提供关键支持（李山有等， 2024）.其中，反方位角（back azimuth）是单台定位中描述震源位置的关键参数，定义为从观测台站指向震源方向与正北方向的夹角，通常由P波或面波的质点运动分析获得（Scholz et al.， 2017）.在台网密度固定的情况下，单台地震定位的反方位角误差越小，地震定位精度越高（黄俊等， 2011）.然而，受复杂地质环境影响，单一震相的特征提取往往难以提供准确的反方位角信息.例如，在海底地震观测环境中，由于海水压力扰动和仪器倾斜等噪声干扰，往往导致基于P波偏振的反方位角估计的精度和稳定性不足（Bell et al.， 2015）.基于面波的方法尽管能够利用更丰富的波形信息，却容易因波形传播路径的非均匀性和多路径效应产生较大偏差（Doran and Laske， 2017）.为克服这些局限性，研究者需深入探索多元震相信息以提高反方位角估计精度.这包括利用复杂的转换震相（Zheng et al.， 2019； Sun et al.， 2024）、分析各向异性震相特性（Tian et al.， 2011）以及应用波形模拟技术（Zhu et al.， 2020； Dai et al.， 2023）等.

近年来，深度学习技术的快速发展为地震定位提供了新的研究范式（Tan et al.， 2024）.通过自动特征提取和非线性建模，深度学习能够从大规模地震波形数据中挖掘地震震相的深层模式（蒋策等， 2024），相较于传统方法展现出更强的适应性和鲁棒性（Mousavi and Beroza， 2023）.在反方位角评估任务中，深度学习方法通过端到端的学习方式能够直接从复杂波形数据中提取特征，从而显著提升评估的精度与时效性.例如，Mousavi and Beroza（2020）提出了一种基于贝叶斯深度学习的方法，成功实现了从单台站P波观测数据中估计近场地震的反方位角，该方法不仅提高了定位精度，还能够量化结果的不确定性，为反方位角评估提供了新的技术路径.Lara et al.（2023）开发的集成学习算法，仅需使用单台站P波到达后的前3 s波形数据即可快速准确评估近场地震事件的反方位角，进一步展现了该技术的应用潜力.张基（2023）通过集成卷积神经网络（Convolutional Neural Network， CNN）、长短期记忆网络（Long Short⁃Term Memory， LSTM）和残差模块，构建了反方位角评估模型AziNet，该模型在四川地区小震数据测试中的平均绝对误差约为22°.因此，尽管深度学习在反方位角评估中取得了显著进展，但当前仍有较大的探索空间和研究价值.例如，面波和全波形信息蕴含了更丰富的震源特性及传播路径细节，然而，针对这些信息进行深度学习分析的相关研究却相对匮乏.此外，上述关于反方位角的研究多集中于特定区域的小规模数据集，模型的泛化性能仍有待探索.

本研究利用2014年至2024年间中国数字地震台网（China Digital Seismograph Network）记录的强震数据，分别采用标准CNN和基于WaveNet（van den Oord et al.， 2016）的深度学习模型，系统地比较了P波、面波及全波形输入在反方位角估计中的性能表现.全球地震监测台网开源数据的泛化测试结果表明，相比于传统偏振分析方法，深度学习显著提升了反方位角估计的稳定性和准确性.鉴于深度学习方法的通用性和灵活性，未来该模型可进一步应用于海底或行星地震仪的方位评估，为极端环境下的地震监测及仪器校准提供全新的技术路径.

1 数据与方法

1.1　地震波形数据

本研究旨在测试中国大陆地震台网对地震反方位角估计的性能表现，重点关注强震事件.研究数据主要来源于2014年1月1日至2024年1月1日期间的三分量地震波形（郑秀芬等，2009）.Deng et al.（2025）基于远场P波偏振方法对中国数字地震台网1 056个宽频带地震台站的仪器方位角进行了评估，结果表明，约66%的地震计方位角偏差小于3°，与地理北向基本一致.为确保反方位角评估的精度和可靠性，本研究仅选取仪器方位角偏差最小的60个台站（图1）的波形作为数据.

考虑到反方位角对近震预警和远震结构探测（如接收函数和各向异性）均具有重要意义，本研究以30°N和100°E为参考中心点，选取震中距范围为0°~130°、震级大于6.0级的强震事件进行研究.基于IRIS（Incorporated Research Institutions for Seismology）数据中心提供的地震目录，共筛选出1 417个满足条件的强震事件.这些事件空间分布均匀，有效覆盖了西太平洋俯冲带、东亚环形俯冲带、特提斯构造带、印度洋中脊和大西洋中脊等全球主要地震活跃区域（图1）.为保证数据质量与一致性，本研究仅选取包含完整三分量（东西向、南北向和垂直分量）记录的波形数据，并对所有波形进行统一处理：采样率标准化为100 Hz，波形起始时间设定为初至波到时前50 s，记录时长统一为5 000 s，以涵盖完整地震信号.

数据预处理为构建高质量的反方位角评估模型训练数据集，本研究对所有地震波形数据进行了系统化的预处理.首先对波形数据进行线性去趋势和去均值处理，以消除数据中的长周期漂移.随后应用带通滤波（0.02~0.5 Hz）消除高频噪声和长周期干扰，并进行1%的锥形窗处理（taper）以减少边缘效应.所有波形均重采样至1 Hz以统一数据格式并降低计算复杂度.鉴于本研究采用单台站评估且波形已归一化，预处理阶段未对仪器响应进行单独校正.基于地震波偏振特性，本研究构建了三种不同窗口的输入数据集（图2）：（1）P波窗口数据：截取P波到时前5 s至后10 s的15 s波形，主要反映地震初至波的偏振特性；（2）面波窗口数据：基于震中距和4.5 km/s的面波理论速度计算面波到时窗口，截取900 s面波记录，重点表征面波偏振信息；（3）全波形数据：提取长度为4 800 s的完整波形，包含P波、S波及面波等全部震相信息.

在此基础上，以理论P波到时为参考点，选取P波到时前20 s至前5 s作为噪声窗口，P波到时前5 s至后10 s作为信号窗口，计算了每个地震事件的P波信噪比（SNR）.然后，将三分量波形从miniseed格式转换为NumPy矩阵，并采用最大‒最小值归一化方法将振幅映射至［-1，1］区间作为模型输入特征.为避免角度值在0°和360°之间的不连续性以及周期性问题，本研究将反方位角转换为正弦和余弦两个分量组成的单位向量，作为模型预测目标.数据集按照7∶1.5∶1.5的比例划分为训练集、验证集和测试集，同时保留震中距、震级和P波信噪比等辅助特征信息，为后续结果分析提供支持.通过以上预处理流程，最终分别获得了58 107个P波样本、61 048个面波样本和61 583个全波形样本的高质量数据集，每个样本均包含三分量波形数据.

为验证模型的泛化能力，本研究额外引入全球地震监测台网（Global Seismic Network， GSN）位于中国大陆的台站（IC台网）波形数据作为独立测试集（图1）.独立测试集的时间范围以及地震目录与训练数据保持一致.通过比较中国数字地震台网和全球地震监测台网的模型表现，能够更好地评估深度学习模型的鲁棒性和适应性，为研究成果的推广应用提供科学依据，具体流程如图3所示.

1.2　数据增强

本研究采用三种数据增强策略对地震波形数据进行处理，以提升模型对复杂地震信号的泛化能力和鲁棒性.方法如下：（1）随机噪声注入：在三分量波形中加入6%幅度的随机高斯白噪声，模拟真实地震观测中普遍存在的环境噪声和仪器噪声干扰.（2）时间轴平移：在±100个采样点范围内对波形进行随机循环移位，模拟地震波理论到时的不确定性，增强模型对震相识别的时间鲁棒性.（3）动态振幅缩放：对波形振幅施加±20%的随机缩放因子，通过线性插值调整信号长度后截取或补零，模拟由震源深度、传播路径差异引起的振幅变化，使模型能够适应不同震级和传播衰减条件下的波形特征.

为避免过度增强导致特征失真并确保数据多样性，采用概率触发机制，以50%的独立概率灵活应用上述增强方法，使模型更好地适应实际地震观测中复杂多变的数据特征.所有增强操作均在训练阶段实时执行，不修改原始数据存储，提升数据利用效率.

1.3　深度学习模型架构

1.3.1　CNN基线模型

基于CNN在噪声环境下检测地震波相位的稳健性（Ross et al.， 2018），本研究首先设计了一维CNN模型对地震波形时间序列进行处理（图4a）.该模型采用三层级联卷积架构：第一层将3通道输入转换为64通道特征，第二、第三层则分别将特征维度扩展至128和256通道，所有卷积层均使用长度为25的一维卷积核以有效捕获长程时序依赖.每层卷积后配备批归一化（Batch Normalization）和ReLU激活函数，显著增强训练稳定性和非线性表达能力，并通过最大池化（kernel_size=2， stride=2）逐步降低时间分辨率以扩大感受野.随后输出表示地震反方位角的二维单位向量，由正弦和余弦分量组成.为防止过拟合，模型在全连接层前引入50%概率的Dropout正则化.

1.3.2　基于WaveNet的时序特征增强模型

考虑到地震波形与音频信号在时序特性上的相似性，为更好地捕获地震波形中的长距离依赖关系，本研究借鉴音频信号处理领域的WaveNet架构，并将其应用于地震反方位角评估任务.本文的目标是整段波形的方向回归而非自回归生成，因此采用非因果（non causal）扩张卷积，通过对称填充同时利用时间序列两侧的信息.不同于传统CNN通过下采样扩大感受野的策略，WaveNet保持全时间分辨率，避免了对长周期面波和转换震相等低频信息的损失.WaveNet模型以扩张卷积（Dilated Convolution）为核心，通过指数增长的感受野高效覆盖长序列信息，并结合残差连接机制确保梯度有效传播，成功解决深层网络训练困难问题（van den Oord et al.， 2016）.该模型结构始于一个初始1×1卷积层，将3通道输入映射至128通道特征空间，随后串联10个WaveNet残差块（图4b）.每个残差块内采用扩张卷积（kernel_size=5），扩张率从2⁰到2⁹指数递增，显著扩大模型感受野，从而实现对远距离时序依赖关系的精确感知.模型输出端通过1×1卷积结合全局平均池化，生成表示反方位角的2维单位向量.

WaveNet模型的训练和推理的计算复杂度主要源于前向传播和反向传播过程.对于训练阶段，输入数据维度为

D t r a i n ∈ R (M × 3 × T)

，其中

M

为训练样本数，

T

为时间序列长度.模型结构包含3个主要部分：初始1×1卷积层，复杂度为

O (M × 3 × 128 × T) = O (M × T)

；随后是

B = 10

个WaveNet残差块，每个包含扩张卷积和

1 × 1

卷积，处理

F = 128

个特征通道，复杂度为

O (B × M × F 2 × T × K)

，其中

K = 5

为卷积核大小；最后是输出层，复杂度为

O (M × F × T)

.总体训练时间复杂度为

O (E × B × M × F 2 × T × K)

，其中

E

为训练轮数；推理阶段复杂度为

O (B × N t e s t × F 2 × T × K)

，其中

N t e s t

为测试样本数量.WaveNet架构的优势在于通过扩张卷积策略，模型能够在保持参数量可控的前提下指数级扩展感受野范围.对于长度为

T

的输入序列，

B

个残差块的堆叠可以实现高达

(K - 1) × ∑ i = 0 B - 1 2 i

的感受野，这一特性使其特别适合处理包含多种震相信息的长时间序列地震波形数据.

1.4　模型训练与实现细节

在模型训练过程中，采用批量大小（batch size）为64的小批量梯度下降法，训练总轮次（epochs）为120轮.模型优化采用均方误差（Mean Squared Error， MSE）损失函数：

L M S E = 1 N ∑ i = 1 N y i - y i^2

，（1）

其中

y i

表示真实的反方位角单位向量，

y i^

表示模型预测的单位向量，N为批次样本数量.MSE损失函数直接优化预测方向与真实方向的欧氏距离，确保模型准确捕捉地震反方位角信息.训练过程使用Adam优化器，初始学习率设置为0.001，权重衰减系数为10^-5.为防止过拟合并提高模型泛化能力，采用学习率自适应调整策略，当验证损失连续3轮未改善时，学习率自动降低50%.

本研究的深度学习框架基于PyTorch 2.5.1实现，充分利用其动态计算图和GPU加速能力.所有模型训练均在配备NVIDIA GeForce RTX 3090 GPU （24GB VRAM）的工作站上进行，模型训练采用CUDA 12.4进行GPU加速，显著缩短了训练时间.在此硬件环境下，全波形输入的CNN和WaveNet模型的总参数量分别为79 674 882和1 970 690.单轮训练平均耗时分别约45 s和 120 s，其他参数详见表1.整个训练过程中，保存验证损失最低的模型权重作为最终模型.

1.5　模型评估指标

为全面评估CNN和WaveNet两种模型在地震反方位角预测中的性能，本研究采用多种定量评估指标.首先，计算模型预测值与真实值之间的平均偏差和方差，用于衡量模型预测的系统误差和离散程度.平均偏差反映了模型预测的整体趋势是否存在系统性偏移，而方差则表征了预测结果的稳定性.其次，采用决定系数（Coefficient of Determination，

R 2

）作为拟合优度评估模型预测精度的整体水平：

R 2 = 1 - ∑ i = 1 M y i^- y i 2 ∑ i = 1 M y i - y ¯ 2

，（2）

其中

y i^

表示模型预测的反方位角单位向量，

y i

表示真实的反方位角单位向量，

y ¯

表示所有真实单位向量的均值，M为样本总数.

R 2

值越接近1，表明模型预测越接近真实值；当

R 2

接近0或为负值时，则表明模型性能不如简单地使用均值预测.该指标通过对比模型预测误差与数据固有离散程度的比值，能够有效量化模型的总体预测能力.此外，考虑到地震学实际应用中对反方位角精度的需求，本研究特别引入了10°误差范围内的推理成功率（Success Rate within 10°）作为关键评估指标.该指标计算模型预测的反方位角与真实值偏差不超过10°的样本比例，直观反映了模型在实际应用场景中的可靠性.

2 结果与分析

2.1　模型性能对比

表1展示了CNN和WaveNet两种深度学习模型在不同输入类型（P波、面波和全波形）下的性能对比.与Mousavi and Beroza（2020）在近震P波上取得的

R 2

≈0.87相比，本文WaveNet在远震P波输入下已达到同等水平.同时，相较张基（2023）以60 s近震波形训练的AziNet（平均绝对偏差≈22°），本文模型的平均偏差控制具备精度优势.当进一步融入面波和全波形信息时，

R 2

分别提升至0.98和0.99，充分体现了多震相信息对地震反方位角估计的显著增益.

对于P波输入，CNN（图5a~5c）和WaveNet（图6a~6c）的平均偏差分别为-0.34°和-0.26°，方差为28.97和25.33，R²值分别为0.83和0.87，10°误差范围内的成功率分别为0.559和0.580.这表明仅用P波信息时模型性能有限，但WaveNet在各项指标上略优于CNN.面波输入显著提升了模型性能，CNN（图5d~5f）和WaveNet（图6d~6f）的平均偏差减至-0.05°和0.09°，方差降至8.86和9.77，R²值升至0.98，成功率分别达0.915和0.929，表明面波的传播路径和震源信息对反方位角估计至关重要.全波形输入表现最佳，CNN（图5g~5i）和WaveNet（图6g~6i）的平均偏差分别为0.08°和0.04°，方差进一步降至7.65和6.24，R²值均达0.99，成功率分别提升至0.968和0.988.全波形融合了P波初至震相、面波强振幅特征及多种转换震相，提供多维度、多尺度信息，使模型更全面地捕捉地震波传播特征，从而显著降低误差并提升预测稳定性.

针对P波预测效果相对较差的现象，进行了深入的影响因素分析.图7对比了CNN与WaveNet两种模型在P波信噪比、震级和震中距三个关键参数上的误差分布情况，特别聚焦于30°偏差阈值的分布规律.从P波信噪比和震级分布直方图来看，偏差大于30°和小于30°的样本分布模式几乎无显著差异，表明单纯的信噪比高低或震级大小并非导致大误差预测的主导因素.然而，震中距分布图显示出明显的规律性：随着震中距增加，尤其超过80°后，误差大于30°的样本比例显著上升.该区间对应P波逐渐进入并穿越地核边界附近的影区，直达波能量因低速层及核幔界面的强烈折射与绕射效应而显著衰减（Lehmann， 1958），进而降低了模型的预测精度.此外，CNN和WaveNet模型中误差大于30°的样本分布模式高度一致，表明P波模型性能的瓶颈主要源于数据质量而非模型结构差异.由此推测P波预测效果较差的主要原因与P波信号的低信噪比以及远震中地球内部结构引起的影区效应密切相关.

虽然CNN和WaveNet在全波形输入条件下表现相近，但WaveNet模型在方差和成功率指标上表现更优，同时模型参数量远低于CNN模型（表1）.图8展示了CNN和WaveNet在全波形输入下的损失变化趋势.两者训练和验证损失在初期快速下降，约20轮后趋于平稳.CNN损失在10~40轮间波动较大，最终稳定在0.02左右，表明学习复杂震相信息时稳定性不足.WaveNet损失下降更平滑，波动小，最终稳定在0.01左右，验证损失更低，显示更强的泛化能力和稳定性.这与其高效结构和较小参数量相符，证明WaveNet在处理全波形数据时更具优势.CNN模型因采用深层卷积和全连接层处理全波形数据，导致参数量较大，而WaveNet通过扩张卷积和残差连接优化了参数效率.然而，由于WaveNet采用扩张卷积和残差连接设计以捕捉长期依赖关系，其训练和推理时间较长，在计算效率上稍逊.尽管如此，WaveNet在全波形输入下的预测精度更高，使其在精度优先的场景中具有显著优势.此外，从实际部署角度考虑，在Mac M1芯片的CPU环境下进行了测试，单次推理时间约为0.78 s，结果表明该延迟仍处于预警系统的可接受范围内，说明WaveNet在保持精度的同时具备应用潜力.

2.2　WaveNet消融实验

为探究WaveNet模型性能的关键因素，本研究通过消融实验分析了残差块数量、数据增强策略和学习率调度器的影响.实验设置包括：（1）调整残差块数量（block=5和block=12）；（2）分别评估单一数据增强策略（仅时间平移、仅噪声增强、仅振幅缩放）或完全移除数据增强；（3）移除学习率调度器.实验基于面波输入数据集（900 s窗口），训练和评估流程遵循2.5节中的方法，采用平均偏差、方差、

R 2

和10°误差范围内的推理成功率作为评估指标.

消融实验结果表明（表2），WaveNet模型性能受多个关键因素影响，其中网络深度最为关键.将残差块数从5增至12显著提升了性能（成功率由0.901 5提高至0.932 6，方差降低至10.87），证实更深层网络结构对捕捉面波长时序特征具有显著优势.数据增强策略具有一定影响，其中振幅缩放（成功率0.925 4）较时间平移（0.918 8）和噪声增强（0.913 5）表现更佳，而完全移除数据增强则导致性能下降（成功率0.907 9）.学习率调度器对训练稳定性表现出重要影响，其缺失导致平均偏差显著增大（0.48°）且成功率降至最低（0.880 9）.

2.3　泛化能力验证

表3展示了应用WaveNet全波形模型对全球地震监测台网中国大陆10个地震台站（IC台网）的泛化测试结果.总体而言，模型在未训练过的独立数据集上表现出色，平均

R 2

值达0.975，10°误差范围内的平均成功率达0.928 19，证实了模型具有较好的泛化能力.

从区域分布来看，北京（IC.BJT）、上海（IC.SSE）和敦煌（IC.ENH）等台站的成功率较高（分别为0.982 9、0.975 2和0.962 7），而拉萨（IC.LSA）和乌鲁木齐（IC.WMQ）台站的成功率相对较低（分别为0.78和0.871 3）.这种差异可能与区域地质构造复杂性有关.拉萨和乌鲁木齐台站分别位于青藏高原和天山构造带，特殊的深部结构可能导致波形传播路径更为复杂，增加了反方位角估计的难度（Xiao et al.， 2023）.此外，本研究的训练数据集所覆盖的台站主要分布在100°E以东地区（图2），缺乏来自西部构造带的样本，也可能是造成IC.LSA和IC.WMQ等台站泛化性能偏低的重要原因.

总体而言，各台站的

R 2

值普遍较高（0.95~0.99），即使对于方差较大的台站，模型仍保持较高的整体预测准确性，表明模型能够有效解释不同地质环境下的波形变异性.这一结果验证了基于WaveNet的深度学习方法在复杂地震环境下的适应性和鲁棒性.

为评估模型在较小震级事件中的适用性，在北京台（IC.BJT）补充测试了5.0~5.9级地震（图9）.结果显示，随着震级降低，模型预测误差逐渐增大，且偏差>30°的事件显著增多；当震级低于5.5级时，平均偏差和方差均快速上升.该现象与远震体波（Lin et al.， 2025）和面波（Fu et al.， 2019）研究中的震级选取阈值一致，说明5.5级以上地震具备更高的体波和面波信噪比，可完整保留方位角信息.结果表明，WaveNet能够有效学习震相中的方向特征，其预测精度取决于输入波形方位信息的清晰程度.因此，实际应用中建议优先使用震级≥5.5级的事件进行单台反方位角估计.

2.4　深度学习方法与传统偏振分析的性能对比

为了更全面地评价本研究提出的深度学习模型的性能，使用IC独立测试集与传统基于物理规则的反方位角评估方法DLOPy（Doran and Laske， 2017）进行了对比.DLOPy通过重复测量远震面波不同频率（20~100 s）的偏振信息来获取反方位角，以减少结构不均匀性引起的偏差.

表4展示了基于WaveNet和全波形的深度学习方法（AI）与传统偏振分析方法（DLOPy）在IC独立测试集上的对比结果.从整体来看，深度学习方法将平均系统绝对偏差从3.68°降低至1.52°，降幅约58.70%；平均方差从14.89°大幅减至10.69°，降幅约28.21%.这种系统性的改进表明，深度学习方法能够更有效地处理独立测试集中地震波形的复杂信息，显著提高反方位角估计的稳定性.在误差分布方面，两种方法的平均偏差虽然在部分台站上相近（如IC.BJT和IC.QIZ），但在多数台站上AI方法展现出更小的系统偏差.

R 2

值的比较表明，AI方法与传统方法在独立测试集上的表现均较高（R²均超过0.95）.然而，AI方法在多数台站表现更优，其中IC.ENH、IC.KMI、IC.SSE三个台站的R²值均提升了0.03.此外，在独立测试集的有效事件数量上，传统DLOPy方法明显少于AI方法.以北京站（IC.BJT）为例，DLOPy方法仅处理了695个事件，而AI方法成功处理了1 112个事件，增幅约60%.这种差异主要源于传统方法依赖基于互相关系数的质量控制，而深度学习方法能够从噪声较大或信号复杂的数据中提取有用特征，大幅提高了测试数据集的利用率.

为了直观展示两种方法的性能差异，图10呈现了两种方法在10个IC台站独立测试数据集上的角度误差分布对比.图中绿色小提琴图表示深度学习方法的误差分布，仅包含95%置信区间内的数据，避免极端值对分布宽度产生过度影响；粉色小提琴图展示传统偏振方法的结果，仅统计互相关系数大于0.7的数据，在保证结果可靠性的同时保留尽可能多的有效事件数量（表4）.结果显示深度学习方法在所有台站上都表现出明显更窄的误差分布，表明其预测结果更为集中和稳定.特别是在IC.ENH、IC.KMI和IC.XAN等台站，传统方法的误差分布明显更宽，且存在较长的尾部，显示其预测结果中包含较多的极端误差值.此外，深度学习方法的平均误差（绿色圆点）更接近零线，表明其系统偏差更小.

3 结论与展望

基于2014年至2024年中国大陆测震台网记录的1 417个强震事件的三分量波形数据，本研究系统比较了CNN与基于WaveNet的深度学习模型在P波、面波及全波形输入下的反方位角评估性能.结果显示，WaveNet结合全波形输入在强震定位中表现出卓越的精度与鲁棒性，泛化能力突出，且性能显著优于传统偏振分析方法DLOPy.WaveNet通过扩张卷积和残差连接设计有效捕捉地震波形的长期依赖关系，特别适合处理包含多种震相的全波形数据，能够应对复杂地质环境及远震影区效应引起的信号衰减，为单台地震定位提供了高精度、快速的解决方案.

本研究提出的WaveNet模型为区域地震预警提供技术支持，能快速提供高精度反方位角估计，尤其在台站稀疏的深海或偏远山区弥补多台定位局限，为震源定位和灾害响应争取关键时间.模型在全球地震监测台网的泛化测试中表现出较强适应性，为全球推广应用奠定了基础.虽然本研究主要基于强震数据训练，但由于全波形输入不依赖震相拾取，该方法具有向中小震推广的潜力，可用于单台仪器方位标定以及低信噪比事件的快速定位，在极端环境地震监测中具有广阔前景.例如，深海地震仪常受海水压力扰动和仪器倾斜影响，传统方法难以准确估计反方位角，而全波形分析可有效提取复杂震相特征，提升定位精度.同样，在火星、月球等行星地震监测中，由于台站数量极为有限，单台定位具有重要应用前景.

尽管取得一定认识，本研究仍存在局限性.例如，拉萨和乌鲁木齐台站受复杂地质构造影响，预测偏差相对较大，可能因训练数据未充分覆盖复杂传播路径.未来可引入小震数据、模拟波形或跨区域数据集，增强模型泛化能力.同时，方位角集中分布可能导致模型对稀疏角度预测不足，可通过旋转波形或合成数据生成均匀分布样本，并结合贝叶斯方法量化不确定性，提升可靠性.此外，尽管WaveNet参数量较低，但在资源受限的边缘设备上计算需求仍较高.未来可通过模型剪枝、量化或知识蒸馏降低复杂度，优化推理速度，满足毫秒级实时监测需求.

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	Bell, S. W., Forsyth, D. W., Ruan, Y. Y., 2015. Removing Noise from the Vertical Component Records of Ocean⁃Bottom Seismometers: Results from Year One of the Cascadia Initiative. Bulletin of the Seismological Society of America, 105(1): 300-313. https://doi.org/10.1785/0120140054

[2]	Dai, A., Bao, X. Y., Sun, Y.C., et al., 2023. A Novel Method to Estimate Orientations of an Ocean⁃Bottom Seismometer Array for Accurate Measurement of Waveform Phases and Amplitudes. Seismological Research Letters,94(4):1936-1947. https://doi.org/10.1785/0220220363

[3]	Deng, W. Z., Han, G. J., Li, J., et al., 2025.Seismometer Orientation Measurements of Broadband Seismic Stations in the China Digital Seismograph Network.Bulletin of the Seismological Society of America, 115(1): 210-227. https://doi.org/10.1785/0120240075

[4]	Doran, A. K., Laske, G., 2017.Ocean⁃Bottom Seismometer Instrument Orientations via Automated Rayleigh⁃Wave Arrival⁃Angle Measurements.Bulletin of the Seismological Society of America, 107(2): 691-708. https://doi.org/10.1785/0120160165

[5]	Fu, Y. V., Li, L., Xiao, Z., 2019. Lithospheric SH Wave Velocity Structure beneath the Northeastern Tibetan Plateau from Love Wave Tomography.Journal of Geophysical Research: Solid Earth, 124(9): 9682-9693. https://doi.org/10.1029/2019JB017788

[6]	Hou, X. R., Guo, Z. W., Gao, D. W., et al., 2024. Review of Recent Advances in Seismic Location Methods. Progress in Geophysics, 39(3): 959-974 (in Chinese with English abstract).

[7]	Huang, J., Yao, Y. S., Wang, Q. L., et al., 2011. A Integrated Single⁃Station Seismic Location Method for Early Warning. Journal of Geodesy and Geodynamics, 31(2): 142-144, 148 (in Chinese with English abstract).

[8]	Jiang, C., Lü, Z. Y., Fang, L. H., 2024. Earthquake Detection Model Trained on Velocity and Acceleration Records and Its Application in Xinfengjiang Reservoir. Earth Science, 49(2): 469-479 (in Chinese with English abstract).

[9]	Lao, G.Y.,Yang, D.H.,Liu, S.L., et al., 2024. An Eikonal Equation⁃Based Earthquake Location Method by Inversion of Multiple Phase Arrivals. Scientia Sinica Terrae, 54(6): 1830-1844 (in Chinese).

[10]	Lara, P., Bletery, Q., Ampuero, J. P., et al., 2023.Earthquake Early Warning Starting from 3 s of Records on a Single Station with Machine Learning.Journal of Geophysical Research: Solid Earth, 128(11): e2023JB026575. https://doi.org/10.1029/2023JB026575

[11]	Lehmann, I., 1958. On Amplitudes of P near the Shadow Zone.Annals of Geophysics, 11(3-4): 154-156. https://doi.org/10.4401/ag⁃5818

[12]	Li, L., Tan, J. Q., Schwarz, B., et al., 2020.Recent Advances and Challenges of Waveform⁃Based Seismic Location Methods at Multiple Scales.Reviews of Geophysics, 58(1): e2019RG000667. https://doi.org/10.1029/2019RG000667

[13]	Li, S. Y., Wang, B. R., Lu, J. Q., et al., 2024. Prediction of Instrumental Intensity for a Single Station Using a LSTM Neural Network. Chinese Journal of Geophysics, 67(2): 587-599 (in Chinese with English abstract).

[14]	Lin, Z. H., Xiao, Z., Zhang, Y. Y., et al., 2025.Lithospheric Footprint of Mantle Upwelling beneath Late Cenozoic Basalts in the Beibu Gulf Basin, Northwestern South China Sea.Journal of Geophysical Research: Solid Earth, 130(6): e2024JB030379. https://doi.org/10.1029/2024JB030379

[15]	Lomax, A., Savvaidis, A., 2022. High⁃Precision Earthquake Location Using Source⁃Specific Station Terms and Inter⁃Event Waveform Similarity.Journal of Geophysical Research: Solid Earth, 127(1): e2021JB023190. https://doi.org/10.1029/2021JB023190

[16]	Mousavi, S. M., Beroza, G. C., 2020. Bayesian⁃Deep⁃Learning Estimation of Earthquake Location from Single⁃ Station Observations. IEEE Transactions on Geoscience and Remote Sensing, 58(11): 8211-8224. https://doi.org/10.1109/TGRS.2020.2988770

[17]	Mousavi, S. M., Beroza, G. C., 2023. Machine Learning in Earthquake Seismology. Annual Review of Earth and Planetary Sciences, 51(1): 105-129. https://doi.org/10.1146/annurev⁃earth⁃071822⁃100323

[18]	van den Oord, A., Dieleman, S., Zen, H., et al., 2016. WaveNet: A Generative Model for Raw Audio. https://doi.org/10.48550/arXiv.1609.03499

[19]	Ross, Z. E., Meier, M. A., Hauksson, E., et al., 2018.Generalized Seismic Phase Detection with Deep Learning.Bulletin of the Seismological Society of America, 108(5A): 2894-2901. https://doi.org/10.1785/0120180080

[20]	Scholz, J. R., Barruol, G., Fontaine, F. R., et al., 2017.Orienting Ocean⁃Bottom Seismometers from P⁃Wave and Rayleigh Wave Polarizations.Geophysical Journal International, 208(3): 1277-1289. https://doi.org/10.1093/gji/ggw426

[21]	Sun, W. J., Tkalčić, H., Tang, Q. Y., 2024.Single⁃Station Back⁃Azimuth Determination with the Receiver Function Rotation Technique Validated by the Locations of Earthquakes, Impacts, and Explosions.Seismological Research Letters, 95(5): 2925-2938. https://doi.org/10.1785/0220240117

[22]	Tan, F. Z., Kao, H., Yi, K. M., et al., 2024. Next Generation Seismic Source Detection by Computer Vision: Untangling the Complexity of the 2016 Kaikōura Earthquake Sequence. Journal of Geophysical Research: Solid Earth, 129(5): e2024JB028735. https://doi.org/10.1029/2024JB028735

[23]	Thurber, C. H., Rabinowitz, N., 2000. Advances in Seismic Event Location. Springer Netherlands, Dordrecht.https://doi.org/10.1007/978⁃94⁃015⁃9536⁃0

[24]	Tian, X. B., Zhang, J. L., Si, S. K., et al., 2011.SKS Splitting Measurements with Horizontal Component Misalignment.Geophysical Journal International, 185(1): 329-340. https://doi.org/10.1111/j.1365⁃246X.2011.04936.x

[25]	Tian, Y., Chen, X. F., 2002. Review of Seismic Location Study. Progress in Geophysics, 17(1): 147-155 (in Chinese with English abstract).

[26]	Tong, P., Zhao, D., Yang, D., et al., 2014. Wave⁃Equation⁃Based Travel⁃Time Seismic Tomography⁃Part 1: Method. Solid Earth, 5(2): 1151-1168. https://doi.org/10.5194/se⁃5⁃1151⁃2014

[27]	Wagner, M., Husen, S., Lomax, A., et al., 2013.High⁃ Precision Earthquake Locations in Switzerland Using Regional Secondary Arrivals in a 3⁃D Velocity Model.Geophysical Journal International, 193(3): 1589-1607. https://doi.org/10.1093/gji/ggt052

[28]	Xiao, Z., Sun, X. L., Wang, J., et al., 2023. Tectonic Transition Revealed by Upper Mantle Heterogeneities and Anisotropy of the SE Margin of the Tibetan Plateau: Insights into the Cenozoic Intraplate Volcanisms. Tectonophysics, 865: 230046. https://doi.org/10.1016/j.tecto.2023.230046

[29]

Zang, C., Wu, W. B., Ni, S. D., et al., 2024. A Reciprocity⁃Based Efficient Method for Improved Source Parameter Estimation of Submarine Earthquakes with Hybrid 3⁃D Teleseismic Green’s Functions. Journal of Geophysical Research: Solid Earth, 129(5): e2023JB028174. https://doi.org/10.1029/2023JB028174

[30]	Zhang, F. X., Li, Y., Chen, Y. P., 2025. A Brief Analysis of Hypocenter Location Accuracy and Its Influencing Factors. Reviews of Geophysics and Planetary Physics, 56(2): 182-192 (in Chinese with English abstract).

[31]	Zhang, J., 2023. Machine⁃Learning Based Earthquake Detection, Location, Phase Picking and Polarity Determination (Dissertation). University of Science and Technology of China, Hefei (in Chinese with English abstract).

[32]	Zheng, H., Fan, J. K., Zhao, D. P., et al.,2019.A New Method to Estimate Ocean⁃Bottom⁃Seismometer Orientation Using Teleseismic Receiver Functions.Geophysical Journal International, 221(1): 893-904. https://doi.org/10.1093/gji/ggaa041

[33]	Zheng, X. F., Ouyang, B., Zhang, D. N., et al., 2009. Technical System Construction of Data Backup Centre for China Seismograph Network and the Data Support to Researches on the Wenchuan Earthquake. Chinese Journal of Geophysics, 52(5): 1412-1417 (in Chinese with English abstract).

[34]	Zhu, G. H., Yang, H. F., Lin, J., et al., 2020.Determining the Orientation of Ocean⁃Bottom Seismometers on the Seafloor and Correcting for Polarity Flipping via Polarization Analysis and Waveform Modeling.Seismological Research Letters, 91(2A): 814-825. https://doi.org/10.1785/0220190239

基金资助

广西自然科学基金面上项目(2025GXNSFAA069152)

广西民族大学引进人才科研启动项目(2023KJQD28)

广州市科技计划项目(2023A04J0183)

AI Summary AI Mindmap

PDF (3733KB)

访问

被引

详细

导航

Received	Accepted	Published
2025-05-01
Issue Date
2026-05-13

摘要

Abstract

Graphical abstract

关键词

Key words

引用本文

0 引言

1 数据与方法

1.1 地震波形数据

1.2 数据增强

1.3 深度学习模型架构

1.3.1 CNN基线模型

1.3.2 基于WaveNet的时序特征增强模型

1.4 模型训练与实现细节

1.5 模型评估指标