基于多模态深度学习的中国地震仪器烈度预测模型

朱景宝; 李山有; 宋晋东

doi:10.3799/dqkx.2025.078

地球科学 ›› 2026, Vol. 51 ›› Issue (01) : 14 -29. DOI: 10.3799/dqkx.2025.078

基于多模态深度学习的中国地震仪器烈度预测模型

朱景宝 ¹^,² ,
李山有 ¹^,² ,
宋晋东 ¹^,²

作者信息 +

A Chinese Seismic Instrument Intensity Prediction Model Based on Multimodal Deep Learning

Jingbao Zhu ¹^,² ,
Shanyou Li ¹^,² ,
Jindong Song ¹^,²

Author information +

文章历史 +

PDF (3308K)

摘要

中国地震仪器烈度预测对我国地震预警和减灾至关重要，但传统方法存在精度不足、多源数据融合不充分等问题.本研究旨在构建一种多模态深度学习模型，探索在中国地区对于地震仪器烈度预测的可行性，提升地震预警中仪器烈度预测的准确性和鲁棒性.建立多模态中国仪器烈度预测网络（MCIINet），采用中国地震台网记录的地震事件对MCIINet进行训练和测试.实验表明：在测试数据集上，P波触发后3 s，和基线模型相比，MCIINet对于仪器烈度预测的MAE和RMSE分别降低了9.03%和8.67%、R²和准确率分别提升了9.10%和2.51%.MCIINet通过多模态深度特征融合有效提升了仪器烈度预测精度，验证了多模态深度学习对于我国地震仪器烈度预测的可行性，可为地震预警中仪器烈度预测提供技术支撑.

Abstract

The Chinese seismic instrument intensity prediction is crucial for earthquake early warning (EEW) and hazard mitigation in China, but traditional methods suffer from issues such as insufficient accuracy and insufficient fusion of multi-source data. This study aims to construct a multimodal deep learning model, explore its feasibility for predicting seismic instrument intensity in China, and improve the accuracy and robustness of instrument intensity prediction for EEW. A Multimodal Chinese Instrument Intensity prediction Network (MCIINet) is proposed, which is trained and tested by the seismic events recorded by China Earthquake Networks Center. Experiments have shown that on the test dataset, compared to the baseline model at 3 s after P-wave triggering, MCIINet reduced MAE and RMSE of instrument intensity prediction by 9.03% and 8.67%, respectively, and improved R² and accuracy by 9.10% and 2.51%, respectively. MCIINet has effectively improved the accuracy of intensity prediction through multimodal deep feature fusion, verifying the feasibility of multimodal deep learning for seismic instrument intensity prediction in China, and providing technical support for instrument intensity prediction in EEW.

Graphical abstract

关键词

地震仪器烈度 / 地震预警 / 多模态 / 深度学习 / P波 / 地震学.

Key words

seismic instrument intensity / earthquake early warning / multimodal / deep learning / P wave / seismology

引用本文

引用格式 ▾

朱景宝,李山有,宋晋东. 基于多模态深度学习的中国地震仪器烈度预测模型[J]. 地球科学, 2026, 51(01): 14-29 DOI:10.3799/dqkx.2025.078

登录浏览全文

4963

注册一个新账户忘记密码

0 引言

地震作为最具破坏性的自然灾害之一，对人类生命财产安全和社会稳定构成严峻威胁.地震预警作为减轻地震灾害的重要手段之一，地震预警系统在破坏性地震波到达目标场地之前预测地震可能造成的破坏程度，并向公众发布预警信息（李山有等， 2004；马强等， 2008； Allen and Melgar， 2019）.目前，许多地震频发的国家和地区都已开始运行或测试地震预警系统，并进一步验证地震预警对于地震减灾的重要性（Erdik et al.， 2003； Peng et al.， 2020； Wu et al.， 2021；吕帅等， 2024； McGuire et al.， 2025）.地震仪器烈度（本文后面统称为仪器烈度）是用观测台站记录的地震动数据计算地震对台站所在场地影响的强弱程度，可以客观反映地震对房屋建筑、生命线工程等造成的破坏程度（Wald et al.， 1999a；金星等， 2013）.仪器烈度预测是地震预警系统的关键技术环节，其目标是通过地震初期信号（如P波）快速估算地震动强度，为公众和关键设施争取宝贵的应急响应时间，对于震后救援、灾情处置等方面也起到非常重要的作用（宋晋东， 2013；张红才， 2013）.因此，发展高效、精准的仪器烈度预测技术，成为我国防震减灾体系建设的核心任务之一.

快速且可靠地获取地震烈度图对于震后灾情快速评估、救援部署等具有重要意义（Chen et al.， 2023a）.一些学者提出基于密集远场地震台阵的地震烈度预测方法，通过利用密集远场地震台阵和反投影法对震源破裂过程进行成像，再结合地震动参数衰减模型GMPE快速获取地震烈度图（Chen et al.， 2022；吴佳杰等， 2025）；此外，美国地质调查局提出的ShakeMap通过对地震台站的实测地震动参数和地震动参数衰减模型GMPE的预测值进行加权处理，以快速预测震后的地震烈度图（Wald et al.， 1999b； Wald et al.， 2022）.快速获取可靠的仪器烈度对于地震烈度图的预测也是非常重要的.传统的仪器烈度预测方法主要依赖单一P波物理参数或经验公式（马强等， 2014； Caruso et al.， 2017）.Wu and Kanamori（2005）发现P波触发后3 s的峰值位移（Peak displacement， P_d）携带了即将到来的地震动强度信息，并建立P_d与地震动峰值速度的经验关系；Brondi et al.（2015）发现P波的速度平方积分（squared velocity integral， IV2）与地震动峰值速度和仪器烈度存在较好的相关性.但是传统的仪器烈度预测方法存在一定的局限性，单参数难以全面表征地震动的复杂时空特性，以及经验公式依赖人工特征工程，对噪声干扰和复杂地质条件适应性差等.这些问题可能导致传统方法对于仪器烈度预测具有较大的误差和不确定性.

近年来，随着人工智能技术的快速发展，机器学习方法在地球科学以及地震学领域得到应用和研究（于子叶等， 2018；宋晋东等， 2021；赵明等， 2021；王墩和孙琨， 2022； Mousavi and Beroza， 2023；蒋策等， 2024）.同时，仪器烈度预测领域也逐渐从传统物理模型向数据驱动方法过渡（李水龙， 2014； Jozinović et al.， 2020； Kubo et al.， 2020；李山有等， 2024a；郑周等， 2024； Jiang et al.， 2025）.早期研究多采用线性回归、极限梯度提升（XGBoost）等机器学习模型，通过人工筛选特征（如P波峰值位移、速度平方积分等）建立预测关系（Hsu et al.， 2013； Zhu et al.， 2022；李水龙等， 2023）.例如，李山有等（2024b）建立了多特征输入的仪器烈度阈值判别XGBoost模型，结果表明，和传统的P_d方法相比，XGBoost模型可以更加准确地预测仪器烈度是低还是高.深度学习技术的引入为仪器烈度预测带来了新思路.以长短期记忆网络（LSTM）和卷积神经网络（CNN）为代表的模型，能够从时域或频域信号中自动提取高阶特征.例如，Zhang et al.（2022）建立了一个基于卷积神经网络的现地烈度预测CONIP模型，使用卷积神经网络从台站记录的原始的地震波形中提取时域特征，进而输出预测的仪器烈度.胡进军等（2023）提出了一个基于长短期记忆网络（LSTM）的仪器烈度预测模型，并将台站记录的三分量的地震动时域数据作为模型的输入.Zhu et al.（2023）建立了一个基于双向门控循环神经网络的地震动峰值预测模型，并将人工从P波信号中提取的多个特征作为模型输入，基于模型预测PGA和PGV计算最终预测的仪器烈度.然而，现有的机器学习、深度学习模型仍存在一些不足，数据模态单一，多数模型仅利用时域波形或频谱数据或多个人工定义的P波特征，未能充分融合地震事件的多维度信息，特征交互不足，不同模态数据间缺乏有效的特征交互机制.此外，现有研究多基于国际公开数据集，缺乏针对中国区域地震动特性的针对性优化，因此，探索建立适用于中国地区的深度学习仪器烈度预测模型是非常有意义的.

多模态深度学习是人工智能领域的重要分支，其核心思想是通过联合学习异构数据源（如图像、文本、时序信号）的互补信息，提升模型的表征能力与泛化性能（Guzhov et al.， 2022； Jabeen et al.， 2023）.在医疗诊断、自动驾驶、自然语言处理等领域，多模态融合已展现突破性进展（Rastgoo et al.， 2019； Behrad and Abadeh， 2022； Stahlschmidt et al.， 2022； Mousavi et al.， 2025）.例如，Chen et al.（2023b）提出了一个基于多模态的全球中期天气预报系统，通过处理气象领域中湿度、风、温度等不同模态的气候数据，进而获取更加多元和丰富的信息，以提高模型对于天气预报的精度.

为了探索多模态深度学习方法在中国地区对于地震仪器烈度预测的可行性以及提高我国地震仪器烈度预测的准确性，本文提出了一种多模态中国仪器烈度预测网络（Multimodal Chinese Instrument Intensity prediction Network，MCIINet），针对地震动频谱、时域及文本（P_d、IV2等）三类异构多模态数据，设计了不同模态数据对应的编码器结构（时域编码器、频谱编码器、文本编码器），通过注意力机制动态融合多模态特征，解决传统模型的特征交互不足问题.使用中国地震台网记录的强震数据对MCIINet进行训练和测试.基于相同的测试数据集，本研究分析了MCIINet在P波触发后3 s对于仪器烈度预测的性能，并和基线模型的仪器烈度预测结果进行了对比.

1 地震数据和处理

1.1　地震数据基本信息

本研究采用中国地震台网记录的发生在中国地区的地震事件，覆盖区域经度为71°~126°E、纬度为19°~49°N，时间跨度为2007年至2020年，包含震级范围M_S3.0~ M_S7.0的1 629次地震事件，涉及 24 204条三分量加速度记录，加速度记录的采样率为100 Hz.本研究为了防止地震数据在训练过程中的信息泄露，根据发震时间和地震事件进行数据集的划分，将2007年至2016年发生的地震事件划分为训练数据集，包含1 246次地震事件，涉及17 028条三分量加速度记录；将2017年至2020年发生的地震事件划分为测试数据集，包含383次地震事件，涉及7 176条三分量加速度记录.图1a展示了训练数据集的地震事件震中和台站分布，图1b展示了测试数据集的地震事件震中和台站分布.同时，本研究没有依据震中距和信噪比对地震动记录进行筛选，图2a~2c和图2d分别展示了训练集和测试集中震中距、信噪比、震级和仪器烈度的分布.

1.2　数据预处理

台站记录的原始强震动加速度数据需经过以下预处理步骤：（1）对原始的三分量强震动加速度记录进行基线校正；（2）采用马强等（2013）提出的P波自动捡拾算法对原始的竖向加速度记录进行P波拾取，并对最终P波拾取结果进行人工校正，以确保模型训练的可靠性；（3）对加速度记录积分获取速度记录，再对速度记录积分获取位移记录，并采用4阶0.075 Hz高通巴特沃斯滤波器对积分后的记录进行滤波，以消除积分造成的低频漂移影响（Peng et al.， 2017）；（4）依据《中国地震烈度表》（GB/T⁃17742-2020），计算中国地震仪器烈度，并作为回归模型训练的标签（这里的标签为每条地震记录对应的仪器烈度数值）.

1.3　多模态数据构建

为了充分利用P波到达后的数据信息，本研究采用的P波到达后的多模态数据包括时域数据、频谱数据和文本数据.时域数据为P波到达后4阶0.075 Hz巴特沃斯滤波器高通滤波后的3分量的加速度波形；频谱数据是通过对P波到达后的3分量的加速度波形进行快速傅里叶变换，根据傅立叶变换出现的实部和虚部进行模长运算，进而得到每个频率分量的振幅；文本数据是根据前人的相关研究通过对P波信号计算得到的12个P波物理参数，包括峰值速度P_v（Wu and Kanamori， 2005）、峰值加速度P_a（Wu and Kanamori， 2005）、峰值位移P_d（Wu and Kanamori， 2005）、阿里亚斯烈度I_A（Arias， 1970）、位移平方积分ID2（Wang and Zhao， 2018）、速度平方积分IV2（Brondi et al.， 2015）、加速度平方积分IA2（Festa et al.， 2008）、竖向加速度之和SVA（Song et al.， 2023）、竖向位移之和SVD（Song et al.， 2023）、竖向速度之和SVV（Song et al.， 2023）、累积绝对速度CAV（Reed and Kassawara， 1990）、累积能量变化率PI_V（Nakamura， 2003）.由于前人已经对这些文本数据做了详细的介绍，这里不再赘述.图3a和图3b分别展示了时域数据和频谱数据的样例，图3a中横坐标0表示P波到达时刻.同时，本研究未对输入数据采取数据增强和归一化处理.

2 方法

2.1　多模态中国仪器烈度预测网络

多模态深度学习是一种结合多种数据模态（如图像、文本、音频、视频、传感器数据等）进行联合建模的机器学习方法（Jabeen et al.， 2023）.其核心思想是通过深度学习模型从不同模态的数据中提取互补信息，并融合这些信息以提升模型的整体性能.与传统的单模态方法不同，多模态深度学习能够更全面地理解复杂场景，解决单一数据源信息不足或噪声干扰的问题.为了探索多模态深度学习在中国地区对于地震仪器烈度预测的可行性以及提高我国地震仪器烈度预测的准确性，本文构建了多模态中国仪器烈度预测网络（MCIINet），利用地震动频谱、时域及文本三类异构多模态数据，并设计不同模态数据下对应的编码器结构（时域编码器、频谱编码器、文本编码器），通过全局注意力机制动态融合多模态特征，解决传统模型的特征交互不足问题.图4展示了MCIINet的网络架构.

MCIINet的时域编码器由3个1维卷积层（Conv1D）、3个1维最大池化层（MaxPooling1D）、1个双向门控单元层（BiGRU）和2个Dropout层组成.作为时域编码器输入的是1.3节多模态数据构建中介绍的P波触发后3 s的时域数据，输入形状表示为［3003］的矩阵，300表示P波触发后3 s的时域数据300个采样点（采样率为100），3表示UD、EW和NS三个分量的数据.最终通过时域编码器输出提取的一维时域特征向量.

MCIINet的频谱编码器由2个Conv1D层、2个MaxPooling1D层、2个BiGRU层和2个Dropout层组成.作为频谱编码器输入的是1.3节多模态数据构建中介绍的P波触发后3 s的频谱数据，输入形状表示为［150， 3］的矩阵，150表示P波触发后的3 s的频谱数据150个采样点，这里的3表示地震动记录的三个分量（垂直分量和两个水平分量）.最终通过频谱编码器输出提取的一维频谱特征向量.

MCIINet的文本编码器由2个全连接层（Dense）组成.作为文本编码器输入的是1.3节多模态数据构建中介绍的P波触发后3 s的文本数据，输入形状表示为［121］的一维向量，12表示12个P波物理参数.最终通过文本编码器输出提取的一维文本特征向量.

MCIINet采用Concatenate层对三类模态特征向量进行拼接，实现跨模态特征融合；并在Concatenate层后采用了全局注意力机制，利用全局注意力机制实现动态权重分配，解决不同模态特征的重要性差异，加强对重要性模态特征的关注度，实现多模态特征的自适应融合.全局注意力的具体实现步骤如下：

（1）隐空间变换：通过一个全连接层将输入［B， D］映射到隐空间［B， U］，并使用tanh激活函数，如下：

h = t a n h (X ∙ W 1 + b 1)

，(1)

其中， X ∈ R^B^×^D （B：批次大小，D：特征维度）为输入， W₁∈ R^D^×^U 表示权重矩阵， b₁∈R ^U 表示偏置向量， h ∈ R^B^×^U 为隐表示.

（2）注意力分数计算：再通过一个全连接层将隐表示映射到［B， D］，得到每个特征的注意力分数，如下：

s = h ∙ W 2 + b 2

，(2)

其中， W₂∈ R^U^×^D 表示权重矩阵， b₂∈ R^D 表示偏置向量， s ∈ R^B^×^D 为注意力分数.

（3）归一化权重：对注意力分数采用softmax归一化（沿特征维度D），生成权重向量 α，确保每个样本的特征权重和为1，如下：

α = s o f t m a x (s) ∈ R B × D

.(3)

（4）特征加权：将输入 X 与归一化的权重逐元素相乘，得到加权后的特征.

注意力机制后连接了2个Dense层.第1个Dense层的神经元数为32，激活函数是ReLU；第2个Dense层的神经元数为1，激活函数为Linear，用于输出预测的中国仪器烈度.同时，为了避免对MCIINet的介绍过于冗长，本研究已对MCIINet的代码进行开源，可以在Github上获取（https：//github.com/Jingbaozhu1996/MCIINet），可以通过开源代码了解MCIINet更加详细的结构和参数信息.

2.2　模型训练

本研究基于TensorFlow 2.3框架、python 3.6版本和NVIDIA Quadro T1000 GPU，采用1.1节地震数据基本信息中介绍的训练数据集对MCIINet进行训练和验证.在训练过程中，采用“validation split=0.1”函数随机将10%的训练数据集作为验证数据集；均方误差作为损失函数；使用Adam优化器，初始学习率为0.001；为优化MCIINet的学习率，采用了学习率调度器，用于监测验证集的损失变化进而自动调整学习率，以提升MCIINet训练的效率和性能，当验证集的损失连续5次迭代后未改善时，学习率会乘以0.1并作为当前更新后的学习率，以便MCIINet更好的收敛；为防止MCIINet训练的过拟合，采用了早停策略，若验证集的损失连续10次迭代后未下降，MCIINet将停止训练；MCIINet训练采用的批量大小为128，最大迭代次数为500.MCIINet的整个训练持续了大约1 min 23 s.附录图A1展示了训练过程中，训练集和验证集的损失随迭代次数变化的趋势.当训练迭代到27次时，验证损失在10轮迭代内都没有降低，MCIINet训练自动停止.同时，训练集和验证集的损失曲线是非常接近的，这也说明MCIINet训练没有出现过拟合现象.

3 结果和讨论

3.1　模型测试结果

在P波触发后3 s，图5展示了MCIINet在测试集上的仪器烈度预测结果，烈度残差定义为预测烈度减去实测烈度.如图5a所示，MCIINet预测烈度与实测烈度的散点分布集中在1∶1对角线附近，并且MCIINet对于烈度预测的决定系数R²为0.707，表明预测烈度与实测烈度具有较高的线性相关性.同时，MCIINet对于烈度预测的平均绝对误差（Mean Absolute Error，MAE）和均方根误差（Root Mean Square Error，RMSE）分别是0.584和0.737.根据前人的研究（Otake et al.， 2020； Ahn et al.， 2023；胡进军等， 2023），烈度残差在±1度范围内被认为是成功预测烈度，正如图5a中灰色区域表示成功预测烈度区域，黄色区域表示高估烈度区域，蓝色区域表示低估烈度区域.根据MCIINet预测的仪器烈度，计算得到成功预测烈度的占比为83.32%，高估烈度的占比为8.28%，低估烈度的占比为8.40%.图5b展示了MCIINet预测烈度残差的分布直方图.

同时，在P波触发后3 s，对于相同的测试集，比较了MCIINet与单一模态的基线模型对于仪器烈度预测的性能.这里的基线模型包括传统的用于仪器烈度预测的Pd方法（Wu and Kanamori， 2005）、Zhang et al.（2022）基于卷积神经网络和时域波形数据输入建立的现地烈度预测CONIP模型、胡进军等（2023）基于长短期记忆网络和时域波形数据输入建立的仪器烈度预测LSTM模型、以及李山有等（2024）基于极限梯度提升和多特征参数组成的文本数据输入建立的仪器烈度预测XGBoost模型.前人对基线模型已做了详细的介绍，这里不再赘述.为了确保模型性能比较的公平性，本研究采用与MCIINet相同的训练集和测试集对基线模型进行训练和测试.表1展示了MCIINet和基线模型在测试集上的性能比较.从表1中可以发现：（1）和基线模型相比，MCIINet对于仪器烈度预测有更小的MAE和RMSE以及更高的R²和准确率；（2）相较于最优的基线模型LSTM模型（MAE=0.642，RMSE=0.807，R²=0.648，准确率=80.81%），MCIINet对于仪器烈度预测的MAE和RMSE分别降低了9.03%和8.67%、R²和准确率提升了9.10%和2.51%.这表明，MCIINet通过多模态数据的互补性有效提升了中国仪器烈度预测的稳定性，验证了多模态特征融合对仪器烈度预测精度具有一定的增强作用.

3.2　不同震中距、信噪比和震级范围下的性能分析

本研究进一步分析了MCIINet在不同震中距、信噪比和震级范围下对于烈度预测的性能.在P波触发后3 s，图6a、6b和图6c分别展示了MCIINet在测试集上的预测烈度残差与震中距、信噪比和震级的关系.图6中红色方块表示预测烈度残差的均值、红色误差棒表示预测烈度残差的标准差.从图6中可以发现：MCIINet的预测烈度残差的均值和标准差没有随震中距、信噪比和震级的变化而发生显著的变化，且预测烈度残差的均值主要在0附近；而当震级大于6时，MCIINet的预测烈度存在一定程度的低估现象，推断可能是大震级事件在断层破裂过程中仅使用P波到达后3 s的数据难以反映整个断层破裂规模导致这一低估现象（Murphy and Nielsen， 2009）.

此外，比较了MCIINet和基线模型对不同震中距范围下仪器烈度预测的性能，如表2所示.从表2中可以发现：（1）与基线模型相比，无论当震中距≤100 km还是震中距>100 km时，MCIINet对于仪器烈度预测都有更小的MAE和RMSE；（2）当震中距≤100 km时，相较于最优的基线模型LSTM模型，MCIINet对于仪器烈度预测的MAE和RMSE分别降低了9.25%和9.87%；（3）当震中距>100 km时，相较于最优的基线模型LSTM模型，MCIINet对于仪器烈度预测的MAE和RMSE分别降低了8.41%和4.03%.这也意味着，MCIINet可以从多模态数据中提取更多有效的信息，提高了仪器烈度预测的可靠性，降低了震中距对仪器烈度预测的影响.

表3比较了MCIINet和基线模型对不同信噪比范围下仪器烈度预测的性能.从表3中可以发现：（1）与基线模型相比，无论信噪比≤10还是信噪比>10时，MCIINet对于仪器烈度预测都有更小的MAE和RMSE；（2）当信噪比≤10时，相较于最优的基线模型LSTM模型，MCIINet对于仪器烈度预测的MAE和RMSE分别降低了7.46%和6.30%；（3）当信噪比>10时，相较于最优的基线模型LSTM模型，MCIINet对于仪器烈度预测的MAE和RMSE分别降低了12.72%和14.28%.这意味着，MCIINet可以从多模态数据中提取更多有效的信息，降低了信噪比对仪器烈度预测的影响.

表4比较了MCIINet和基线模型对不同震级范围下仪器烈度预测的性能.从表4中可以发现：（1）与基线模型相比，无论震级≤6还是震级>6时，MCIINet对于仪器烈度预测都有更小的MAE和RMSE；（2）当震级≤6时，相较于最优的基线模型LSTM模型，MCIINet对于仪器烈度预测的MAE和RMSE分别降低了8.47%和8.18%；（3）当震级>6时，相较于最优的基线模型LSTM模型，MCIINet对于仪器烈度预测的MAE和RMSE分别降低了18.82%和14.20%.这意味着，MCIINet可以从多模态数据中提取更多有效的信息，降低了震级对仪器烈度预测的影响.

3.3　消融实验

消融实验是一种通过逐步移除或禁用模型中的某些组成部分，以评估它们对整体性能贡献的实验方法.为了分析MCIINet中不同模态数据和编码器对仪器烈度预测的性能影响，表5展示了对MCIINet进行消融实验，只保留相应组成部分编码器的仪器烈度预测结果.从表5中可以发现：（1）无论移除任一编码器，仪器烈度预测的MAE和RMSE均增加，R²减小，这也意味着各模态数据和编码器都对改进仪器烈度预测起着一定的作用；（2）当只保留单一模态编码器时（时域编码器或频谱编码器或文本编码器），对于保留时域编码器或频谱编码器时的仪器烈度预测的MAE是接近的，且对于保留文本编码器下，仪器烈度预测的RMSE最小、R²最大，这也意味着MCIINet对于文本数据的敏感性更大，并且文本数据对于MCIINet仪器烈度预测的贡献最大；（3）通过和只保留单一模态的编码器相比，当使用两种模态的编码器时，仪器烈度预测的MAE和RMSE均下降，R²上升，这也意味着通过增加不同模态数据，可以提供更多的有效信息，使得不同模态数据实现信息互补，进而提升仪器烈度预测的性能.这也进一步证明了多模态融合的必要性，揭示了文本特征在对于中国仪器烈度预测中的核心作用.

同时，为了进一步分析文本信息中不同文本特征对MCIINet性能的影响和物理约束，对文本信息进行消融实验，即：依次移除不同的文本特征，分析MCIINet对于仪器烈度预测的MAE、RMSE和R².表6展示了文本信息消融实验的结果，从表6中可以发现：当移除文本特征速度平方积分IV2，MCIINet对于仪器烈度预测有更高的MAE和RMSE，以及更低的R²，且分别为0.627、0.773和0.677，这意味着文本信息中速度平方积分IV2最为重要，对于MCIINet仪器烈度预测的贡献最大.

此外，进一步通过消融实验分析了是否包含全局注意力机制对MCIINet性能的影响，如表7所示.从表7中可以发现：通过引入全局注意力机制，一定程度上降低了MCIINet对于仪器烈度预测的MAE和RMSE，以及提升了R²，这也说明通过全局注意力机制动态权重分配对多模态特征融合具有一定的贡献.

3.4　定日6.8级震例分析

2025年1月7日西藏定日发生了6.8级地震，震中在东经87.45°、北纬28.50°，此次地震造成严重的人员伤亡和经济损失（吴佳杰等， 2025；杨婷等， 2025）.本研究进一步分析了MCIINet对于此次定日地震仪器烈度预测的性能和警报性能.图7a展示了此次地震实测仪器烈度的分布，图7b展示了在P波触发后3 s时MCIINet的预测仪器烈度分布.对比图7a和图7b可以发现，预测仪器烈度与实际烈度是较为接近的，且对于震中附近6度以上存在一定程度低估现象，推断这可能是大震级事件在断层破裂过程中仅使用P波到达后3 s的数据难以反映整个断层破裂规模导致（Murphy and Nielsen， 2009）.此外，地震预警系统通常通过判断预测烈度是否超过预先设置的阈值来评估台站附近是否存在潜在地震破坏，进而判断是否向公众或重大工程发布警报（Hoshiba et al.， 2008； Zollo et al.， 2010）.本研究中，根据中国地震烈度表在烈度6度以上以房屋震害为主要评定依据，将实测烈度6度作为预先设置的阈值.同时，根据前人的研究，预测烈度残差在±1度范围内是可接受的，因此，在统计意义上定义了警报，如表8所示.图7c展示了实测烈度大于6度和实测烈度小于6度的台站分布，从图7c中可以清楚看到只有3个台站的实测烈度是大于6度的.在P波到达后3 s，图7d展示了基于MCIINet的预测烈度，每个台站的警报性能.从图7d中可以发现：只有一个台站XZ.D0001出现漏报，且没有台站出现误报现象.表9进一步展示了台站XZ.D0001的信息，该台站的震中距接近100 km且信噪比仅有1.47，推断低信噪比可能也是导致该台站漏报的原因之一.同时，随着P波到达后时间窗的增加，在P波到达后5 s，该台站成功报警.

4 结论

针对中国地震仪器烈度预测精度不足与多源数据融合不充分的问题，本研究提出了一种基于多模态深度学习的中国仪器烈度预测网络（MCIINet），并探索MCIINet在中国地区对于地震仪器烈度预测的可行性.通过融合地震波时域数据、频谱数据及文本参数数据三类异构模态，结合注意力机制动态优化特征权重，MCIINet实现了对中国仪器烈度预测.使用中国地震台网从2007年至2020年记录的地震事件对MCIINet进行训练和测试.同时，还将训练好的MCIINet对2025年1月7日西藏定日发生的6.8级地震进行烈度预测性能分析.通过分析MCIINet的仪器烈度预测结果，本文得到以下结论：

（1）本文提出的多模态中国仪器烈度预测MCIINet网络有效地缓解了传统烈度预测方法和单一模态基线模型中存在的信息单一、多源数据融合不充分的问题.MCIINet可以同时处理地震动时域数据、频谱数据和文本数据，并从不同模态数据中提取特征进行信息融合，进而预测仪器烈度.

（2）在P波触发后3 s，MCIINet对于烈度预测的MAE、RMSE、R²和预测烈度准确率分别是0.584、0.737、0.707和83.32%，且显著优于基线模型.同时，和基线模型相比，MCIINet的仪器烈度预测残差受震中距、信噪比和震级的影响更小，且对于仪器烈度预测有更好的鲁棒性.

（3）通过消融实验表明，多模态降低了仪器烈度预测MAE和RMSE、提升了R²，进一步验证了多模态信息的互补性.

（4）在2025年1月7日西藏定日发生的6.8级地震中，在P波触发后3 s，MCIINet基于仪器烈度预测没有发生误报，只有一个台站发生漏报.

本研究的主要目的是构建多模态中国仪器烈度预测网络（MCIINet），探索在中国地区对于地震仪器烈度预测的可行性，提升地震预警中仪器烈度预测的准确性和鲁棒性.为了确保模型性能比较的公平性，本研究采用与MCIINet相同的训练集和测试集对基线模型进行训练和测试.通过和基线模型相比，进一步表明MCIINet在一定程度上提升了仪器烈度预测精度，验证了多模态深度学习对于我国地震仪器烈度预测的可行性.同时，对于不同的震中距、信噪比和震级范围，在相同的测试集上，MCIINet对于仪器烈度预测表现出更优的性能.此外，对于深度学习任务来说，进一步优化模型性能，使深度学习模型逼近完美也是算法工程师们一直追求的目标.不断优化MCIINet模型，增加MCIINet模型的性能，提升MCIINet对于仪器烈度预测的准确性对于地震预警和防震减灾也是非常重要的.在未来的研究中，也会考虑通过不同的数据集切分方法、模型超参数优化、数据增强等技术进一步优化MCIINet的性能，使MCIINet对于仪器烈度预测的准确率可以得到进一步的提升.

本研究验证了多模态深度学习在地震预警中国地震仪器烈度预测中的可行性，推动了人工智能与地震科学的交叉融合，为提升我国地震预警系统的时效性与准确性奠定了理论基础.在未来的研究中，还需要进一步的优化MCIINet的时域编码器、频谱编码器和文本编码器的架构，这对于进一步改进MCIINet的性能也是非常重要的.同时，在未来，还需要持续纳入新发地震事件，尤其是超大地震（M>7）记录，以提升和优化模型对极端事件和小样本事件的适应性（Li， 2022）.基于本研究的数据和结果，可以推断MCIINet可以有效地提高地震预警地震仪器烈度预测的可靠性，也为我国地震预警系统仪器烈度预测模块优化升级提供理论支撑与技术保障.

随着现在多元数据（例如路由器、手机振动传感器、监控摄像头、分布式光纤等）的融入，可以为地震监测预警提供海量的辅助地震观测数据，而人工智能大模型和大数据等新兴技术的发展有望充分且有效地利用和处理海量的多元数据，发展泛在振动传感智能化地震烈度预测技术，可为我国地震预警和防震减灾提供新的方向和手段.

附录见https：//doi.org/10.3799/dqkx. 2025.078.

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	Ahn, J. K., Park, E., Kim, B., et al., 2023. Stable Operation Process of Earthquake Early Warning System Based on Machine Learning: Trial Test and Management Perspective. Frontiers in Earth Science, 11: 1157742. https://doi.org/10.3389/feart.2023.1157742

[2]	Allen, R. M., Melgar, D., 2019. Earthquake Early Warning: Advances, Scientific Challenges, and Societal Needs.Annual Review of Earth and Planetary Sciences, 47: 361-388. https://doi.org/10.1146/annurev⁃earth⁃053018⁃060457

[3]	Arias, A., 1970. A Measure of Earthquake Intensity. In: Hansen, R.J., ed., Seismic Design for Nuclear Power Plants. MIT Press, Cambridge, 438-483.

[4]	Brondi, P., Picozzi, M., Emolo, A., et al., 2015. Predicting the Macroseismic Intensity from Early Radiated P Wave Energy for On⁃Site Earthquake Early Warning in Italy. Journal of Geophysical Research: Solid Earth, 120(10): 7174-7189. https://doi.org/10.1002/2015jb012367

[5]	Behrad, F., Abadeh, M.S., 2022. An Overview of Deep Learning Methods for Multimodal Medical Data Mining. Expert Systems with Applications, 200: 117006. https://doi.org/10.1016/j.eswa.2022.117006

[6]	Caruso, A., Colombelli, S., Elia, L., et al., 2017. An On⁃Site Alert Level Early Warning System for Italy. Journal of Geophysical Research: Solid Earth, 122(3): 2106-2118. https://doi.org/10.1002/2016JB013403

[7]	Chen, K., Han, T., Gong, J., et al., 2023b. Fengwu: Pushing the Skillful Global Medium⁃Range Weather Forecast beyond 10 Days Lead. arXiv: 2304.02948. https://doi.org/10.48550/arXiv.2304.02948

[8]	Chen, W. K., Rao, G., Kang, D. J., et al., 2023a. Early Report of the Source Characteristics, Ground Motions, and Casualty Estimates of the 2023 Mw 7.8 and 7.5 Turkey Earthquakes. Journal of Earth Science, 34(2): 297-303. https://doi.org/10.1007/s12583⁃023⁃1316⁃6

[9]

Chen, W. K., Wang, D., Si, H. J., et al., 2022. Rapid Estimation of Seismic Intensities Using a New Algorithm That Incorporates Array Technologies and Ground⁃ Motion Prediction Equations (GMPEs). Bulletin of the Seismological Society of America, 112(3): 1647-1661. https://doi.org/10.1785/0120210207

[10]	Erdik, M., Fahjan, Y., Ozel, O., et al., 2003. Istanbul Earthquake Rapid Response and the Early Warning System. Bulletin of Earthquake Engineering, 1(1): 157-163. https://doi.org/10.1023/A:1024813612271

[11]	Festa, G., Zollo, A., Lancieri, M., 2008. Earthquake Magnitude Estimation from Early Radiated Energy. Geophysical Research Letters, 35(22): 2008GL035576. https://doi.org/10.1029/2008GL035576

[12]	Guzhov, A., Raue, F., Hees, J., et al., 2022. Audioclip: Extending Clip to Image, Text and Audio. In: ICASSP 2022-2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, Singapore, 976-980. https://doi.org/10.1109/icassp43922.2022.9747631

[13]	Hsu, T. Y., Huang, S. K., Chang, Y. W., et al., 2013. Rapid On⁃Site Peak Ground Acceleration Estimation Based on Support Vector Regression and P⁃Wave Features in Taiwan. Soil Dynamics and Earthquake Engineering, 49: 210-217. https://doi.org/10.1016/j.soildyn.2013.03.001

[14]	Hoshiba, M., Kamigaichi, O., Saito, M., et al., 2008. Earthquake Early Warning Starts Nationwide in Japan. Eos, Transactions American Geophysical Union, 89(8): 73-74. https://doi.org/10.1029/2008EO080001

[15]	Hu, J. J., Ding, Y. T., Zhang, H., et al., 2023. A Real⁃Time Seismic Intensity Prediction Model Based on Long Short⁃Term Memory Neural Network. Earth Science, 48(5): 1853-1864 (in Chinese with English abstract).

[16]	Jabeen, S., Li, X., Amin, M. S., et al., 2023. A Review on Methods and Applications in Multimodal Deep Learning. ACM Transactions on Multimedia Computing, Communications,and Applications, 19(2s): 1-41. https://doi.org/10.1145/3545572

[17]	Jiang, C., Lyu, Z. Y., Fang, L. H., 2024. Earthquake Detection Model Trained on Velocity and Acceleration Records and Its Application in Xinfengjiang Reservoir. Earth Science, 49(2): 469-479 (in Chinese with English abstract).

[18]	Jiang, M.Y., Chen, D.Y., Chin, T. L., 2025. Ground⁃ Shaking Intensity Prediction for Onsite Earthquake Early Warning Using Deep Learning. Seismological Research Letters, 96(1): 526-537. https://doi.org/10.1785/0220230263

[19]	Jin, X., Zhang, H. C., Li, J., et al., 2013. Preliminary Study on Instrumental Seismic Intensity Standard. Progress in Geophysics, 28(5): 2336-2351 (in Chinese with English abstract).

[20]	Jozinović, D., Lomax, A., Štajduhar, I., et al., 2020. Rapid Prediction of Earthquake Ground Shaking Intensity Using Raw Waveform Data and a Convolutional Neural Network. Geophysical Journal International, 222(2): 1379-1389. https://doi.org/10.1093/gji/ggaa233

[21]	Kubo, H., Kunugi, T., Suzuki, W., et al., 2020. Hybrid Predictor for Ground⁃Motion Intensity with Machine Learning and Conventional Ground Motion Prediction Equation. Scientific Reports, 10: 11871. https://doi.org/10.1038/s41598⁃020⁃68630⁃x

[22]	Li, S. L., 2014. Preliminary Study of Seismic Instruments Intensity Calculation Method (Dissertation). Institute of Engineering Mechanics, China Earthquake Administration, Harbin (in Chinese with English abstract).

[23]	Li, S. L., Chen, Y. L., Yu, W. H., et al., 2023. Prediction Models for Instrumental Seismic Intensity Based on Artificial Neural Network. China Earthquake Engineering Journal, 45(1): 181-190 (in Chinese with English abstract).

[24]	Li, S. Y., Wang, B. R., Lu, J. Q., et al., 2024a. Prediction of Instrumental Intensity for a Single Station Using a LSTM Neural Network. Chinese Journal of Geophysics, 67(2): 587-599 (in Chinese with English abstract).

[25]	Li, S. Y., Chen, X., Lu, J. Q., et al., 2024b. Real⁃Time Discrimination Model for Local Earthquake Intensity Threshold Based on XGBoost. Earth Science, 49(2): 379-390 (in Chinese with English abstract).

[26]	Li, S. Y., Jin, X., Ma, Q., et al., 2004. Study on Earthquake Early Warning System and Intellegent Emergency Controling System. World Information on Earthquake Engineering, 20(4): 21-26 (in Chinese with English abstract).

[27]	Li, Z. F., 2022. A Generic Model of Global Earthquake Rupture Characteristics Revealed by Machine Learning. Geophysical Research Letters, 49(8): e2021GL096464. https://doi.org/10.1029/2021GL096464

[28]	Lyu, S., Fang, L. H., Ren, H. Y., et al., 2024. Overview of the Earthquake Monitoring Status in the United States. China Earthquake Engineering Journal, 46(2): 431-448 (in Chinese with English abstract).

[29]	Ma, Q., 2008. Study and Application on Earthquake Early Warning (Dissertation). Institute of Engineering Mechanics, China Earthquake Administration, Harbin (in Chinese with English abstract).

[30]	Ma, Q., Jin, X., Li, S. Y., et al., 2013. Automatic P⁃Arrival Detection for Earthquake Early Warning. Chinese Journal of Geophysics, 56(7): 2313-2321 (in Chinese with English abstract).

[31]	Ma, Q., Li, S. L., Li, S. Y., et al., 2014. On the Correlation of Ground Motion Parameters with Seismic Intensity. Earthquake Engineering and Engineering Dynamics, 34(4): 83-92 (in Chinese with English abstract).

[32]	McGuire, J. J., Ulberg, C. W., Lux, A. I., et al., 2025. ShakeAlert® Version 3: Expected Performance in Large Earthquakes. Bulletin of the Seismological Society of America, 115(2): 533-561. https://doi.org/10.1785/0120240189

[33]	Murphy, S., Nielsen, S., 2009. Estimating Earthquake Magnitude with Early Arrivals: A Test Using Dynamic and Kinematic Models. Bulletin of the Seismological Society of America, 99(1): 1-23. https://doi.org/10.1785/0120070246

[34]	Mousavi, S. M., Stogaitis, M., Gadh, T., et al., 2025. Gemini and Physical World: Large Language Models can Estimate the Intensity of Earthquake Shaking from Multimodal Social Media Posts. Geophysical Journal International, 240(2): 1281-1294. https://doi.org/10.1093/gji/ggae436

[35]	Mousavi, S. M., Beroza, G. C., 2023. Machine Learning in Earthquake Seismology. Annual Review of Earth and Planetary Sciences, 51: 105-129. https://doi.org/10.1146/annurev⁃earth⁃071822⁃100323

[36]	Nakamura, Y., 2003. A New Concept for the Earthquake Vulnerability Estimation and Its Application to the Early Warning System. In: Zschau, J., Küppers, A.N., eds., Early Warning Systems for Natural Disaster Reduction. Springer, Berlin, 693-699. https://doi.org/10.1007/978⁃3⁃642⁃55903⁃7_92

[37]	Otake, R., Kurima, J., Goto, H., et al., 2020. Deep Learning Model for Spatial Interpolation of Real⁃Time Seismic Intensity. Seismological Research Letters, 91(6): 3433-3443. https://doi.org/10.1785/0220200006

[38]	Peng, C. Y., Yang, J. S., Zheng, Y., et al., 2017. New τc Regression Relationship Derived from all P Wave Time Windows for Rapid Magnitude Estimation. Geophysical Research Letters, 44(4): 1724-1731. https://doi.org/10.1002/2016GL071672

[39]	Peng, C. Y., Ma, Q., Jiang, P., et al., 2020. Performance of a Hybrid Demonstration Earthquake Early Warning System in the Sichuan⁃Yunnan Border Region. Seismological Research Letters, 91(2A): 835-846. https://doi.org/10.1785/0220190101

[40]	Rastgoo, M. N., Nakisa, B., Maire, F., et al., 2019. Automatic Driver Stress Level Classification Using Multimodal Deep Learning. Expert Systems with Applications, 138: 112793. https://doi.org/10.1016/j.eswa.2019.07.010

[41]	Reed, J. W., Kassawara, R. P., 1990. A Criterion for Determining Exceedance of the Operating Basis Earthquake. Nuclear Engineering and Design, 123(2-3): 387-396. https://doi.org/10.1016/0029⁃5493(90)90259⁃Z

[42]	Song, J. D., Zhu, J. B., Li, S. Y., 2023. MEANet: Magnitude Estimation via Physics⁃Based Features Time Series, an Attention Mechanism, and Neural Networks.Geophysics, 88(1): V33-V43. https://doi.org/10.1190/geo2022⁃0196.1

[43]	Song, J. D., 2013. Research on Seismic Ground Motion Indices for Operation Control and Single Station Earthquake Early Warning Applied for High⁃Speed Railway (Dissertation). Institute of Engineering Mechanics, China Earthquake Administration, Harbin (in Chinese with English abstract).

[44]	Song, J. D., Yu, C., Li, S. Y., 2021. Continuous Prediction of Onsite PGV for Earthquake Early Warning Based on Least Squares Support Vector Machine. Chinese Journal of Geophysics, 64(2): 555-568 (in Chinese with English abstract).

[45]	Stahlschmidt, S. R., Ulfenborg, B., Synnergren, J., 2022. Multimodal Deep Learning for Biomedical Data Fusion: A Review. Briefings in Bioinformatics, 23(2): bbab569. https://doi.org/10.1093/bib/bbab569

[46]	Wald, D. J., Quitoriano, V., Heaton, T. H., et al.,1999a. Relationships between Peak Ground Acceleration, Peak Ground Velocity, and Modified Mercalli Intensity in California.Earthquake Spectra,15(3): 557-564.https://doi.org/10.1193/1.1586058

[47]	Wald, D. J., Quitoriano, V., Heaton, T. H., et al., 1999b. TriNet “ShakeMaps”: Rapid Generation of Peak Ground Motion and Intensity Maps for Earthquakes in Southern California. Earthquake Spectra, 15(3): 537-555. https://doi.org/10.1193/1.1586057

[48]	Wald, D. J., Worden, C. B., Thompson, E. M., et al., 2022. ShakeMap Operations, Policies, and Procedures. Earthquake Spectra, 38(1): 756-777. https://doi.org/10.1177/87552930211030298

[49]	Wang, D., Sun, K., 2022. How the Big Data Seismology and AI Refine Rapid Determination of Source Parameters of Large Earthquakes？. Earth Science, 47(10): 3915-3917 (in Chinese with English abstract).

[50]	Wang, Z. J., Zhao, B. M., 2018. Method of Accurate⁃Fast Magnitude Estimation for Earthquake Early Warning—Trial and Application for the 2008 Wenchuan Earthquake. Soil Dynamics and Earthquake Engineering, 109: 227-234. https://doi.org/10.1016/j.soildyn.2018.03.006

[51]	Wu, J. J., Chen, W. K., Jia, Y. J., et al., 2025. Rapid Seismic Intensity and Disaster Assessment Based on Dense Seismic Array: A Case of the 2025 Rikaze M_S6.8 Earthquake in Xizang. Earth Science, 50(5): 1770-1781 (in Chinese with English abstract).

[52]	Wu, Y. M., Kanamori, H., 2005. Rapid Assessment of Damage Potential of Earthquakes in Taiwan from the Beginning of P Waves.Bulletin of the Seismological Society of America, 95(3): 1181-1185.https://doi.org/10.1785/0120040193

[53]	Wu, Y. M., Mittal, H., Chen, D. Y., et al., 2021. Earthquake Early Warning Systems in Taiwan: Current Status. Journal of the Geological Society of India, 97: 1525-1532.https://doi.org/10.1007/s12594⁃021⁃1909⁃6

[54]	Yang, T., Wang, S. G., Fang, L. H., et al., 2025. Analysis of Earthquake Sequence and Seismogenic Structure of the 2025 M_S6.8 Dingri Earthquake in Tibetan Plateau. Earth Science, 50(5): 1721-1732 (in Chinese with English abstract).

[55]	Yu, Z. Y., Chu, R. S., Sheng, M. H., 2018. Pick Onset Time of P and S Phase by Deep Neural Network. Chinese Journal of Geophysics, 61(12): 4873-4886 (in Chinese with English abstract).

[56]	Zhang, H. C., Melgar, D., Sahakian, V., et al., 2022. Learning Source, Path and Site Effects: CNN⁃Based On⁃Site Intensity Prediction for Earthquake Early Warning. Geophysical Journal International, 231(3): 2186-2204. https://doi.org/10.1093/gji/ggac325

[57]	Zhang, H. C., 2013. Study of Key Technologies in Earthquake Early Warning System (Dissertation). Institute of Engineering Mechanics, China Earthquake Administration, Harbin (in Chinese with English abstract).

[58]	Zhao, M., Tang, L., Chen, S., et al., 2021. Machine Learning Based Automatic Foreshock Catalog Building for the 2019 M_S6.0 Changning, Sichuan Earthquake. Chinese Journal of Geophysics, 64(1): 54-66 (in Chinese with English abstract).

[59]	Zheng, Z., Lin, B. H., Jin, X., et al., 2024. Predicting Instrumental Seismic Intensity Using Deep Learning and Physical Features. Chinese Journal of Geophysics, 67(7): 2712-2728 (in Chinese with English abstract).

[60]	Zhu, J. B., Li, S. Y., Song, J. D., 2022. Magnitude Estimation for Earthquake Early Warning with Multiple Parameter Inputs and a Support Vector Machine. Seismological Research Letters, 93(1): 126-136. https://doi.org/10.1785/0220210144

[61]	Zhu, J. B., Li, S. Y., Wei, Y. X., et al., 2023. On⁃Site Instrumental Seismic Intensity Prediction for China via Recurrent Neural Network and Transfer Learning. Journal of Asian Earth Sciences, 248: 105610. https://doi.org/10.1016/j.jseaes.2023.105610

[62]	Zollo, A., Amoroso, O., Lancieri, M., et al., 2010. A Threshold⁃Based Earthquake Early Warning Using Dense Accelerometer Networks. Geophysical Journal International, 183(2): 963-974. https://doi.org/10.1111/j.1365⁃246X.2010.04765.x