在军事场景中,调制识别为抗干扰通信信号截获提供支撑,战场复杂电磁环境下相似信号混淆与低信噪比(Signal-to-Noise Ratio, SNR)干扰直接影响电磁控制权;民用领域中,其支撑频谱管理与非法信号监测
[1 ] 。复杂环境下强噪声、多信号混叠及海量数据处理压力,使传统方法面临瓶颈,需技术革新突破。早期调制识别采用传统机器学习方法,依赖专家经验提取手工特征(如信号瞬时幅度、相位),典型代表为支持向量机(Support Vector Machine, SVM)、决策树算法
[2 -3 ] 。但手工特征的噪声鲁棒性差,低SNR下性能急剧下降。深度学习通过端到端学习突破传统局限,CNN为调制识别基础架构,ResNet-CNN-BiLSTM模型因残差块解决梯度消失,BiLSTM捕捉双向时序信息获认可
[4 ] 。美国无线电实验室在RML2016.10a数据集上用其实现11类信号高效分类
[5 ] 。该模型虽识别能力强,但存在计算复杂、训练收敛慢的问题,难以满足实时需求。本文开展模型优化研究,突破现有模型效率瓶颈,实现高精度与实时性平衡,为算力受限、复杂环境下的信号处理提供有力支撑。
1 信号模型与预处理
1.1 信号模型及其特性
实际无线通信场景中,信号传输会受信道噪声干扰,其通用数学表达式可表示为加性高斯白噪声(Additive White Gaussian Noise, AWGN)信道下的叠加模型:
式中:r t 为接收端观测信号;s t 为无噪声调制信号;n t 为AWGN噪声。无噪声调制信号s t 由载波与基带调制信息共同决定,基础载波形式为
式中:
A c 为载波幅度;
f c 为载波中心频率;
φ c 为初始相位;
t ∈ 0 , T s (
T s 为符号周期)。AWGN噪声满足均值为0的高斯分布,接收端信号模型为“无噪声调制信号+AWGN噪声”,可覆盖主流通信场景
[6 ] 。不同调制技术通过改变载波幅度、频率或相位传递信息,核心差异体现在的参数变化规律上。
参照雷达信号调制分类框架,调制方式可分为频率调制(含FSK等)、相位调制(含BPSK/QPSK等)及联合调制等3类,本文研究的Bose-Chaudhuri-Hocquenghem Code(BCH)、Tactical Data Link(LIN)、Multi-Level Transmit-3(MLT)、Packet Radio and AMTOR(PAC)和Standardization Agreement(STA)等5种信号分属这些类,其中调制类型相似的信号在低SNR下易出现特征混淆,关键时频特征差异为:BCH呈双亮柱,LIN呈三阶段亮带,PAC呈16亮条或双亮带,STA呈中心暗纹亮带,为模型分类提供依据。
5种信号的具体调制方式及波特率/传信率参数如下:BCH(USB+2FSK,200 Baud)、LIN(8PSK,2 400 bps)、MLT(8FSK,125 Baud)、PAC(2FSK,100/200 Baud)、STA(OFDM+PSK,2 400 bps)。其中:2FSK、8FSK等二进制调制信号波特率与传信率数值相等,故仅标注波特率;8PSK、OFDM+PSK等多进制调制信号传信率=波特率×比特数,仅标注传信率以反映实际数据传输效率。
1.2 信号预处理与时频图转换
信号经归一化([0,1]区间)、FIR低通滤波与汉宁窗分帧(重叠率50%)预处理,减少幅度干扰与频谱泄漏
[7 -8 ] 。
预处理后的信号通过短时傅里叶变换(STFT)转换为时频图,STFT计算公式为
X n , ω = ∑ m = - ∞ ∞ x m w m - n e - j ω m (3)
式中:x ( m ) 为分帧后信号;w ( m - n ) 为汉宁窗函数;m 为角频率;n 为帧索引。最终将时频图转换为灰度图像格式,作为神经网络的输入数据。
2 混合模型设计
2.1 传统CNN网络结构设计
传统CNN验证准确率达97.33%、参数量1.3×106 ,稳定性较好,但迭代前期收敛慢、复杂时频特征提取不全面,为后续改进明确方向。
2.2 传统ResNet网络结构
ResNet通过残差连接解决深层网络梯度消失问题,其基础残差块结构为
式中:x 为残差块的输入特征向量;Γ x , W i 为残差函数(由卷积层、批归一化层、ReLU激活函数构成);W i 为卷积层权重参数;y 为残差块输出。当输入与输出特征维度不匹配时,需通过1×1卷积调整维度,此时公式扩展为
式中:
W s 为度匹配的1×1卷积权重。ResNet通过多层残差块堆叠,可自动提取信号深层频域与空域特征(如2ASK幅度跳变、16QAM星座图分布),参数量效率优于传统CNN
[9 ] 。
2.3 ResNet- CNN- BiLSTM网络结构
传统CNN存在深层梯度衰减、空间特征提取局限的问题,本文设计ResNet-CNN-BiLSTM混合模型,通过提取时频图深浅层特征,建立空间—时序特征与调制类型的映射关系,生成特征权重,实现多类信号调制识别。
ResNet-CNN-BiLSTM算法包含时频域处理与模型识别两部分:时频域处理流程为“信号预处理(归一化+滤波+分帧)→STFT时频变换→时频图”;模型主体由4个卷积层、1个池化层、1个BiLSTM层及全连接层构成,且卷积层间通过残差连接防止特征退化
[10 ] ,如
图1 所示。
3 网络结构优化实现
实验中ResNet-CNN-BiLSTM混合模型存在计算冗余(参数量大、推理延迟高)、实时性不足(批量样本处理时GPU内存占用率高)及稳定性欠缺(低信噪比下易过拟合)3大核心问题。据此设定优化目标:参数量降至1.5×106 以下、训练时间缩短至48 min以内,推理速度提升至每样本8 ms以下、验证准确率达98%以上,训练损失波动控制在±1.2%以内。优化策略围绕“参数精简、流程简化、泛化能力增强”展开,具体聚焦3大模块:卷积与池化层参数适配调制信号时频特征、BiLSTM层结构简化以降低递归计算延迟、引入正则化与自适应训练策略提升噪声鲁棒性。
3.1 卷积与池化层参数优化
不同调制类型信号的时频图存在显著特征尺度差异, 而调制类型相似的信号(如BCH与LIN)仅在局部细节特征上存在差异(BCH无同步段单音,LIN同步段单音对应时频图的“短亮带前缀”),传统固定参数易导致浅层关键特征丢失或深层计算冗余
[11 ] 。
前两层采用3×3小核提取浅层细节特征,后两层采用5×5大核挖掘深层全局特征,适配不同尺度的信号时频特征差异。
引入深度可分离卷积替代传统卷积,将空间卷积与通道卷积解耦,参数量计算公式为
P s e p = K H × K W × C i n + 1 × 1 × C i n × C o u t (6)
式中:K H 、K W 为卷积核高宽;C i n 、C o u t 为输入/输出通道数。对比传统卷积P s e p = K H × K W × C i n × C o u t ,参数量可减少89%(以3×3核为例),适配实时处理需求。
针对调制信号时序连续性,采用自适应时序池化替代固定最大池化,池化核大小S 随输入时频图的符号周期T s 动态调整,有:
式中:
f s 为时频图采样率;
F s i z e 为时频图宽度。例如2ASK信号
T s = 10 μ s 、
f s = 1 M H z 、
F s i z e = 128 时,
S = 2 ,可避免固定池化导致的时序特征断裂,保障信号时序关联的完整性。卷积与池化层优化后的核心参数如
表1 所示。
3.2 BiLSTM 层结构简化
原BiLSTM层因递归计算导致推理延迟约15 ms,结合调制信号的时序依赖特性(如2FSK的频率切换仅依赖前1~2个符号周期,无长程时序关联),从“输入采样+门控简化”双维度优化。
1)输入序列降采样。对卷积层输出的特征序列X = x 1 , x 2 , ⋯ , x N (N 为序列长度)进行间隔采样,采样步长k 根据调制信号符号周期T s 与特征序列长度适配:
X ' = x 1 , x 1 + k , x 1 + 2 k , ⋯ , x 1 + m k (8)
式中:k = N T s × f f e a t ,f f e a t 为特征序列采样频率。以16QAM信号(T s = 8 μ s )、N = 256 为例,k = 4 ,序列长度从256降至64,计算量减少75个百分点。
2) 门控机制简化合并。LSTM的遗忘门f t 与输入门i t 简化合并为“更新门”u t (f t 用于决定从细胞状态中丢弃哪些信息;i t 用于决定向细胞状态中添加哪些新的信息;u t 为合并遗忘门与输入门后的“更新门”,整合了遗忘与输入的功能),简化细胞状态更新公式,有:
式中:σ (·)为Sigmoid激活函数;W u 为更新门的权重矩阵,用于对输入h t - 1 , x t ' 进行线性变换;h t - 1 为上一时刻的隐藏状态;x t ' 为当前时刻的输入;b u 更新门的偏置项。
细胞状态公式为
C t = u t ⊙ t a n h W c h t - 1 , x t ' + b c + 1 - u t ⊙ C t - 1 (10)
式中:C t 为当前时刻的细胞状态,用于存储长期信息;W c 为细胞状态更新时的权重矩阵,对h t - 1 , x t ' 进行线性变换;b c 为细胞状态更新时的偏置项;⊙ 为按元素相乘,用于逐元素地结合不同部分的信息;C t - 1 为上一时刻的细胞状态。
输出门保持不变,公式为
Q t = σ W o h t - 1 , x t ' + b o (11)
h t ' = o t ⊙ t a n h C t (12)
式中:o t 为输出门,用于决定从细胞状态中输出哪些信息到隐藏状态;W o 为输出门的权重矩阵,对h t - 1 , x t ' 进行线性变换;b o 为输出门的偏置项;h t ' 为当前时刻的隐藏状态。
简化后,BiLSTM每个细胞的参数量从4 × d h 2 + d h d x 降至3 × d h 2 + d h d x 其中:d h 为隐藏单元数,d x 为输入维度,且消除f t 与i t 的冗余计算。
与GRU相比,本方案同样合并遗忘门与输入门以减参,但未引入重置门,且保留细胞状态与输出门——细胞状态可精准存储时序特征,输出门控制特征输出权重,适配调制识别对时序特征的复杂依赖
[12 ] 。简化后BiLSTM推理延迟从15 ms降至6 ms,SNR≥2 dB时准确率与原模型差距≤1.5%,适配实时信号处理需求。
3.3 正则化与训练策略优化
调制信号在低SNR环境下特征波动大(如AWGN噪声导致时频图模糊),模型易过拟合
[13 ] 。优化方向聚焦“噪声鲁棒性+快速收敛”,结合信号统计特性设计策略。
1)分层正则化设计。卷积层:引入“噪声感知Dropout”,Dropout概率
p 随输入信号的信噪比SNR动态调整为
式(13) 。传统Dropout算法的核心原理由Srivastava等
[14 ] 提出,其通过随机失活神经元抑制过拟合的思路,为本文“噪声感知Dropout”的设计提供基础,本文在此基础上结合信号SNR动态调整概率,进一步适配调制信号的噪声特性:
p = m a x ( p m i n , p 0 × e x p - α ⋅ R S N _ L (13)
式中:基础概率p 0 = 0.5 ;衰减系数α = 0.1 ;R S N _ L 为信噪比SNR。低SNR时,p = 0.38 ,保留更多特征用于学习;高SNR时,p = 0.2 ,抑制过拟合。式(13) 中R S N _ L 需由输入信号dB值通过R S N _ L = 10 R S N _ d B / 10 转换为线性值,避免对数形式直接代入导致计算偏差;衰减系数α = 0.1 与基础概率p 0 = 0.5 均基于本文实验数据集(3 000条信号样本,SNR范围)拟合确定,若调整数据集或SNR范围(-6~10 dB),可通过控制变量法重新校准α 值(建议调整范围为0.01~0.03),确保p 始终处于合理区间。
全连接层:添加L2正则化,损失函数修正为
式中:Ξ C E 为交叉熵损失;λ = 10 - 4 为正则化系数;W i 为全连接层中的第i 个权重参数;. 2 2 为L2范数的平方。
2)自适应训练策略。动态学习率:采用信噪比感知学习率,更新公式为
η t = η 0 × 0 . 95 1 T × 1 + β ⋅ R S N _ a v g (15)
式中:η t 为第t 次迭代时的动态学习率;η 0 为初始学习率;t 为迭代次数;T = 50 为衰减周期;· 为向下取整操作;β = 0.02 为SNR权重;R S N _ a v g 为当前批次数据的平均SNR。
SNR感知动态学习率可适配不同场景:低SNR批次降低学习率防震荡,高SNR批次提高学习率加速收敛,较固定学习率(初始0.000 6)收敛速度提升33%,最终精度提升2.6%,损失波动控制在±1.2%。
4 置信度计算改进
4.1 核心特征与权重确定
通过特征重要性分析,确定时频图的3大关键特征:边缘纹理特征(权重ω 1 = 0.4 )、能量分布特征(权重ω 2 = 0.3 )、时序演变特征(权重ω 3 = 0.3 ),3大特征权重之和等于1,特征重要性基于测试集准确率下降幅度评估。
4.2 多维度置信度计算逻辑
改进后的置信度计算分为特征差异度计算、特征响应强度计算、综合置信度生成、阈值自适应调整4步,具体如下。
1)特征差异度计算。设待识别信号的3大特征权重为ω 1 p 、 ω 2 p 、 ω 3 p ,标准信号的3大特征权重为ω 1 k 、 ω 2 k 、 ω 3 k (k 为信号类别),则差异度d k , t 为
d k , t = 0 , s k , t ≥ 0.9 ; ω t k - ω t p , s k , t < 0.9 . (16)
式中:t = 1 、 2 、 3 对应3大特征;ω t 为待识别信号第t 类特征的权重;ω t k 为第k 类标准信号第t 类特征的权重;s k , t = m i n ω t k , ω t p m a x ω t k , ω t p 为权重相似值;0.9为设置的权重相似值门限。当相似值≥0.9时,认为特征差异可忽略,差异度设为0,有效降低参数波动对置信度的干扰。
最终置信度计算为
式中:C k 为待识别信号属于第k 类的置信度;ω t 为3大特征的权重(0.4,0.3,0.3);∑ t = 1 3 ω t ⋅ d k , t 为加权差异度总和。置信度取值范围为[0,1],越接近1表示识别结果越可靠。
2)特征响应强度计算。特征响应强度反映卷积层输出中与类别匹配的特征激活水平,计算卷积层输出特征图的类别匹配激活值均值为
式中:M 为卷积层输出特征图数量;a i , c 为第i 个特征图对类别c 的激活值。经归一化R S N _ n o r m = R - R S N _ m i n R S N _ m a x - R S N _ m i n 后用于后续计算,确保数值范围统一。
3)综合置信度生成。定义综合置信度C o n f c 为“分类概率+SNR权重+特征响应强度”的加权融合,有:
C o n f c = ω 1 ⋅ R c + ω 2 ⋅ R S N _ n o r m + ω 3 ⋅ R c (19)
式中,C o n f c 取值范围为[0,1],越接近1表示识别结果越可靠。分类概率越高、特征差异越小、特征响应越强、SNR适配性越好,置信度越高。
4)置信度阈值自适应调整。根据实时SNR动态设定置信度判决阈值T h 为
式中:
T h 0 = 0.7 为基础阈值;
δ = 0.02 为SNR修正系数。从
图2 可见,SNR从
- 6 dB到0 dB,改进方法误判率比传统方法降低4.2%~6.8%,尤其在低SNR场景下,结合信号特征的置信度计算可有效提升识别可靠性。
4.3 消融实验
为探究不同网络组件对模型性能的贡献,设计两组对照消融实验:实验A(理想信噪比场景)聚焦高SNR(≥6 dB)环境下组件的特征提取能力,实验B(复杂噪声场景)覆盖全SNR(-6~10 dB)区间以模拟实际应用场景,两组实验保持输入特征、训练参数一致,通过“准确率(权重0.7)+平均置信度(权重0.3)”的加权得分评估有效性,实验重复10次,标准差≤0.3%,结果如
表2 所示。
实验A结果表明,高SNR环境下信号特征清晰,CNN模块可充分捕捉时频图局部关键特征(如2FSK的频率切换点、BPSK的相位跳变),故CNN-only模型测试集准确率达99.5%;引入BiLSTM后,通过双向时序建模进一步优化特征关联判断,准确率提升至99.8%,但增益幅度仅0.3%,说明高SNR场景下时序特征对识别结果的影响较小。
实验B结果显示,全SNR区间内噪声干扰导致信号特征退化,CNN-only模型准确率降至95.2%(较实验A下降4.3个百分点),而CNN+BiLSTM模型准确率仅下降3.5个百分点,且平均置信度保持86.54%(显著高于CNN-only的79.8%),印证了BiLSTM层对噪声鲁棒性的增强作用——其可通过长序列建模抑制噪声对时序连续性特征的破坏,避免局部特征误判。
4.4 组件贡献分析
为进一步明确各组件在实际应用场景中的核心价值,以实验B为基准,以优化后完整模型(ResNet- CNN-BiLSTM)为基线,通过系统性移除单一组件构建对照组,重点考核测试集准确率、平均置信度、推理速度每个样本推理耗时及低SNR(≤0 dB)准确率4项关键指标,结果如
表3 所示。
表中可见各组件贡献呈现显著场景差异性。
1)CNN模块的基础支撑作用。CNN模块虽在全SNR区间准确率达95.2%,但低SNR准确率仅81.5%,且推理速度略低于基线模型,说明其擅长局部空间特征提取,但缺乏对噪声干扰的抵抗能力及时序特征建模能力。
2)BiLSTM层的专项增益价值。消融BiLSTM层后,整体准确率仅下降0.1个百分点,但低SNR准确率下降5.1个百分点,且平均置信度从86.54%降至82.1%,表明其核心价值集中于低SNR环境与置信度稳定两类场景——对BCH(2FSK)与LIN(单音+ 2FSK)等调制类型相似的信号,BiLSTM层可捕捉LIN信号同步段的短亮带前缀时序特征,使误判率降低3倍。
3)组件协同的必要性:基线模型通过ResNet残差连接强化CNN的深层特征提取能力,结合简化BiLSTM的时序建模优势,实现空间与时序特征互补,最终在低SNR准确率(89.3%)、推理速度(单样本耗时8 ms)、置信度稳定性(86.54%)3项指标上达成最优平衡,验证了混合架构的合理性。
5 实验验证与性能分析
为保障改进ResNet-CNN-BiLSTM混合模型训练稳定、推理高效及结果可复现,首先明确实验核心超参数和基础设置,再通过对比实验验证模型性能优势。
5.1 模型训练
模型训练与结构优化的关键超参数如
表4 所示,所有参数均基于本文数据集(3 000条信号样本,SNR范围-6~10 dB)及硬件平台适配确定,确保实验可复现。动态学习率SNR权重为0.000 1,Dropout衰减系数为0.02。
硬件采用NVIDIA GeForce RTX 3060 GPU,软件基于Ubuntu 18.04.6系统、MATLAB R2023a+CUDA 11.6实现GPU加速。
实验选取3 000条信号样本,覆盖本文研究的 BCH、LIN、MLT、PAC、STA等5种信号(调制方式及波特率/传信率参数见1.1节)。样本经预处理转化为时频图后,按8∶1∶1的比例划分为训练集(2 400条)、验证集(300条)和测试集(300条),并为所有时频图标注对应信号类别标签。为保障结果可靠性,设计3折交叉验证:将3 000条样本划分为3个子集(每子集含800条训练、100条验证和100条测试样本),循环完成3次独立评估。结果显示,平均验证准确率达98.12%(标准差0.05%),平均测试准确率达96.2%(标准差0.08%),模型性能稳定。两类核心指标的低标准差表明,模型在不同数据划分场景下性能稳定,无单次实验偶然性偏差。
模型采用ResNet-CNN-BiLSTM混合架构,训练过程中以验证集性能为依据调整超参数,最终在测试集上进行性能评估。为减少随机因素对结果的影响,实验重复进行10次,取10次测试的平均置信度作为关键评价指标之一,结果见
图3 。模型经40轮(1 480次迭代)训练,验证准确率稳定在98.17%,训练耗时48 min20 s,损失值降至0.05,无过拟合。
5.2 对比实验
为全面验证改进后ResNet-CNN-BiLSTM混合模型的性能优势,除与传统CNN、传统BiLSTM及未优化ResNet-CNN-BiLSTM模型对比外,新增与近期调制识别领域主流方法(Transformer-based模型、CNN+通道注意力模型)的对比实验。实验保持相同硬件平台及数据集划分规则,确保对比公平性,结果如
表5 所示。
1)精度对比。本文模型验证准确率(98.17%)高于Transformer-based模型(97.80%)和CNN+通道注意力模型(97.50%),验证了多尺度卷积与简化BiLSTM的协同优势
[15 ] 。核心原因在于多尺度卷积核(3×3+5×5)精准捕捉BCH信号“双亮柱”、LIN信号“短亮带前缀”等细节特征,简化BiLSTM层有效建模信号时序关联,二者协同弥补了Transformer对局部细节捕捉不足、CNN+注意力模型对时序特征建模缺失的短板。
2)效率对比。本文模型参数量(1.5×106 )仅为Transformer-based模型(5.2×106 )的28.8%,前者推理速度为单样本耗时8 ms,是后者的36.4%,训练时间(48 min20 s)仅为后者的38.4%,得益于深度可分离卷积的参数精简与自适应时序池化的特征压缩,解决了近期工作中高精度伴随高计算成本的共性问题。
3)鲁棒性对比。在低SNR(≤0 dB)环境下,模型准确率(89.30%)较Transformer-based模型(86.50%)高2.8个百分点,较CNN+通道注意力模型(84.70%)高4.6个百分点,印证分层正则化(噪声感知Dropout+L2约束)与SNR感知动态学习率的协同作用,强化了复杂噪声环境下的特征抗干扰能力。
5.3 结果分析
1)模型优化后性能提升显著。多尺度卷积与简化BiLSTM协同提升精度,BCH与LIN信号在SNR为- 4 dB时准确率差值扩至8.7%;改进置信度计算使平均置信度86.54%,低SNR(- 6~0 dB)误判率降4.2%~6.8%。
2)效率优化方面。深度可分离卷积将参数量从3.1×106 降至1.5×106 (减少51.6%),简化BiLSTM使推理延迟从单样本耗时15 ms降至单样本8 ms(提升46.7%),自适应时序池化避免时序特征断裂,三者结合使训练时间较传统BiLSTM缩短52 min18 s,满足实时处理需求。
3)稳定性保障方面。分层正则化与SNR感知学习率协同,使损失波动控制在±1.2%,优于传统 BiLSTM的±3.5%。
由
表6 可知,所提模型在不同SNR环境下表现优异:当SNR从
- 6 dB提升至10 dB时,识别准确率从72.3%升至99.5%,较未优化模型提升4.2~15.6个百分点(SNR为
- 6 dB时提升最显著),验证分层正则化与自适应训练策略的噪声鲁棒性增强效果;低SNR下BCH信号识别准确率约89.5%,后续需优化其与LIN信号的特征区分度。
未来的研究将进一步扩展信号类别至10类以上,覆盖更多民用与军事通信场景的调制类型,并引入特征注意力机制,强化对BCH等易混淆信号的特征提取能力,同时探索非高斯噪声环境下的模型适配方法,进一步增强模型泛化性。
6 结束语
本研究针对复杂电磁环境下调制识别的性能与实时性需求,通过结构优化、正则化与置信度计算改进,优化ResNet-CNN-BiLSTM模型,解决传统模型鲁棒性差、计算冗余、收敛慢等问题。实验表明,模型参数量1.5×106, 验证准确率98.17%,训练时间48 min20 s,推理速度为每样本耗时8 ms,平均置信度86.54%,实现了精度的定时性的平衡,可为军事抗干扰通信、民用频谱管理提供支撑。