基于改进的多度量优化自适应语音增强算法

付春雨, 刘均

吉林大学学报(理学版) ›› 2026, Vol. 64 ›› Issue (2) : 403 -410.

PDF
吉林大学学报(理学版) ›› 2026, Vol. 64 ›› Issue (2) : 403 -410. DOI: 10.13413/j.cnki.jdxblxb.2024400

基于改进的多度量优化自适应语音增强算法

    付春雨, 刘均
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对多指标语音增强算法在训练过程中易受异常值干扰、导致优化不稳定的问题,提出一种基于多头注意力机制的自适应语音增强算法.首先,通过在判别网络中间层引入多头注意力结构,增强模型对语音频谱局部特征和整体结构的联合建模能力,并结合在线知识蒸馏策略实现多生成器之间的信息共享,从而提升多指标条件下的协同优化效果.其次,为减少异常值对训练过程的影响,将损失函数替换为对数均方误差形式,以提升模型的稳定性和鲁棒性.在公开语音数据集VoiceBank-DEMAND上的实验结果表明,该方法在语音质量、背景噪声抑制和语音可懂度指标上均优于现有多指标语音增强模型.因此,引入注意力机制与稳定化损失函数能显著改善多指标语音增强算法的综合性能.

关键词

语音增强 / 频域 / 多头注意力机制 / 在线知识蒸馏 / 对数均方误差损失

Key words

引用本文

引用格式 ▾
基于改进的多度量优化自适应语音增强算法[J]. 吉林大学学报(理学版), 2026, 64(2): 403-410 DOI:10.13413/j.cnki.jdxblxb.2024400

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

10

访问

0

被引

详细

导航
相关文章

AI思维导图

/