基于变种注意力的双鉴别器语音增强算法

李正, 周斌

中南民族大学学报(自然科学版) ›› 2025, Vol. 44 ›› Issue (02) : 245 -252.

PDF
中南民族大学学报(自然科学版) ›› 2025, Vol. 44 ›› Issue (02) : 245 -252. DOI: 10.20056/j.cnki.ZNMDZK.20250214

基于变种注意力的双鉴别器语音增强算法

    李正, 周斌
作者信息 +

Author information +
文章历史 +
PDF

摘要

日常通信以及说话人识别和语音唤醒等领域的前端任务,都需要干净的语音信号以保证准确的语音可懂度和高效的性能.现有的语音增强算法存在模型参数量大、过度关注评价指标而忽视增强语音真假性等问题.针对上述问题,提出一种基于变种注意力的双鉴别器语音增强算法对含噪语音进行时频域增强.含噪语音信号经过短时傅里叶变换和幂律压缩等一系列操作传入生成器,编码器首先使用稠密卷积模块进行特征提取,后经过维度变化分别利用变种注意力获取时域和频域特征,解码器恢复信号的幅度和复数频谱.最终分别利用评价指标和梅尔频谱训练两个同结构但不同输入的鉴别器.实验结果证明:该模型与SE-Conformer相比,语音质量感知、噪声失真测度和综合质量测度分别提升0.15、0.27和0.25.

关键词

语音增强 / 变种注意力 / 双鉴别器

Key words

引用本文

引用格式 ▾
基于变种注意力的双鉴别器语音增强算法[J]. 中南民族大学学报(自然科学版), 2025, 44(02): 245-252 DOI:10.20056/j.cnki.ZNMDZK.20250214

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

64

访问

0

被引

详细

导航
相关文章

AI思维导图

/