说话人验证中基于语音质量的自适应损失函数研究

王佳龙, 陈奕豪, 许敏强, 何亮, 方磊

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (07) : 1585 -1589.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (07) : 1585 -1589. DOI: 10.20009/j.cnki.21-1106/TP.2024-0136

说话人验证中基于语音质量的自适应损失函数研究

    王佳龙, 陈奕豪, 许敏强, 何亮, 方磊
作者信息 +

Author information +
文章历史 +
PDF

摘要

说话人验证任务中模型性能与语音质量有关,但目前研究并未关注语音质量的高低对模型能力的影响,因此本文提出了一种基于语音数据质量的自适应损失函数的方法.首先本文观察到说话人特征的模长与语音质量存在正相关性;其次根据说话人特征模长,本文提出了一种新型损失函数(AMGsoftmax),通过更加关注高质量大模长的样本,实现自适应调整不同质量数据的损失函数,从而提升模型识别能力.实验结果表明,AMGsoftmax与常用的AMsoftmax损失函数相比,在VoxCeleb1-O数据集上,等误识率(EER)相对降低了9.69%;在VoxSRC21-val数据集上,EER相对降低了7.38%.

关键词

说话人验证 / 语音质量 / 损失函数

Key words

引用本文

引用格式 ▾
说话人验证中基于语音质量的自适应损失函数研究[J]. 小型微型计算机系统, 2025, 46(07): 1585-1589 DOI:10.20009/j.cnki.21-1106/TP.2024-0136

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

52

访问

0

被引

详细

导航
相关文章

AI思维导图

/