基于AOF-LCNN的语音回放攻击场景下的说话人识别算法

李波, 蔡晓东, 侯珍珍, 陈思

桂林电子科技大学学报 ›› 2020, Vol. 40 ›› Issue (01) : 13 -17.

PDF
桂林电子科技大学学报 ›› 2020, Vol. 40 ›› Issue (01) : 13 -17. DOI: 10.16725/j.cnki.cn45-1351/tn.2020.01.003

基于AOF-LCNN的语音回放攻击场景下的说话人识别算法

作者信息 +

Author information +
文章历史 +
PDF

摘要

针对语音回放攻击场景下的LCNN说话人识别系统中存在的过拟合问题,提出一种基于AOF-LCNN的神经网络。设计了一个新的DNN结构分类器作为后端分类网络,将该DNN结构级联在LCNN网络之后,形成一套新的端到端网络结构。由于LCNN结构中的MFM结构可能是造成过拟合的原因,在DNN后端结构中采用LeakyReLU作为激活函数,以抵消MFM的过拟合影响。在ASVspoof 2017数据集上的结果表明,该算法在Dev数据集和Eval数据集上分别达到了3.59%和13.79%的等错误率(EER),相对LCNN系统的等错误率分别降低了2.12%和3.51%。该算法一定程度上解决了过拟合的问题,提高了系统的鲁棒性,同时降低了系统的等错误率,从而提高识别性能。

关键词

说话人识别 / 回放语音攻击 / AOF-LCNN

Key words

引用本文

引用格式 ▾
李波, 蔡晓东, 侯珍珍, 陈思 基于AOF-LCNN的语音回放攻击场景下的说话人识别算法[J]. 桂林电子科技大学学报, 2020, 40(01): 13-17 DOI:10.16725/j.cnki.cn45-1351/tn.2020.01.003

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

28

访问

0

被引

详细

导航
相关文章

AI思维导图

/