基于听觉融合特征的多声音事件检测

罗吉, 夏秀渝

四川大学学报(自然科学版) ›› 2024, Vol. 61 ›› Issue (04) : 231 -237.

PDF
四川大学学报(自然科学版) ›› 2024, Vol. 61 ›› Issue (04) : 231 -237. DOI: 10.19907/j.0490-6756.2024.043006

基于听觉融合特征的多声音事件检测

    罗吉, 夏秀渝
作者信息 +

Author information +
文章历史 +
PDF

摘要

为提高多声音事件检测任务的性能,本文深入研究速动压缩非对称谐振器级联CARFAC数字耳蜗模型,并提出了基于听觉融合特征的多声音事件检测方法 .该方法首先利用CARFAC提取混叠声音的神经活动模式图NAP,然后将NAP与GFCC拼接后生成融合听觉特征,并将其送入CRNN神经网络进行全监督学习,以实现对城市声音事件的检测.实验表明,在低信噪比且重叠事件较多的情况下,融合听觉特征较单独的NAP、MFCC以及GFCC等特征具有更好的鲁棒性和多声音事件检测性能.

关键词

数字耳蜗模型 / 神经活动模式 / 融合听觉特征 / 声音事件检测 / 四折交叉验证

Key words

引用本文

引用格式 ▾
基于听觉融合特征的多声音事件检测[J]. 四川大学学报(自然科学版), 2024, 61(04): 231-237 DOI:10.19907/j.0490-6756.2024.043006

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

1

访问

0

被引

详细

导航
相关文章

AI思维导图

/