基于听觉融合特征的多声音事件检测

罗吉; 夏秀渝

doi:10.19907/j.0490-6756.2024.043006

四川大学学报(自然科学版) ›› 2024, Vol. 61 ›› Issue (04) : 231 -237. DOI: 10.19907/j.0490-6756.2024.043006

基于听觉融合特征的多声音事件检测

罗吉, 夏秀渝

作者信息 +

Author information +

文章历史 +

PDF

摘要

为提高多声音事件检测任务的性能，本文深入研究速动压缩非对称谐振器级联CARFAC数字耳蜗模型，并提出了基于听觉融合特征的多声音事件检测方法 .该方法首先利用CARFAC提取混叠声音的神经活动模式图NAP，然后将NAP与GFCC拼接后生成融合听觉特征，并将其送入CRNN神经网络进行全监督学习，以实现对城市声音事件的检测.实验表明，在低信噪比且重叠事件较多的情况下，融合听觉特征较单独的NAP、MFCC以及GFCC等特征具有更好的鲁棒性和多声音事件检测性能.