PDF
摘要
传统语音增强方法,通常只对含噪语音信号的幅度进行增强处理,忽略了相位信息。相位谱在语音的可懂度和感知质量方面也具有积极影响。为了解决传统语音增强方法对相位处理的不足以及在语音增强过程中普遍存在的可理解性较低的问题,提出一种谐波结构相位估计联合幅度补偿的语音增强方法,该方法强调谐波结构的相位估计恢复浊音信息,并针对由浊音相位估计后清音特征被背景噪声破坏引起的语音信息丢失问题,提出一种平滑背景噪声策略来抑制噪声的影响。此外,还利用谐波比分离谐波结构和清音特征,基于谐波判决来判断是否应该平滑背景噪声,为避免不可靠的判决导致清音特征损失,在谐波判决的基础上还增加了清音特征信息的利用。实验结果表明,该方法在白噪声环境下的信噪比(signal to noise ratio, SNR)、语音质量感知评估(perceptual evaluation of speech quality, PESQ)和短时客观可懂度(short-time objective intelligibility, STOI)分别提升了12.02 dB,1.03和0.07,进一步证实该方法可以有效减少语音失真,提高噪声环境下语音信号质量和可懂度。
关键词
相位估计
/
语音增强
/
谐波结构
/
幅度补偿
Key words
谐波结构相位估计联合幅度补偿的语音增强方法[J].
重庆邮电大学学报(自然科学版), 2024, 36(05): 935-944 DOI: