文档名:听觉模型鲁棒性特征研究及应用
摘要:人类的听觉系统具有非常精细而巧妙的结构,即使在嘈杂的环境中,也能准确地理解语音.采用精细的耳蜗模型作为前端处理可以实现更好的语音处理.利用快速压缩的非对称谐振器级联(CARFAC)作为人耳外周模型,结合听觉稳定图像得到精确的皮层前听觉模型.在听觉模型的基础上提取较准确的基音轮廓,利用基音信息进行声场景分析,合成鲁棒性语音特征,并将其送入神经网络进行监督训练,以实现语音增强.实验结果表明,噪声条件下,由听觉模型提取的特征在各语音评价指标下都有较好的体现,可以更好表征语音信号,具有一定的鲁棒性.
Abstract:Thehumanauditorysystemhasaveryfineandingeniousstructure,anditcanaccuratelyunderstandspeeche-veninanoisyenvironment.Usingafinecochleamodelasfront-endprocessingallowsforbetterspeechprocessing.Inthispaper,arapidlycompressedasymmetricresonatorcascade(CARFAC)isusedasaperipheralmodelofthehumanear,combinedwithanauditorystabilizationimage(SAI)toobtainanaccurateprecorticalauditorymodel.Basedontheaudi-torymodel,amoreaccuratepitchcontourisextracted,thepitchinformationisusedtoanalyzetheacousticscene,andro-bustspeechfeaturesaresynthesized,whicharesenttotheneuralnetworkforsupervisedtrainingtoachievespeechen-hancement.Experimentsshowthatundernoiseconditions,thefeaturesextractedbytheauditorymodelarebetterreflec-tedinvariousspeechevaluationindicators,whichcanbettercharacterizethespeechsignalandhavecertainrobustness.
作者:王文华 夏秀渝Author:WANGWenhua XIAXiuyu
作者单位:四川大学电子信息学院,四川成都610064
刊名:成都信息工程大学学报
Journal:JournalofChengduUniversityOfInformationTechnology
年,卷(期):2024, 39(3)
分类号:TP391.4
关键词:CARFAC模型 听觉稳定图像 语音增强系统 基音提取
Keywords:CARFACmodel auditorystabilizationimage speechenhancementsystem pitchextraction
机标分类号:U115TN912.3TP391.4
在线出版日期:2024年7月8日
基金项目:听觉模型鲁棒性特征研究及应用[
期刊论文] 成都信息工程大学学报--2024, 39(3)王文华 夏秀渝人类的听觉系统具有非常精细而巧妙的结构,即使在嘈杂的环境中,也能准确地理解语音.采用精细的耳蜗模型作为前端处理可以实现更好的语音处理.利用快速压缩的非对称谐振器级联(CARFAC)作为人耳外周模型,结合听觉稳定图像...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
听觉模型鲁棒性特征研究及应用 Research and Application of Robust Characteristics of Auditory Models
听觉模型鲁棒性特征研究及应用.pdf
- 文件大小:
- 1.66 MB
- 下载次数:
- 60
-
高速下载
|
|