文档名:多媒体网络语音音调数据特征智能识别方法
利用传统方法对多媒体网络语音音调数据特征进行识别,存在识别准确性低,识别速度慢的问题.针对上述问题,提出一种新的多媒体网络语音音调数据特征智能识别方法.该方法分为三部分:第一对输入的多媒体网络语音音调数据进行预处理,包括数据转换、预加重、分帧加窗和端点检测等4步;第二提取预处理数据特征参数,包括基音频率、共振峰、mel倒谱系数;第三利用GMM-SVM模型在提取到的特征参数基础上进行智能识别.结果表明:利用本方法对多媒体网络语音音调数据特征进行智能识别,与基于人工神经网络的语音特征识别方法和基于蚁群算法特征选择的语音识别方法相比,平均正确识别率提高8.3%和12.4%,平均所用时间减少0.7s和1.24s,识别速度加快.
作者:周挺杨荣
作者单位:西安航空职业技术学院,西安710089
母体文献:2019年西南三省一市自动化与仪器仪表学术年会论文集
会议名称:2019年西南三省一市自动化与仪器仪表学术年会
会议时间:2019年10月1日
会议地点:四川绵阳
主办单位:中国自动化学会,中国仪器仪表学会
语种:chi
分类号:
关键词:多媒体网络 语音音调 特征提取 智能识别
在线出版日期:2020年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 1.35 MB
- 下载次数:
- 60
-
高速下载
|
|