文档名:基于SIFT的说话人唇动识别
针对唇部特征提取维度过高以及时尺度空间敏感的问题,提出了一种基于尺度不变特征变换(SIFT)算法作特征提取来进行说话人身份认证的技术.首先,提出了一种简单的视频帧图片规整算法,将不同长度的唇动视频规整到同一的长度,提取出具有代表性的唇动图片;然后,提出一种在SIFT关键点的基础上,进行纹理和运动特征的提取算法,并经过主成分分析(PCA)算法的整合,最终得到具有代表性的唇动特征进行认证;最后,根据所得到的特征,提出了一种简单的分类算法.实验结果显示,和常见的局部二元模式(LBP)特征和方向梯度直方图(HOG)特征相比较,该特征提取算法的错误接受率(FAR)和错误拒绝率(FRR)表现更佳.说明整个说话人唇动特征识别算法是有效的,能够得到较为理想的结果.
作者:马新军吴晨晨仲乾元李园园
作者单位:哈尔滨工业大学(深圳)机电工程与自动化学院,广东深圳518055
母体文献:第十七届中国Rough集与软计算学术会议、第十一届中国Web智能学术研讨会、第十一届中国粒计算研讨会及第五届三支决策学术会议联合会议(CRSSC-CWI-CGrC-3WD2017)论文集
会议名称:第十七届中国Rough集与软计算学术会议、第十一届中国Web智能学术研讨会、第十一届中国粒计算研讨会及第五届三支决策学术会议联合会议(CRSSC-CWI-CGrC-3WD2017)
会议时间:2017年5月26日
会议地点:合肥
主办单位:中国计算机学会,中国人工智能学会
语种:chi
分类号:
关键词:唇部图片 图像识别 特征提取 分类算法
在线出版日期:2018年7月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 1.29 MB
- 下载次数:
- 60
-
高速下载
|
|