返回列表 发布新帖

基于注意力机制的BiLSTM动物声音情绪识别

14 0
1 黄金阳光 发表于 2024-10-4 00:56 | 查看全部 阅读模式
文档摘要:声音是动物向外界表达情绪的一种重要方式,通过提取动物声音特征,建立特征值与动物情绪之间的映射关系,可以实现对动物情绪的感知和理解.为提高动物情绪识别性能,本文提出基于Bahdanau注意力机制的双向长短期记忆网络的动物声音情绪识别方法.该方法对动物声音进行特征提取,提取了的频谱质心、频谱带宽、频谱滚降点、过零率、均方根能量、频谱对比度、梅尔倒谱系数以及其一阶差分作为特征向量,输入双向长短期记忆网络,通过注意力机制对情绪特征进行通道方向的权重学习,最后由全连接层进行情感类型判别.本文以狗为例,对狗的声音进行了情绪识别实验,实验结果表明:相比于循环神经网络、双向长短期记忆网络,本文方法的识别准确度更高.

Abstract:Soundservesasacrucialmeanforanimalstoexpresstheiremotionstotheoutsideworld.Byestablishingthemappingrelationshipbetweenanimal'semotionsandfeaturesextractedfromanimalsound,itbecomespossibleforcomputerstoperceiveandunderstandtheemotionalstatesofanimals.Inordertoimprovetheperformanceofanimalemotionrecognition,amethodforrecognizingemotionsinanimalsoundsbasedontheBi-directionalLongShort-TermMemory(BiLSTM)networkwithBahdanauattentionmechanismispresentedinthispaper.Featureextractionoftheproposedmethodsuchasthespectralcentroid,spectralbandwidth,spectralrolloffpoint,zero-crossingrate,rootmeansquareenergy,spectralcontrast,Mel-frequencycepstralcoefficientsandtheirfirst-orderdifferences,formingafeaturevectorfromanimalsound.ThefeaturevectoristreatedastheinputofBiLSTMnetwork.Throughtheattentionmechanism,theproposedmethodlearnschannel-wiseweightsforemotionalfeatures.Ultimately,afullyconnectedlayerisutilizedfortheclassificationofemotionalcategories.Takingdogsasanexample,experimentsareconductedtorecognizeemotionsindogsounds.TheexperimentalresultsdemonstratethattheproposedmethodoutperformsthemethodsbasedonRecurrentNeuralNetworksandBiLSTMnetworkswithhigheraccuracyinemotionrecognition.

作者:胡文星  蔡佳欣  柯振宇  彭烁钟  胡松  赵小燕Author:HUWenxing  CAIJiaxin  KEZhenyu  PENGShuozhong  HUSong  ZHAOXiaoyan
作者单位:南京工程学院信息与通信工程学院,南京211167
刊名:智能计算机与应用
Journal:IntelligentComputerandApplications
年,卷(期):2024, 14(7)
分类号:TP391.41
关键词:动物情绪识别  Bahdanau注意力机制  双向长短期记忆网络  特征提取  
Keywords:animalemotionrecognition  Bahdanauattentionmechanism  bidirectionallongshort-termmemorynetwork  featureextraction  
机标分类号:TP391TP183TN912.34
在线出版日期:2024年7月22日
基金项目:江苏省大学生实践创新训练计划项目,南京工程学院引进人才科研启动基金项目基于注意力机制的BiLSTM动物声音情绪识别[
期刊论文]  智能计算机与应用--2024, 14(7)胡文星  蔡佳欣  柯振宇  彭烁钟  胡松  赵小燕声音是动物向外界表达情绪的一种重要方式,通过提取动物声音特征,建立特征值与动物情绪之间的映射关系,可以实现对动物情绪的感知和理解.为提高动物情绪识别性能,本文提出基于Bahdanau注意力机制的双向长短期记忆网络的...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

关键词:动物情绪识别,Bahdanau注意力机制,双向长短期记忆网络,特征提取,

2024-10-4 00:56 上传
文件大小:
2.65 MB
下载次数:
0
附件售价:
1 下载券 [赞助会员免费下载]
本地下载 立即购买
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
  • 联系QQ客服
2022-2024 新资汇 - 参考资料分享下载网站
关灯 返回顶部
快速回复 返回顶部 返回列表