文档摘要:声音是动物向外界表达情绪的一种重要方式,通过提取动物声音特征,建立特征值与动物情绪之间的映射关系,可以实现对动物情绪的感知和理解.为提高动物情绪识别性能,本文提出基于Bahdanau注意力机制的双向长短期记忆网络的动物声音情绪识别方法.该方法对动物声音进行特征提取,提取了的频谱质心、频谱带宽、频谱滚降点、过零率、均方根能量、频谱对比度、梅尔倒谱系数以及其一阶差分作为特征向量,输入双向长短期记忆网络,通过注意力机制对情绪特征进行通道方向的权重学习,最后由全连接层进行情感类型判别.本文以狗为例,对狗的声音进行了情绪识别实验,实验结果表明:相比于循环神经网络、双向长短期记忆网络,本文方法的识别准确度更高.
Abstract:Soundservesasacrucialmeanforanimalstoexpresstheiremotionstotheoutsideworld.Byestablishingthemappingrelationshipbetweenanimal'semotionsandfeaturesextractedfromanimalsound,itbecomespossibleforcomputerstoperceiveandunderstandtheemotionalstatesofanimals.Inordertoimprovetheperformanceofanimalemotionrecognition,amethodforrecognizingemotionsinanimalsoundsbasedontheBi-directionalLongShort-TermMemory(BiLSTM)networkwithBahdanauattentionmechanismispresentedinthispaper.Featureextractionoftheproposedmethodsuchasthespectralcentroid,spectralbandwidth,spectralrolloffpoint,zero-crossingrate,rootmeansquareenergy,spectralcontrast,Mel-frequencycepstralcoefficientsandtheirfirst-orderdifferences,formingafeaturevectorfromanimalsound.ThefeaturevectoristreatedastheinputofBiLSTMnetwork.Throughtheattentionmechanism,theproposedmethodlearnschannel-wiseweightsforemotionalfeatures.Ultimately,afullyconnectedlayerisutilizedfortheclassificationofemotionalcategories.Takingdogsasanexample,experimentsareconductedtorecognizeemotionsindogsounds.TheexperimentalresultsdemonstratethattheproposedmethodoutperformsthemethodsbasedonRecurrentNeuralNetworksandBiLSTMnetworkswithhigheraccuracyinemotionrecognition.
作者:胡文星 蔡佳欣 柯振宇 彭烁钟 胡松 赵小燕Author:HUWenxing CAIJiaxin KEZhenyu PENGShuozhong HUSong ZHAOXiaoyan
作者单位:南京工程学院信息与通信工程学院,南京211167
刊名:智能计算机与应用
Journal:IntelligentComputerandApplications
年,卷(期):2024, 14(7)
分类号:TP391.41
关键词:动物情绪识别 Bahdanau注意力机制 双向长短期记忆网络 特征提取
Keywords:animalemotionrecognition Bahdanauattentionmechanism bidirectionallongshort-termmemorynetwork featureextraction
机标分类号:TP391TP183TN912.34
在线出版日期:2024年7月22日
基金项目:江苏省大学生实践创新训练计划项目,南京工程学院引进人才科研启动基金项目基于注意力机制的BiLSTM动物声音情绪识别[
期刊论文] 智能计算机与应用--2024, 14(7)胡文星 蔡佳欣 柯振宇 彭烁钟 胡松 赵小燕声音是动物向外界表达情绪的一种重要方式,通过提取动物声音特征,建立特征值与动物情绪之间的映射关系,可以实现对动物情绪的感知和理解.为提高动物情绪识别性能,本文提出基于Bahdanau注意力机制的双向长短期记忆网络的...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
关键词:动物情绪识别,Bahdanau注意力机制,双向长短期记忆网络,特征提取,
|
|