文档名:弱标签声音事件检测的空间通道特征表征与自注意池化
摘要:深度神经网络声音事件检测方法需要大量标记声音事件类别和起止时间的强标签音频样本,然而强标签标注非常困难和耗时.弱标签声音事件检测是解决这一困难的有效途径.本文将弱标签声音事件检测作为多实例学习问题,并基于卷积循环神经网络提出弱标签声音事件检测的空间-通道特征表征与自注意池化方法.该方法研究多实例弱标签声音事件检测的特征表征和帧级预测结果池化两个方面的内容.在特征表征方面,为了增强卷积神经网络的特征表征能力,结合上下文门控和通道注意机制构建门控注意力结构并嵌入到卷积循环神经网络中,实现了音频样本特征的空间和通道特征选择;在预测结果池化方面,引入自注意思想设计音频帧预测结果的自注意池化方法,增强了音频样本中事件帧之间的相关度,使事件帧获得更大的权重.本文方法通过对卷积循环神经网络特征表征和预测结果池化的革新,有效提升了模型的检测性能.本文提出的方法在DCASE2017任务4和DCASE2018任务4数据集的评估集中分别取得了52.47%和31.00%的F1得分,性能优于当前绝大部分的弱标签声音事件检测方法.实验结果表明:本文提出的空间-通道特征表征与自注意池化方法能显著改善弱标签声音事件检测的综合性能.
作者:杨利平 侯振威 辜小花 郝峻永 Author:YANGLi-ping HOUZhen-wei GUXiao-hua HAOJun-yong
作者单位:重庆大学光电技术及系统教育部重点实验室,重庆400044重庆科技学院电气工程学院,重庆401331
刊名:电子学报 ISTICEIPKU
Journal:ActaElectronicaSinica
年,卷(期):2023, 51(2)
分类号:TP391.4TP37
关键词:特征表征 自注意池化 卷积循环神经网络 弱标签学习 声音事件检测
机标分类号:TP391TP183TN912.34
在线出版日期:2023年5月8日
基金项目:国家自然科学基金弱标签声音事件检测的空间-通道特征表征与自注意池化[
期刊论文] 电子学报--2023, 51(2)杨利平 侯振威 辜小花 郝峻永深度神经网络声音事件检测方法需要大量标记声音事件类别和起止时间的强标签音频样本,然而强标签标注非常困难和耗时.弱标签声音事件检测是解决这一困难的有效途径.本文将弱标签声音事件检测作为多实例学习问题,并基于卷...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
弱标签声音事件检测的空间-通道特征表征与自注意池化 Spatial-Channel Feature Representation and Self-attention Pooling for Weakly-Labeled Sound Event Detection
弱标签声音事件检测的空间-通道特征表征与自注意池化.pdf
- 文件大小:
- 1.95 MB
- 下载次数:
- 60
-
高速下载
|
|