文档名:基于标签层次结构的视觉关系检测模型
摘要:视觉关系检测是在目标识别的基础上,进一步检测出目标之间的关系,属于视觉理解和推理的关键技术.然而,由于关系标签视觉上的相似性以及数据不平衡问题造成少样本的尾部关系检测召回率较低.为了提高尾部关系的检测效果,本文将关系标签进行粗细粒度划分构建了标签的层次结构表示,提出了基于标签层次结构的视觉关系检测模型.模型利用视觉关系之间的相似性以及数据带有的偏见性构建关系标签的层次结构表示,以此将关系区分为粗粒度关系和细粒度关系,使尾部关系在由粗粒度到细粒度的结构上获得更多的关注.同时,针对标签层次结构的性质设计其损失函数,该损失函数通过结构化信息逐层学习不同类别关系之间的差异,使模型更好的检测尾部细粒度关系.分别在公开数据集VisualRelationshipDetection(VRD)和VisualGenome(VG)中验证了本文模型检测尾部关系的效果.与现有模型相比,在VRD数据集中平均召回率mR@20、mR@50和mR@100分别提高了0.62%、1.57%和2.47%;在VG数据集中,mR@20、mR@50和mR@100分别提高了0.67%、0.83%和1.15%.
作者:王元龙 雷鸣 王智强 张虎 李茹 梁吉业 Author:WANGYuan-long LEIMing WANGZhi-qiang ZHANGHu LIRu LIANGJi-ye
作者单位:山西大学计算机与信息技术学院,山西太原030006山西大学计算机与信息技术学院,山西太原030006;山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006
刊名:电子学报 ISTICEIPKU
Journal:ActaElectronicaSinica
年,卷(期):2023, 51(12)
分类号:TP391.7
关键词:视觉关系检测 标签层次结构表示 长尾分布 粗粒度关系 细粒度关系
Keywords:visualrelationshipdetection taghierarchicalrepresentation long-taileddistributions coarse-grainedrelationship fine-grainedrelationship
机标分类号:TP391F752.7D822.347.4
在线出版日期:2024年3月13日
基金项目:基于标签层次结构的视觉关系检测模型[
期刊论文] 电子学报--2023, 51(12)王元龙 雷鸣 王智强 张虎 李茹 梁吉业视觉关系检测是在目标识别的基础上,进一步检测出目标之间的关系,属于视觉理解和推理的关键技术.然而,由于关系标签视觉上的相似性以及数据不平衡问题造成少样本的尾部关系检测召回率较低.为了提高尾部关系的检测效果,本...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于标签层次结构的视觉关系检测模型 Visual Relationship Detection Model Based on Label Hierarchy
基于标签层次结构的视觉关系检测模型.pdf
- 文件大小:
- 2.27 MB
- 下载次数:
- 60
-
高速下载
|
|