文档名:结合坐标Transformer的轻量级人体姿态估计算法
摘要:针对现有的大多数自底向上人体姿态估计算法存在模型规模大、计算成本高及对边缘设备不友好等问题,提出了一种基于YOLOv5s6-Pose的轻量级多人姿态估计网络模型YOLOv5s6-Pose-CT.该模型在颈部网络中引入空间和通道重建卷积,以减少空间和通道维度上的特征冗余.同时,提出了一种坐标Transformer嵌入于主干网络中,使模型专注于长距离依赖和拥有高效的局部特征提取能力.其次,通过使用无偏特征位置对齐来解决多尺度融合过程中出现的特征错位问题.最后,使用损失函数MPDIoU对边界框的回归损失重新定义.在COCO2017数据集上的实验结果表明,本文优化的网络模型与主流的轻量级网络EfficientHRNet-H1模型相比,在保持相同精度的同时,参数量和计算量分别减少16.2%和66.1%.相比于基准模型YOLOv5s6-Pose,参数量减少11.2%,计算量降低5.8%,平均检测精度和平均召回率分别提升2.5%和2.6%.
Abstract:Addressingissuessuchaslargemodelsize,highcomputationalcosts,andlimitedcompatibilitywithedgedevicesinmostexistingbottom-uphumanposeestimationalgorithms,thisstudyproposedalightweightmulti-personposeestimationnetworkmodelnamedYOLOv5s6-Pose-CTbasedonYOLOv5s6-Pose.Inordertoreducefeatureredundancyacrossbothspatialandchanneldimensions,thenetworkmodelintroducedspatialandchannelreconstructionconvolutioninthenecknetwork.Simultaneously,acoordinateTransformerwasincorporatedintothebackbonenetworktoenhancelong-distancedependencewhilemaintainingefficientlocalfeatureextractionability.Furthermore,unbiasedfeaturepositionalignmentwasemployedtoresolvefeaturedislocationduringmulti-scalefusion.Finally,thisstudyredefinedtheregressionlossofboundingboxesusingtheMPDIoU(minimumpointdistance-basedIoU)lossfunction.ExperimentalresultsontheCOCO2017datasetdemonstratedthatcomparedwithEfficientHRNet-H1(amainstreamlightweightnetwork),ouroptimizednetworkmodelreducedparametersby16.2%andcomputationby66.1%,respectively,whilemaintainingcomparableaccuracylevels.Moreover,comparedwiththebaselineapproach,ourproposedmodelachievedparameterandcomputationreductionsof11.2%and5.8%,respectively,alongwithimprovementsof2.5%inaveragedetectionaccuracyand2.6%inrecallrate.
作者:黄友文 林志钦 章劲 陈俊宽Author:HUANGYouwen LINZhiqin ZHANGJin CHENJunkuan
作者单位:江西理工大学信息工程学院,江西赣州341000
刊名:图学学报 ISTICPKU
Journal:JournalofGraphics
年,卷(期):2024, 45(3)
分类号:TP391
关键词:人体姿态估计 轻量级 坐标Transformer 无偏特征位置对齐 损失函数
Keywords:humanposeestimation lightweight coordinateTransformer unbiasedfeaturepositionalignment lossfunction
机标分类号:TP391.41TN911.7TP181
在线出版日期:2024年6月19日
基金项目:结合坐标Transformer的轻量级人体姿态估计算法[
期刊论文] 图学学报--2024, 45(3)黄友文 林志钦 章劲 陈俊宽针对现有的大多数自底向上人体姿态估计算法存在模型规模大、计算成本高及对边缘设备不友好等问题,提出了一种基于YOLOv5s6-Pose的轻量级多人姿态估计网络模型YOLOv5s6-Pose-CT.该模型在颈部网络中引入空间和通道重建卷积...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
结合坐标Transformer的轻量级人体姿态估计算法 Lightweight human pose estimation algorithm combined with coordinate Transformer
结合坐标Transformer的轻量级人体姿态估计算法.pdf
- 文件大小:
- 2.35 MB
- 下载次数:
- 60
-
高速下载
|
|