文档摘要:本文设计一种用于三维(3D)人体姿态(pose)估计的改进Transformer的多级特征编码网络.采用空间池化(pooling)算子结构来替换注意力(Attention)模块,缩减了模型参数量和运行复杂度,串联该结构得到初始特征表示,然后使用交叉注意力(CA)机制进行特征信息交互学习,并应用跨步卷积降低时间维度并合并相近的Pose到Pose序列的单个表示.在Human3.6M数据集上进行验证实验.结果表明:该方法针对3D人体Pose估计,混合使用Pooling结构和Attention机制能达到有效的估计效果,与原始Trans-former的方法进行对比,模型参数量降低了30%,位置精度提升了8.6%.
Abstract:AnimprovedTransformermulti-levelfeatureencodingnetworkfor3Dhumanposeestimationisdesigned.ThespatialpoolingoperatorstructureisusedtoreplacetheAttentionmodule,whichreducestheamountofmodelparametersandoperationcomplexity.Thestructureisconnectedinseriestoobtaintheinitialfeaturerepresentation.Then,thecross-attention(CA)mechanismisusedforinteractivelearningoffeatureinformation,andstridedconvolutionisusedtoreducethetimedimension,andsimilarPosesarecombinedintoasinglerepresentationofPosesequences.ResultsofverificationexperimentonHuman3.6Mdatasetsshowthatthismethodcanachieveeffectiveestimationeffectfor3DhumanPoseestimationbyusingPoolingstructureandattentionmechanism.ComparedwiththeoriginalTransformermethod,theamountofmodelparametersisreducedby30%andthepositionalprecisionisimprovedby8.6%.
作者:陈从平 郁春明 闫焕章 江高勇 张屹 戴国洪Author:CHENCongping YUChunming YANHuanzhang JIANGGaoyong ZHANGYi DAIGuohong
作者单位:常州大学机械与轨道交通学院,江苏常州213164
刊名:传感器与微系统 ISTICPKU
Journal:TransducerandMicrosystemTechnologies
年,卷(期):2024, 43(6)
分类号:TP391.41
关键词:姿态估计 Transformer模型 空间池化算子 交叉注意力机制 跨步卷积
Keywords:poseestimation Transformermodel spatialpoolingoperator cross-attentionmechanism stridedconvolution
机标分类号:TP391.41TH89TP181
在线出版日期:2024年7月12日
基金项目:国家自然科学基金,国家重点研发计划基于改进Transformer的三维人体姿态估计[
期刊论文] 传感器与微系统--2024, 43(6)陈从平 郁春明 闫焕章 江高勇 张屹 戴国洪本文设计一种用于三维(3D)人体姿态(pose)估计的改进Transformer的多级特征编码网络.采用空间池化(pooling)算子结构来替换注意力(Attention)模块,缩减了模型参数量和运行复杂度,串联该结构得到初始特征表示,然后使用交...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
关键词:姿态估计,Transformer模型,空间池化算子,交叉注意力机制,跨步卷积,
|
|