文档摘要:针对现有机械臂动态目标抓取方法轨迹规划困难、实时性不足、难以实现六自由度抓取等问题,提出一种基于深度强化学习(deepreinforcementlearning,DRL)的机械臂动态目标抓取方法.进行马尔可夫决策过程(Markovdecisionprocess,MDP)建模,设计状态空间、动作空间以及奖励函数,实现机械臂对动态目标的六自由度抓取.基于Pybullet构建机械臂动态目标抓取仿真试验环境,对该方法进行训练,将训练得到的策略在新颖场景进行测试,并与经典规划控制的动态目标抓取方法进行对比.仿真结果表明:该方法能实现机械臂对动态目标的六自由度抓取,在抓取成功率和速度上具有优势.
Abstract:Aimingattheproblemsoftrajectoryplanningdifficulty,insufficientreal-timeperformanceanddifficultyinrealizingsix-degree-of-freedomgraspingofexistingmanipulatordynamictargetgraspingmethods,amanipulatordynamictargetgraspingmethodbasedondeepreinforcementlearning(DRL)isproposed.TheMarkovdecisionprocess(MDP)ismodeled,andthestatespace,actionspaceandrewardfunctionaredesignedtorealizethesix-degree-of-freedomgraspingofthedynamictargetbythemanipulator.BasedonPybullet,thedynamictargetgraspingsimulationtestenvironmentofmanipulatorisconstructed,andthemethodistrained.Thetrainedstrategyistestedinanovelscene,andcomparedwiththedynamictargetgraspingmethodofclassicalplanningcontrol.Thesimulationresultsshowthatthemethodcanrealizethesix-degree-of-freedomgraspingofthedynamictargetbythemanipulator,andhasadvantagesingraspingsuccessrateandspeed.
作者:张轩 卢惠民 任君凯 莫新民 肖浩然 张伟杰 杨璇 Author:ZhangXuan LuHuimin RenJunkai MoXinmin XiaoHaoran ZhangWeijie YangXuan
作者单位:西北机电工程研究所人体增强技术创新中心,陕西咸阳712099国防科技大学智能科学学院,长沙410073
刊名:兵工自动化 ISTICPKU
Journal:OrdnanceIndustryAutomation
年,卷(期):2024, 43(6)
分类号:TP241
关键词:动态目标抓取 马尔科夫 轨迹规划 深度强化学习 六自由度抓取
Keywords:dynamictargetgrasping Markov trajectoryplanning deepreinforcementlearning six-degree-of-freedomgrasping
机标分类号:TP3TP181TP242
在线出版日期:2024年7月1日
基金项目:基于深度强化学习的机械臂动态目标抓取方法[
期刊论文] 兵工自动化--2024, 43(6)张轩 卢惠民 任君凯 莫新民 肖浩然 张伟杰 杨璇针对现有机械臂动态目标抓取方法轨迹规划困难、实时性不足、难以实现六自由度抓取等问题,提出一种基于深度强化学习(deepreinforcementlearning,DRL)的机械臂动态目标抓取方法.进行马尔可夫决策过程(Markovdecisionp...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
关键词:动态目标抓取,马尔科夫,轨迹规划,深度强化学习,六自由度抓取,
|
|