改进DDPG算法在外骨骼机械臂轨迹运动中的应用

admin · 发表于 2024-12-14 13:39

文档名：改进DDPG算法在外骨骼机械臂轨迹运动中的应用
摘要：针对现阶段外骨骼机器人轨迹运动时出现效果不佳的问题,提出了基于优先经验回放与分区奖励(PERDA)融合的深度确定性策略梯度(DDPG)强化学习算法,即PERDA-DDPG.该方法利用时间差分误差(TD-errors)的大小对经验排序,改变了原始采样的策略.此外,相较于以往二值奖励函数,本文根据物理模型提出针对化的分区奖励.在OpenAIGym平台上实现仿真环境,实验结果表明:改进的算法收敛速度提升了约9.2％,学习过程更加稳定.

作者：苏杰刘光宇暨仲明黄雨梦 Author：SUJie LIUGuangyu JIZhongming HUANGYumeng
作者单位：杭州电子科技大学自动化学院(人工智能学院),浙江杭州310018;杭州电子科技大学浙江省物联感知与信息融合重点实验室,浙江杭州310018杭州电子科技大学自动化学院(人工智能学院),浙江杭州310018
刊名：传感器与微系统 ISTICPKU
Journal：TransducerandMicrosystemTechnologies
年，卷(期)：2023, 42(2)
分类号：TP391
关键词：外骨骼机械臂  深度强化学习  优先经验回放与分区奖励  深度确定性策略梯度
机标分类号：TP241TP301.6TP18
在线出版日期：2023年3月13日
基金项目：国家自然科学基金，国家自然科学基金，浙江省自然科学研究基金资助项目改进DDPG算法在外骨骼机械臂轨迹运动中的应用[
期刊论文]  传感器与微系统--2023, 42(2)苏杰  刘光宇  暨仲明  黄雨梦针对现阶段外骨骼机器人轨迹运动时出现效果不佳的问题,提出了基于优先经验回放与分区奖励(PERDA)融合的深度确定性策略梯度(DDPG)强化学习算法,即PERDA-DDPG.该方法利用时间差分误差(TD-errors)的大小对经验排序,改变了...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

改进DDPG算法在外骨骼机械臂轨迹运动中的应用  Application of improved DDPG algorithm in trajectory motion of exoskeleton manipulator

改进DDPG算法在外骨骼机械臂轨迹运动中的应用.pdf

2024-12-14 13:39 上传

改进DDPG算法在外骨骼机械臂轨迹运动中的应用.pdf

文件大小:: 1.14 MB

下载次数:: 60

高速下载

改进DDPG算法在外骨骼机械臂轨迹运动中的应用

相关帖子

能源电力

化工

建筑工程

机械

电子信息

医药

科学