文档名:改进DDPG算法在外骨骼机械臂轨迹运动中的应用
摘要:针对现阶段外骨骼机器人轨迹运动时出现效果不佳的问题,提出了基于优先经验回放与分区奖励(PERDA)融合的深度确定性策略梯度(DDPG)强化学习算法,即PERDA-DDPG.该方法利用时间差分误差(TD-errors)的大小对经验排序,改变了原始采样的策略.此外,相较于以往二值奖励函数,本文根据物理模型提出针对化的分区奖励.在OpenAIGym平台上实现仿真环境,实验结果表明:改进的算法收敛速度提升了约9.2%,学习过程更加稳定.
作者:苏杰 刘光宇 暨仲明 黄雨梦 Author:SUJie LIUGuangyu JIZhongming HUANGYumeng
作者单位:杭州电子科技大学自动化学院(人工智能学院),浙江杭州310018;杭州电子科技大学浙江省物联感知与信息融合重点实验室,浙江杭州310018杭州电子科技大学自动化学院(人工智能学院),浙江杭州310018
刊名:传感器与微系统 ISTICPKU
Journal:TransducerandMicrosystemTechnologies
年,卷(期):2023, 42(2)
分类号:TP391
关键词:外骨骼机械臂 深度强化学习 优先经验回放与分区奖励 深度确定性策略梯度
机标分类号:TP241TP301.6TP18
在线出版日期:2023年3月13日
基金项目:国家自然科学基金,国家自然科学基金,浙江省自然科学研究基金资助项目改进DDPG算法在外骨骼机械臂轨迹运动中的应用[
期刊论文] 传感器与微系统--2023, 42(2)苏杰 刘光宇 暨仲明 黄雨梦针对现阶段外骨骼机器人轨迹运动时出现效果不佳的问题,提出了基于优先经验回放与分区奖励(PERDA)融合的深度确定性策略梯度(DDPG)强化学习算法,即PERDA-DDPG.该方法利用时间差分误差(TD-errors)的大小对经验排序,改变了...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
改进DDPG算法在外骨骼机械臂轨迹运动中的应用 Application of improved DDPG algorithm in trajectory motion of exoskeleton manipulator
改进DDPG算法在外骨骼机械臂轨迹运动中的应用.pdf
- 文件大小:
- 1.14 MB
- 下载次数:
- 60
-
高速下载
|
|