返回列表 发布新帖

改进DDPG算法在外骨骼机械臂轨迹运动中的应用

12 0
admin 发表于 2024-12-14 13:39 | 查看全部 阅读模式

文档名:改进DDPG算法在外骨骼机械臂轨迹运动中的应用
摘要:针对现阶段外骨骼机器人轨迹运动时出现效果不佳的问题,提出了基于优先经验回放与分区奖励(PERDA)融合的深度确定性策略梯度(DDPG)强化学习算法,即PERDA-DDPG.该方法利用时间差分误差(TD-errors)的大小对经验排序,改变了原始采样的策略.此外,相较于以往二值奖励函数,本文根据物理模型提出针对化的分区奖励.在OpenAIGym平台上实现仿真环境,实验结果表明:改进的算法收敛速度提升了约9.2%,学习过程更加稳定.

作者:苏杰   刘光宇   暨仲明   黄雨梦 Author:SUJie   LIUGuangyu   JIZhongming   HUANGYumeng
作者单位:杭州电子科技大学自动化学院(人工智能学院),浙江杭州310018;杭州电子科技大学浙江省物联感知与信息融合重点实验室,浙江杭州310018杭州电子科技大学自动化学院(人工智能学院),浙江杭州310018
刊名:传感器与微系统 ISTICPKU
Journal:TransducerandMicrosystemTechnologies
年,卷(期):2023, 42(2)
分类号:TP391
关键词:外骨骼机械臂  深度强化学习  优先经验回放与分区奖励  深度确定性策略梯度  
机标分类号:TP241TP301.6TP18
在线出版日期:2023年3月13日
基金项目:国家自然科学基金,国家自然科学基金,浙江省自然科学研究基金资助项目改进DDPG算法在外骨骼机械臂轨迹运动中的应用[
期刊论文]  传感器与微系统--2023, 42(2)苏杰  刘光宇  暨仲明  黄雨梦针对现阶段外骨骼机器人轨迹运动时出现效果不佳的问题,提出了基于优先经验回放与分区奖励(PERDA)融合的深度确定性策略梯度(DDPG)强化学习算法,即PERDA-DDPG.该方法利用时间差分误差(TD-errors)的大小对经验排序,改变了...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        改进DDPG算法在外骨骼机械臂轨迹运动中的应用  Application of improved DDPG algorithm in trajectory motion of exoskeleton manipulator

改进DDPG算法在外骨骼机械臂轨迹运动中的应用.pdf
2024-12-14 13:39 上传
文件大小:
1.14 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表