文档名:基于改进的深度强化学习多智能体协作方法
摘要:针对多智能体深度强化学习在值函数拟合过程中未充分考虑智能体之间的作用关系,且动作大概率随机,导致迭代试错过程的数据浪费、协作效率低、收敛速度慢等问题,提出了一种在协作中的平均权重机制和改进的探索策略.首先,利用平均深度Q学习网络(DQN)在多智能体的值函数策略网络中设计一种权重结构,减小智能体间的不利影响;其次,改进探索策略,利用欧氏距离提高智能体的探索效率与策略协作性,增大系统跳出局部最小点的能力.通过多个场景实验的结果表明,所提方法提高了多智能体的学习能力和学习效率.
作者:孙英博 苗国英 庄亚楠Author:SUNYingbo MIAOGuoying ZHUANGYa'nan
作者单位:南京信息工程大学自动化学院,江苏南京210044
刊名:传感器与微系统 ISTICPKU
Journal:TransducerandMicrosystemTechnologies
年,卷(期):2023, 42(9)
分类号:TP242
关键词:多智能体 深度强化学习 平均权重 协作 策略
Keywords:multi-agent deepreinforcementlearning averageweight collaboration policy
机标分类号:TP242.6TP18TP391.9
在线出版日期:2023年9月26日
基金项目:国家自然科学基金,江苏省333工程项目基于改进的深度强化学习多智能体协作方法[
期刊论文] 传感器与微系统--2023, 42(9)孙英博 苗国英 庄亚楠针对多智能体深度强化学习在值函数拟合过程中未充分考虑智能体之间的作用关系,且动作大概率随机,导致迭代试错过程的数据浪费、协作效率低、收敛速度慢等问题,提出了一种在协作中的平均权重机制和改进的探索策略.首先,利...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于改进的深度强化学习多智能体协作方法 Multi-agent collaboration method based on improved deep reinforcement learning
基于改进的深度强化学习多智能体协作方法.pdf
- 文件大小:
- 974.29 KB
- 下载次数:
- 60
-
高速下载
|
|