文档名:基于专家示范深度强化学习的光伏系统MPPT控制
摘要:提出一种基于专家示范的深度确定性策略梯度算法(ED-DDPG)的MPPT算法,该算法将最大功率点跟踪问题转化为马尔科夫决策过程(MDP),选择基于连续动作空间的深度确定性策略梯度算法(DDPG)训练MPPT控制算法,来提高输出电压的控制精度,并基于专家示范改进了DDPG算法,使其在强化学习算法的经验池中预先加入传统方法的经验,从而加快算法神经网络训练的收敛速度.该算法解决了传统MPPT算法在面对温度、光照不断变化的复杂环境下动态效率较低的问题,解决了深度确定性策略梯度算法(DDPG)在求解MPPT问题时训练时间过长、收敛难度较大的问题.算例表明该算法在EN50530标准下MPPT动态效率平均达到97.3%,具有较强的鲁棒性.
作者:王逸轩 戴宇轩Author:WANGYixuan DAIYuxuan
作者单位:上海电力大学自动化工程学院,上海200090
刊名:电源技术 ISTICPKU
Journal:ChineseJournalofPowerSources
年,卷(期):2023, 47(2)
分类号:TM615
关键词:复杂环境 MPPT DDPG 专家示范 MDP
机标分类号:TP18TP391TM615
在线出版日期:2023年3月30日
基金项目:基于专家示范深度强化学习的光伏系统MPPT控制[
期刊论文] 电源技术--2023, 47(2)王逸轩 戴宇轩提出一种基于专家示范的深度确定性策略梯度算法(ED-DDPG)的MPPT算法,该算法将最大功率点跟踪问题转化为马尔科夫决策过程(MDP),选择基于连续动作空间的深度确定性策略梯度算法(DDPG)训练MPPT控制算法,来提高输出电压的...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于专家示范深度强化学习的光伏系统MPPT控制 MPPT control of photovoltaic system based on expert demonstration of deep reinforcement learning
基于专家示范深度强化学习的光伏系统MPPT控制.pdf
- 文件大小:
- 3.61 MB
- 下载次数:
- 60
-
高速下载
|
|