文档摘要:为实现混合动力系统在电池荷电状态(stateofcharge,SOC)平衡以及动力性约束下的经济性提升,提出了基于偏好强化学习的混合动力能量管理策略,该策略将能量管理问题建模为马尔科夫决策过程,采用深度神经网络建立输入状态值到最优动作控制输出的函数映射关系.与传统的强化学习控制算法相比,偏好强化学习算法无需设定回报函数,只需对多动作进行偏好判断即可实现网络训练收敛,克服了传统强化学习方法中回报函数加权归一化设计难题.通过仿真试验和硬件在环验证了所提出能量管理策略的有效性和可行性.结果表明,与传统强化学习能量管理策略相比,该策略能够在满足混合动力车辆SOC平衡和动力性约束下,提升经济性4.6%~10.6%.
Abstract:ToenhancetheeconomyofhybridpowersystemunderSOCbalanceandpowerconstraints,ahybridpowerenergymanagementstrategywasproposedbasedonthepreferringreinforcementlearning.Thestrategytreatedtheenergymanage-mentproblemasaMarkovdecisionprocessandadoptedadeepneuralnetworktolearnandbuildthenonlinearmappingfromtheinputstatestotheoptimalcontrolinputs.Comparedwiththetraditionalreinforcementlearningalgorithm,thepreferringreinforcementlearningdidnotrequirethesettingofarewardfunctionandonlyneededtomakepreferencejudgmentsonmulti-pleactionstoachievetheconvergenceofnetworktraining,whichovercamethedesigndifficultyofweightingnormalizationinrewardfunction.Theeffectivenessandfeasibilityoftheproposedenergymanagementstrategywereverifiedthroughsimulationexperimentsandhardware-in-the-looptests.Theresultsshowthatcomparedwithtraditionalreinforcementlearningenergymanagementstrategies,theproposedstrategycanimprovetheeconomyby4.6%to10.6%whilemaintainingtheSOCbalanceandpowerconstraintsofhybridpowervehicle.
作者:唐香蕉 满兴家 罗少华 邵杰 Author:TANGXiangjiao MANXingjia LUOShaohua SHAOJie
作者单位:上汽通用五菱汽车股份有限公司,广西柳州545000中国汽车工程研究院股份有限公司,重庆401122
刊名:车用发动机 ISTICPKU
Journal:VehicleEngine
年,卷(期):2024, (3)
分类号:U469.72
关键词:混合动力汽车 能量管理 偏好强化学习 优化控制 电池荷电状态(SOC) 控制策略
Keywords:hybridelectricvehicle energymanagement preferringreinforcementlearning optimalcontrol SOC controlstrategy
机标分类号:TP391U469.72TP273
在线出版日期:2024年6月25日
基金项目:国家重点研发计划,柳州市科技计划混合动力系统偏好强化学习能量管理策略研究[
期刊论文] 车用发动机--2024, (3)唐香蕉 满兴家 罗少华 邵杰为实现混合动力系统在电池荷电状态(stateofcharge,SOC)平衡以及动力性约束下的经济性提升,提出了基于偏好强化学习的混合动力能量管理策略,该策略将能量管理问题建模为马尔科夫决策过程,采用深度神经网络建立输入状态...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
关键词:混合动力汽车,能量管理,偏好强化学习,优化控制,电池荷电状态(SOC),控制策略,
- 文件大小:
- 1.62 MB
- 下载次数:
- 60
-
高速下载
|
|