文档名:基于异步优势强化学习的交通信号控制策略
摘要:为解决交通信号控制中的信号灯配时调度不合理、路口拥堵等问题,提出一种基于行动者-评论家算法的城市智能交通控制算法.该算法是一种基于异步优势的算法,可对交通状态特征进行抽象表征,并以多线程并行实现对交通状态的精确感知.该算法还参考了强化学习算法,能在最短时间内不断迭代优化其内部参数,得到交通信号控制的最优方案.为验证该算法的有效性,采用交通仿真软件SUMO,对该算法和其他3种典型的交通信号控制算法进行模拟仿真,并对仿真结果进行比较和分析.研究结果表明:与这3类典型算法中效果最好的Q-learning算法相比,该算法的交叉口车辆平均延误时间减少了14.1%,平均队列长度缩短了13.1%,平均等待时间减少了13.5%.该交通信号控制算法能有效地改善城市道路拥堵,提高道路交叉口的通行效率.
作者:邓兰 吴义虎Author:DENGLan WUYihu
作者单位:长沙理工大学交通运输工程学院,湖南长沙410114
刊名:交通科学与工程
Journal:JournalofTransportScienceandEngineering
年,卷(期):2023, 39(3)
分类号:U491.5
关键词:智能交通信号控制 城市交通控制 深度强化学习 异步强化学习
Keywords:intelligenttrafficsignalcontrol urbantrafficcontrol deepreinforcementlearning asynchronousreinforcementlearning
机标分类号:U116.2F127TP393
在线出版日期:2023年7月21日
基金项目:基于异步优势强化学习的交通信号控制策略[
期刊论文] 交通科学与工程--2023, 39(3)邓兰 吴义虎为解决交通信号控制中的信号灯配时调度不合理、路口拥堵等问题,提出一种基于行动者-评论家算法的城市智能交通控制算法.该算法是一种基于异步优势的算法,可对交通状态特征进行抽象表征,并以多线程并行实现对交通状态的精...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于异步优势强化学习的交通信号控制策略 Traffic signal control strategy based on asynchronous advantage actor-critic algorithm
基于异步优势强化学习的交通信号控制策略.pdf
- 文件大小:
- 1.19 MB
- 下载次数:
- 60
-
高速下载
|
|