文档名:基于深度确定性梯度算法的端到端自动驾驶策略
摘要:根据深度确定性策略梯度算法理论,提出了端到端的自动驾驶控制策略,通过Carla无人驾驶模拟器,以汽车前视图像和少量测量信息作为输入,直接输出转向、油门或制动的控制动作.同时,鉴于强化学习过程中存在大量试错行为,设计了对危险试错动作加以约束并修正的监督器,以减少危险动作并提升训练效率.根据Carla的训练测试结果表明,深度确定性策略梯度算法能使小车学习到有效的自动驾驶策略,且添加监督器之后的算法能明显减少试错行为并提升训练效率.
作者:赖晨光 杨小青 胡博 庞玉涵 邹宏Author:LAIChenguang YANGXiaoqing HUBo PANGYuhan ZOUHong
作者单位:重庆理工大学汽车零部件制造及检测技术教育部重点实验室,重庆400054;重庆理工大学车辆工程学院,重庆400054
刊名:重庆理工大学学报 ISTICPKU
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2023, 37(1)
分类号:U463.6TP181
关键词:自动驾驶 强化学习 深度确定性策略梯度 监督式深度强化学习
机标分类号:TP18U461.8TP301.6
在线出版日期:2023年3月7日
基金项目:国家自然科学基金,重庆市研究生教育教学改革研究项目基于深度确定性梯度算法的端到端自动驾驶策略[
期刊论文] 重庆理工大学学报--2023, 37(1)赖晨光 杨小青 胡博 庞玉涵 邹宏根据深度确定性策略梯度算法理论,提出了端到端的自动驾驶控制策略,通过Carla无人驾驶模拟器,以汽车前视图像和少量测量信息作为输入,直接输出转向、油门或制动的控制动作.同时,鉴于强化学习过程中存在大量试错行为,设计...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于深度确定性梯度算法的端到端自动驾驶策略 An end-to-end autonomous driving strategy based on the deep deterministic gradient algorithm
基于深度确定性梯度算法的端到端自动驾驶策略.pdf
- 文件大小:
- 1.49 MB
- 下载次数:
- 60
-
高速下载
|
|