文档名:一种基于强化学习的指挥智能体控制方法
摘要:针对无人水下航行器(unmannedunderwatervehicle,UUV)如何进行任务分配、航路规划、指挥控制问题,提出一种新的控制实现方法.搭建UUV指挥智能体训练平台,设计学习训练所需的想定,进行状态设计、数据适配、决策解析和规则库建立,选定近端策略优化(proximalpolicyoptimization,PPO)强化学习算法进行训练,并进行应用验证.结果表明:指挥智能体能有效对UUV进行任务分配、航路规划、指挥控制;通过不断优化算法,可提高战胜基于规则的传统控制方法的胜率.
Abstract:Aimingatthemethodsoftaskallocation,routeplanningandcommandcontrolofunmannedunderwatervehicle(UUV),anewcontrolimplementationmethod,commandagentbasedondeepreinforcementlearning,isproposedtoreplacehumaninthelooporautomaticcommandandcontrol.BuildUUVcommandagenttrainingplatform,designscenariosrequiredforlearningandtraining,conductstatedesign,dataadaptation,decisionanalysisandrulebaseestablishment,andselectproximalpolicyoptimization(PPO)reinforcementlearningalgorithmfortraining.Theapplicationverificationofthecommandagentgeneratedbytrainingandlearningiscarriedout.Theresultsshowthatthecommandintelligencecaneffectivelycarryouttaskallocation,routeplanning,commandandcontrolofUUV,andmakeboldguesses.Bycontinuouslyoptimizingthealgorithm,thewinningrateofdefeatingthetraditionalrule-basedcontrolmethodcanbeimproved.
作者:林九根 朱衍明 余景锋 宋家平 吴如悦Author:LinJiugen ZhuYanming YuJingfeng SongJiaping WuRuyue
作者单位:中国船舶工业系统工程研究院智能中心,北京100094
刊名:兵工自动化
Journal:OrdnanceIndustryAutomation
年,卷(期):2024, 43(1)
分类号:TJ6E925
关键词:航路规划 任务分配 智能体 强化学习
Keywords:routeplanning taskallocation agent reinforcementlearning
机标分类号:TP393TP183TP242
在线出版日期:2024年3月28日
基金项目:一种基于强化学习的指挥智能体控制方法[
期刊论文] 兵工自动化--2024, 43(1)林九根 朱衍明 余景锋 宋家平 吴如悦针对无人水下航行器(unmannedunderwatervehicle,UUV)如何进行任务分配、航路规划、指挥控制问题,提出一种新的控制实现方法.搭建UUV指挥智能体训练平台,设计学习训练所需的想定,进行状态设计、数据适配、决策解析和规则库...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
一种基于强化学习的指挥智能体控制方法 A Control Method of Command Agent Based on Reinforcement Learning
一种基于强化学习的指挥智能体控制方法.pdf
- 文件大小:
- 3.24 MB
- 下载次数:
- 60
-
高速下载
|
|