文档名:基于多智能体强化学习的目标跟踪辐射方法及设计
摘要:针对分布式空间功率合成中单平台微波发射装置有最大发射功率限制的问题,提出了一种基于Friend-Q多智能强化学习的微波发射装置路径规划方法,以实现对目标施加持续4min及以上的10mW/cm2~15mW/cm2的辐射强度.在所提方法中通过变ε-贪婪策略平衡探索和利用的关系,同时提出一种具有选择性的输入功率方案,以减少系统耗能.通过对三种具有代表性的仿真场景进行训练,实验结果表明:①相比于分散远离场景和单一接近场景,路径结合场景的成功率分别提高了55.7%和120.9%,证实了微波辐射源的合理位置排布可以在很大程度上提高模型的成功率;②采用多智能体强化学习训练的模型相比于采用随机策略的模型,三种仿真场景中的成功率分别提高了48.8%、72%、41.8%,进一步验证了该算法的有效性.
Abstract:Aimingattheproblemthatsingle-platformmicrowavetransmittingdeviceshavemaximumtransmitpowerlimitationsindis-tributedspatialpowersynthesis,apathplanningmethodofmicrowavetransmittingdevicesbasedonFriend-Qmulti-intelligentreinforce-mentlearningisproposedtoachievetheradiationintensityof10mW/cm2~15mW/cm2lasting4minormoretothetarget.Therela-tionshipbetweenexplorationandutilizationisbalancedbythevariableε-greedystrategy,andaselectiveinputpowerschemeispro-posedtoreducetheenergyconsumptionofthesystem.Throughthetrainingofthreerepresentativesimulationscenarios,theexperimentalresultsshowthatcomparedwiththescatteredremotesceneandsingleproximityscene,thesuccessrateofpathcombinedsceneisincreasedby55.7%and120.9%,respectively,whichconfirmsthatthereasonablelocationarrangementofmicrowaveradiationsourcescangreatlyimprovethesuccessrateofthemodel.Comparedwiththemodelusingstochasticstrategy,thesuccessratesofthemodeltrainedbymulti-agentreinforcementlearninginthreesimulationscenesareincreasedby48.8%,72%and41.8%,respectively,whichfurtherverifiestheeffectivenessofthealgorithm.
作者:陈翰 张远媛 何聪 朱城磊 张为Author:CHENHan ZHANGYuanyuan HECong ZHUChenglei ZHANGWei
作者单位:东南大学仪器科学与工程学院,江苏南京210096
刊名:电子器件 ISTIC
Journal:ChineseJournalofElectronDevices
年,卷(期):2024, 47(2)
分类号:TN820.1
关键词:多智能体强化学习 分布式空间功率合成 跟踪辐射 路径规划
Keywords:multi-agentreinforcementlearning distributedspacepowersynthesis trackingradiation pathplanning
机标分类号:TP391.41TN953TP242
在线出版日期:2024年6月5日
基金项目:国防科技创新特区项目基于多智能体强化学习的目标跟踪辐射方法及设计[
期刊论文] 电子器件--2024, 47(2)陈翰 张远媛 何聪 朱城磊 张为针对分布式空间功率合成中单平台微波发射装置有最大发射功率限制的问题,提出了一种基于Friend-Q多智能强化学习的微波发射装置路径规划方法,以实现对目标施加持续4min及以上的10mW/cm2~15mW/cm2的辐射强度.在所提方...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于多智能体强化学习的目标跟踪辐射方法及设计 Target Tracking Radiation Method and Design Based on Multi-Agent Reinforcement Learning
基于多智能体强化学习的目标跟踪辐射方法及设计.pdf
- 文件大小:
- 1.23 MB
- 下载次数:
- 60
-
高速下载
|
|