文档名:基于DDPG的综合化航电系统多分区任务分配优化方法
摘要:综合化航电系统(IntegratedModularAvionics,IMA)通过时空分区机制实现共享资源平台下的多航电功能集成,分区间的任务分配方法的优劣决定着航电系统的整体效能.针对航电任务集合在多分区内的分配调度问题,提出了一种基于深度强化学习的优化方法.构建了航电系统模型与任务模型,以系统资源限制与任务实时性需求为约束,以提高系统资源利用率为优化目标,将任务分配过程描述为序贯决策问题.引入马尔科夫决策模型,建立基于深度确定性策略梯度(DeepDeterministicPolicyGradient,DDPG)法的IMA任务分配模型并提出通用分配架构;引入状态归一化、行为噪声等策略训练技巧,提高DDPG算法的学习性能和训练能力.仿真结果表明,提出的优化算法迭代次数达到500次时开始收敛,分析800次之后多分区内驻留任务方案在能满足约束要求的同时,最低处理效率提升20.55%.相较于传统分配方案和AC(Actor-Critic)算法,提出的DDPG算法在收敛能力、优化性能以及稳定性上均有显著优势.
Abstract:Theintegratedmodularavionics(IMA)systemimplementstheintegrationofmultipleavionicsfunctionsunderasharedresourceplatformthroughaspatio-temporalpartitioningmechanism.ThemeritofthetaskdistributionmethodbetweenpartitionsdeterminestheoveralleffectivenessoftheIMAsystem.Anoptimizationmethodbasedondeepreinforcementlearning(DRL)isproposedforthedistributionandschedulingofavionicstasksetswithinmultiplepartitionsisproposed.TheIMAsystemmodelandtaskmodelareconstructed,andtheconstraintsofsystemresourceandtaskreal-timerequirementsareusedtoimprovethesystemresourceutilizationastheoptimizationobjective.Thetaskdistributionprocessisdescribedasasequentialdecisionproblem.AMarkovdecisionmodelisintroducedtodevelopadeepdeterministicpolicygradient(DDPG)algorithm-basedIMAtaskdistributionmodelandagenericdistributionarchitectureisproposed.PolicytrainingtechniquessuchasstatenormalizationandbehavioralnoiseareintroducedtoimprovethelearningperformanceandtrainingcapabilityoftheDDPGalgorithm.Simulationresultsshowthattheproposedoptimizationalgorithmstartstoconvergeafter500iterations,andtheefficiencyofdistributionschemeisimprovedby20.55%whilesatisfyingtheconstraintrequirementsafter800iterations.ComparedwiththetraditionalassignmentschemeandtheActor-Critic(AC)algorithm,theproposedDDPGalgorithmhassignificantadvantagesintermsofconvergenceability.
作者:赵长啸 李道俊 汪鹏辉 田毅 Author:ZHAOChangxiao LIDaojun WANGPenghui TIANYi
作者单位:中国民航大学安全科学与工程学院,天津300300;民航航空器适航审定技术重点实验室,天津300300中国民航大学安全科学与工程学院,天津300300
刊名:电讯技术
Journal:TelecommunicationEngineering
年,卷(期):2024, 64(1)
分类号:V243
关键词:综合模块化航空电子系统(IMA) 任务分配及调度 深度强化学习 DDPG算法
Keywords:integratedmodularavionics(IMA) taskallocationandscheduling deepreinforcementlearning DDPGalgorithm
机标分类号:TP391.9O224E257
在线出版日期:2024年1月30日
基金项目:国家重点研发计划,天津市自然科学基金基于DDPG的综合化航电系统多分区任务分配优化方法[
期刊论文] 电讯技术--2024, 64(1)赵长啸 李道俊 汪鹏辉 田毅综合化航电系统(IntegratedModularAvionics,IMA)通过时空分区机制实现共享资源平台下的多航电功能集成,分区间的任务分配方法的优劣决定着航电系统的整体效能.针对航电任务集合在多分区内的分配调度问题,提出了一种基...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于DDPG的综合化航电系统多分区任务分配优化方法 A DDPG-based Optimization Method for Multi-partition Task Assignment of IMA
基于DDPG的综合化航电系统多分区任务分配优化方法.pdf
- 文件大小:
- 832.78 KB
- 下载次数:
- 60
-
高速下载
|
|