基于DDPG的综合化航电系统多分区任务分配优化方法

admin · 发表于 2024-12-14 12:21

文档名：基于DDPG的综合化航电系统多分区任务分配优化方法
摘要：综合化航电系统(IntegratedModularAvionics,IMA)通过时空分区机制实现共享资源平台下的多航电功能集成,分区间的任务分配方法的优劣决定着航电系统的整体效能.针对航电任务集合在多分区内的分配调度问题,提出了一种基于深度强化学习的优化方法.构建了航电系统模型与任务模型,以系统资源限制与任务实时性需求为约束,以提高系统资源利用率为优化目标,将任务分配过程描述为序贯决策问题.引入马尔科夫决策模型,建立基于深度确定性策略梯度(DeepDeterministicPolicyGradient,DDPG)法的IMA任务分配模型并提出通用分配架构;引入状态归一化、行为噪声等策略训练技巧,提高DDPG算法的学习性能和训练能力.仿真结果表明,提出的优化算法迭代次数达到500次时开始收敛,分析800次之后多分区内驻留任务方案在能满足约束要求的同时,最低处理效率提升20.55%.相较于传统分配方案和AC(Actor-Critic)算法,提出的DDPG算法在收敛能力、优化性能以及稳定性上均有显著优势.

Abstract：Theintegratedmodularavionics(IMA)systemimplementstheintegrationofmultipleavionicsfunctionsunderasharedresourceplatformthroughaspatio-temporalpartitioningmechanism.ThemeritofthetaskdistributionmethodbetweenpartitionsdeterminestheoveralleffectivenessoftheIMAsystem.Anoptimizationmethodbasedondeepreinforcementlearning(DRL)isproposedforthedistributionandschedulingofavionicstasksetswithinmultiplepartitionsisproposed.TheIMAsystemmodelandtaskmodelareconstructed,andtheconstraintsofsystemresourceandtaskreal-timerequirementsareusedtoimprovethesystemresourceutilizationastheoptimizationobjective.Thetaskdistributionprocessisdescribedasasequentialdecisionproblem.AMarkovdecisionmodelisintroducedtodevelopadeepdeterministicpolicygradient(DDPG)algorithm-basedIMAtaskdistributionmodelandagenericdistributionarchitectureisproposed.PolicytrainingtechniquessuchasstatenormalizationandbehavioralnoiseareintroducedtoimprovethelearningperformanceandtrainingcapabilityoftheDDPGalgorithm.Simulationresultsshowthattheproposedoptimizationalgorithmstartstoconvergeafter500iterations,andtheefficiencyofdistributionschemeisimprovedby20.55%whilesatisfyingtheconstraintrequirementsafter800iterations.ComparedwiththetraditionalassignmentschemeandtheActor-Critic(AC)algorithm,theproposedDDPGalgorithmhassignificantadvantagesintermsofconvergenceability.

作者：赵长啸李道俊汪鹏辉田毅 Author：ZHAOChangxiao LIDaojun WANGPenghui TIANYi
作者单位：中国民航大学安全科学与工程学院,天津300300;民航航空器适航审定技术重点实验室,天津300300中国民航大学安全科学与工程学院,天津300300
刊名：电讯技术
Journal：TelecommunicationEngineering
年，卷(期)：2024, 64(1)
分类号：V243
关键词：综合模块化航空电子系统(IMA)  任务分配及调度  深度强化学习  DDPG算法
Keywords：integratedmodularavionics(IMA)  taskallocationandscheduling  deepreinforcementlearning  DDPGalgorithm
机标分类号：TP391.9O224E257
在线出版日期：2024年1月30日
基金项目：国家重点研发计划，天津市自然科学基金基于DDPG的综合化航电系统多分区任务分配优化方法[
期刊论文]  电讯技术--2024, 64(1)赵长啸  李道俊  汪鹏辉  田毅综合化航电系统(IntegratedModularAvionics,IMA)通过时空分区机制实现共享资源平台下的多航电功能集成,分区间的任务分配方法的优劣决定着航电系统的整体效能.针对航电任务集合在多分区内的分配调度问题,提出了一种基...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

基于DDPG的综合化航电系统多分区任务分配优化方法  A DDPG-based Optimization Method for Multi-partition Task Assignment of IMA

基于DDPG的综合化航电系统多分区任务分配优化方法.pdf

2024-12-14 12:21 上传

基于DDPG的综合化航电系统多分区任务分配优化方法.pdf

文件大小:: 832.78 KB

下载次数:: 60

高速下载

基于DDPG的综合化航电系统多分区任务分配优化方法

相关帖子

能源电力

化工

建筑工程

机械

电子信息

医药

科学