文档摘要:针对高动态车联网环境中基站难以收集和管理瞬时信道状态信息的问题,提出了基于多智能体深度强化学习的车联网频谱分配算法.该算法以车辆通信延迟和可靠性约束条件下最大化网络吞吐量为目标,利用学习算法改进频谱和功率分配策略.首先通过改进DQN模型和Exp3策略训练隐式协作智能体.其次,利用迟滞性Q学习和并发体验重放轨迹解决多智能体并发学习引起的非平稳性问题.仿真结果表明,该算法有效载荷平均成功交付率可达95.89%,比随机基线算法提高了16.48%,可快速获取近似最优解,在降低车联网通信系统信令开销方面具有显著优势.
Abstract:Aimingattheproblemthatitisdifficultforbasestationstocollectandmanageinstantaneouschannelstateinformationinhighdynamicvehiclenetworkingenvironment,aspectrumallocationalgorithmforvehiclenetworkingbasedonmulti-agentdeepreinforcementlearningisproposed.Thealgorithmaimstomaximizethenetworkthroughputundertheconstraintsofvehiclecommunicationdelayandreliability,andusesthelearningalgorithmtoimprovethespectrumandpowerallocationstrategy.Firstly,theimplicitcooperativeagentistrainedbyimprovingDQNmodelandEXP3strategy.Secondly,thenonstationaryproblemcausedbymulti-agentconcurrentlearningissolvedbyusinghystereticQ-learningandconcurrentexperiencereplaytrajectory.Thesimulationresultsshowthattheaveragesuccessfuldeliveryrateofthepayloadoftheproposedalgorithmcanreach95.89%,whichis16.48%higherthantherandombaselinealgorithm.Itcanquicklyob-taintheapproximateoptimalsolution,andhassignificantadvantagesinreducingthesignalingoverheadoftheInternetofvehiclescommunicationsystem.
作者:王为念 苏健 陈勇 张建照 唐震 Author:WANGWei-nian SUJian CHENYong ZHANGJian-zhao TANGZhen
作者单位:南京信息工程大学计算机与软件学院,江苏南京210044国防科技大学第六十三研究所,江苏南京210007
刊名:电子学报 ISTICEIPKU
Journal:ActaElectronicaSinica
年,卷(期):2024, 52(5)
分类号:TP393.1
关键词:车联网 分布式频谱共享 多智能体 深度强化学习
Keywords:Vehicularnetwork Distributedspectrumsharing Multiagent Deepreinforcementlearning
机标分类号:TN929.5TP393U469.72
在线出版日期:2024年7月22日
基金项目:基于多智能体深度强化学习的车联网频谱共享[
期刊论文] 电子学报--2024, 52(5)王为念 苏健 陈勇 张建照 唐震针对高动态车联网环境中基站难以收集和管理瞬时信道状态信息的问题,提出了基于多智能体深度强化学习的车联网频谱分配算法.该算法以车辆通信延迟和可靠性约束条件下最大化网络吞吐量为目标,利用学习算法改进频谱和功率...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
关键词:车联网,分布式频谱共享,多智能体,深度强化学习,
|
|