文档名:基于门控循环单元强化学习的晶圆光刻区实时调度方法研究
摘要:为求解具有动态性、实时性、多约束、多目标特点的晶圆光刻区调度问题,提出一种基于门控循环单元强化学习的晶圆光刻区实时调度方法.设计引入门控循环单元学习光刻区历史调度决策与状态的时序信息,为双深度强化学习模型提供辅助决策信息;设计双深度强化学习模型的输入状态空间、输出动作集,并面向晶圆最小化最大完工时间和晶圆准时交货率指标设计多目标奖励函数,为智能体优化调度输出;设计设备专用性约束与掩模版约束的解约束规则与调度方法相结合,提高调度方案实施的实用性.通过某晶圆制造企业实际算例,将该方法与传统双深度强化学习和光刻区启发式规则方法比较,该方法均为最优,证明了其解决此问题的有效性.
Abstract:Toaddresstheschedulingproblemofwaferphotolithographyarea,characterizedbydynamicnature,real-timerequirements,multipleconstraints,andmultipleobjectives,areal-timeschedulingmethodbasedongatedrecurrentunit(GRU)reinforcementlearningisproposed.ThismethodincorporatesGRUtolearnthetemporalinformationofhistoricalschedulingdecisionsandstatesinthephotolithographyarea,providingauxiliarydecision-makinginformationforthedoubledeepreinforcementlearning(DDRL)model.TheinputstatespaceandoutputactionsetoftheDDRLmodelaredesigned,andamulti-objectiverewardfunctionisestablishedwiththeobjectiveofminimizingthemaximumcompletiontimeofwafersandmaximizingtheon-timedeliveryrate,optimizingtheschedulingoutputbyintelligentagents.Additionally,constraintrelaxationrulesandschedulingmethodsareproposedcombiningequipment-specificconstraintsandmaskconstraints,toenhancethepracticalityofschedulingstrategies.Throughempiricalevaluationusingreal-worldcasesfromawafermanufacturingenterprise,thismethodiscomparedwithtraditionaldoubledeepreinforcementlearningandheuristicrulemethodsforphotolithographyarea,demonstratingitssuperiorityandverifyingitseffectivenessinsolvingthisproblem.
作者:吴立辉 石津铭 金克山 张洁 Author:WULihui SHIJinming JINKeshan ZHANGJie
作者单位:上海应用技术大学机械工程学院,上海201400东华大学人工智能研究院,上海201620
刊名:工业工程 ISTIC
Journal:IndustrialEngineeringJournal
年,卷(期):2024, 27(3)
分类号:F426.4TP391
关键词:晶圆制造系统 光刻区调度 深度强化学习 门控循环单元(GRU) 多目标
Keywords:waferfabricationsystem schedulingofphotolithographyarea deepreinforcementlearning gatedrecurrentunit(GRU) multi-objective
机标分类号:TP301.6TP18TP242
在线出版日期:2024年7月18日
基金项目:国家重点研发计划,上海应用技术大学引进人才科研启动项目基于门控循环单元强化学习的晶圆光刻区实时调度方法研究[
期刊论文] 工业工程--2024, 27(3)吴立辉 石津铭 金克山 张洁为求解具有动态性、实时性、多约束、多目标特点的晶圆光刻区调度问题,提出一种基于门控循环单元强化学习的晶圆光刻区实时调度方法.设计引入门控循环单元学习光刻区历史调度决策与状态的时序信息,为双深度强化学习模型提供...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于门控循环单元强化学习的晶圆光刻区实时调度方法研究 Real-time Scheduling of Wafer Photolithography Area Based on Reinforcement Learning with Gated Recurrent Unit
基于门控循环单元强化学习的晶圆光刻区实时调度方法研究.pdf
- 文件大小:
- 1.2 MB
- 下载次数:
- 60
-
高速下载
|
|