文档名:一种大众麻将计算机博弈的快速出牌方法
摘要:麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果.但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数据集,因此,如何在对弈中快速出牌就成为主要问题.针对以上问题,对出牌动作进行研究,以启发式快速出牌为思路,提出了面向敌方胡牌牌张的蒙特卡洛评估法,将启发式快速出牌方法和蒙特卡洛评估法相结合,对每张手牌进行估值计算,通过估值分数决定每轮出牌牌张.以历史出牌次数为分界点,以此分界将博弈过程时序化为前后2个决策时段,前段采用启发式快速出牌方法,后段采用蒙特卡洛评估法.通过前后时段法分层递进决策处理过程,给出最佳出牌着法,能有效减少出牌的决策时间并降低点炮率.采用所提方法的程序在中国计算机博弈锦标赛中获得了一等奖,证明了该方法的有效性.
Abstract:Mahjongisatypicalgameofimperfectinformation.Currently,mostsolutionstomahjongproblemsarestudiedinthedirectionofdeepreinforcementlearning,andfairlygoodresultshavebeenachieved.However,suchmahjongAIisbuiltonthebasisofhigh-qualitydatasets,andthemassmahjonglacksalargenumberofcriticalandeffectivelylabeleddatasets.Howtoquicklyplaycardsinthegamehasbecomethemainproblem.Toaddressit,thepaperstudiestheactionofplayingcardsandputsforwardtheMonteCarloevaluationmethodagainsttheopponent'scardsguidedbytheheuristicquickcardplaying.ByintegratingtheheuristicquickcardplayingmethodwithMonteCarloevaluationmethod,thepaperevaluateseachhandcardanddetermineseachroundofplayingcardsthroughthevaluationscore.Theempiricalknowledgeisinitiallyemployedtobuildademarcationpointwithacertainnumberofhistoricalcardplayingtimes,andthegameprocessisdividedintotwodecisionperiods.Theheuristicfastcardplayingmethodisusedinthefirstperiod,andtheMonteCarloevaluationmethodinthesecondperiod.Theoptimalplayingmethodisgiventhroughthehierarchicalandprogressivedecision-makingprocessofthefrontandbacktimemethod,effectivelyreducingthedecisiontimeofplayingcardsandthepointshotrate.TheprogramusingthismethodwinsthefirstprizeintheChineseComputerGameTournament,demonstratingitseffectiveness.
作者:张小川 严明珠 涂飞 陈俊宇 魏乐天Author:ZHANGXiaochuan YANMingzhu TUFei CHENJunyu WEILetian
作者单位:重庆理工大学两江人工智能学院,重庆401120
刊名:重庆理工大学学报 PKU
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2024, 38(9)
分类号:TP311
关键词:计算机博弈 不完美信息博弈 麻将 启发式快速出牌 蒙特卡洛评估法
Keywords:computergame imperfectinformationgame mahjonggame heuristicfastdiscard MonteCarlomethodofevaluation
机标分类号:TP391TP18F830.9
在线出版日期:2024年7月11日
基金项目:国家自然科学基金,重庆市技术创新与应用发展专项项目一种大众麻将计算机博弈的快速出牌方法[
期刊论文] 重庆理工大学学报--2024, 38(9)张小川 严明珠 涂飞 陈俊宇 魏乐天麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果.但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
一种大众麻将计算机博弈的快速出牌方法 A fast discard method of public mahjong computer game
一种大众麻将计算机博弈的快速出牌方法.pdf
- 文件大小:
- 3.73 MB
- 下载次数:
- 60
-
高速下载
|
|