返回列表 发布新帖

一种大众麻将计算机博弈的快速出牌方法

11 0
admin 发表于 2024-12-14 02:56 | 查看全部 阅读模式

文档名:一种大众麻将计算机博弈的快速出牌方法
摘要:麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果.但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数据集,因此,如何在对弈中快速出牌就成为主要问题.针对以上问题,对出牌动作进行研究,以启发式快速出牌为思路,提出了面向敌方胡牌牌张的蒙特卡洛评估法,将启发式快速出牌方法和蒙特卡洛评估法相结合,对每张手牌进行估值计算,通过估值分数决定每轮出牌牌张.以历史出牌次数为分界点,以此分界将博弈过程时序化为前后2个决策时段,前段采用启发式快速出牌方法,后段采用蒙特卡洛评估法.通过前后时段法分层递进决策处理过程,给出最佳出牌着法,能有效减少出牌的决策时间并降低点炮率.采用所提方法的程序在中国计算机博弈锦标赛中获得了一等奖,证明了该方法的有效性.

Abstract:Mahjongisatypicalgameofimperfectinformation.Currently,mostsolutionstomahjongproblemsarestudiedinthedirectionofdeepreinforcementlearning,andfairlygoodresultshavebeenachieved.However,suchmahjongAIisbuiltonthebasisofhigh-qualitydatasets,andthemassmahjonglacksalargenumberofcriticalandeffectivelylabeleddatasets.Howtoquicklyplaycardsinthegamehasbecomethemainproblem.Toaddressit,thepaperstudiestheactionofplayingcardsandputsforwardtheMonteCarloevaluationmethodagainsttheopponent'scardsguidedbytheheuristicquickcardplaying.ByintegratingtheheuristicquickcardplayingmethodwithMonteCarloevaluationmethod,thepaperevaluateseachhandcardanddetermineseachroundofplayingcardsthroughthevaluationscore.Theempiricalknowledgeisinitiallyemployedtobuildademarcationpointwithacertainnumberofhistoricalcardplayingtimes,andthegameprocessisdividedintotwodecisionperiods.Theheuristicfastcardplayingmethodisusedinthefirstperiod,andtheMonteCarloevaluationmethodinthesecondperiod.Theoptimalplayingmethodisgiventhroughthehierarchicalandprogressivedecision-makingprocessofthefrontandbacktimemethod,effectivelyreducingthedecisiontimeofplayingcardsandthepointshotrate.TheprogramusingthismethodwinsthefirstprizeintheChineseComputerGameTournament,demonstratingitseffectiveness.

作者:张小川  严明珠  涂飞  陈俊宇  魏乐天Author:ZHANGXiaochuan  YANMingzhu  TUFei  CHENJunyu  WEILetian
作者单位:重庆理工大学两江人工智能学院,重庆401120
刊名:重庆理工大学学报 PKU
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2024, 38(9)
分类号:TP311
关键词:计算机博弈  不完美信息博弈  麻将  启发式快速出牌  蒙特卡洛评估法  
Keywords:computergame  imperfectinformationgame  mahjonggame  heuristicfastdiscard  MonteCarlomethodofevaluation  
机标分类号:TP391TP18F830.9
在线出版日期:2024年7月11日
基金项目:国家自然科学基金,重庆市技术创新与应用发展专项项目一种大众麻将计算机博弈的快速出牌方法[
期刊论文]  重庆理工大学学报--2024, 38(9)张小川  严明珠  涂飞  陈俊宇  魏乐天麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果.但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        一种大众麻将计算机博弈的快速出牌方法  A fast discard method of public mahjong computer game

一种大众麻将计算机博弈的快速出牌方法.pdf
2024-12-14 02:56 上传
文件大小:
3.73 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表