多人扩展式博弈问题中的虚拟遗憾最小化算法研究

admin · 发表于 2024-12-9 19:58

文档名：多人扩展式博弈问题中的虚拟遗憾最小化算法研究
本文对多人扩展式博弈问题中虚拟遗憾最小化算法展开研究.针对该算法基于二人零和博弈的前提假设的应用局限性,提出了将其扩展应用于多人博弈问题的方法.本文给出了虚拟遗憾最小化算法在多人非合作零和博弈条件下的收敛性及收敛的纳什均衡偏移阈值证明.基于一种简化的德州扑克游戏——PineapplePoker,利用其三人非合作博弈的性质作为实验平台,提出了虚拟遗憾最小化方法在多人博弈问题中的应用及训练方法.最后,本文通过与Q-Learning和MCTS算法实现系统的比对实验验证了本文的研究成果的有效性.
作者：张加佳刘宏钱涛
作者单位：北京大学深圳研究生院信息工程学院,广东深圳518055深圳市逸风网络科技有限公司,广东深圳518055
母体文献：第十二届中国智能机器人大会论文集
会议名称：第十二届中国智能机器人大会
会议时间：2017年10月1日
会议地点：哈尔滨
主办单位：中国人工智能学会
语种：chi
分类号：
关键词：多人扩展式博弈虚拟遗憾最小化算法纳什均衡
在线出版日期：2020年10月26日
基金项目：
相似文献
相关博文

2024-12-9 19:58 上传

多人扩展式博弈问题中的虚拟遗憾最小化算法研究.pdf

文件大小:: 2.16 MB

下载次数:: 60

高速下载

多人扩展式博弈问题中的虚拟遗憾最小化算法研究

相关帖子

能源电力

化工

建筑工程

机械

电子信息

医药

科学