结合A2C和手牌估值方法的麻将博弈研究

衣御寒, 王亚杰, 吴燕燕, 刘松, 张兴慧, 蒋传禹

重庆理工大学学报(自然科学版) ›› 2024, Vol. 38 ›› Issue (05) : 154 -161.

PDF
重庆理工大学学报(自然科学版) ›› 2024, Vol. 38 ›› Issue (05) : 154 -161. DOI: CNKI:SUN:CGGL.0.2024-05-020

结合A2C和手牌估值方法的麻将博弈研究

    衣御寒, 王亚杰, 吴燕燕, 刘松, 张兴慧, 蒋传禹
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对大众麻将中对手牌信息利用不充分的问题,提出了手牌估值方法,并设计了基础麻将程序(MJE)。为进一步提升麻将AI的博弈能力,使用深度强化学习方法设计了麻将AI(MJE-RL)。首先,通过MJE自对弈生成深度学习的训练数据。其次,根据训练集、测试集和对比实验的结果,选择效果最好的模型作为强化学习的预训练模型。最后,使用优势演说-评论家模型作为强化学习的主要框架,将训练好的深度学习模型作为演说家部分进行决策,通过MJE-RL与MJE的对弈不断提升麻将AI的博弈能力。实验结果显示,MJE-RL的胜率比MJE高4.08%,点炮率比MJE低3.02%,表明MJE-RL在攻守两端都有提升,达到了提升麻将AI牌力的目的。

关键词

麻将 / 非完备信息 / 深度强化学习 / A2C

Key words

引用本文

引用格式 ▾
结合A2C和手牌估值方法的麻将博弈研究[J]. 重庆理工大学学报(自然科学版), 2024, 38(05): 154-161 DOI:CNKI:SUN:CGGL.0.2024-05-020

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

156

访问

0

被引

详细

导航
相关文章

AI思维导图

/