融合先验知识的藏久棋MCTS算法优化

王亚杰, 谷峰, 刘松, 杨静怡, 王世鹏

沈阳航空航天大学学报 ›› 2025, Vol. 42 ›› Issue (04) : 59 -67.

PDF
沈阳航空航天大学学报 ›› 2025, Vol. 42 ›› Issue (04) : 59 -67.

融合先验知识的藏久棋MCTS算法优化

作者信息 +

Author information +
文章历史 +
PDF

摘要

传统民间棋艺——藏久棋,是一种承载着深厚藏族文明与灿烂文化的完备信息博弈游戏。鉴于藏久棋规则体系的复杂性与棋局变化的多样性,传统博弈搜索算法难以有效应对其复杂决策需求。为提升藏久棋博弈的智能水平,提出了一种融合先验知识的蒙特卡洛树搜索(Monte Carlo tree search,MCTS)算法优化策略。在布局规划、行棋策略等关键阶段,基于深度强化学习,融合领域专家的先验知识设计了策略选择优化函数和评估函数。通过函数来有效指导MCTS的搜索过程,并训练出能够生成高质量着法的最佳模型。实验表明,改进的MCTS算法在对弈中取得显著效果。

关键词

藏久棋 / 先验知识 / 蒙特卡洛树搜索 / 深度强化学习 / 策略选择优化函数 / 评估函数

Key words

引用本文

引用格式 ▾
王亚杰, 谷峰, 刘松, 杨静怡, 王世鹏. 融合先验知识的藏久棋MCTS算法优化[J]. 沈阳航空航天大学学报, 2025, 42(04): 59-67 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/